메트로人 머니 산업 IT·과학 정치&정책 생활경제 사회 에듀&JOB 기획연재 오피니언 라이프 AI영상 플러스
글로벌 메트로신문
로그인
회원가입

    머니

  • 증권
  • 은행
  • 보험
  • 카드
  • 부동산
  • 경제일반

    산업

  • 재계
  • 자동차
  • 전기전자
  • 물류항공
  • 산업일반

    IT·과학

  • 인터넷
  • 게임
  • 방송통신
  • IT·과학일반

    사회

  • 지방행정
  • 국제
  • 사회일반

    플러스

  • 한줄뉴스
  • 포토
  • 영상
  • 운세/사주
IT/과학>IT/인터넷

“모델보다 데이터”… AI 성능 좌우할 데이터 전쟁 시작

성능 평준화 시대… 차별화 위한 데이터 필요

8일(현지 시간) 미국 실리콘밸리에서 네이버 이해진 네이버 이사회 의장이 네이버 벤처스 네트워킹 행사에서 발표를 진행하는 모습. 이날 이 의장은 소버린 AI 구축을 위해 확보 중인 데이터의 중요성을 설명했다. /네이버

"검색도 처음에는 알고리즘 싸움이었지만 결국 다 비슷해지고, 데이터를 갖고 차별화하는 것이 중요해졌습니다. 인공지능(AI) 또한 비슷한 일이 생길 것입니다."

 

10일 <메트로경제신문> 취재에 따르면 이해진 네이버 이사회 의장은 지난 5일(현지시간) 미국 실리콘벨리에서 진행 된 네이버의 첫 해외 투자법인 '네이버 벤처스' 기자간담회에서 이같이 말했다. 이 의장의 발언은 AI 기술의 주도권이 이제 '누가 더 똑똑한가'가 아니라 '누가 더 고품질의 데이터를 가졌는가'로 이동했음을 시사한다.

 

AI 개발 기업의 데이터 싸움은 오래전부터 이어졌다. GPT-4나 제미나이(Gemini), 클로드(Claude) 등 거대언어모델(LLM)은 모델 구조 자체보다는 얼마나 방대한·다양한·정제된 데이터를 학습했는가가 성능을 좌우한다. 특히 최근 AI 개발의 초점은, 다른 LLM이 갖지 못한 고품질 데이터를 선점해 학습하는 쪽으로 옮겨가고 있다.

 

이 의장은 "AI 시대에도 차별화의 핵심은 결국 데이터"라고 강조하며, 사용자 제작 콘텐츠(UGC)를 통한 네이버의 검색 경쟁력을 사례로 들었다.

 

그는 AI 생태계에서도 블로그·카페 같은 UGC 기반 플랫폼의 재구축이 중요하다고 보고, 중고거래 플랫폼 '포쉬마크' 인수 또한 상거래 데이터 확보를 위한 전략의 일환이라고 설명했다. 기초 AI 모델은 미국·중국이 선점했지만, 한국 내수 특화 AI 영역에서는 네이버가 데이터 경쟁력을 기반으로 충분히 승부를 걸 수 있다는 판단이다.

 

특화 데이터 확보와 함께 글로벌 빅테크 기업들은 최근 학습 데이터에 정확한 이름을 붙이는 '데이터 라벨링(DATA labeling)' 기술 확보에 집중하고 있다. 데이터 라벨링은 인공지능(AI)에 학습시키는 데이터를 정확히 어떤 사물과 객체인지 분류하는 작업을 말한다.

 

가령, 거리에서 자전거를 탄 소녀를 찍은 사진이 있다면 '거리' '자전거' '소녀' 등으로 분류해 라벨링 하는 식이다. 최근까지도 해당 작업은 사람의 수작업으로 이뤄졌는데, 주요 빅테크 기업이 비용 절감을 위해 폭력적이고 음란한 콘텐츠까지 포함해 개발도상국에 하청을 준 사실이 드러나 논란이 일기도 했다. 최근에는 이같은 작업 또한 AI를 통해 자동화 하는 추세다.

 

블룸버그 통신이 지난 8일(현지시간) 보도한 바에 따르면 최근 메타는 인공지능(AI) 학습 데이터 정제 기업 스케일AI에 최대 100억달러(약 13조6000억원)의 투자를 추진 중이다. 스케일AI는 MS·아마존·엔비디아 등으로부터 투자받은 비상장 기업으로, 데이터 라벨링 기술에 특화했다. 과거 데이터 라벨링 기업에 데이터를 구매했으나 한발 더 나아가 원천 기술을 확보하려는 전략으로 풀이된다.

 

AI 학습 데이터 가공 업체 관계자는 "최근 학계에서도 AI 학습 데이터가 점차 고갈되고 있다는 연구 결과가 잇따르고 있다"며 "이제는 다른 LLM들이 확보하지 못한 차별화된 데이터나, 정밀하고 고품질의 데이터를 얼마나 갖고 있느냐가 핵심이 될 것"이라고 설명했다. 이어 "LLM 모델 성능이 상향평준화된 지금, 결국 미래 경쟁은 데이터 확보 전쟁으로 갈 수밖에 없다"고 밝혔다.

 

트위터 페이스북 카카오스토리 Copyright ⓒ 메트로신문 & metroseoul.co.kr