메트로人 머니 산업 IT·과학 정치&정책 생활경제 사회 에듀&JOB 기획연재 오피니언 라이프 AI영상 플러스
글로벌 메트로신문
로그인
회원가입

    머니

  • 증권
  • 은행
  • 보험
  • 카드
  • 부동산
  • 경제일반

    산업

  • 재계
  • 자동차
  • 전기전자
  • 물류항공
  • 산업일반

    IT·과학

  • 인터넷
  • 게임
  • 방송통신
  • IT·과학일반

    사회

  • 지방행정
  • 국제
  • 사회일반

    플러스

  • 한줄뉴스
  • 포토
  • 영상
  • 운세/사주
IT/과학>IT/인터넷

데이터 고갈 위기...AI 경쟁력, '데이터 파운드리'가 가른다

AI 학습용 데이터의 부족 현상이 심화되며, '데이터 파운드리'가 인공지능 기술 경쟁력을 결정하는 핵심 요소로 대두되고 있다./ 제미나이로 생성한 이미지

인공지능(AI) 학습에 활용할 수 있는 데이터가 점차 고갈되면서 '데이터 파운드리'가 AI 경쟁력의 핵심 동력으로 떠오르고 있다.

 

8일 IT 업계에 따르면 현재의 데이터 소비 속도로 오는 2028년이면 인터넷에서 활용 가능한 텍스트 데이터가 대부분 소진돼 AI 발전이 정체기에 접어들 것으로 전망된다.

 

AI 대전환 흐름 속에서 기존 자연어 처리 인공지능 모델은 GPT-3 이후 라마 3, 팔콘-180B 등과 같은 초거대 언어 모델로 진화했고, 챗GPT·클로드 등 대화형 AI의 확산과 텍스트·이미지·음성을 통합 처리하는 멀티모달 AI 등장으로 학습에 필요한 데이터 수요가 기하급수적으로 증가했다.

 

문제는 이러한 수요에 비해 고품질 데이터 공급은 턱없이 부족하다는 점이다. 정보통신기획평가원(IITP)은 최근 발표한 'AI·ICT 브리프(2025-19호)' 보고서에서 AI 학습에 활용되는 기존 데이터의 중복성, 편향성, 노이즈 등 구조적인 문제가 드러났다고 진단했다.

 

보고서는 ▲인터넷에서 수집한 데이터의 대규모 중복 문제로 AI 학습의 비효율성 심화, 새로운 지식 습득보다는 반복 학습이 증가하는 악순환 ▲웹페이지에서 추출한 텍스트에 각종 불필요한 요소가 섞여들어가 AI가 학습해야 할 콘텐츠 품질 저하 ▲특정 언어와 문화권에 치우친 데이터 분포로 인해 AI의 글로벌 활용성 제한 및 다양성 결여를 문제점으로 지적했다.

 

IITP는 데이터 기근으로 인해 데이터 전문 공급 체계인 '데이터 파운드리'가 AI 시대 기업의 경쟁력을 결정짓는 중요 인프라로 주목받고 있다고 설명했다.

 

데이터 파운드리는 반도체 파운드리 모델을 벤치마킹한 것으로, 단순 데이터 저장소를 넘어 수집·정제·라벨링·관리·품질보증까지 전 과정을 전문적으로 수행하는 종합 데이터 처리 서비스다.

 

보고서는 "AI 모델의 성능은 알고리즘보다 데이터 품질에 더 크게 좌우된다는 것이 업계 정설로 자리잡으면서 체계적인 데이터 파운드리 구축·활용이 AI 시대 기업 경쟁력의 핵심 요소로 부상했다"며 "온전한 데이터 파운드리의 형태를 갖추기 위해서는 데이터의 수집·통합, 전처리·정제, 라벨링·주석, 저장·관리, 품질 관리·거버넌스 확보가 필요하다"고 밝혔다.

트위터 페이스북 카카오스토리 Copyright ⓒ 메트로신문 & metroseoul.co.kr