일론 머스크의 인공지능(AI) 기업인 xAI가 미국 서부 시간 기준 17일 오후 8시(한국시간 18일 오후 1시) AI 챗봇 최신 모델인 '그록(Grok)3'를 공개한다.
앞서 머스크는 지난 15일(현지 시간) 소셜미디어 X를 통해 "그록3의 출시 및 라이브 데모가 이번주 월요일 밤 8시(태평양 표준시)에 진행된다"며 "이건 지구상에서 가장 똑똑한 AI가 될 것이다"고 밝혔다.
이번에 베일을 벗는 그록3는 xAI에서 개발한 최신 버전의 대규모 언어 모델(LLM)이다. 특히 머스크가 그록3에 대해 세계에서 가장 똑똑한 AI라고 주장하는 배경에는 합성 데이터를 통한 방대한 양의 학습 데이터와 연산 훈련에 있다.
xAI는 그록3의 훈련 데이터를 기하급수적으로 늘리기 위해 모델 개발에 합성 데이터를 사용했다. 합성 데이터는 실제 세계에서 수집한 데이터가 아닌, 컴퓨터 프로그램이나 알고리즘을 통해 인공적으로 생성한 데이터다.
이에 따라 개인 정보 침해 및 데이터 부족 문제로부터 자유롭다는 장점을 갖췄다. 의료, 자산 등 이용자의 실제 데이터를 사용할 경우 개인 프라이버시를 침범한다는 비판을 피해 가기 힘들지만, 합성 데이터는 가상으로 만들어졌기 때문에 이 같은 애로사항을 해소할 수 있다.
또 합성 데이터를 활용하면 특정 분야의 데이터가 적어 수집이 힘들고 비용이 과도하게 드는 문제가 해결되고, 다채로운 시나리오와 상황을 만들어 데이터의 다양성을 확보할 수 있다.
그러나 합성 데이터는 현실성이 부족하고, 데이터 생성 알고리즘이 편향성을 가졌을 때 가치 중립적이지 못하다는 단점도 지니고 있다. 실제 데이터를 대체 가능한지에 대한 검증도 필요하다.
다른 생성형 AI 업체인 챗GPT와 딥시크도 모델 성능 향상에 합성 데이터를 활용했지만, 그록3는 데이터 다양성 증대를 위해 특히 더 많은 양의 합성 데이터를 사용해 LLM 모델을 훈련한 것으로 알려졌다.
한편, 그록3에 대해 이전 모델인 그록2에 질의하자 그록2는 xAI가 그록3의 설계 목표를 '인간에 대한 외부적 관점'으로 삼았다는 설명을 내놨다. 이는 그록3가 단순히 인간의 언어를 모방하는 것을 넘어 인간의 행동과 문화에 대한 질문을 던질 수 있도록 설계됐음을 의미한다고 그록2는 부연했다.
Copyright ⓒ Metro. All rights reserved. (주)메트로미디어의 모든 기사 또는 컨텐츠에 대한 무단 전재ㆍ복사ㆍ배포를 금합니다.
주식회사 메트로미디어 · 서울특별시 종로구 자하문로17길 18 ㅣ Tel : 02. 721. 9800 / Fax : 02. 730. 2882
문의메일 : webmaster@metroseoul.co.kr ㅣ 대표이사 · 발행인 · 편집인 : 이장규 ㅣ 신문사업 등록번호 : 서울, 가00206
인터넷신문 등록번호 : 서울, 아02546 ㅣ 등록일 : 2013년 3월 20일 ㅣ 제호 : 메트로신문
사업자등록번호 : 242-88-00131 ISSN : 2635-9219 ㅣ 청소년 보호책임자 및 고충처리인 : 안대성