네이버와 LG, SK텔레콤, 엔씨소프트 등 국내 주요 IT 기업이 개발한 대규모언어모델(LLM)이 수학 추론 능력에서 해외 선도 모델과 뚜렷한 격차를 보였다. 검색과 게임, 통신, 콘텐츠 등 각 분야에서 AI 경쟁력을 강조해온 기업들이 기초 추론 영역에서는 글로벌 모델의 벽을 넘지 못했다는 평가다.
16일 IT 업계에 따르면 김종락 서강대 수학과 교수 연구팀은 네이버, LG AI연구원, SK텔레콤, 엔씨소프트, 업스테이지 등 국내 기업이 개발한 LLM 5종과 오픈AI, 구글, 앤트로픽, xAI, 딥시크 등 해외 모델 5종을 대상으로 수학 문제 풀이 성능을 비교 분석했다. 연구팀은 동일한 수능 수학·논술 문제를 각 모델에 동시에 제시해 추론 과정과 정답률을 비교했다.
이번 실험에서 네이버는 자체 LLM HCX-007을 투입했다. LG AI연구원은 엑사원 4.0.1, SK텔레콤은 A.X 4.0 72B 모델을 활용했다. 엔씨소프트는 경량 모델인 라마 바르코 8B 인스트럭트를 실험에 참여시켰고, 업스테이지는 솔라 프로-2를 내세웠다. 이들 모델은 모두 각 기업이 상용 서비스와 연구개발에서 핵심 자산으로 활용하는 LLM이다.
연구팀은 수능 수학 공통과목과 확률과 통계, 미적분, 기하에서 최고 난도의 문항 5개씩을 선정해 총 20문제를 구성했다. 여기에 국내 주요 대학 논술 기출 문제 10문제, 인도 대학입시 수학 문제 10문제, 일본 도쿄대 공대 대학원 입시 수학 문제 10문제를 더해 총 50문항을 출제했다.
실험 결과 네이버·LG·SKT·엔씨소프트 등 국내 기업의 LLM은 단순 계산이나 구조가 명확한 문제에서는 일정 수준의 답안을 제시했지만, 다단계 추론과 복잡한 논리 전개가 필요한 문제에서는 오류를 반복했다. 풀이 과정 중 전제 조건을 놓치거나 중간 계산을 잘못 이어가는 사례가 다수 관찰됐다. 특히 논술 문제와 대학원 입시 문제처럼 정형화되지 않은 문항에서 정답률이 크게 낮아졌다.
반면 오픈AI의 GPT-5.1과 구글 제미니 3 프로 프리뷰, 앤트로픽 클로드 오푸스 4.5 등 해외 모델은 풀이 과정의 일관성과 안정성을 유지했다. 복잡한 수식 전개 과정에서도 논리 흐름을 비교적 정확히 따라가며 정답에 도달하는 경우가 많았다.
이번 결과는 국내 기업들이 AI 서비스 적용과 한국어 처리 성능에서는 빠르게 경쟁력을 확보했지만, 수학적 추론과 범용 문제 해결 능력에서는 여전히 글로벌 선두 그룹과 격차를 보인다는 점을 보여준다. 업계에서는 파라미터 규모 경쟁이나 서비스 최적화 중심 전략이 기초 추론 역량 강화로 충분히 이어지지 않았다는 분석도 나온다.
특히 네이버와 LG, SK텔레콤, 엔씨소프트 등 대기업이 참여하는 국가대표 AI 프로젝트의 방향성에 대한 재검토 필요성도 제기된다. 기업들이 단기간 내 상용 서비스 성과를 내는 데 집중하면서, 범용 추론 능력과 기초 모델 경쟁력 강화에는 상대적으로 투자가 부족했던 것 아니냐는 지적이다.
업계 관계자는 "국내 기업의 LLM은 특정 서비스 환경에 맞춘 활용도에서는 강점을 보이지만, 수학적 사고력과 일반화된 추론 능력에서는 아직 한계를 드러낸다"며 "글로벌 경쟁을 목표로 한다면 기업 차원에서 학습 구조와 데이터 전략을 근본적으로 다시 짜야 한다"고 말했다.
이번 실험은 국산 AI를 둘러싼 기업들의 현재 위치를 분명히 보여준다. AI 경쟁의 다음 단계는 누가 더 많은 서비스를 붙였느냐가 아니라, 누가 더 깊이 사고하고 문제를 풀 수 있는 모델을 갖췄느냐로 옮겨가고 있다.
Copyright ⓒ 메트로신문 & metroseoul.co.kr
Copyright ⓒ Metro. All rights reserved. (주)메트로미디어의 모든 기사 또는 컨텐츠에 대한 무단 전재ㆍ복사ㆍ배포를 금합니다.
주식회사 메트로미디어 · 서울특별시 종로구 자하문로17길 18 ㅣ Tel : 02. 721. 9800 / Fax : 02. 730. 2882
문의메일 : webmaster@metroseoul.co.kr ㅣ 대표이사 · 발행인 · 편집인 : 이장규 ㅣ 신문사업 등록번호 : 서울, 가00206
인터넷신문 등록번호 : 서울, 아02546 ㅣ 등록일 : 2013년 3월 20일 ㅣ 제호 : 메트로신문
사업자등록번호 : 242-88-00131 ISSN : 2635-9219 ㅣ 청소년 보호책임자 및 고충처리인 : 안대성