메트로人 머니 산업 IT·과학 정치&정책 생활경제 사회 에듀&JOB 기획연재 오피니언 라이프 AI영상 플러스
글로벌 메트로신문
로그인
회원가입

    머니

  • 증권
  • 은행
  • 보험
  • 카드
  • 부동산
  • 경제일반

    산업

  • 재계
  • 자동차
  • 전기전자
  • 물류항공
  • 산업일반

    IT·과학

  • 인터넷
  • 게임
  • 방송통신
  • IT·과학일반

    사회

  • 지방행정
  • 국제
  • 사회일반

    플러스

  • 한줄뉴스
  • 포토
  • 영상
  • 운세/사주
IT/과학>IT/인터넷

KT AI '믿:음 2.0', 한국어 LLM 성능 평가서 국내 1위 차지

KT는 지난 4일 공개한 KT의 자체 개발 모델 믿:음 2.0 베이스가 한국어 LLM 평가 지표 '호랑이 리더보드3'에서 파라미터 수 150억개 미만의 국내 기업 개발 모델 가운데 종합 성능 1위를 기록했다고 9일 밝혔다. 사진은 지난 8일 기준 '호랑이 리더보드' 파라미터 수 150억개(15B사이즈) 이하 모델 순위. /KT

KT가 자체 개발한 '믿:음 2.0'이 한국어 LLM(초거대언어모델) 성능 평가 플랫폼 '호랑이(Horangi) 리더보드'에서 국내 1위를 차지했다.

 

KT는 지난 4일 공개한 KT의 자체 개발 모델 '믿:음 2.0 베이스'가 한국어 LLM 평가 지표 '호랑이 리더보드3'에서 파라미터 수 150억개 미만의 국내 기업 개발 모델 가운데 종합 성능 1위를 기록했다고 9일 밝혔다.

 

믿:음 2.0 베이스의 종합 점수는 0.7197다. 세부적으로는 범용 성능 0.7004, 응답 정렬 성능 0.739로 평가됐다. 전세계 동급 모델 중에서는 3위에 해당하는 수준이다.

 

호랑이 리더보드는 글로벌 MLOps(머신러닝작업) 기업 웨이트앤바이어스(W&B)가 주관하는 한국어 특화 LLM 평가 벤치마크다. 실제 한국어 환경에서의 범용적인 언어 이해력과 응답 안전성을 포함하는 정렬성 등 한국어 LLM의 실용적인 역량을 다면적으로 평가한다.

 

단편적인 지식을 묻는 질문에 대한 답변 정확성을 평가하는 기존 벤치마크와 달리, 작문·추론·정보 추출 등 실생활 시나리오를 기반으로 평가하여 모델의 실용적 능력을 평가하는 지표로 주목받고 있다.

 

믿:음 2.0은 외산 모델을 기반으로 단순 튜닝하는 방식이 아닌, 아키텍처 설계부터 데이터 구축, 학습까지 전 과정을 KT가 직접 수행하는 '프롬 스크래치' 방식으로 개발한 순수 자체 개발 모델이라는 점에서도 기술적 의미가 크다.

 

KT 생성형 AI 랩장(CAIO) 신동훈 상무는 "믿:음 2.0을 국내 다양한 산업 분야에 적용해 '한국적 AI'의 시장 확산에 본격적으로 나설 것"이라며 "한국적 AI의 실용화와 기술 발전을 이끄는 핵심 주체로 자리매김하겠다"고 말했다.

 

한편 KT는 믿:음 2.0 기반의 맞춤형 B2B AI 솔루션을 산업 전반에 제공하고, 공공·금융·교육·법률 분야에서 실증을 추진한다. 현재 공개된 버전에서 성능을 더 높인 믿:음 2.0 프로 공개도 준비하고 있다. 이어 믿:음 2.0의 추론, 멀티모달 기능 확장과 함께 국산 AI 반도체 기업 리벨리온과의 협력을 통한 AI 생태계 강화 등도 계획 중이다.

 

트위터 페이스북 카카오스토리 Copyright ⓒ 메트로신문 & metroseoul.co.kr