카카오는 AI 서비스의 안전성과 신뢰성을 검증하기 위한 가드레일 모델 '카나나 세이프가드(Kanana Safeguard)'를 개발하고, 국내 기업 최초로 3종의 모델을 오픈소스로 공개했다.
카카오는 생성형 AI 확산에 따른 유해 콘텐츠 위험성과 관련한 사회적 우려에 대응해 해당 모델을 개발했다. '카나나 세이프가드'는 카카오의 자체 언어모델 '카나나(Kanana)'를 기반으로 한국어 및 한국 문화에 특화된 데이터셋을 활용해 구축됐다. F1 스코어(F1-Score) 기준으로 한국어 성능에서 글로벌 모델을 상회하는 성과를 기록했다.
▲'카나나 세이프가드(Kanana Safeguard)' 사용자 발화나 AI 응답에서 증오, 괴롭힘, 성적 콘텐츠 등 유해성을 탐지하는 모델 ▲'카나나 세이프가드-사이렌(Kanana Safeguard-Siren)' 개인정보나 지식재산권 등 법적 리스크가 있는 요청을 탐지하는 모델 ▲'카나나 세이프가드-프롬프트(Kanana Safeguard-Prompt)'는 AI 서비스를 악용하려는 공격성 요청을 탐지하는 모델 등이다.
모든 모델은 오픈소스 플랫폼 허깅페이스(Hugging Face)를 통해 공개됐다. 아파치 2.0 라이선스(Apache 2.0 License)를 적용해 상업적 이용, 수정 및 재배포가 가능하다. 카카오는 향후 모델을 지속적으로 고도화할 계획이다.
카카오 AI 세이프티(AI Safety) 리더 김경훈은 책임 있는 AI 기술 개발의 필요성을 강조하며, 윤리적 AI 생태계 조성을 위한 노력을 이어가겠다고 밝혔다.
Copyright ⓒ Metro. All rights reserved. (주)메트로미디어의 모든 기사 또는 컨텐츠에 대한 무단 전재ㆍ복사ㆍ배포를 금합니다.
주식회사 메트로미디어 · 서울특별시 종로구 자하문로17길 18 ㅣ Tel : 02. 721. 9800 / Fax : 02. 730. 2882
문의메일 : webmaster@metroseoul.co.kr ㅣ 대표이사 · 발행인 · 편집인 : 이장규 ㅣ 신문사업 등록번호 : 서울, 가00206
인터넷신문 등록번호 : 서울, 아02546 ㅣ 등록일 : 2013년 3월 20일 ㅣ 제호 : 메트로신문
사업자등록번호 : 242-88-00131 ISSN : 2635-9219 ㅣ 청소년 보호책임자 및 고충처리인 : 안대성