카카오, AI 안전성 검증 위한 가드레일 모델 '카나나 세이프가드' 공개

메트로신문 김서현 기자 ㅣ2025-05-27 11:09:18

카카오는 AI 서비스의 안전성과 신뢰성을 검증하기 위한 가드레일 모델 '카나나 세이프가드(Kanana Safeguard)'를 개발하고, 국내 기업 최초로 3종의 모델을 오픈소스로 공개했다.

카카오는 생성형 AI 확산에 따른 유해 콘텐츠 위험성과 관련한 사회적 우려에 대응해 해당 모델을 개발했다. '카나나 세이프가드'는 카카오의 자체 언어모델 '카나나(Kanana)'를 기반으로 한국어 및 한국 문화에 특화된 데이터셋을 활용해 구축됐다. F1 스코어(F1-Score) 기준으로 한국어 성능에서 글로벌 모델을 상회하는 성과를 기록했다.

▲'카나나 세이프가드(Kanana Safeguard)' 사용자 발화나 AI 응답에서 증오, 괴롭힘, 성적 콘텐츠 등 유해성을 탐지하는 모델 ▲'카나나 세이프가드-사이렌(Kanana Safeguard-Siren)' 개인정보나 지식재산권 등 법적 리스크가 있는 요청을 탐지하는 모델 ▲'카나나 세이프가드-프롬프트(Kanana Safeguard-Prompt)'는 AI 서비스를 악용하려는 공격성 요청을 탐지하는 모델 등이다.

모든 모델은 오픈소스 플랫폼 허깅페이스(Hugging Face)를 통해 공개됐다. 아파치 2.0 라이선스(Apache 2.0 License)를 적용해 상업적 이용, 수정 및 재배포가 가능하다. 카카오는 향후 모델을 지속적으로 고도화할 계획이다.

카카오 AI 세이프티(AI Safety) 리더 김경훈은 책임 있는 AI 기술 개발의 필요성을 강조하며, 윤리적 AI 생태계 조성을 위한 노력을 이어가겠다고 밝혔다.

메트로人

머니

산업

IT·과학

정치＆정책

생활경제

사회

에듀＆JOB

기획연재

오피니언

라이프

플러스

독자서비스

포럼＆컨퍼런스

카카오, AI 안전성 검증 위한 가드레일 모델 '카나나 세이프가드' 공개

기사이력코드