메트로人 머니 산업 IT·과학 정치&정책 생활경제 사회 에듀&JOB 기획연재 오피니언 라이프 AI영상 플러스
글로벌 메트로신문
로그인
회원가입

    머니

  • 증권
  • 은행
  • 보험
  • 카드
  • 부동산
  • 경제일반

    산업

  • 재계
  • 자동차
  • 전기전자
  • 물류항공
  • 산업일반

    IT·과학

  • 인터넷
  • 게임
  • 방송통신
  • IT·과학일반

    사회

  • 지방행정
  • 국제
  • 사회일반

    플러스

  • 한줄뉴스
  • 포토
  • 영상
  • 운세/사주
IT/과학>IT/인터넷

카카오, AI 안전성 검증 위한 가드레일 모델 '카나나 세이프가드' 공개

카카오가 공개한 가드레일 모델 구성. /카카오

카카오는 AI 서비스의 안전성과 신뢰성을 검증하기 위한 가드레일 모델 '카나나 세이프가드(Kanana Safeguard)'를 개발하고, 국내 기업 최초로 3종의 모델을 오픈소스로 공개했다.

 

카카오는 생성형 AI 확산에 따른 유해 콘텐츠 위험성과 관련한 사회적 우려에 대응해 해당 모델을 개발했다. '카나나 세이프가드'는 카카오의 자체 언어모델 '카나나(Kanana)'를 기반으로 한국어 및 한국 문화에 특화된 데이터셋을 활용해 구축됐다. F1 스코어(F1-Score) 기준으로 한국어 성능에서 글로벌 모델을 상회하는 성과를 기록했다.

 

▲'카나나 세이프가드(Kanana Safeguard)' 사용자 발화나 AI 응답에서 증오, 괴롭힘, 성적 콘텐츠 등 유해성을 탐지하는 모델 ▲'카나나 세이프가드-사이렌(Kanana Safeguard-Siren)' 개인정보나 지식재산권 등 법적 리스크가 있는 요청을 탐지하는 모델 ▲'카나나 세이프가드-프롬프트(Kanana Safeguard-Prompt)'는 AI 서비스를 악용하려는 공격성 요청을 탐지하는 모델 등이다.

 

모든 모델은 오픈소스 플랫폼 허깅페이스(Hugging Face)를 통해 공개됐다. 아파치 2.0 라이선스(Apache 2.0 License)를 적용해 상업적 이용, 수정 및 재배포가 가능하다. 카카오는 향후 모델을 지속적으로 고도화할 계획이다.

 

카카오 AI 세이프티(AI Safety) 리더 김경훈은 책임 있는 AI 기술 개발의 필요성을 강조하며, 윤리적 AI 생태계 조성을 위한 노력을 이어가겠다고 밝혔다.

트위터 페이스북 카카오스토리 Copyright ⓒ 메트로신문 & metroseoul.co.kr