메트로人 머니 산업 IT·과학 정치&정책 생활경제 사회 에듀&JOB 기획연재 오피니언 라이프 AI영상 플러스
글로벌 메트로신문
로그인
회원가입

    머니

  • 증권
  • 은행
  • 보험
  • 카드
  • 부동산
  • 경제일반

    산업

  • 재계
  • 자동차
  • 전기전자
  • 물류항공
  • 산업일반

    IT·과학

  • 인터넷
  • 게임
  • 방송통신
  • IT·과학일반

    사회

  • 지방행정
  • 국제
  • 사회일반

    플러스

  • 한줄뉴스
  • 포토
  • 영상
  • 운세/사주
IT/과학>IT/인터넷

'음성AI 비서' 기술, 벌써 여기까지? … 애교부터 자연스러운 대화까지

삼성전자의 음성AI 비서 '빅스비(BIXBY)'를 사용하는 모습. /삼성전자

음성 인공지능(AI) 비서 개발 경쟁이 치열해지고 있다. 생성형 AI의 발전으로 음성 AI 비서는 과거 미리 설정한 질문과 답만을 하던 데에서 벗어나 자연스러운 대화는 물론 연결 된 기기를 제어하고 뉴스를 요약하는 등 고도로 인간에 가까워지고 있다.

 

26일 <메트로경제> 취재 결과 생성형 AI를 활용한 소프트웨어가 속속 등장하면서 음성AI 비서 서비스가 주목 받고 있다. 음성AI 비서 서비스는 생성형 AI를 기반으로 이용자의 음성 명령에 따라 AI가 실시간 대화 및 인터넷 검색 등을 수행하는 서비스를 말한다.

 

글로벌 인포메이션의 보고서에 따르면, AI 가상 비서 시장 규모는 2023년 111억3000만 달러(약 12조2500억원)에서 2028년 458억3000만 달러(약 62조6900억원)로 연평균 32.7%의 성장률을 보일 것으로 전망된다.

 

오픈AI는 24일 고도화 한 음성AI 비서 서비스인 챗GPT '어드밴스드 보이스 모델(Advanced Voice Model)'를 출시했다. 지난 7월 '스탠다드 음성모드'를 출시하고 2개월 만으로, 이번 업데이트에서는 한국어를 포함한 50개 언어를 개선했다. 기존 챗GPT 유료 구독자들에게 제공되는 서비스로, 한국어의 경우 과거 어색한 말투에서 벗어나 실제 한국인이 말하듯 자연스러운 수준에 이르렀다. 심지어 한국어 사투리도 전보다 더 많이 이해할 수 있게 됐다.

 

재키 섀넌 오픈AI 챗GPT 멀티모달 총괄은 "새 버전은 더 자연스럽고 실시간 대화가 가능하다"며 "대화 도중에도 언제든지 끼어들 수 있고 사용자의 감정을 감지하고 반응할 수 있다"고 밝혔다.

 

앞서 구글은 음성AI 비서 '제미나이 라이브(Gemini Live)'를 출시했다. 제미나이 라이브는 기존 제미나이에 고급 음성 기능을 더한 것으로 향상된 음성 엔진으로 더 일관되고 감정적으로 표현력이 풍부하며 현실적인 대화를 제공한다. 대화 중 챗봇의 말을 자르고 질문할 수도 있으며, 실시간으로 사용자의 음성 패턴에 적응한다는 설명이다. 또 10가지 음성중 하나를 선택할 수 있다. 제미나이 앱으로 구동, 다른 앱을 사용하거나 또는 휴대폰이 잠긴 상태에서도 계속 말할 수 있으며 언제든지 대화를 일시 중지하고 다시 시작할 수 있다.

 

음성AI 비서는 빅테크뿐 아니라 휴대폰 시장을 양분하고 있는 삼성전자와 애플 또한 고도화에 박차를 가하고 있다.

 

삼성전자는 기존 AI 서비스 '빅스비'에 자체 생성형 AI 기술을 연동할 예정이다. 지금까지 빅스비는 생성형 AI에 연동되지 않아 단편적 질문에 대한 답변만을 제공했으나 향후 거대언어모델(LLM) 기반 생성형 AI가 접목되면 인터넷 연결 없이 갤럭시 내 다양한 기능을 이용자친화적이며 개인화한 서비스를 제공할 전망이다.

 

애플 시리는 내년 1월에서 3월 사이 애플 인텔리전스 업데이트와 함께 대대적인 성능 개선이 될 전망이다. 맥루머스 등 외신에 따르면 오는 10월 업데이트 예정인 iOS 18.1에는 애플 인텔리전스의 베타 버전이 처음으로 추가되며 생성형 AI 챗GPT(GPT-4o)와 결합한 iOS 18.2는 12월 출시 가능성이 높다는 분석이다. 최종적으로 애플 인텔리전스가 완성되는 시기는 iOS 18.4가 출시 되는 내년도 1분기 전후로, 시리는 사용자에 따라 더 개인화된 응답을 제공할 수 있게 된다. 단순한 명령-응답을 넘어 맥락에 맞는 대화가 가능해지고, 시리가 아이폰이나 아이패드 화면을 인식할 수 있게 돼 앱을 통한 작업을 요청할 수도 있게 된다.

 

음성AI 비서 개발 경쟁이 치열해지는 데에는 이용자의 일상과 업무를 자동화하고 최적화 할 수 있는 AI 서포트를 통해 자사 기기와 서비스에 이용자를 록인(Lock-In) 할 수 있다는 데에 있다. 이와 더불어 사용자의 일상생활 자체가 거대한 데이터가 되는 만큼 이를 활용할 수도 있다.

 

업계 관계자는 "AI 음성 비서는 캐즘(Chasm) 현상이 여느 기술보다도 길어질 가능성이 있다"며 "음성AI 비서가 갖는 효용성을 시장에 설명할 수 있는 게 성공의 열쇠가 될 것"이라고 설명했다.

 

트위터 페이스북 카카오스토리 Copyright ⓒ 메트로신문 & metroseoul.co.kr