한국말 어색했던 챗GPT…"마, 좋심더" 사투리도 척척
오픈AI, 챗GPT 음성 기능 강화한 '고급 음성 모드' 출시
- 김승준 기자
(서울=뉴스1) 김승준 기자 = 한국어는 어색했던 챗GPT의 음성 기능이 자연스러워진다.
25일 업계에 따르면 오픈AI가 음성 인식 기능을 강화한 '고급 음성 모드'(Advanced Voice Mode)를 출시했다. 고급 음성 모드에서는 한국어, 일본어, 영어 등 50개 언어 처리 능력이 개선됐다.
오픈AI는 이번 주부터 챗GPT 일부 유료 구독자를 시작으로 순차적으로 고급 음성 모드를 제공한다고 발표했다.
오픈AI는 5월 GPT-4o를 공개하며 챗GPT에 음성 기능을 선보였다. 영어 기능 시연에서는 사람 말 중간에 끼어들고 발음도 정확해 사람 같다는 평을 받았다. 다만 출시 후에 한국어, 일본어 등 일부 언어는 발음이 어색하다는 고객 반응이 나오기도 했다.
오픈AI는 "고급 음성 기능에는 새로운 음성 5개가 추가됐고 발음, 억양 성능이 강화됐다"며 "(한국어, 일본어 등 일부 언어에) 대화 속도와 매끄러움, 억양 등이 개선됐다"고 설명했다.
여러 언어 사용자의 피드백을 통한 개선으로 각 언어의 사투리 인식 성능도 향상된 것으로 알려졌다.
이번에 5개의 음성이 추가되며 이용자는 9개 목소리 중 하나를 골라 챗GPT와 대화할 수 있게 된다.
유료 이용자들은 고급 음성 모드를 사용할 수 있게 되면 애플리케이션(앱) 내에 알림창으로 안내를 받을 수 있다.
한편 지난 몇 년간 거대 언어 모델(LLM) 경쟁을 벌였던 빅테크의 인공지능(AI) 경쟁이 음성 AI 비서와 같은 서비스 경쟁으로 확장되고 있다.
LLM과 기존 AI 비서를 결합해 사람처럼 반응하며 다양한 업무를 할 수 있도록 발전하고 있다.
구글은 5월 '제미나이 라이브'를 공개했다. AI와의 대화로 여행 계획을 짜거나 시청한 유튜브 영상에 나온 제품을 AI에 물어보고 답을 받는 등 향상된 음성 AI 기능을 선보였다.
애플도 향후 시리(Siri) 성능 개선을 예고했고 메타 역시 관련 서비스를 준비 중인 것으로 알려졌다.
seungjun241@news1.kr
Copyright ⓒ 뉴스1. All rights reserved. 무단 전재 및 재배포, AI학습 이용금지.