한국말 어색했던 챗GPT…"마, 좋심더" 사투리도 척척

오픈AI, 챗GPT 음성 기능 강화한 '고급 음성 모드' 출시

샘 올트먼 오픈 AI 전 최고경영자(CEO)가 6일(현지시간) 미국 캘리포니아주 샌프란시스코에서 열린 오픈 AI 개발자 콘퍼런스에서 발표하고 있다. 2023.11.06 ⓒ AFP=뉴스1 ⓒ News1 정지윤 기자

(서울=뉴스1) 김승준 기자 = 한국어는 어색했던 챗GPT의 음성 기능이 자연스러워진다.

25일 업계에 따르면 오픈AI가 음성 인식 기능을 강화한 '고급 음성 모드'(Advanced Voice Mode)를 출시했다. 고급 음성 모드에서는 한국어, 일본어, 영어 등 50개 언어 처리 능력이 개선됐다.

오픈AI는 이번 주부터 챗GPT 일부 유료 구독자를 시작으로 순차적으로 고급 음성 모드를 제공한다고 발표했다.

오픈AI는 5월 GPT-4o를 공개하며 챗GPT에 음성 기능을 선보였다. 영어 기능 시연에서는 사람 말 중간에 끼어들고 발음도 정확해 사람 같다는 평을 받았다. 다만 출시 후에 한국어, 일본어 등 일부 언어는 발음이 어색하다는 고객 반응이 나오기도 했다.

오픈AI는 "고급 음성 기능에는 새로운 음성 5개가 추가됐고 발음, 억양 성능이 강화됐다"며 "(한국어, 일본어 등 일부 언어에) 대화 속도와 매끄러움, 억양 등이 개선됐다"고 설명했다.

여러 언어 사용자의 피드백을 통한 개선으로 각 언어의 사투리 인식 성능도 향상된 것으로 알려졌다.

이번에 5개의 음성이 추가되며 이용자는 9개 목소리 중 하나를 골라 챗GPT와 대화할 수 있게 된다.

유료 이용자들은 고급 음성 모드를 사용할 수 있게 되면 애플리케이션(앱) 내에 알림창으로 안내를 받을 수 있다.

한편 지난 몇 년간 거대 언어 모델(LLM) 경쟁을 벌였던 빅테크의 인공지능(AI) 경쟁이 음성 AI 비서와 같은 서비스 경쟁으로 확장되고 있다.

LLM과 기존 AI 비서를 결합해 사람처럼 반응하며 다양한 업무를 할 수 있도록 발전하고 있다.

구글은 5월 '제미나이 라이브'를 공개했다. AI와의 대화로 여행 계획을 짜거나 시청한 유튜브 영상에 나온 제품을 AI에 물어보고 답을 받는 등 향상된 음성 AI 기능을 선보였다.

애플도 향후 시리(Siri) 성능 개선을 예고했고 메타 역시 관련 서비스를 준비 중인 것으로 알려졌다.

seungjun241@news1.kr