사투리도 실시간 번역하는 AI…음성 번역 '딥엘 보이스' 첫 공개
대면 대화·화상회의용 2개 모델로 개발…13개국 언어 지원
차세대 LLM에 한국어 추가...영어·일본어와 조합해 사용 가능
- 신은빈 기자
(서울=뉴스1) 신은빈 기자 = 방언과 억양 같은 미세한 음성 특성까지 실시간으로 번역해 주는 인공지능(AI) 기술이 공개됐다. 다국적 이용자들이 대면 대화나 화상회의에서 각자 모국어로도 명확하게 소통할 수 있게 됐다.
독일의 언어 인공지능(AI) 기업 딥엘(DeepL)은 28일 서울 용산구 그랜드 하얏트 서울에서 간담회를 열고 첫 실시간 음성 번역 설루션 '딥엘 보이스'를 선보였다. 딥엘 보이스는 음성을 텍스트로 번역해 주는 기업용 서비스로, 딥엘의 첫 음성 번역 시도다.
가장 눈에 띄는 점은 시중의 번역 서비스와 달리 방언, 말투, 발화 속도, 어감을 모두 인식한다는 점이다. 발화자의 특징과 무관하게 내용을 정확히 이해하고 번역해 준다.
번역 품질을 텍스트 번역기 수준과 동일하게 끌어올린 점도 특징이다. 실시간 음성 번역 서비스인 만큼 문장이 끝나기 전에 자막을 제공할지, 의미를 완전히 파악한 후 번역할지 상황에 맞게 맥락을 판단한다.
야렉 쿠틸로브스키 딥엘 최고경영자(CEO)는 "기업용 실시간 회의 번역 서비스는 속도가 가장 중요하다"며 "빠르게 정확한 대화 맥락을 반영하고자 시간이 오래 걸리는 음성 통역보다 자막 번역 방식을 채택했다"고 설명했다.
이번 신제품은 비대면 화상회의에 맞춘 '보이스 포 미팅'과 대면 회의용 '보이스 포 컨버세이션' 2개 모델로 출시된다.
보이스 포 미팅은 마이크로소프트(MS)의 화상회의 플랫폼 팀즈에서 사용할 수 있다. 내년쯤 다른 회의 플랫폼에도 이 서비스를 적용할 계획이다. 회의 참석자들은 각자 선호하는 언어로 말하고 실시간 번역 자막으로 내용을 확인할 수 있다.
이날 간담회에서는 크리스토퍼 오즈번 딥엘 제품 담당 부사장이 딥엘 보이스 활용 방법을 설명했다. 시연 영상에서 한 참가자가 한국어로 발화하자 영어로 자막이 나왔고 영어, 러시아어 발화자가 말하자 모두 한국어 자막으로 표시됐다.
보이스 포 컨버세이션은 기업 직원과 고객의 1대 1 대면 대화를 돕는 모바일 설루션이다. 2가지 보기 모드로 자막 번역이 제공돼 하나의 기기에서 두 사람이 동시에 번역 내용을 확인할 수 있다.
딥엘 보이스의 음성 번역은 한국어, 영어, 일본어, 독일어 등 13개국 언어를 지원하며 추후 지원 대상을 확대할 예정이다. 실시간 자막 번역에는 텍스트를 변환하는 딥엘 번역기가 지원하는 33개국 언어가 모두 적용된다.
딥엘은 이날 딥엘 번역기의 차세대 거대언어모델(LLM)에 한국어 서비스를 추가한다는 사실도 함께 알렸다. 올해 7월 출시한 차세대 LLM은 번역용으로 특별히 설계된 모델이다.
쿠틸로브스키 CEO는 "번역을 위해 수집한 독점 데이터와 언어 전문가의 모델 튜터링을 적용했다"며 "영어와 일본어에 이어 한국어까지 추가해 향상된 품질의 기업용 번역 서비스를 제공할 계획"이라고 말했다.
bean@news1.kr
Copyright ⓒ 뉴스1. All rights reserved. 무단 전재 및 재배포, AI학습 이용금지.