게임 속 "진격!" 외치는 장군 캐릭터의 성난 표정, AI로 손쉽게 구현

넷마블 '3D 휴먼' 기술…음성 톤·감정 학습한 AI가 표정 렌더링
"유저 상호작용도 AI로 구현…이미지 생성으로 콘셉트 아트 제작"

13일 한국콘텐츠진흥원이 개최한 '2024 콘텐츠산업포럼'에서 박성범 넷마블 컴퓨터비전AI 팀장이 자사의 3D휴먼 기술을 설명하는 모습.(한국콘텐츠진흥원 제공)

(서울=뉴스1) 윤주영 기자 = 부드러운 목소리가 나오자 3D로 구현된 여성의 얼굴이 온화한 표정으로 변했다. 반면 중년 남성은 심각한 표정을 지으며 중후한 음성을 읊조렸다.

이런 표정 변화는 인공지능(AI)이 실시간으로 구현했다.

13일 한국콘텐츠진흥원이 개최한 '2024 콘텐츠산업포럼'에서 박성범 넷마블(251270) 컴퓨터비전AI 팀장은 자사의 '3D 휴먼' 구현 기술을 소개했다.

AI가 텍스트뿐 아니라 영상·음성 기반으로 소통하는 '멀티모달' 방식으로 고도화되고 있다. 이에 따라 국내 게임사도 게임 애셋(자산)을 만드는 데 이를 활용하는 중이다.

넷마블의 3D 휴먼 기술은 캐릭터 대사에 어울리는 표정과 립싱크 애니메이션을 구현하는 것이다. 고품질의 3D 그래픽 연출을 자동화하는 게 목표다. 실감 나는 상호작용이 가능한 논 플레이어 캐릭터(NPC)를 구현하는 데 활용될 수 있다.

박 팀장은 "현실 의사소통은 표정과 제스처 등이 가미돼 감정이 드러난다"며 "게임 캐릭터가 이를 구사한다면 보다 '감정'이 담긴 상호작용이 가능해진다"고 설명했다.

넷마블은 대사에서 음성, 감정에 해당하는 요소를 추출한 뒤 데이터화했다. 이를 학습한 AI는 매칭되는 표정 데이터를 출력하는 식이다.

박 팀장은 "기술이 공개된 2021년에는 입을 벌리고 오므리는 수준이었다면 이후 고도화를 거쳐 다양한 입술 모양, 한국어에 적합한 표현 등이 가능해졌다"고 설명했다.

박 팀장은 이런 기술이 '현실적 비용'으로 고품질 결과를 구현하는 데 의의가 있다고 봤다. 기존에는 이런 렌더링을 준비하려면 수십 대 이상의 카메라로 실사 촬영을 해야 했기 때문이다. 제작 비용이 빠듯한 소규모 게임사도 쓸만한 대안이 나온 것이다.

이외에도 생성AI는 이전에는 구현이 불가능했던 게임 문법을 현실화하기도 했다.

이날 인디게임 제작사 반지하게임즈는 자사가 개발 중인 게임 '페이크북'을 소개하기도 했다. 이는 사회관계망서비스(SNS) 콘셉트로 하는데 스토리 진행 방식에 AI의 생성 기능이 적용됐다.

이유원 반지하게임즈 대표는 "페이크북은 유저 선택에 따라 게임 스토리가 다양한 분기로 뻗어나간다"며 "AI가 등장하면서 다양한 인물과 연결된 SNS 특유의 소통을 구현할 수 있게 됐다"고 설명했다.

이어 "이전에는 개발자들이 일일이 선택지에 따른 분기, 출력 결과를 만들어야 했다"며 "AI가 캐릭터 성격에 맞춰 SNS 게시글 작성, 메시지 보내기 등을 구현한다"고 부연했다.

반지하게임즈는 한국어 학습에 강점이 있는 네이버(035420) '하이퍼클로바X'를 활용했다고 공유했다.

이외에도 업계는 이미지 생성 AI가 '콘셉트 아트'를 손쉽게 구현해 개발 의사소통을 효율화한다고 입을 모았다. 원화가가 아니라도 고품질의 게임 맵·캐릭터 초안 등이 작성해 기획 구체화에 도움이 된다는 설명이다.

legomaster@news1.kr