기사최종편집일 2025-01-22 19:00
게임

음성 AI 발전 속도, 정말 빠르다! 수퍼톤 신기술 2종 체험해보니 [지스타 2023]

기사입력 2023.11.19 12:30


(엑스포츠뉴스 부산, 임재형 기자) 현재 IT업계는 'AI 시대'에 접어들었다. 게임업계부터 엔터테인먼트사까지 다양한 분야에서 AI 기술이 사용되고 있으며, 음성 파트도 마찬가지다. 지난 2020년 설립된 수퍼톤은 '음성 AI' 분야에서 한국을 대표하는 기업이다. '낸시' 프레임워크를 기반으로 독자 기술을 보유한 수퍼톤은 지난 1월 하이브의 자회사로 편입돼 '음악과 기술의 융합'이라는 중장기 성장 전략의 한 축으로 자리매김했다.

수퍼톤은 16일~18일까지 부산 해운대구 백스코에서 열리는 국제 게임 전시회 '지스타 2023'의 B2B 부스에 참가해 신기술 2종을 출품했다. 이번에 선보인 신기술은 게임 캐릭터의 대사를 자연스러운 오디오로 생성할 수 있는 '프로젝트 스크린 플레이(이하 스크린 플레이)'와, 게임 유저가 특정 캐릭터의 목소리로 다른 유저와 실시간 대화를 나눌 수 있는 '프로젝트 시프트(이하 시프트)'다.


▲TTS(텍스트 투 스피치) 기반의 '스크린 플레이'... 제작은 쉽게, 결과물은 정교하게


2024년 중 출시 예정인 '스크린 플레이'는 TTS(텍스트 투 스피치) 기술을 기반으로 한 오디오 생성 소프트웨어다. 다양한 게임 캐릭터의 목소리를 쉽고 빠르게 디자인할 수 있도록 도울 수 있는 만큼 '게임 개발' 속도를 크게 높일 수 있을 것으로 전망된다. 실제로 '스크린 플레이'를 경험해보니, 속도도 상당히 빠르지만 정교한 퀄리티가 매우 인상적이었다.

이처럼 풍부한 감정표현을 목소리에 담을 수 있는 이유는 무엇일까. 수퍼톤 측은 "실제 사람의 발화 스타일을 AI로 학습시켰다. 이에 수퍼톤 고유의 TTS 기술을 기반으로 위화감 없는 자연스러운 목소리가 생성된다"고 설명했다. AI가 음성, 음색과 관련해 정확한 포인트를 짚어내는 만큼 사용자의 연출 의도에 맞게 최적화된 오디오 생성이 가능하다.

'스크린 플레이'는 인터페이스가 직관적이기 때문에 처음 접하는 이용자도 손쉽게 목소리를 구현할 수 있다. 한 소프트웨어 안에서 대본 작성, 음성 조정, 캐릭터 변경, 음성 연기 가이드 제공 등 다양한 기능을 모두 사용할 수 있다. 완성된 음성을 바로 추출해 게임에 빠르게 적용할 수 있는 것도 '스크린 플레이'의 강점 중 하나다. 모든 과정은 메모를 남겨 팀과 효율적인 작업 환경을 도모할 수 있다.

'스크린 플레이'의 사용 범위는 매우 넓다. 수퍼톤 측은 "게임에 더해 팟캐스트, 유튜브 등 목소리가 필요한 콘텐츠에는 모두 사용 가능하다"고 알렸다. 최근 동영상 콘텐츠에는 녹음된 음성이 필요한 경우가 많은데, '스크린 플레이'를 이용하면 콘텐츠 전달 품질을 상당히 높일 수 있게 된다.


▲건장한 남성 목소리가 가냘픈 여성으로? '시프트'에 푹 빠진 관람객들


'스크린 플레이'가 콘텐츠 개발에 도움을 주는 '사무적' 특색이 강하다면, 수퍼톤이 함께 선보인 '시프트'는 톡톡튀는 모습으로 관람객을 찾았다. 현장을 찾았을때 '시프트' 시연에는 많은 관람객이 몰려 있었다. 중후한 목소리의 남성 시연자가 여성 캐릭터로 송출 환경을 변경하자, 어울리지 않은 하이톤의 목소리에 지켜보던 사람들은 함박 미소를 지었다.

'시프트'는 음성을 실시간으로 변화하는 'RTVC(리얼-타임 보이스 컨버젼)' 기술에 기반하고 있다. 오는 2024년 중 출시가 예정돼 있다. 처음 시연을 시작한 사용자는 '시프트'가 제공하는 문장을 읽으면 된다. '시프트'는 문장 내 목소리 구성 요소들을 다양하게 조합해 해당 유저에게 맞는 환경을 구성한다. 원하는 캐릭터 목소리가 자연스럽게 사용자의 보이스와 결합돼 송출된다. 유저의 성문은 분석이 끝나면 저장되지 않고 즉시 삭제된다.

수퍼톤 측은 '시프트'의 사용 범위를 게임 영역에 더해 아티스트의 공연, 발표자의 강연 등 "특정 목소리가 필요한 어느곳에나 활용될 수 있다"고 밝혔다. 최근 방송 업계의 트렌드 중 하나로 떠오르고 있는 '버튜버'도 '시프트' 기술을 사용하면 캐릭터에 딱 들어맞는 목소리를 송출할 수 있을 것으로 전망된다. 아울러 전문 방송인도 목소리의 정체성을 유지하면서 약점을 보완할 수 있기 때문에 '시프트'의 혜택을 받을 것으로 예측된다.

이교구 수퍼톤 대표는 '지스타 2023'의 출품에 앞서 “게임에 등장하는 다양한 캐릭터들에게 생동감을 부여하고, 음성을 통한 상호 작용을 가능하게 함으로써 게임 유저뿐만 아니라 게임 창작자와 개발자들에게도 새로운 지평을 열어줄 것이다"고 강조한 바 있다. 수퍼톤의 음성 AI 기술이 향후 게임업계의 개발 환경에 어떤 영향을 미치게 될지 관심이 모아진다.

사진=수퍼톤 제공, 엑스포츠뉴스 임재형 기자

임재형 기자 lisco@xportsnews.com

ⓒ 엑스포츠뉴스 / 무단전재 및 재배포 금지


실시간 인기 기사

연예
스포츠
게임

주간 인기 기사

연예
스포츠
게임