한국전자통신연구원(ETRI)은 인물 사진 한 장만으로 실제 사람처럼 자연스럽게 말하는 ‘초실사 인공지능(AI) 아바타’ 생성 기술을 개발했다고 16일 밝혔다.
기존 음성 기반의 AI 비서가 단순한 명령 수행에 그쳤다면 초실사 AI 아바타는 정교한 표정과 입 모양 표현을 통해 실제 사람과 같은 자연스러운 대화가 가능하다. 이를 통해 자율주행차, 키오스크, 은행 창구, 뉴스 진행, 광고 모델 등 디지털휴먼(가상인간) 산업 전반에 확산될 수 있을 것으로 ETRI는 기대했다.
신기술의 핵심은 기존 생성형 AI와 달리 입술, 턱 등 발화와 직접 연관된 부위를 선별적으로 학습·합성하는 알고리즘이다. 불필요한 정보 학습을 줄이는 한편 입 모양, 치아, 피부 주름 등 세밀한 얼굴 표현을 더욱 정교하게 구현할 수 있다는 설명이다. ETRI는 이 기술이 CVPR, AAAI 등 국제 주요 학술대회 발표 기술들보다도 합성 화질과 입술 동기화 성능에서 우수한 결과를 얻었다고 전했다.
ETRI는 후속 연구로 주문, 상담 등 인력을 대체 가능한 수준으로 기술을 고도화한다는 방침이다. 윤대섭 ETRI 모빌리티UX연구실장은 “모빌리티 기술이 고도화될수록 노인이나 사회적 약자들이 소외될 수 있다”며 “초실사 AI 아바타 생성 기술이 디지털 리터러시 향상에 기여하고, 모두가 쉽게 이용할 수 있는 스마트 모빌리티 서비스로 발전하길 기대한다”고 말했다.
< 저작권자 ⓒ 서울경제, 무단 전재 및 재배포 금지 >