카카오가 텍스트를 동영상으로 만들어주는 새로운 인공지능(AI) 기술을 공개했다. 챗GPT를 둘러싸고 빅테크 간 AI 경쟁이 격화하고 있는 가운데 국내 테크기업들도 경쟁력을 키우기 위해 고난도 신기술 확보에 적극적으로 나서는 모습이다.
14일 정보기술 업계에 따르면 카카오의 AI 전문 자회사 카카오브레인은 이달 9일(현지시간) 세계 최고 권위의 AI학회인 ‘전미인공지능학회(AAAI)’에서 최성준 고려대 인공지능학과 교수 연구팀과 공동 개발한 텍스트 투 모션(text to motion·텍스트를 동작으로 바꿔주는) AI ‘플레임(FLAME)’에 관한 논문을 구두 발표했다. 구두 발표는 AAAI가 높은 평가를 내린 논문을 선정해 이뤄진다.
플레임은 초거대 AI를 활용해 이용자가 명령어를 입력하면 그에 맞는 동작을 가상인간을 통해 구현해준다. 가령 ‘오른발로 발차기하는 사람’을 입력하면 화면 속 가상인간이 실제로 오른발을 들어 발차기를 한다. 복잡한 문장을 입력해도 완성도 높은 동작을 만들어낸다고 회사는 설명했다. 김일두 카카오브레인 대표는 “플레임은 게임, 애니메이션, 영화 등 모션 그래픽 제작이 필요한 영역에서 작업 자동화와 업무 효율성 증진에 큰 기여를 할 것”이라고 말했다.
플레임을 포함하는 텍스트를 동영상으로 바꿔주는 ‘텍스트 투 비디오’ AI는 세계적으로도 아직 상용화되지 못한 기술인 만큼 카카오브레인도 시장 선점을 노려볼 수 있다. 지난해 하반기 메타가 ‘메이크 어 비디오’, 구글이 ‘이매진 비디오’라는 자체 AI를 공개한 바 있다. 플레임을 공동 개발한 최 교수는 “여러 기업들이 텍스트 기반의 비디오 생성에 집중하고 있다”며 “차별화된 연구 결과를 만들겠다”고 말했다.
카카오브레인은 한국어 모델 ‘코(Ko)GPT’, 텍스트-이미지 멀티모델 ‘칼로(Karlo)’에 이어 플레임 개발을 통해 초거대 AI 경쟁력을 한층 더 키울 전망이다. 특히 오픈AI의 챗GPT와 네비어의 하이퍼클로바 등에 크게 밀리는 언어 모델보다는 이미지·동영상 같은 멀티미디어 영역에서 승부를 펼치려는 모습이다. 칼로를 활용한 이미지 생성 애플리케이션 ‘비 디스커버’는 지난해 10월 상용화된 데 이어 올해 1·4분기 전문가용 유료 버전 출시를 앞두고 있다. 카카오톡 프로필과 배경화면 제작에도 칼로가 도입된다. 코GPT는 AI 비서와 마케팅 도구 같은 버티컬 서비스로 연내 상용화된다.
< 저작권자 ⓒ 서울경제, 무단 전재 및 재배포 금지 >