네이버가 생성형 인공지능(AI) 기반의 ‘멀티모달 거대언어모델(LLM)’ 출시 경쟁에 가세했다.
멀티모달 LLM은 텍스트 뿐만 아니라 이미지나 영상 등 다양한 형태의 데이터를 인식하는 생성형 AI모델로, 이미 해외에서는 구글 등이 멀티모달 AI 차별화에 나섰다.
19일 정보기술(IT)업계에 따르면 네이버는 최근 클로바X에 텍스트와 이미지 등을 조합해서 결과물을 내놓는 ‘이미지 멀티 모달 기능’을 추가해 서비스를 시작했다.
그간 네이버는 클로바X에 이미지 멀티모달 기능을 추가해 고도화 하는 방안을 준비해왔다. 최근 멀티모달 AI 경쟁이 치열해진 만큼 타 생성형 AI와 차별성을 높이기 위해서다.
다만 기자가 직접 사용해 보니, 이미지를 활용한 결과값을 도출해내기는 했지만 ‘제한적’으로 이뤄져 아쉬움을 남겼다.
기자가 클로바X에 네이버 사옥 이미지를 업로드 하고 사옥을 영역으로 설정한 뒤 “건물색을 바꿔달라”고 대화창에 입력하자, 건물 색이 자동으로 하늘색으로 바뀌었다. AI가 만든 ‘네이버 사옥 이미지’가 완성됐다.
아울러 사옥 배경 부분을 영역으로 설정한 뒤 “붉은 노을이 지는 하늘로 만들어달라”고 대화창에 입력하자, 노을이 지는 하늘로 배경이 변경돼 또다른 AI이미지가 만들어졌다.
다만 인물사진 등에는 멀티모달 서비스가 제공되지 않아 클로바X에서 활용가능한 사진은 제한적이었다.
최근 멀티모달 AI 경쟁이 치열해진만큼 네이버의 멀티모달 서비스도 고도화될 전망이다. 지난 6일(현지시간) 구글은 멀티모달 AI인 ‘제미나이’(Gemini)를 공개했다. 오픈AI의 'GPT-4'도 텍스트는 물론 이미지까지 다양한 데이터를 인식하는 멀티모달 모델이다.
< 저작권자 ⓒ 서울경제, 무단 전재 및 재배포 금지 >