인공지능(AI) 기술 역량을 강화하고 있는 카카오(035720)가 이미지와 자연어 텍스트를 동시에 처리하는 멀티모달대규모언어모델(MLLM) ‘허니비’를 오픈소스 형태로 공개했다. 자체 개발한 MLLM의 소스 코드를 공개함으로써 개인과 기업들이 고도화할 수 있도록 해 AI 기술 발전에 기여하겠다는 목표다.
카카오의 AI 연구 전문 계열사인 카카오브레인은 자사가 개발한 MLLM 허니비의 소스코드를 깃허브에 공개했다고 19일 밝혔다.
허니비는 이미지와 텍스트 명령어를 입력하면 텍스트로 답변하는 MLLM으로 텍스트로만 입출력하는 자연어 기반 대규모언어모델(LLM)보다 고도화된 모델이다. 자연어는 물론 이미지까지 포함해 질문할 수 있어 이미지에 담긴 장면을 묘사하거나 이미지와 텍스트가 혼합된 콘텐츠에 관한 질문을 이해하고 답변할 수 있다. 예를 들어 허니비에 ‘농구 경기 중인 두 명의 선수’ 이미지와 함께 ‘왼쪽 선수는 몇 번 우승했나요’라는 질문을 영어로 입력하면 허니비가 입력된 이미지 내용과 질문을 종합적으로 이해하고 답변을 생성해낸다.
카카오브레인에 따르면 허니비는 ‘MME’와 ‘MM벤치’ 등의 성능 실험(벤치마크)에서 모델이 공개된 다른 오픈소스 MLLM에 비해 높은 성능을 보인 것으로 나타났다. 특히 지각능력과 인지능력을 평가하는 MME 벤치마크에서는 2800점 만점 중 1977점을 받았다. 카카오브레인은 허니비가 향후 효과적인 교육이나 학습 보조 도구로 사용될 것으로 전망하고 있다.
앞서 2021년 LLM ‘코지피티(koGPT)’를 공개한 카카오는 이를 개선한 ‘코지피티 2.0’ 개발을 완료하고 공개 방식을 검토 중이다. 이와 별개로 MLLM을 오픈소스 형태로 공개한 것에 대해 카카오브레인 측은 “현재 MLLM에 대한 연구는 공개된 모델 수가 적고 학습 방법도 자세히 공개되지 않아 개발이 어려운 상황”이라며 “MLLM의 발전에 기여하겠다는 취지로 공개했다”고 밝혔다.
한편 이날 과학기술정보통신부 주최로 열린 ‘AI 최고위 전략대화’에서는 정신아 카카오 대표 내정자를 비롯해 국내 정보통신기술(ICT) 기업의 최고경영자(CEO)들이 참석해 AI 기술 개발 및 고도화를 위한 국내 기업 간 협력 강화와 함께 정부 차원의 보다 과감한 지원을 요청했다. 정 내정자는 “오픈AI의 챗GPT 열풍을 통해 자국의 자체 언어 모델을 소유해야 한다는 책임감을 느낀다”면서 “AI 시대에는 기업 간 협업이 중요하기 때문에 글로벌로 진출할 수 있는 생태계를 같이 만들어가자”고 제안했다. 최수연 네이버 대표는 “한국은 초거대 AI 관련 기업들이 많아 AI 선진국이 될 가능성 높고 빅테크 공세를 효과적으로 버티면서 지켜온 경쟁력도 있다”며 “네이버뿐 아니라 국내 경쟁력 있는 기업이 AI 시장에서 성장하고 디지털 다양성을 넓힐 수 있도록 실질적인 지원이 필요하다”고 강조했다.
ICT 기업 CEO들은 허니비처럼 적은 비용으로도 서비스를 구동할 수 있는 경량형언어모델(sLLM)이 보편화되고 이를 스마트폰 같은 전자기기에 내장하는 ‘온디바이스 AI’가 대세가 된 ‘AI 에브리웨어(일상화)’ 시대에 대비해야 한다고 입을 모았다. 배경훈 LG AI연구원장은 “곧 메타에서 차세대 오픈소스 모델 ‘라마3’를 발표하고 인프라 투자도 강화한다고 한다”며 “이러한 경쟁 속에 우리만의 강점을 갖추기 위해서 우리 기업에 보호 정책도 필요하고 AI 개발사들을 좀 더 격려하고 지원해 자체적인 경쟁력을 확보해나가는 게 중요하다”고 말했다. 이에 대해 이종호 과기정통부 장관은 “주요국은 이미 기업과 국가가 한 몸이 돼 관련 인프라 조성과 투자를 연계하는 등 노력에 총력을 다하고 있다”면서 “정부에서도 AI 기술 경쟁력 확보를 위해 강한 의지를 갖고 있으며 전력투구하겠다”고 화답했다.
< 저작권자 ⓒ 서울경제, 무단 전재 및 재배포 금지 >