카카오가 자체 개발한 인공지능(AI) 모델 ‘카나나’가 오픈AI의 챗GPT와 함께 전면 개편된 카카오톡의 핵심 축으로 떠올랐다. 카나나는 외부 서버가 아닌 스마트폰 내에서 구동하는 온디바이스(on-device) AI로 개인정보의 외부 전송 우려를 차단하면서도 챗GPT에 버금가는 성능으로 카카오톡의 이용 편의성을 높이는 역할을 맡는다.
정신아 카카오톡 대표는 23일 카카오톡의 전면 개편을 발표하며 “카나나는 AI 기술과 서비스 전반을 포함하는 카카오의 AI 기술”이라며 “5000만 카카오톡 이용자의 일상 곳곳에 스며들 것”이라고 말했다.
카카오는 카나나를 카카오톡과 결합해 통화 내용 요약과 이용자에게 먼저 ‘선톡’하는 양방향 소통을 구현했다. 카나나는 읽지 못한 대화를 요약하거나 긴 보이스톡 통화를 간략하게 정리한다. 그동안 대화창에서 ‘샵(#)’을 붙여 검색하던 샵검색은 카나나 기반 생성형 AI 검색으로 바뀐다.
카나나는 이용자가 요청하지 않아도 놓치면 안 되는 할 일이나 생활에 도움이 되는 정보를 먼저 제안한다. 예를 들어 “토요일은 어머니 생일, 선물 추천드려요”와 같은 제안을 보낸다.
카카오는 카나나가 범용 AI와 달리 한국어의 뉘앙스를 잘 이해해 복잡한 다자간 대화에서도 맥락을 감지하고 적절한 에이전트를 빠르게 실행한다고 설명했다. 예를 들어 넷플릭스 시리즈 ‘폭싹 속았수다’ 포스터를 인식시키면 카나나는 텍스트와 음성으로 “이 이미지는 넷플릭스 시리즈 ‘폭싹 속았수다’의 포스터예요”라며 “제주도의 풍경과 가족, 사랑, 우정 이야기를 담아 많은 분들에게 감동을 준 작품”이라고 답한다. 김병학 카나나 성과 리더는 “카나나는 한국어와 한국 문화에 특화돼 제주도 사투리도 정확하게 인식하고 내용을 설명한다”고 말했다.
프라이버시 보호도 강조했다. 카카오는 스마트폰 안에서만 작동하는 ‘카나나 나노’ 모델을 기반으로 온디바이스 AI를 구현했다. 카카오톡 대화 내용은 학습에 쓰지 않고 서버에도 저장하지 않는다. 보이스톡 녹음본은 요약 직후 삭제한다. 민감 데이터를 서버로 전송하지 않고 네트워크 연결 없이도 AI를 구현한다는 설명이다. 정신아 대표는 “온디바이스 카나나 나노는 1.3B 규모로 와이파이 환경에서 18초 만에 다운로드할 수 있다”며 “AI의 문턱을 낮추되 개인정보 보호는 철저히 지키겠다”고 말했다.
카카오에 따르면 음성 인식 모델 ‘카나나-카브(Kanana-Karve)’는 통화 녹음 기능에 적용된다. 이 모델은 최대 30분 통화를 10초 안에 텍스트로 변환한다. 오픈AI의 GPT-4o mini와 비교해 정확도는 105%이며 처리 비용은 2% 수준이라는 설명이다.
통합 멀티모달 언어 모델 ‘카나나-o’는 숏폼 추천을 위한 비디오 분석에 적용됐다. 이 모델은 오디오와 비주얼 정보를 동시에 분석해 1.4초 만에 추천 키워드와 요약 등을 생성한다.
한편 카카오는 이번 개편에서 채팅탭 상단에 ‘ChatGPT’를 눌러 오픈AI의 생성형 AI 서비스 챗지피티를 사용할 수 있도록 했다. 챗지피티로 주고 받은 대화와 생성된 콘텐츠를 채팅방에 바로 공유할 수 있다. 탑재된 챗지피티는 오픈AI의 최신 모델 ‘GPT-5’로 텍스트와 이미지 처리·생성, 고도화된 맥락 인지 능력을 갖췄다. 기존 챗지피티 유료 회원은 카톡에서도 유료 버전을 계속 이용할 수 있다.
< 저작권자 ⓒ 서울경제, 무단 전재 및 재배포 금지 >