국내 인공지능(AI) 기업들이 손을 안대고도 AI 에이전트(비서)를 부를 수 있는 핸즈프리 기능 등을 속속 추가하고 있다. 글로벌 빅테크들 역시 스마트안경 등 스마트폰을 대체할 새 AI 디바이스 개발에 공을 들이면서 이동 중에도 AI비서를 활용할 수 있는 ‘음성인식 고도화’에 나선 것으로 분석된다.
29일 정보기술(IT) 업계에 따르면 최근 뤼튼테크놀로지스는 ‘나만의 AI’ 서비스에 양방향 음성으로 소통 가능한 ‘통화 모드’를 업데이트했다. 이용자는 이를 통해 스마트폰이 잠겨있어도 AI와 대화할 수 있다. 뤼튼테크놀로지 관계자는 “현재는 일주일에 10분 가량의 한정된 시간 내에서 통화 모드를 사용할 수 있지만 점차 모델을 확대해나갈 것”이라고 설명했다.
뤼튼 뿐만 아니라 카카오(035720)도 이동하면서 손 쉽게 사용할 수 있는 AI 비서를 개발하고 있다. 카카오는 내년 상반기 중 정식 출시할 기업소비자간거래(B2C) 서비스 ‘카나나’에 운동이나 운전 중에 AI 메이트와 대화할 수 있는 핸즈프리 모드를 적용할 예정이다. 동시에 SK텔레콤의 ‘에이닷’과 LG유플러스의 ‘익시오’ 등 이동통신사들도 AI를 차기 성장동력으로 점찍고 AI 비서 운영에 박차를 가하는 모습이다. 향후 AI에이전트 시장이 이동중 사용이 경쟁력을 가르는 요소가 될 것이라는 점에서 단순 핸즈프리 수준 이상의 기술력으로 발전할 수 있다는 기대감도 크다.
실제 글로벌 빅테크들이 스마트안경 등 혁신적인 AI 디바이스에 공을 들이고 있는 것과 같은 맥락이다. 올해 메타가 AI와 대화할 수 있는 스마트안경을 선보인 가운데 구글도 최근 제미나이가 탑재돼 실시간 통역·길 안내 등이 가능한 스마트안경의 프로토타입을 공개했다. 여기에 삼성전자도 내년 초 갤럭시 언팩 행사에서 증강현실(AR) 글라스 시제품을 영상 혹은 이미지 형태로 공개할 것으로 알려졌다. 한 업계 관계자는 “영화 ‘아이언맨’ 속 AI 비서 ‘자비스’처럼 스마트안경을 통해 누구나 손을 대지 않고도 AI 서비스를 이용할 수 있는 시대가 열릴 것이라는 전망이 힘을 얻으면서 글로벌 빅테크들이 주도권을 쥐기 위해 고군분투하는 모습”이라고 설명했다.
동시에 글로벌 빅테크들이 혁신적인 AI 기능들을 내놓고 있어 후발주자인 국내 AI 기업들은 조금이라도 경쟁력 있는 서비스가 절실한 상황이다. 최근 ‘제미나이 2.0’을 공개한 구글은 올해 8월 일찍이 핸즈프리 기능을 입힌 ‘제미나이 라이브’를 선보였다. 향후 구글은 이르면 내년쯤 사람처럼 보고 음성으로 대화하는 AI 비서인 ‘프로젝트 아스트라’도 선보인다는 방침이다.
뿐만 아니라 오픈AI도 최근 ‘챗GPT’의 고급 음성 모드(AVM)에 실시간 영상 이해 모드를 추가했다. 스마트폰 카메라로 사물을 비췄을 때 챗GPT가 이를 실시간으로 분석한 후 답변을 제공하는 기술로, AI 비서 서비스를 위한 필수적인 기능으로 꼽힌다. 예컨대 커피를 만드는 모습을 보여주면 챗GPT가 단계별로 맛있는 커피를 내리는 방법을 설명하는 식이다. 이 외에도 애플도 최근 음성 비서 ‘시리’에 챗GPT를 탑재했고, 큐타이의 음성 AI 비서인 ‘모시’에는 두 개의 오디오 스트림을 동시에 듣고 말하는 기능이 올해 추가됐다.
한편 AI 비서 시장 규모가 나날이 커지고 있어 더 빠른 대응이 필요하다는 목소리도 나온다. 글로벌 시장조사업체 마켓앤마켓에 따르면 2030년 전 세계 AI 비서 시장 규모는 471억 달러(약 67조 원)까지 성장할 전망이다. 일각에서는 2030년 AI 비서 시장 규모가 705억 3000만 달러(약 100조 원)에 달할 것이라는 분석도 있다. IT 업계 관계자는 “스마트안경처럼 AR, 가상현실(VR) 등의 서비스를 제공할 수 있는 기기들이 나오면서 음성으로 AI를 사용하는 것은 필수가 됐다”며 “구글이 신형 AI 모델을 약 10개월 만에 다시 내놓는 등 글로벌 빅테크들의 개발 속도가 점차 빨라지고 있어 국내 기업들도 신속한 대응이 필요하다”고 설명했다.
< 저작권자 ⓒ 서울경제, 무단 전재 및 재배포 금지 >