오픈AI가 인공지능(AI) 챗봇 ‘챗GPT’의 한국어 음성 표현 능력을 실제 한국인 수준으로 더욱 개선하면서 음성 AI 비서 시장의 주도권 선점에 나섰다. 일상 생활에 AI를 침투시켜 구독을 통한 유료화를 자연스럽게 유도할 것으로 예상되는 가운데 빅테크 간 음성 AI 비서 개발 경쟁이 불붙는 모습이다.
오픈AI는 24일(현지 시간) 한국어를 비롯해 영어 외에 50개 언어의 사용을 개선한 챗GPT의 ‘어드밴스드 보이스 모델(음성 모드)’을 출시한다고 밝혔다. 5월 실시간 음성 대화 기능을 추가해 업그레이드한 챗GPT-4o(포오)의 음성 기능을 개선한 모델이다.
기존 챗GPT-4o는 한국어 대화가 가능하긴 했지만 마치 외국인이 말하는 것처럼 어색하다는 지적이 있었다. 이번에 업그레이드된 모델은 실제 한국인 수준으로 언어 능력을 끌어올렸다. 오픈AI는 발표에 하루 앞선 23일 향상된 챗GPT 음성 기능을 시연했다. “한국어로 너를 소개해줘”라고 주문하자 “안녕하세요. 저는 챗GPT라고 해요”라고 답했다. 애교를 넣어달라고 하자 “안녕, 나는 챗GPT야”라며 애교 섞인 목소리를 냈다. 표준어와 다른 억양의 사투리도 더욱 잘 이해할 수 있다고 오픈AI는 설명했다. 욕설은 하지 않도록 설계됐고 말투는 더욱 부드러워졌다. 챗GPT의 목소리 종류도 기존 4개에서 5개가 더 늘었다. 업데이트된 챗GPT는 ‘챗GPT 플러스’ 등 유료가입 모델부터 적용될 예정이다.
챗GPT의 성능 고도화와 함께 글로벌 음성 AI 비서 시장은 더욱 뜨거워질 전망이다. 글로벌 시장조사기관 포춘비즈니스인사이트에 따르면 지난해 126억 2000만 달러(약 16조 8000억 원)인 음성 인식 시장 규모는 연평균 23.7%씩 성장해 2032년에 849억 7000만 달러(약 113조 3000억 원)에 이를 전망이다.
생성형 AI 시장에서 챗GPT를 맹추격 중인 구글은 5월 음성 AI 비서 서비스인 ‘제미나이 라이브’를 공개했다. 제미나이 라이브는 여행 계획을 짜달라거나 사진 설명을 만들어달라는 등 다양한 요청을 자연스러운 음성 응답과 함께 제공했다. 구글은 최근 유료 가입자를 대상으로 서비스했던 제미나이 라이브를 무료로 전환하면서 이용자 확대에 승부수를 던졌다. 아직 안드로이드·영어로만 서비스를 이용할 수 있지만 순차적으로 다른 언어까지 적용 대상을 확대할 방침이다.
에릭 슈미트 구글 전 최고경영자(CEO) 등이 투자한 프랑스의 비영리 AI 연구소 큐타이는 인간 감정을 이해하는 음성 비서 ‘모시’를 7월 공개했다. 공개된 모델은 70가지 감정과 스타일로 인간처럼 대화할 수 있는 게 특징이다. 아마존은 내달 AI 비서 ‘알렉사’의 음성 성능을 고도화한 버전을 선보이고 유료 서비스로 전환하는 방안을 검토 중이다.
국내에서는 SK텔레콤(017670)이 AI 비서 ‘에이닷(A.)’을 앞세워 글로벌 시장 추격에 나서고 있다. 최근에는 미국의 AI 기업 퍼플렉시티와 함께 ‘개인 AI 에이전트’ 전략을 공개했다. 순차적인 기능 개선을 통해 AI 에이전트가 주체적으로 업무를 제안하고 설계하는 ‘창의적 업무 수행’까지 도달하는 게 목표다. 삼성전자(005930) ‘빅스비’와 LG유플러스(032640)의 ‘익시오’ 등도 기능 고도화에 집중하고 있다.
생성형 AI의 수익화 전략을 고민 중인 글로벌 빅테크들은 생활에 밀접하게 파고드는 음성 AI 비서를 통해 유료화의 저변을 확대할 수 있을 것으로 기대한다. 업계의 한 관계자는 “AI가 일상 속으로 스며들려면 이용자들과 자연스럽게 대화할 수 있는 성능이 중요하다”면서 “AI 스피커를 넘어 새로운 디바이스와 시장이 생겨날 것”이라고 말했다.
< 저작권자 ⓒ 서울경제, 무단 전재 및 재배포 금지 >