마이크로소프트(MS)와 오픈AI가 ‘음성 인공지능(AI)’ 강화에 나섰다. ‘음성 비서’를 일반 소비자 대상 AI 서비스 격전지로 보고 사용성·생태계 강화에 힘쓰는 구도다.
1일(현지 시간) MS는 AI 서비스 ‘코파일럿’에 음성 대화와 시각 인식 기능을 추가했다고 밝혔다. 코파일럿 보이스를 사용해 자연스러운 음성 문답이 가능하고, 음성으로 아침 뉴스와 날씨를 요약해주기도 한다. 음성 대화 서비스는 미국과 캐나다, 영국, 호주, 뉴질랜드 등 영미권에서 영어로 우선 제공된다.
또 유료 구독자들에게는 AI가 웹페이지의 문서나 사진을 파악하는 코파일럿 비전 기능과 ‘추론’ 능력을 제공한다. MS와 협력관계인 오픈AI의 최신 AI GPT-4o의 멀티모달과 ‘오픈AI o1’의 추론 기능을 담은 것이다.
이번 코파일럿 업데이트는 MS가 지난 3월 영입한 구글 딥마인드 공동 창업자 무스타파 술레이만이 이끌었다. 그는 이날 블로그 게시물을 통해 “코파일럿은 당신을 대신해 삶의 복잡성을 완화하고 중요한 일에 더 많은 시간을 집중하게 해줄 것”이라고 밝혔다.
같은날 오픈AI는 외부 앱 개발자들이 GPT-4o의 음성 대화 기능을 쉽게 활용할 수 있도록 하는 실시간·대화완성 앱 인터페이스(API)를 공개했다. 챗GPT가 아닌 타 앱에도 손쉽게 오픈AI 음성 비서를 적용할 수 있도록 하는 도구다. 과거 외부 앱 개발사가 챗GPT 음성 대화를 활용하기 위해서는 음성을 문자로 변환해 AI로 처리한 후 다시 음성으로 변환하는 복잡한 과정이 필요해 소요 자원과 시간이 컸으나, 새 API 공개로 이 과정을 생략할 수 있게 됐다.
< 저작권자 ⓒ 서울경제, 무단 전재 및 재배포 금지 >