음성인식 API는 스마트폰을 통해 인식한 한국어 음성을 문자로 자동 변환하는 기능이다. 지난 2012년 말 다음이 인수한 음성인식 전문기업 ‘다이알로이드’의 기술로 제작됐으며, 단순한 키워드 인식을 넘어 연속 문장까지 높은 음성 인식률을 자랑한다. 현재 KT의 음성인식 큐레이션 서비스 ‘매직보이스’와 다음 애플리케이션 ‘음성댓글’ 서비스에 적용돼 있다.
또 이 기술은 네 가지 종류의 음성 인식 기능을 제공한다. 단어 기반의 웹 검색을 위한 ‘키워드형’과 지도상의 위치 설명 문장을 더 빠르게 인식하는 ‘지도형’, 일반적인 문장과 대화에 유리한 ‘연속형’, 단어 집합 단위로 음성 인식을 수행하는 ‘단어인식형’ 등이다. 특히 단어인식형이란 사용자가 인식되기를 원하는 단어들의 집합을 미리 정해 그 범위 안에서 음성 인식을 수행하는 방식이다.
다음의 음성인식 API는 안드로이드와 아이폰 앱 개발자 모두 사용할 수 있으며, 다음 개발자 네트워크(http://dna.daum.net)의 ‘제휴신청’을 통해 무료로 발급 받을 수 있다. 이상호 다음 검색 부문 부사장은 “모바일 앱 개발자들이 다음이 제공하는 음성 인식 기능을 이용해 더욱 가치있는 모바일 서비스를 만들 수 있을 것으로 기대한다”며 “앞으로 다음 검색 등 부가 서비스와 연계한 기능을 지속적으로 추가해 나갈 계획”이라고 말했다.
< 저작권자 ⓒ 서울경제, 무단 전재 및 재배포 금지 >