SK텔레콤(017670)의 ‘AI통화녹음’ 기능은 음성 내용을 자동으로 글로 풀어준다는 점에서 매우 매력적이다. 기존 T전화 자동 통화녹음에 음성 인식(Speech to Text·STT)을 덧붙인 것으로 취재기자에게는 그야말로 ‘잇템’으로 보였다. 결론적으로 통화부터 녹음, 문자 변환까지 별도 조작 없이 자연스럽게 이뤄져 매우 편했다. 기자처럼 전화 통화를 많이하면서 녹음이 필요한 직종이라면 활용도가 높아 보였다. 다만 아직 베타 테스트 중이어서 음성 인식 성능이 떨어지는 순간도 많았다. 정식 출시에 앞서 개선이 필요한 부분이다.
SK텔레콤은 지난 달 23일부터 AI통화녹음 베타 서비스를 시작했다. T전화 앱 이용자라면 설정 메뉴에서 참가 신청해 즉시 사용할 수 있다. T전화 앱은 설정에 따라 선택한 일부 통화, 또는 모든 통화를 자동 녹음해준다. AI통화녹음은 이렇게 녹음한 음성을 클라우드상에서 문자화 해 앱 내에서 확인할 수 있게 한다.
가장 인상적인 점은 이용자경험(UX)이다. AI통화녹음은 네이버 클로바노트 등 다른 STT와 달리 음성인식 결과를 메신저 대화창처럼 보여준다. 마치 카카오(035720)톡으로 휴대전화에 저장된 상대의 이름을 보며 채팅하는 느낌이다. 직관적으로 대화가 구분 돼 파악이 쉽다. 음성 소스인 ‘통화’가 2인 간 대화라는 점을 활용한 UI다.
통화·녹음·클라우드·문자화까지 이어지는 자연스러운 연계도 장점이다. 한 번 설정을 해놓으면 녹음 파일을 선택해 문자화하는 번거로운 작업이 필요 없다. 대부분 전화를 마친 후 수 초 내에 문자화 된 결과물을 확인할 수 있었다. AI 분석을 통해 통화 중 말한 전화번호나 일정, 계좌번호 등 키워드를 추출해주기도 한다. 기존 STT에서는 찾아볼 수 없는 기능이다.
단점도 있었다. 일상 대화 변환은 자연스럽지만 인명·지명·전문용어 등은 제대로 인식하지 못하는 경우가 많았다. ‘휴가’를 ‘휴강’으로 인식하거나, ‘장관님’을 ‘장모님’으로 변환하기도 했다. 통화 당사자는 문자화가 제대로 되지 않더라도 문맥을 통해 본 뜻을 알 수 있지만, 변환된 문자만 보는 제3자는 대화 내용을 파악하기 힘들 수 있어 보였다. 때론 발화자를 제대로 구분하지 못하거나, 화자가 반대로 기록되기도 했다. SK텔레콤 관계자는 “전화 도중 말이 섞이거나 목소리가 비슷한 경우 구분이 명확하지 않을 수 있다”며 “대화가 차분히 오갈 때 성능이 더 높다”고 설명했다.
아쉬운 점도 있지만 AI통화녹음이 무료 베타 테스트 중이고 다른 STT도 현재까지는 완벽한 음성인식을 제공하지 못하고 있다는 점을 감안하면 만족할만한 경험이었다. SK텔레콤은 이번 테스트를 통해 서비스를 고도화하고 편의 기능을 추가해 추후 정식 버전을 내놓을 계획이다.
< 저작권자 ⓒ 서울경제, 무단 전재 및 재배포 금지 >