전체메뉴

검색
팝업창 닫기
이메일보내기

[잇써보니]90분 녹음파일을 3분만에 텍스트로 척척 정리

AI음성기록 서비스 '클로바노트'

강연·낭독 상황서 정확도 높아

화자, 캐릭터별로 정리 인상적

클로바노트가 받아쓰기한 대화에서 ‘깃허브’, ‘AI’, ‘파이썬’ 등 IT 전문용어가 등장하자 속수무책 오류가 늘었다. IT용어의 경우 아직 음성인식 엔진이 익숙하지 않기 때문에 자주 쓰는 단어에 설정해두는 것을 추천한다. /클로바노트 화면 갈무리




“김포구에 올라가 있어요”

인터뷰 녹음 파일을 ‘클로바노트’를 활용해 텍스트로 변환하자 처음 들어보는 문장이 나왔다. 분명 인공지능(AI) 비즈니스와 관련한 인터뷰였는데 난데없이 ‘김포구’라는 단어가 등장해 황당했다. 녹음 파일을 다시 들어보니 김포구는 ‘깃허브(프로그램 소스 코드 공유 플랫폼)’란 IT 용어를 텍스트로 잘못 번역한 것이었다. 첨단 음성인식 기술이 만든 서비스지만 아직 IT 용어는 소화하기 어려워 보인다. 다만 이런 경우 ‘자주 사용하는 단어’에 등록해두면 정확도가 높아진다.

녹음 파일 텍스트 변환 서비스 클로바노트를 직접 사용해 본 결과다. 기자라는 직업 특성 상 인터뷰나 강연 등에서 나오는 말들을 받아적는 일이 업무의 적잖은 부분을 차지하는 만큼 기대감이 컸다. 90분 남짓한 녹음 파일을 텍스트로 변환하는 데는 불과 3분 남짓에 불과했다. 떨리는 마음으로 결과를 보니 음성이 텍스트로 변환돼 있었다. 특히 화자마다 다른 이모티콘으로 표시가 되어 있어 편리했다. 음성 파일을 텍스트로 변환하기 전 이용자는 대화·회의·강연·인터뷰·전화 통화 등 음성 녹음 상황과 참석 인원만 표시하면 된다. “녹음 환경에 따라 텍스트를 인식하는 방식을 달리해 정확도를 높이기 위한 단계”라는 게 네이버 관계자의 설명이다. 그는 또 “아무래도 여러 명이 말하는 대화 상황보다는 한 명이 스크립트를 바탕으로 읽는 상황이 정확도가 더 높다”고 덧붙였다.

클로바노트에 음성 파일을 텍스트로 변환하기 전에 두 가지 사항을 선택해야 한다. 녹음 환경에 따라 텍스트 인식의 정확성을 높이기 위해서다. /클로바노트 서비스 화면 갈무리




체험 첫 주에는 인터뷰가 두 건 있었다. 양해를 구하고 클로바노트로 녹음을 했다. 일대일 인터뷰와 두 명을 동시에 인터뷰하는 2건 이었다. 발음의 정확성 차이· 사투리 여부 등을 제외하고 봤을 때 화자가 한 명인 경우에 확실히 정확성이 높았다. 아나운서의 정확한 발음은 어떨까. MBC 아나운서 여러 명이 고(故) 박완서 소설가의 작품을 낭독했던 낭독회의 음성 파일을 변환해봤다. 3분 남짓의 받아쓰기에서 오류가 세 건 정도밖에 없었다. 낭독할 때의 강약에 따라 상대적으로 가볍게 읽는 부분을 빼 먹는 정도의 오류였다.

MBC 아나운서들이 진행한 고 박완서 소설가 낭독회 중 일부분을 클로바노트를 통해 텍스트로 변환했다. 클로바노트에서 텍스트 부분을 누르면 해당 음성이 재생되어 대화 상황을 쉽게 복기할 수 있다. 대부분 정확히 받아쓰기에 성공했고 말의 상대적 강약에 따라 잘 들리지 않는 경우 단어를 빼먹기도 했다. /클로바노트 화면 갈무리


눈길을 끄는 부분은 참석자를 구분하는 기능이었다. 참석자를 나누는 데는 화자인식 엔진인 ‘와이즈’(WISE)가 쓰인다. 이 엔진은 화자를 인증·식별·분할할 수 있는 기술을 갖고 있다. 정확성은 아직 부족해 보였다. 같은 성별인 두 명의 다른 화자를 한 명으로 인식하는 등 한계가 나타났다. 다만 식별 기술이 적용되면 음색 특징을 딥러닝 기반으로 학습·구분해 서로 다른 녹음파일에서도 특정 인물의 목소리를 찾아 매칭하는 것도 가능해질 것으로 보인다. 또 다른 음성인식 엔진 ‘네스트’(NEST)는 대화나 강연 같은 긴 문장을 받아쓰는 데 강점이 있다. 사용량이 늘어날수록 정확도가 높아지는 건 네스트의 학습량이 늘어나 정답을 찾아낼 확률이 높아지기 때문이다. 클로바노트를 적극 추천하지만 어떤 단어가 돌발적으로 등장할지 모르니 업무 상대방과 공유하기 전에는 직접 검수하는 것을 권한다. /정혜진기자 madein@sedaily.com
< 저작권자 ⓒ 서울경제, 무단 전재 및 재배포 금지 >
주소 : 서울특별시 종로구 율곡로 6 트윈트리타워 B동 14~16층 대표전화 : 02) 724-8600
상호 : 서울경제신문사업자번호 : 208-81-10310대표자 : 손동영등록번호 : 서울 가 00224등록일자 : 1988.05.13
인터넷신문 등록번호 : 서울 아04065 등록일자 : 2016.04.26발행일자 : 2016.04.01발행 ·편집인 : 손동영청소년보호책임자 : 신한수
서울경제의 모든 콘텐트는 저작권법의 보호를 받는 바, 무단 전재·복사·배포 등은 법적 제재를 받을 수 있습니다.
Copyright ⓒ Sedaily, All right reserved

서울경제를 팔로우하세요!

서울경제신문

텔레그램 뉴스채널

서경 마켓시그널

헬로홈즈

미미상인