전체메뉴

검색
팝업창 닫기
이메일보내기

메타, 대규모 음성↔텍스트 변환 AI 모델 개방…"기존 대비 10배 많은 언어 지원”

변환 가능 언어 1107개

기존 100여개 수준에서 10배↑

마크 주커버그 메타 CEO. AP연합뉴스




메타가 '대규모 다국어 음성인식'(MMS)' 인공지능(AI) 모델을 24일 오픈소스로 공개했다. 이 모델은 기존 대비 10배 많은 언어를 음성에서 문자로 또는 문자에서 음성으로 바꿔준다. 빅테크 기업으로서 AI 생태계의 발전을 이끌기 위해 모델을 개방했다.

메타는 이 모델이 변환이 가능한 언어의 수를 기존 100여 개에서 1107개로 10배 가량 늘렸다는 점에서 의미가 있다고 설명했다. 또 음성으로 식별할 수 있는 언어의 수가 4000개 이상으로 40배 가량 증가했다. 현재 지구상에 사용되는 언어의 수는 7000개가 넘는 것으로 알려졌는데, 기존 음성 인식 모델은 최대 100여 개의 언어만을 지원한다.



메타는 이 모델이 기존 모델과 비교했을 때 성능이 우수하다고 강조했다. 메타 분석 결과, 음성 변환 언어의 수를 61개에서 1107개로 18배가량 늘렸을 때 문자 오류율은 단 0.4% 증가했다. 또 오픈AI의 음성인식 모델 '위스퍼'와 비교한 결과, MMS 데이터로 교육된 모델은 단어 오류율을 절반으로 줄이면서도 11배 더 많은 언어를 처리할 수 있는 것으로 나타났다.

메타는 언어 다양성 보존에 기여하고, AI 생태계 전반의 발전과 책임 있는 개발을 위해 MMS 모델과 코드를 오픈소스로 공개했다. 기존 음성 기술로는 다루기 어려운 방언 처리 문제 해결을 위해서도 지속적으로 노력할 계획이다. 메타 관계자는 "발전된 음성 인식 기술은 VR/AR 기술 영역이나 메시지 서비스에 적용돼 혁신을 주도할 수 있다"고 말했다.
< 저작권자 ⓒ 서울경제, 무단 전재 및 재배포 금지 >
주소 : 서울특별시 종로구 율곡로 6 트윈트리타워 B동 14~16층 대표전화 : 02) 724-8600
상호 : 서울경제신문사업자번호 : 208-81-10310대표자 : 손동영등록번호 : 서울 가 00224등록일자 : 1988.05.13
인터넷신문 등록번호 : 서울 아04065 등록일자 : 2016.04.26발행일자 : 2016.04.01발행 ·편집인 : 손동영청소년보호책임자 : 신한수
서울경제의 모든 콘텐트는 저작권법의 보호를 받는 바, 무단 전재·복사·배포 등은 법적 제재를 받을 수 있습니다.
Copyright ⓒ Sedaily, All right reserved

서울경제를 팔로우하세요!

서울경제신문

텔레그램 뉴스채널

서경 마켓시그널

헬로홈즈

미미상인