전체메뉴

검색
팝업창 닫기
이메일보내기

글로벌 코로나 연구? AI 의학 전문 번역만 있으면 '이상 無'

생물의학 정보에 특화된 번역 모델 개발





백신 개발 등 신종 코로나바이러스 감염증(코로나19)과 관련된 다양한 의학적 연구들이 시작된 가운데 이들의 연구를 도와줄 번역 모델이 등장했다. 코로나19가 한국, 독일, 이탈리아, 미국 등 전 세계로 확산한 만큼 연구에 필요한 정보도 여러 언어로 작성돼 이를 통합하는 것조차 어려웠는데 해당 번역 모델이 연구의 효율성을 높여줄지 관심이 집중된다.

10일 정보기술(IT) 업계에 따르면 네이버랩스유럽(NLE)과 네이버 AI 통번역 서비스 ‘파파고’가 코로나19 관련 정보를 더 정확하게 파악해 연구할 수 있는 ‘다국어 및 다중 도메인 번역 모델’을 개발했다. 이는 인공지능(AI)이 스스로 빅데이터를 학습해 번역하는 최신 통·번역 모델로, 한국어·프랑스어·독일어·이탈리아어·스페인어 등 5개 언어로 된 생물 의학 정보를 영어로 번역해준다.

‘Medical’ 태그 하나로 번역 정확도 UP
해당 AI 번역 모델의 가장 큰 특징은 생물 의학 정보를 더욱 정확하게 번역하도록 생물 의학 관련 문장에 ‘Medical(의학)’ 태그를 적용해 학습했다는 점이다. 일반적으로 사용되는 번역 모델은 특정 분야에 전문화되어 있지 않기 때문에 생물의학 용어들을 정확하게 번역하는 데 한계가 있다. 예를 들어 ‘high temperature(고온)’이란 영단어를 독일어로 번역할 때 이것이 기상학 단어인지 의학 단어인지에 따라 각각 ‘hohe Temperatur(고온)’나 ‘Fieber(열)’로 다르게 번역될 수 있다. 하지만 특정 단어나 문장이 생물 의학과 관련된 것인지 여부를 번역 모델 자체에 적용하면 이런 문제가 없다. NLE 연구 결과에 따르면 ‘항암제’가 포함된 문장을 번역하고자 할 때 일반 번역 모델에서는 항암제가 ‘drugs(약)’로 번역되지만 ‘Medical’ 태그가 적용되면 ‘다국어 및 다중 도메인 번역 모델’에서는 이를 ‘anti-cancer drugs’로 번역한다.

일반 번역 모델과 네이버의 ‘다국어 및 다중 도메인 번역 모델’로 한국어 문장을 번역한 결과 차이. 왼쪽부터 한국어 문장, 일반 번역 결과, ‘medical’ 태그가 붙은 번역 결과./네이버랩스유럽블로그캡처




사용자 입장에서는 생물의학 태그 선택 여부에 따라 같은 문장에 대해 다른 번역 결과를 얻을 수 있다. 생물의학 태그를 선택하면 이에 최적화된 번역 결과를, 선택하지 않으면 일반 번역 모델의 결과를 얻는 것이다. 해당 번역 모델을 개발한 연구진은 “현재 축적되고 있는 코로나19에 대한 방대한 양의 디지털 정보가 수백 개 연구 프로그램의 기초가 될 것”이라며 “누구나 해당 번역 모델을 다운로드 해 이용할 수 있다”고 밝혔다.

한 모델로 5개 언어를 번역
아울러 일반적으로 각 언어별로 번역 모델이 필요한 것과 달리 ‘다국어 및 다중 도메인 번역 모델’은 하나의 모델로 5개 언어를 영어로 번역할 수 있어 데이터 저장 용이성과 안정성, 효율성을 높였다. 연구진은 “현재 가장 성능이 좋은 이중 언어 모델(bilingual model)과 번역 품질도 비슷하다”며 “한국어와 이탈리아어처럼 상대적으로 학습 데이터가 적은 언어 번역에 유용하다”고 설명했다.

신중휘 네이버 파파고 리더는 “파파고만이 가진 강점을 활용해 언어적 차이를 넘어 전 세계 사람들이 원활히 소통할 수 있도록 해당 모델을 개발했다”면서 “차별화된 기술을 바탕으로 하는 우리의 노력이 향후 경제, 위기관리, 공중보건 등 다양한 분야의 연구 활동에 활용되는 데에 보탬이 되고자 한다”고 말했다.

이밖에 네이버는 코로나19로 변화한 근무환경에 맞춰 실시간 화상회의 시 활용할 수 있는 통번역 서비스도 개발 중이다. 우선 한국어와 일본어에 대해서만 개발을 진행했고, ‘파파고 밋(가칭)’이라는 이름으로 최근 사내에 공개됐다. 참석자들이 모바일 앱에서 한국어나 일본어로 말하면 실시간으로 상대방의 언어로 번역된 내용이 화면에 나오는 방식이다.
/백주원기자 jwpaik@sedaily.com
< 저작권자 ⓒ 서울경제, 무단 전재 및 재배포 금지 >
주소 : 서울특별시 종로구 율곡로 6 트윈트리타워 B동 14~16층 대표전화 : 02) 724-8600
상호 : 서울경제신문사업자번호 : 208-81-10310대표자 : 손동영등록번호 : 서울 가 00224등록일자 : 1988.05.13
인터넷신문 등록번호 : 서울 아04065 등록일자 : 2016.04.26발행일자 : 2016.04.01발행 ·편집인 : 손동영청소년보호책임자 : 신한수
서울경제의 모든 콘텐트는 저작권법의 보호를 받는 바, 무단 전재·복사·배포 등은 법적 제재를 받을 수 있습니다.
Copyright ⓒ Sedaily, All right reserved

서울경제를 팔로우하세요!

서울경제신문

텔레그램 뉴스채널

서경 마켓시그널

헬로홈즈

미미상인