|
청각장애자들의 의사전달 수단인 수화는 단순히 손의 동작뿐 아니라 얼굴의 표정까지도 결합돼서 의미를 전한다. 그런 이유로 수화 동작을 카메라로 인식한 후 의미를 파악할 수 있도록 하는 소프트웨어를 개발하는 것은 난제 중 하나로 평가 받아왔다.
이성환 고려대 정보통신대학 교수는 비디오 영상에서 수화, 이상 행동 등 의미 있는 사람의 동작을 자동으로 파악함과 동시에 인식가능한 방법론을 세계 최초로 개발해 인간 동작 자동 분석 및 인식을 위한 원천기술을 확보했다.
기존 연구에서는 손동작에서 의미 있는 수화 동작을 파악하는 동시에 수화 어휘를 인식하는 문제를 해결하지 못했다. 이 교수는 "예를 들어 '나는 학교에 간다'라는 말을 수화로 전하면 '나는'과 '학교'가 연결돼 동작으로 이어지는데 둘 사이 동작에서 끝나는 포인트와 시작하는 포인트를 분할하고 인식할 수 있도록 하는 알고리즘을 개발했다"며"미국수화데이타베이스를 대상으로 테스트해 그 성과를 입증했다"고 설명했다.
현재 이 기술은 동영상에서의 인간 동작 자동 파악 및 인식 문제에 대한 해결 방안을 제시한 획기적인 방법론으로 평가 받고 있다. 이를 반영하듯 이에 대한 연구성과는 전기전자공학 전분야 학술지 229종 중에서 영향력 지수(Impact Factor)가 가장 높은 국제학술지(IEEE Trans. on Pattern Analysis and Machine Intelligence)에 최우수 논문으로 게재됐다. 아울러 국제전기전자공학회(IEEE) 주관의 '2011년 기계 학습 및 사이버네틱스 국제학술대회(2011 IEEE International Conference on Machine Learning and Cybernetics)'에서도 최우수 논문으로 선정됐으며 이 교수는 국내 연구자로서는 처음으로 '자데흐 최우수 논문상(Lotfi Zadeh Best Paper Award)'을 수상하기도 했다. 이 기술은 스마트폰 환경에서의 가상 키패드 인터페이스와 화면 조작 스마트 인터페이스에 적용되도록 삼성전자와 LG디스플레이에 각각 기술 이전됐다. 아울러 지능로봇을 비롯해 비디오 감시 프로그램, 게임 및 엔터테인먼트 산업 등 실생활의 다양한 분야에서 활용될 것으로 전망된다.
이 교수는 또한 제대로 얼굴을 파악하기 어려운 해상도가 낮은 영상에서 얼굴의 눈ㆍ코ㆍ입과 같은 지역적인 특성을 보존하면서 자동으로 고해상도 얼굴 영상으로 복원하는 기술을 개발했다. 이 기술을 이용하면 기존에 설치된 CCTV와 같은 저해상도의 카메라로도 고해상도 얼굴 정보를 획득하는 것이 가능해져 새롭게 고해상도의 CCTV 카메라를 설치하지 않아도 된다. 비용 절감 효과가 기대된다.
그 외에도 시각 장애인의 시각을 대신해 건물 내에서 벽ㆍ문ㆍ계단 등 보행로와 장애물의 위치를 알려주며 사람의 얼굴과 표정, 안내판의 문자 등을 인식해 음성으로 보행 정보를 알려줄 수 있는 '보행 안내 시스템' 기술을 비롯해 CCTV 화면 등을 통해 범죄자의 얼굴이 모자나 복면 등에 가려 신원의 확인이 어려웠던 문제점을 개선할 수 있는 가려진 얼굴 영상 복원 기술을 세계 최초로 개발했다.
지난 20여년간 컴퓨터 비전 기반의 휴먼 동작 자동 분석 및 인식을 위한 다양한 방법론과 소프트웨어를 개발해온 이 교수는 과학기술논문 인용색인(SCI) 등재 국제 학술지에 115편, 국내 학술지에 62편의 논문을 게재했으며 11권의 저서(국내 2권, 국외 9권)를 출판하는 등 탁월한 연구 업적을 보였다. 현재까지 발표한 논문들의 피인용 횟수가 4,000회 이상에 달할 정도다.
이 교수는 "앞으로 원천성과 실용성을 함께 추구하는 세계를 선도하는 연구를 수행하는 데 최선을 다할 것"이라고 수상소감을 밝혔다.
< 저작권자 ⓒ 서울경제, 무단 전재 및 재배포 금지 >