인공지능(AI) 신기술 수준을 놓고 전 세계 142개 팀이 겨룬 국제 대회에서 한국과학기술원(KAIST)을 포함한 한국팀들이 상위권을 휩쓸었다.
LG AI연구원은 캐나다 벤쿠버에서 열리는 세계 최대의 컴퓨터 비전 학회인 ‘국제컴퓨터비전·패턴인식 학술대회(CVPR) 2023’을 앞둔 18일(현지시간) 서울대 AI대학원, 셔터스톡과 공동으로 ‘LG 글로벌 AI 챌린지’를 개최했다. 생성형 AI가 대규모 데이터 학습을 거쳐 기존에 학습한 적 없는 이미지를 보고도 캡션(사진 설명)을 만들어내는 ‘제로샷 이미지 캡셔닝’ 분야의 경쟁력을 가리는 대회다.
대회에서 가장 높은 정확도로 최고 득점을 받은 팀은 중국 난징과학기술대 연구팀이다. 난징과기대 연구팀은 AI의 이미지 이해력을 높이기 위해 유사한 내용을 담은 대규모의 참조 데이터를 학습시켜 정확도를 높이는 방법을 선보였다. 뒤를 이어 한국과학기술원(KAIST)과 카카오브레인, 우리은행 연구팀이 각각 2~4위를 차지하며 기술력을 자랑했다.
2위를 차지한 KAIST의 오영택 전기및전자공학부 연구원은 수상자 발표를 통해 “LG AI연구원이 첫 진행한 ‘LG 글로벌 AI 챌린지’에서 AI가 기존 이미지 데이터를 참조할 때 부하가 걸리지 않도록 최적화하는 데 초점을 맞춰 좋은 결과를 낼 수 있었다”며 “최근 이미지를 보고 이를 글로 묘사하는 비전 인식 분야에 관심이 집중되고 있다”고 말했다. 그는 “(기술 경쟁에 따라) 내년에는 챌린지 경쟁도 더 치열해질 것으로 예상되지만 좋은 아이디어를 발굴해 다시 참가하겠다”고 덧붙였다.
LG AI연구원은 이번 대회를 계기로 이미지 캡셔닝 분야의 연구를 주도해나갈 방침이다. 김승환 LG AI연구원 비전랩장(상무)은 “이번 챌린지를 통해 연구자들이 이미지 캡셔닝에 대한 큰 관심을 가지고 있음을 볼 수 있었다”며 “내년에는는 다양한 분야에 활용되는 이미지 등 실제로 활용할 수 있는 형태까지 확장해 이미지 이해 연구에서 LG AI연구원의 리더십을 확장해 나가겠다”고 말했다.
공동 주관사인 셔터스톡은 저작권 없이 사용할 수 있는 이미지-텍스트 데이터셋 2만6000개를 이번 대회에 무상 제공했다. 알레산드라 살라 셔터스톡 AI·데이터사이언스 총괄책임자는 “AI모델을 만들 때 가장 중요한 것은 데이터를 수집하고 고품질화하는 작업”이라며 “이미지 캡셔닝 AI모델에는 편견과 고정관념을 배제하고 다양성, 형평성, 포용성을 가지도록 해야 한다”고 강조했다. 밴쿠버=한국과학기자협회 공동취재단
< 저작권자 ⓒ 서울경제, 무단 전재 및 재배포 금지 >