[사이언스] 동영상 생성 AI 퀀텀점프…수년 내 초지능 AI 나온다

전체서비스

문화·스포츠

영상·포토

서경스타

이용안내

스페셜 컨텐츠

보내는 사람
받는 사람	※ 여러명에게 보낼 경우 콤마(,)로 구분하세요.

보내는 사람

받는 사람

※ 여러명에게 보낼 경우 콤마(,)로 구분하세요.

[사이언스] 동영상 생성 AI 퀀텀점프…수년 내 초지능 AI 나온다

입력2024-02-21 14:19:01 수정 2024.02.21 23:04:41 고광본 선임기자

‘서산 너머 노을이 지는 가운데, 74세 할머니 농부가 밭일을 마치고 지친 발걸음으로 제방을 지나 집으로 가고 있다. (눈동자를 클로즈업 하며) 중간에 잠시 멈춰 회한에 찬 모습으로 지고 있는 태양을 바라본다.’ , ‘개미가 단체로 먹잇감인 지렁이를 사냥한 뒤 땅속의 수많은 방으로 이뤄진 개미굴 내부로 들어가고 있다.’, ‘음식물이 입에서 식도, 위, 장을 거쳐 배출되기까지 기계적·화학적 소화 과정을 거치고 있다.’….

이처럼 한 두 마디로 원하는 장면과 모습을 문자 기반 동영상 생성 인공지능(AI) 모델인 ‘소라(Sora)’에 입력하면 수초만에 최대 1분 길이 동영상을 얻을 수 있다.

챗GPT 개발사인 오픈AI는 지난 15일 소라를 공개해 큰 화제를 모으고 있다. 현재 오픈AI 홈페이지에는 약 50개의 소라 동영상이 있다. 사람이 촬영하거나 컴퓨터그래픽(CG) 작업을 하지 않고도 사실처럼 보이는 비교적 정확한 동영상이 많다. 많은 인력과 비용 투자 없이도 광고 영상이나 3D 애니메이션 영화, 교육 영상 등을 손쉽게 만들 수 있는 것이다. 사진으로 동영상을 만드는 것은 물론 기존 비디오를 확장하거나 필요한 장면을 채워넣을 수도 있다.

물론 이 기술은 아직은 전후 인과관계를 100% 구현하는 데는 한계가 있지만 갈수록 빠른 속도로 진화할 것으로 예상된다. 소라를 이용해 단편 애니메이션 ‘서유기’를 만든 ‘AI 정신병원’이라는 중국 블로거는 “미술 경력 15년차로 수작업으로 하면 최소 반년이 걸리는데 소라를 활용하니 1주일 만에 완성할 수 있었다”며 “속도가 (서유기 주인공인) 손오공보다 빠르다”고 말했다.

오픈AI 측은 “여러 캐릭터와 특정 유형의 동작, 복잡한 장면 등을 영상으로 빠르게 만들 수 있다”며 “문자로 된 명령을 정확하게 해석하고 생생한 감정을 표현하는 매력적인 캐릭터를 생성할 수 있다”고 설명했다. 오픈AI와 각을 세우며 지난해 AI 회사를 차린 일론 머스크 테슬라·스페이스X CEO는 X(옛 트위터)에 “gg humans(인류는 끝났다)”라고 썼다. gg는 ‘Good Game’의 줄임말로 게임에서 승부에서 졌을 때 쓴다.

다른 빅테크 기업들도 동영상 생성 AI에 대한 투자에 나서고 있으나 소라에 비해서는 역부족인 것으로 평가된다. 구글이 지난달 동영상 생성 AI ‘루미에르(Lumiere)’를 공개했으나 소라만큼 큰 관심을 끌지 못했다. 2022년 선보인 아마존의 애니메이션 생성 ‘크리에이트 위드 알렉사(Create with Alexa)’, 메타(옛 페이스북)의 ‘메이크 오 비디오’도 마찬가지다. 김정호 KAIST 전기및전자공학부 교수는 “거대언어모델(LLM) 기반 AI가 나온지 2년도 채 안돼 글을 입력하면 글로 답변하거나 음성과 이미지를 만들어주는 것은 물론 동영상까지 제작해주는 시대가 됐다”며 “앞으로 갈수록 실제와 구분이 어려운 동영상까지 만들어낼 것”이라고 했다.

빅테크 업계에서는 동영상 생성 AI 모델의 퀀텀점프에 맞춰 모든 분야에서 인간 지능에 가깝거나 능가하는 초지능 인공지능(AGI·Artificial General Intelligence) 구현이 앞당겨질 것이라고 내다봤다.

중국 인터넷 보안 기업 치후360 창립자 저우훙이는 웨이보(중국판 트위터)에 “소라가 당분간 틱톡의 제작 도구에 머물겠지만 광고와 영화 예고편 업계를 완전히 흔들 것”이라며 “AGI에 필요한 기간이 10년에서 1~2년으로 단축될 것”이라고 주장했다. 그러면서 “중국의 LLM 발전 수준은 오픈AI가 지난해 3월 내놓은 GPT-4.0과 1년 반 정도 격차가 있다”고 지적했다. 중국은 AI 분야 특허 건수에서는 세계 1위이지만 미국의 엔비디아 그래픽처리장치(GPU) 수출 규제 등으로 인해 어려움을 겪고 있다.

전문가들은 동영상 변환 AI의 발전 과정에서 AI로 만든 유해 합성 조작물인 딥페이크(Deepfake)에 대한 우려도 내놓고 있다.

오는 4·10 총선을 앞두고 딥페이크 게시물이 잇따라 적발되고 있는 게 예다. 중앙선거관리위원회가 지난달 29일부터 이달 19일까지 불과 20일간 적발한 건수만 129건이다. 공직선거법상 딥페이크를 이용한 선거운동은 금지돼 있다. AI로 특정 정치인의 얼굴과 목소리를 재현한 뒤 특정 후보자나 정당을 비난하면 공정한 선거 질서를 해치기 때문이다. 예를 들어 중산층 이하 백인들의 지지를 많이 받는 도널드 트럼프 전 대통령을 딥페이크로 만든 뒤 수많은 흑인들에 둘러싸여 지지를 받는 것처럼 조작할 수도 있는 셈이다. 선관위 관계자는 “총선이 다가올 수록 딥페이크가 크게 늘어날 것으로 보고 AI전담반을 운영하고 있다”고 소개했다.

샘 알트만 오픈AI 최고경영자(CEO)가 “우선 소라를 제한된 수의 창작자만 활용하도록 하고 상업화하기 전에 전문가팀에 맡겨 안전성을 평가하도록 할 것”이라고 했지만 여전히 고품질 동영상의 악의적 배포에 대한 위험성은 남아 있다. LLM의 특성상 어떤 데이터를 사용해 AI가 학습했는지에 관한 저작권 등 지식재산권 문제도 첨예한 이슈다.

김정호 교수는 “AI로 동영상을 생성하려면 많은 데이터를 처리하기 위한 고성능 그래픽처리장치(GPU)는 물론 고대역폭 메모리(HBM)같은 메모리 반도체가 필요하다”며 “AI 저작권과 윤리 문제에 대해서도 사회적 공론화에 나서야 한다”고 강조했다.