오픈AI, '소형 AI'와 전용 가속기로 비용 절감 나서

오픈AI가 소형언어모델(sLM) ‘GPT-4o 미니’를 선보이며 인공지능(AI) 경량화 경쟁에 뛰어들었다. 이와 함께 브로드컴과 손잡고 챗GPT 전용 AI 가속기 개발을 추진한다는 소식도 들려온다. ‘초거대 AI’ 시대의 문을 연 오픈AI조차 폭증하는 AI 개발·운영비에 부담을 느끼며 가성비를 추구하는 모양새다.

18일(현지 시간) 오픈AI는 지난 5월 공개한 GPT-4o를 소형화한 미니 버전을 공개했다. 오픈AI가 소형화에 초점을 둔 sLM을 공개한 것은 처음이다. 오픈AI는 “현존하는 AI 중 가장 유능하고 비용 효율적인 소형 모델”이라며 “향후 이미지와 동영상, 음성 등 멀티모달 기능을 통합할 계획”이라고 밝혔다.

GPT-4o 미니는 100만 토큰(AI 연산 단위) 당 비용이 입력 기준 0.15달러, 출력 기준 0.6달러다. 기존 GPT-3.5 터보 대비 60%가량 저렴한 셈이다. 이는 구글이 지난 5월 공개한 소형 모델 제미나이 1.5 플래시의 100만 토큰 당 0.35달러를 일부 상회한다. 성능은 더 높다고 한다. GPT-4o 미니는 AI 측정 지표인 대규모다중작업언어이해(MMLU) 추론 평가에서 정답률 82%를 기록해 제미나이 1.5 플래시의 77.9%를 넘어섰다.

같은날 IT 전문매체 디인포메이션은 오픈AI가 자체 AI 가속기 개발을 위해 브로드컴과의 협력을 논의중이라고 보도했다. 오픈AI가 자체 칩 설계를 추진한다는 소식은 이미 알려져 있다. 샘 올트먼 오픈AI 최고경영자(CEO)도 공개적으로 자체 칩 설계팀을 구축했음을 언급했다. 다만 구체적인 협력 대상이 언급된 것은 처음이다. 디인포메이션은 “올트먼 CEO가 구글 등에서 엔지니어들을 영입해 별도 스타트업을 설립하는 방안을 추진해왔으나 최근 브로드컴과의 논의가 구체화하고 있다”고 전했다.

올트먼 CEO는 최근 반도체 생산은 물론 전력까지 아우른 AI 인프라 확장의 필요성을 강조하고 있다. 오픈AI의 자체 칩셋 개발 또한 챗GPT에 최적화한 반도체로 비용을 줄이겠다는 목적으로 추진되는 사안이다. 다만 오픈AI가 브로드컴과 실제 칩셋 설계에 나선다 해도 실제 AI 가속기가 공급되는 시점을 빨라야 2026년이 될 전망이다.