오픈AI가 이미지 분석이 가능한 추론 인공지능(AI) ‘o3’ 정식 버전과 신 모델 ‘o4 미니’를 내놨다. 이틀전 코딩 특화 AI GPT-4.1을 출시한 데 이어 추론 AI 강화에 나서는 구도다. 오픈AI는 나아가 코딩 에이전트 ‘코덱스 CLI’를 오픈소스로 내놓고 코딩 도구 업체 스타트업 인수를 타진하며 개발자 시장 공략 의지를 재확인했다.
16일(현지 시간) 오픈AI는 지난해 12월 공개한 추론 AI o3 기본형과 신형 추론 모델 o4의 소형 버전인 미니를 출시했다. o3는 지난해 공개 이후 소형화 버전인 ‘미니’만 서비스되고 있었다. 오픈AI는 “o3는 지금까지 출시된 가장 진보한 추론 모델로 코딩, 수학, 과학 및 시각적 이해 분야에서 뛰어난 성능을 보인다”며 “o4 미니는 더 작고 빠른 모델로 더 낮은 비용으로 수학, 코딩, 시각적 작업에서 인상적인 결과를 제공한다”고 설명했다.
오픈AI의 새 추론 AI는 기존 o1~o3 미니보다 더욱 뛰어난 성능 지표를 보인다. 수학 풀이능력을 검증하는 AIME 2025 정답률에서 o1은 79.2%, o3 미니는 86.5%를 기록한 데 반해 o3는 88.9%, o4 미니는 92.7%에 도달했다. 현존하는 가장 어려운 AI 벤치마크로 불리는 '인류의 마지막 시험'에서는 기존 o3 미니가 13.4%를 기록한 가운데 o3 기본형은 20.32%를 나타냈고, o4 미니는 14.28%를 보였다.
이날 선보인 추론 모델들은 ‘도구’를 사용할 수 있다고 한다. 이미지와 도표 등을 분석해 사고할 수 있게 된 것이다. 오픈AI는 “단순히 이미지를 보는 게 아니라 시각과 텍스트 추론을 융합하는 새로운 차원의 문제 해결이 가능해졌다”며 “이미지가 흐릿하거나 반전되었거나 품질이 낮더라도 해석할 수 있다”고 했다.
나아가 챗GPT 내 이미지 생성, 이해, 웹브라우징, 코딩 등 도구를 활용해 AI 에이전트 구현을 뒷받침할 전망이다. 오픈AI는 “복잡하고 여러 단계로 구성된 문제를 더욱 효과적으로 해결하고 독립적으로 행동하기 위한 실질적인 단계를 밟을 수 있다”고 했다.
신형 추론 모델은 이날부터 챗GPT 플러스와 프로, 팀 등 유료 가입자에게 제공된다. 응답 신뢰도를 높이기 위해 추론에 더 많은 시간을 들이도록 하는 ‘o4 미니 하이’버전도 제공한다. 또 수 주 내로 o3 상위 버전으로 더욱 정교한 답변이 가능한 o3 프로도 내놓을 계획이다. 이는 챗GPT 프로 가입자만 사용할 수 있다.
샘 올트먼 오픈AI 최고경영자(CEO)는 "o3와 o4 미니는 GPT-5 출시 전까지 마지막 독립형 AI 추론 모델이 될 수 있다"고 말했다. GPT-5는 기존 GPT-4.1 모델과 추론 모델을 통합하는 차세대 모델로 소개할 예정이다.
오픈AI는 이와 함께 o3와 o4 미니를 활용하는 오픈소스 코딩 에이전트 코덱스 CLI도 출시했다. 개별 컴퓨터에서 문자 기반으로 실행돼 가볍고 개발자 친화적이다. 코덱스 CLI를 활용한 초기 프로젝트 지원을 위해 100만 달러의 자금도 제공한다고 한다. 이는 앞서 경쟁사 앤스로픽 등이 선보인 ‘클로드 코드’ 등을 견제하기 위한 행보로 해석된다.
실제 오픈AI는 이틀 전 코딩 성능을 대폭 강화한 GPT-4.1를 기업용 앱인터페이스(API) 전용으로 출시하며 개발자 시장 공략을 서두르고 있다. 이날 블룸버그는 오픈AI가 AI 코딩 도구 업체 ‘윈드서프’ 인수에 나섰다고 보도하기도 했다. 인수 대금은 30억 달러에 달한다. 윈드서프는 ‘커서’와 함께 자연어 명령만으로 프로그램을 개발하는 바이브 코딩 도구로 주목 받고 있다.
< 저작권자 ⓒ 서울경제, 무단 전재 및 재배포 금지 >