오픈AI의 인공지능(AI) 모델이 올해 대학수학능력시험 국어 영역에서 만점에 가까운 점수를 받은 것으로 나타났다. 그동안 복잡한 추론이 필요한 수능 국어 영역에서 AI는 3~8등급에 해당하는 점수를 획득했는데 1년새 AI의 추론 능력이 비약적으로 향상된 것이다.
16일 정보통신기술(ICT) 업계에 따르면 국내 AI 스타트업 마커AI가 최근 오픈AI의 AI 모델을 활용해 2025학년도 수능 국어 영역 시험을 치른 결과 'o1-프리뷰' 모델이 1등급에 해당하는 원점수 97점을 받았다. 'o1-프리뷰'가 유일하게 틀린 문제는 국어 영역 8번(홀수형 기준) 문제였다.
해당 문제는 근대화에 대한 두 가지 비문학 지문을 읽고 보기에서 주어진 사례에 대입해 논리적 사고를 평가하는 문제였다. 이 문제는 2025학년도 수능 국어 영역 가운데 오답률(81.5%)이 가장 높았다.
마커AI는 o1-프리뷰가 지문과 보기의 맥락을 이해하고 문제의 숨은 취지를 파악하는 과정에서 오류를 범했다고 설명했다.
마커AI는 최근 10년간 수능 국어 영역에 대해 AI 모델의 처리 능력을 평가해왔다. 2025학년도 수능 국어 영역을 푼 'o1-미니'는 원점수 78점을, 'gpt-4o'는 75점을 기록해 4등급에 포함됐다.
< 저작권자 ⓒ 서울경제, 무단 전재 및 재배포 금지 >