전체메뉴

검색
팝업창 닫기
이메일보내기

텍스트로 경제 예측…한은 “GPT 등 거대 통계 모형 구축해야”

증권사 보고서 분석했더니 거시경제 예측

“방대한 텍스트 경제 분야서 활용 가치 높아”





증권사 보고서 등 방대한 텍스트 정보를 GPT(Generative Pre-trained Transformer)와 같은 자연어처리 기술을 통해 경제 분석에 적극적으로 활용해야 한다는 주장이 제기됐다. 특히 한국은행에 GPT 등 거대 통계 모형을 구축해야 한다는 지적이다.

16일 서범석 한국은행 조사국 과장은 ‘AI 알고리즘을 이용한 산업 모니터링: 증권사 리포트 텍스트 분석’ 보고서를 통해 이같이 밝혔다. 최근 문장 생성 모형으로 화제를 모으는 GPT는 다양한 학습 문장 패턴을 분석해 특정 주제에 맞춰 수려한 문장을 만들 수 있다. 일반 사람의 문장력을 능가하는 만큼 통계 수치를 읽어주는 문장을 만들거나 특정 경제 용어를 설명하는 간단한 문장을 만드는 등 경제 분야의 활용도가 클 것으로 보고 있다.

서 과장은 “사람이 읽고 정리할 수 없을 정도의 방대한 텍스트를 다양한 통계 기법으로 분석해 유용한 경제 정보를 추출헸다”며 “텍스트는 정보를 주고받는 가장 기본적 수단이며 정보 전달 범위에 한계가 없다는 점에서 경제 분야에서 활용 가치가 매우 높다”고 말했다.

서 과장은 2019~2022년 증권사 52곳의 애널리스트 1079명이 낸 기업평가 보고서 12만 8000건을 알고리즘으로 입수해 자연어처리 기법을 이용해 분석했다. 입수한 보고서에서 중복 문장이나 단순 수치 언급 등 문장을 제거한 뒤 200자 원고지 16만 장 분량에 해당하는 유효 문장 145만 개를 확보했다.



분석 결과 텍스트 업황 지수는 국내총생산(GDP), 기업경기실사지수(BSI) 등 거시경제 지표를 에측하는 데 매우 유용한 것으로 나타났다. 전 산업 텍스트 업황 지수와 경기선행지수 순환변동치와의 인과 관계를 보면 코스피 컨센서스 전망치엔 나타나지 않는 관계가 감지된다. 애널리스트들이 제시하는 텍스트 맥락에 숫자가 전달하지 못하는 새로운 정보가 반영됐을 가능성이 있다는 것이다.

코로나, 러시아·우크라이나 전쟁, 환율, 금리 등 주요 경제 이슈에 대한 산업별 영향도 정량화해 비교 가능한 것으로 나타났다. 산업 간 공통 키워드를 분석해 산업 간 유사도 지표로 추정하는 등 다양한 활용이 가능하다는 기대다.

서 과장은 챗GPT 등 최근 자연어처리 기술이 경제 분석 자동화에 커다란 혁신을 가져올 수 있음을 보여준다고 평가했다. 방대한 텍스트 정보를 알고리즘으로 취합하면 애널리스트들의 생각을 1차적으로 취합해 2차 가공자인 경제 분석 연구자들의 업무 효율을 크게 높일 수 있다는 것이다.

서 과장은 “텍스트를 이용한 보다 깊이 있는 경제 분석을 위해서는 텍스트에 나타나는 정보를 경제 이론 등 배경지식과 연결해 분석할 필요가 있다”라며 “이를 위해서는 GPT 등과 같은 거대 통계 모형의 구축이 필요할 것”이라고 말했다.
< 저작권자 ⓒ 서울경제, 무단 전재 및 재배포 금지 >
주소 : 서울특별시 종로구 율곡로 6 트윈트리타워 B동 14~16층 대표전화 : 02) 724-8600
상호 : 서울경제신문사업자번호 : 208-81-10310대표자 : 손동영등록번호 : 서울 가 00224등록일자 : 1988.05.13
인터넷신문 등록번호 : 서울 아04065 등록일자 : 2016.04.26발행일자 : 2016.04.01발행 ·편집인 : 손동영청소년보호책임자 : 신한수
서울경제의 모든 콘텐트는 저작권법의 보호를 받는 바, 무단 전재·복사·배포 등은 법적 제재를 받을 수 있습니다.
Copyright ⓒ Sedaily, All right reserved

서울경제를 팔로우하세요!

서울경제신문

텔레그램 뉴스채널

서경 마켓시그널

헬로홈즈

미미상인