카셰어링 플랫폼 쏘카가 차량 공유 서비스에 최적화한 거대언어모델(LLM) 개발에 나섰다. LLM이 산업 혁신의 최첨단에 설 차세대 기술로 자리잡은 만큼 모빌리티 영역도 LLM 도입이 대세가 될 것이라 보고, 장기적 관점에서 자사 서비스와 궁합이 맞는 모델 구축에 나선 것이다. 쏘카는 LLM을 활용해 현재 서비스를 고도화하는 것은 물론 향후 자율주행 시대에 대비해 독립 비즈니스로도 키운다는 구상이다.
15일 정보기술(IT) 업계에 따르면 쏘카는 올 2분기부터 태스크포스(TF)를 구성하고 자체 기술력을 바탕으로 LLM 개발에 착수했다. 모든 부문을 자체 기술로 구성하는 방안부터 이미 공개된 오픈소스 모델을 차용하는 방안 등 가장 효율적인 모델 구축 방식을 논의 중이다. 쏘카 관계자는 “LLM 구축에 많은 인력과 GPU(그래픽처리장치) 등 투입 자원이 필요하지만 모빌리티 영역에 특화한 작은 파운데이션 모델은 ‘챗GPT’나 ‘하이퍼클로바’ 정도의 대규모 투자가 필요하진 않을 것으로 보고 있다”고 말했다.
이미 차량으로부터 수집한 각종 데이터를 기반으로 서비스 운영 효율화에 공을 들여온 쏘카는 자체 LLM을 계기로 이러한 프로세스를 한 단계 업그레이드할 수 있을 것으로 기대하고 있다. 연간 1만5000~2만 대 차량을 운영하는 쏘카는 차량 한 대에서만 월 10기가바이트(GB) 안팎의 방대한 데이터를 수집하고 있다. 이를 자체 AI 모델 등을 기반으로 분석·가공해 사고 확률을 낮추며 고장을 감지해 최적의 정비 타이밍을 찾고 공유 차량 배치를 최적화하는데 활용하고 있다. 이 과정에서 활용된 데이터들이 주로 센서·이미지·영상 등 비정형 데이터였다면 인간의 언어를 이해하고 생성하는 LLM의 자연어 처리 능력까지 더해 서비스 운영 품질을 끌어올리고 신규 기능과 서비스를 발굴하겠다는 것이다.
자체 모델 개발은 성능 향상은 물론 비용 절감에도 도움이 된다. 쏘카는 오픈AI의 GPT 애플리케이션개발인터페이스(API)를 통해 LLM 관련 기능을 구현해왔는데, 비용 부담이 크면서 한국어 학습량이 적어 한국어 구사 능력은 떨어진다는 지적이 있었다. 쏘카 관계자는 “쏘카존과 같은 특수한 명사는 물론이고 한국인들이 자주 쓰는 은어 등 한국어에 대한 의미는 물론 컨텍스트에 대한 이해도가 떨어져 서비스 운영에 어려운 점이 있다”고 설명했다.
쏘카는 앞서 차세대 LLM ‘하이퍼클로바X’를 개발 중인 네이버와도 협력하기로 했지만 이와 별개로 자체 모델 개발은 지속한다는 입장이다. 타사 LLM이 지닌 장점에도 불구하고 자사 서비스에 최적화하는데도 한계가 있기 때문이다. 무엇보다 향후 LLM을 별도 사업화하기 위해서도 자체 모델 개발이 필수적이라는 판단이다. 쏘카는 자체 LLM을 기반으로 우선 기존 서비스 품질을 향상시킨 뒤 이를 기업간거래(B2B) 서비스로 상용화한다는 계획이다. 모빌리티 사업에 특화한 LLM을 통해 대표적인 모빌리티 운영 서비스를 만들어 다른 사업자들에게도 제공하겠다는 구상이다. 차량 공유 플랫폼 외에도 차량관리시스템(FMS) 등 사업으로 수익화에 집중하고 있는 쏘카는 LLM 기술이 또다른 매출원으로 자리잡기를 기대하고 있다. 업계의 한 관계자는 “자율주행 시대가 점차 가까워지고 있어 차량을 더 스마트하게 관리해줄 LLM 기술의 가치는 더 높아질 것”이라며 “AI 기술이 초기 투자 비용이 적지 않게 드는 만큼 속도감 있게 연구개발을 진행하는 기업이 시장 선점 효과를 누릴 수 있을 것”이라고 평가했다.
/허진 기자 hjin@sedaily.com
< 저작권자 ⓒ 서울경제, 무단 전재 및 재배포 금지 >