교통사고 분석의 혁신: LLM 기반 CrashSage 프레임워크 등장


Hao Zhen과 Jidong J. Yang이 개발한 CrashSage는 LLM을 활용하여 교통사고 데이터를 분석하는 혁신적인 프레임워크입니다. 기존 방식의 한계를 극복하고, 텍스트 기반 데이터 변환, 맥락 인식 데이터 증강, 고성능 사고 심각도 예측, 기울기 기반 설명 가능성 기법을 통해 더욱 정확하고 투명한 분석을 제공합니다.

related iamge

매년 130만 명 이상의 목숨을 앗아가고 1조 8천억 달러가 넘는 경제적 손실을 초래하는 교통사고. 이러한 심각한 사회적, 경제적 영향은 효과적인 교통 안전 연구의 절실함을 보여줍니다. 하지만 기존의 통계 모델이나 트리 앙상블 방식은 구조화된 데이터에만 의존하여 맥락 정보를 간과하고 복잡한 관계와 의미를 제대로 포착하지 못하는 한계를 가지고 있습니다. 특히 다중 차량 충돌, 사고 진행 과정, 희귀 사건 특성 등 서술적 요소에 대한 정보 손실이 심각했습니다.

이러한 문제를 해결하기 위해 등장한 것이 바로 CrashSage입니다. Hao Zhen과 Jidong J. Yang이 개발한 CrashSage는 대규모 언어 모델(LLM)을 중심으로 하는 혁신적인 교통사고 분석 및 모델링 프레임워크입니다. CrashSage의 핵심 혁신은 다음과 같습니다.

첫째, 탁월한 데이터 변환: 기존의 이질적인 교통사고 데이터를 풍부하고 구조화된 텍스트 서술로 변환하는 전략을 통해 필수적인 구조 및 관계적 맥락을 유지합니다. 단순한 숫자 데이터를 넘어 사고의 상세한 상황을 담은 서술적 데이터로 변환하는 것이죠.

둘째, 맥락 인식 데이터 증강: 기본 LLM 모델을 사용하여 서술의 일관성을 높이는 동시에 사실적 정확성을 유지하는 맥락 인식 데이터 증강 기법을 적용합니다. 이를 통해 더욱 정확하고 포괄적인 분석이 가능해집니다.

셋째, 우수한 사고 심각도 예측: LLaMA3-8B 모델을 미세 조정하여 사고 심각도를 예측하는데, Zero-shot, Chain-of-Thought 프롬프팅, Few-shot 학습 등 다양한 기법을 사용한 다른 모델들(GPT-4o, GPT-4o-mini, LLaMA3-70B)보다 우수한 성능을 보였습니다. 즉, 어떤 사고가 얼마나 심각한지 더 정확하게 예측할 수 있다는 의미입니다.

넷째, 투명성 확보: 기울기 기반 설명 가능성 기법을 사용하여 개별 사고 수준과 광범위한 위험 요인 차원 모두에서 모델의 결정을 명확하게 설명합니다. 이는 모델의 투명성을 높이고, 가장 영향력 있는 요인에 대한 심층적인 통찰력을 제공하여 표적화된 교통 안전 개입을 가능하게 합니다. 즉, 어떤 요인 때문에 사고가 발생했는지, 어떻게 예방할 수 있는지에 대한 명확한 답을 제공하는 것이죠.

CrashSage는 단순한 사고 분석을 넘어, 데이터의 맥락을 이해하고, 미래 사고를 예측하며, 예방 전략을 제시하는 혁신적인 시스템입니다. 교통 안전 분야에 획기적인 발전을 가져올 것으로 기대됩니다.


*이 기사는 AI가 생성한 내용으로, 일부 정보가 실제와 다를 수 있습니다. 정확한 확인을 위해 추가적인 검증을 권장드립니다.

Reference

[arxiv] CrashSage: A Large Language Model-Centered Framework for Contextual and Interpretable Traffic Crash Analysis

Published:  (Updated: )

Author: Hao Zhen, Jidong J. Yang

http://arxiv.org/abs/2505.07853v1