FinSage: 금융 보고서 질의응답을 위한 혁신적인 다면적 RAG 시스템
FinSage는 금융 보고서의 다양한 데이터 형식과 규정 준수 요구사항을 효과적으로 처리하는 혁신적인 RAG 시스템입니다. 높은 정확도와 실제 환경 적용을 통해 금융 분야의 질의응답 시스템에 새로운 기준을 제시합니다.

FinSage: 금융 보고서 질의응답의 새로운 지평을 열다
금융 업계는 복잡한 규정 준수가 필수적입니다. 최근 대규모 언어 모델(LLM)을 활용한 질의응답 시스템이 주목받고 있지만, 금융 보고서의 다양한 데이터 형식(텍스트, 표, 다이어그램)과 끊임없이 변화하는 규제 표준을 정확하게 처리하는 데 어려움을 겪고 있습니다.
이러한 문제를 해결하기 위해, Xinyu Wang 등 13명의 연구진은 FinSage라는 혁신적인 다면적 RAG(Retrieval-Augmented Generation) 시스템을 개발했습니다. FinSage는 세 가지 핵심 구성 요소로 이루어져 있습니다.
- 다중 모달 전처리 파이프라인: 다양한 데이터 형식을 통합하고 각 데이터 조각에 대한 메타데이터 요약을 생성합니다. 이를 통해 시스템은 다양한 형태의 정보를 효율적으로 처리하고 이해할 수 있습니다.
- 다중 경로 스파스-밀집 검색 시스템: 쿼리 확장(HyDE)과 메타데이터 기반 의미 검색을 통해 관련 정보를 더욱 정확하게 검색합니다. 이는 질문의 의도를 더욱 정확하게 파악하고 관련 정보를 효과적으로 검색하는 데 도움을 줍니다.
- 도메인 특화 재순위 지정 모듈: Direct Preference Optimization (DPO)을 통해 미세 조정되어 규정 준수에 중요한 콘텐츠를 우선시합니다. 이를 통해 시스템은 규정 준수에 가장 중요한 정보를 정확하게 찾아낼 수 있습니다.
FinSage의 성능은 놀랍습니다. 75개의 전문가가 선별한 질문에 대해 92.51%의 높은 재현율을 달성했으며, FinanceBench 질의응답 데이터셋에서 기존 최고 성능 모델보다 정확도를 24.06% 향상시켰습니다. 더욱이, FinSage는 이미 온라인 회의에서 1,200명 이상에게 서비스를 제공하며 실제 환경에서의 효용성을 입증했습니다.
FinSage는 단순한 질의응답 시스템을 넘어, 금융 분야의 규정 준수를 위한 강력한 도구로 자리매김할 것으로 기대됩니다. 이 연구는 금융 데이터의 복잡성을 효과적으로 처리하고 규제 준수를 위한 새로운 기준을 제시하는 중요한 이정표가 될 것입니다.
Reference
[arxiv] FinSage: A Multi-aspect RAG System for Financial Filings Question Answering
Published: (Updated: )
Author: Xinyu Wang, Jijun Chi, Zhenghan Tai, Tung Sum Thomas Kwok, Muzhi Li, Zhuhong Li, Hailin He, Yuchen Hua, Peng Lu, Suyuchen Wang, Yihong Wu, Jerry Huang, Ling Zhou
http://arxiv.org/abs/2504.14493v1