멀티 모달리티 시대를 여는 혁신: UniversalRAG의 등장!
서울대학교 연구팀이 개발한 UniversalRAG은 다양한 모달리티와 과립도의 데이터를 활용하여 질의에 대한 정확하고 효율적인 답변을 제공하는 혁신적인 RAG 프레임워크입니다. 모달리티 인식 라우팅 메커니즘과 다중 과립도 활용을 통해 기존 RAG의 한계를 극복하고, 8개의 벤치마크를 통해 우수성을 입증했습니다.

최근 몇 년 동안, Retrieval-Augmented Generation (RAG) 기술은 외부 지식을 활용하여 AI 모델의 정확성을 높이는 데 괄목할 만한 성과를 보여주었습니다. 하지만 기존 RAG 접근 방식은 대부분 텍스트 기반 데이터에 국한되었으며, 이미지나 비디오와 같은 다른 모달리티로 확장된 경우에도 단일 모달리티에 집중하는 경향이 있었습니다.
여기서 서울대학교 연구팀(여웅영, 김강산, 정소영, 백진헌, 황성주)의 혁신적인 연구가 빛을 발합니다. UniversalRAG이라는 새로운 RAG 프레임워크를 통해, 연구팀은 다양한 모달리티와 과립도를 가진 데이터 소스에서 지식을 검색하고 통합하는 방법을 제시했습니다.
기존 RAG의 한계 극복: 모달리티 간의 장벽 허물기
UniversalRAG의 핵심은 바로 모달리티 인식 라우팅 메커니즘입니다. 모든 모달리티를 단일 표현 공간으로 통합하는 기존 방식은 특정 모달리티에 편향된 검색 결과를 초래할 수 있다는 점을 간파한 연구팀은, 질의에 가장 적합한 모달리티 특유의 데이터 소스를 동적으로 식별하고, 해당 소스 내에서만 표적 검색을 수행하는 전략을 채택했습니다. 이는 마치 다국어 번역가가 질문의 언어를 파악하고 해당 언어의 데이터베이스를 활용하는 것과 같습니다.
섬세한 검색을 위한 다중 과립도: 질의의 복잡성에 맞춘 대응
또한, UniversalRAG은 각 모달리티를 여러 과립도 수준으로 구성하여, 질의의 복잡성과 범위에 따라 검색의 정교함을 조절합니다. 간단한 질문에는 간결한 답변을, 복잡한 질문에는 심층적인 정보를 제공하여 사용자에게 최적의 경험을 제공하는 것입니다. 마치 도서관에서 단순한 정보 검색부터 학술 논문 연구까지 다양한 수준의 정보를 효율적으로 찾는 것과 같습니다.
8개의 벤치마크를 통한 검증: UniversalRAG의 우수성 입증
연구팀은 다양한 모달리티를 아우르는 8개의 벤치마크를 통해 UniversalRAG의 성능을 검증했습니다. 그 결과, 기존의 모달리티 특화형 및 통합형 기준 모델들을 능가하는 우수한 성능을 보여주었습니다. 이는 UniversalRAG가 다양한 모달리티와 과립도를 가진 복잡한 데이터 환경에서도 효과적으로 작동함을 증명하는 것입니다.
UniversalRAG는 단순한 기술적 발전을 넘어, 멀티 모달리티 시대의 AI 발전에 중요한 이정표를 세웠습니다. 앞으로 더욱 다양한 분야에서 UniversalRAG의 활용이 기대됩니다.
Reference
[arxiv] UniversalRAG: Retrieval-Augmented Generation over Corpora of Diverse Modalities and Granularities
Published: (Updated: )
Author: Woongyeong Yeo, Kangsan Kim, Soyeong Jeong, Jinheon Baek, Sung Ju Hwang
http://arxiv.org/abs/2504.20734v2