Vendi-RAG: 다양성과 정확성의 완벽한 조화, 차세대 RAG 프레임워크 등장!
Vendi-RAG는 다양성과 정확성을 동시에 고려하여 기존 RAG의 한계를 극복한 새로운 프레임워크입니다. Vendi Score를 활용한 다양한 문서 검색과 LLM 기반 평가 시스템으로 다단계 추론 문제에서 높은 정확도를 달성했으며, 다양한 LLM에서도 일관된 성능 향상을 보였습니다.

Vendi-RAG: 다양성과 정확성의 완벽한 조화, 차세대 RAG 프레임워크 등장!
최근 대규모 언어 모델(LLM) 기반의 질의응답(QA) 시스템에서 Retrieval-augmented generation (RAG) 기술이 주목받고 있습니다. RAG는 외부 지식을 활용하여 LLM의 성능을 향상시키는 기술이지만, 기존 RAG는 관련성에만 집중하여 중복 정보를 처리하는 데 어려움을 겪었습니다. 특히 여러 정보원을 연결해야 하는 복잡한 추론 과제에서는 한계가 명확했습니다.
하지만 이제 혁신적인 변화가 찾아왔습니다! Mohammad Reza Rezaei와 Adji Bousso Dieng 연구팀이 개발한 Vendi-RAG가 바로 그 주인공입니다. Vendi-RAG는 반복적인 과정을 통해 정보 검색의 다양성과 답변의 정확성을 동시에 최적화하는 획기적인 프레임워크입니다.
Vendi-RAG의 핵심은 Vendi Score (VS) 라는 새로운 다양성 지표입니다. VS는 유사도 기반의 다양성 측정 방식으로, 의미적으로 다양한 문서를 검색하는 데 효과적입니다. LLM 기반의 평가 시스템을 통해 후보 답변을 평가하고, 그 결과를 토대로 검색 과정에서 관련성과 다양성 간의 균형을 조절합니다. 마치 숙련된 연구자가 다양한 자료를 종합하여 논문을 작성하는 과정과 유사합니다.
HotpotQA, MuSiQue, 2WikiMultiHopQA 등 세 가지 복잡한 데이터셋을 이용한 실험 결과, Vendi-RAG는 기존의 단일 단계 및 다단계 RAG 방식에 비해 상당한 정확도 향상을 보였습니다. HotpotQA에서는 최대 +4.2%, 2WikiMultiHopQA에서는 +4.1%, MuSiQue에서는 +1.3%의 정확도 향상을 달성, 기존 최고 성능 기준인 Adaptive-RAG를 능가했습니다. 특히 검색 문서의 수가 증가할수록 Vendi-RAG의 장점이 더욱 두드러졌습니다.
더욱 놀라운 점은 Vendi-RAG가 GPT-3.5, GPT-4, GPT-4-mini 등 다양한 LLM 백본에서 일관된 성능 향상을 보였다는 것입니다. 이는 Vendi-RAG의 우수성이 특정 모델에 국한되지 않고, 모델과 무관하게 적용 가능한 범용적인 기술임을 증명합니다.
Vendi-RAG의 등장은 RAG 기술의 새로운 장을 여는 쾌거라 할 수 있습니다. 다양성과 정확성을 동시에 추구하는 Vendi-RAG는 앞으로 더욱 복잡하고 정교한 질의응답 시스템 구축에 중요한 역할을 할 것으로 기대됩니다. 이 연구는 LLM 기반 QA 시스템의 발전에 큰 획을 그은 쾌거로 평가받을 만합니다.
Reference
[arxiv] Vendi-RAG: Adaptively Trading-Off Diversity And Quality Significantly Improves Retrieval Augmented Generation With LLMs
Published: (Updated: )
Author: Mohammad Reza Rezaei, Adji Bousso Dieng
http://arxiv.org/abs/2502.11228v1