혁신적인 AI 추론 모델 FREESON: 검색 엔진 없이도 가능할까?
김채은, 김승원 연구팀의 FREESON은 기존 검색 증강 추론 모델의 한계를 극복하고 LRM이 자체적으로 지식을 검색하는 혁신적인 프레임워크입니다. CT-MCTS 알고리즘을 통해 5개의 QA 벤치마크에서 평균 14.4%의 성능 향상을 기록했습니다.

검색 엔진 없이도 가능한 놀라운 추론 모델, FREESON
김채은, 김승원 연구팀이 발표한 논문 "FREESON: Retriever-Free Retrieval-Augmented Reasoning via Corpus-Traversing MCTS"는 인공지능 분야에 새로운 이정표를 제시합니다. 대규모 추론 모델(LRM)은 다단계 추론에서 뛰어난 능력을 보여주지만, 기존의 검색 증강 추론 방식은 별도의 검색 모델에 의존하여 하드웨어 및 운영 비용 증가, 그리고 검색 과정의 오류 가능성을 높이는 한계를 가지고 있었습니다. 이러한 문제는 표현 병목 현상(representation bottleneck) , 즉 검색 모델의 임베딩 공간이 생성 모델의 요구사항을 충족하기에 충분하지 않은 현상에서 기인합니다.
FREESON: 검색 모델을 뛰어넘는 새로운 패러다임
FREESON(Retriever-FREE Retrieval-Augmented ReaSONing)은 이러한 한계를 극복하기 위해 기존의 순차적 일치 방식(sequence-to-sequence matching) 에서 벗어나, 말뭉치 내에서 답변을 포함하는 경로를 찾는 방식으로 접근합니다. 즉, LRM이 생성 모델이자 검색 모델의 역할을 동시에 수행하도록 설계되었습니다.
핵심 기술: CT-MCTS 알고리즘
FREESON의 핵심은 CT-MCTS(Corpus-Traversing Monte Carlo Tree Search) 알고리즘입니다. 이는 MCTS 알고리즘을 검색 작업에 특화시킨 것으로, LRM이 말뭉치를 탐색하여 답변이 포함된 영역으로 이동하는 것을 가능하게 합니다. 이는 마치 미궁을 탐험하는 듯한 과정으로, LRM이 스스로 최적의 경로를 찾아가는 지능적인 메커니즘입니다.
놀라운 성능 향상: 벤치마크 결과
5개의 오픈 도메인 QA 벤치마크(단일 단계 및 다단계 질문 포함)에서 FREESON은 기존의 별도 검색 모델을 사용하는 다단계 추론 모델 대비 평균 14.4%의 EM 및 F1 성능 향상을 달성했습니다. 특히 PopQA 및 2WikiMultihopQA에서는 최고 성능 기준 모델을 각각 3%, 2% 상회하는 결과를 보였습니다. 이는 단순한 성능 개선을 넘어, AI 추론 모델의 패러다임을 바꿀 잠재력을 시사합니다.
미래 전망
FREESON은 단순한 기술적 진보를 넘어, AI 추론의 효율성과 정확성을 크게 향상시킬 수 있는 획기적인 시도입니다. 향후 이 기술이 더욱 발전하여 더욱 복잡하고 다양한 문제 해결에 활용될 수 있을 것으로 기대됩니다. 이는 AI가 더욱 인간의 사고 방식에 가까워지는 중요한 발걸음이 될 것입니다. 하지만 동시에, 대규모 언어 모델의 에너지 소비와 윤리적인 문제에 대한 지속적인 논의가 필요합니다.
Reference
[arxiv] FREESON: Retriever-Free Retrieval-Augmented Reasoning via Corpus-Traversing MCTS
Published: (Updated: )
Author: Chaeeun Kim, Seungone Kim
http://arxiv.org/abs/2505.16409v1