O$^2$-Searcher: 개방형 질문에 대한 혁신적인 검색 기반 에이전트 모델 등장


본 기사는 중국과학원 자동화연구소 연구진이 개발한 혁신적인 검색 기반 에이전트 모델 O$^2$-Searcher에 대해 소개합니다. O$^2$-Searcher는 강화학습 기반으로 개방형 및 폐쇄형 질문에 효과적으로 대응하며, 새로운 벤치마크 O$^2$-QA를 통해 그 성능을 입증했습니다. 3B 모델임에도 불구하고 기존 LLM 에이전트들을 능가하는 성능을 보이며, 다양한 분야에서의 혁신적인 활용 가능성을 제시합니다.

related iamge

한계를 넘어선 AI: O$^2$-Searcher의 탄생

최근 급속한 발전을 거듭하고 있는 거대 언어 모델(LLM)은 정적인 매개변수 지식에 의존하기 때문에, 최신 정보가 필요하거나 다양한 답변이 가능한 개방형 질문에 대한 응답 능력이 제한적입니다. 외부 지식 환경과의 상호작용을 통해 이러한 한계를 극복하려는 시도가 있었지만, 대부분 폐쇄형 문제에 초점을 맞춰왔습니다.

하지만 중국과학원 자동화연구소(Institute of Automation, Chinese Academy of Sciences) 연구진이 개발한 O$^2$-Searcher는 이러한 한계를 뛰어넘는 혁신적인 검색 기반 에이전트 모델입니다. Mei Jianbiao 등 13명의 연구진은 강화 학습을 활용하여 개방형 질문과 폐쇄형 질문 모두에 효과적으로 대응하는 시스템을 구축했습니다. 특히, 외부 지식 환경과 모델의 추론 과정을 효과적으로 분리하여 지식 획득의 효율성을 극대화했습니다.

O$^2$-Searcher는 정교하게 설계된 보상 함수를 사용하는 통합적인 학습 메커니즘을 통해 문제 유형을 식별하고 다양한 답변 생성 전략을 적용할 수 있습니다. 이는 마치 인간처럼 상황에 맞는 최적의 해결 방식을 선택하는 지능적인 행동을 보이는 것과 같습니다.

O$^2$-QA: 개방형 질문에 대한 새로운 기준

연구진은 O$^2$-Searcher의 성능을 측정하기 위해 O$^2$-QA라는 새로운 벤치마크를 구축했습니다. O$^2$-QA는 수동으로 엄선된 300개의 다영역 개방형 질문과 관련 웹 페이지 캐시로 구성되어 있으며, 기존 벤치마크에서는 다루기 어려웠던 복잡한 개방형 질문들을 포함하고 있습니다.

실험 결과, O$^2$-Searcher는 단 3B 모델임에도 불구하고 O$^2$-QA에서 기존 최고 성능의 LLM 에이전트들을 크게 능가하는 성능을 보였습니다. 또한 다양한 폐쇄형 질문 답변 벤치마크에서도 동일한 크기의 모델들에 비해 최고 성능을 달성했으며, 훨씬 더 큰 모델들과 비슷한 수준의 성능을 기록했습니다.

미래를 향한 도약: O$^2$-Searcher의 가능성

O$^2$-Searcher의 개발은 LLM의 한계를 극복하고 실제 세계 문제 해결에 더욱 가까이 다가가는 중요한 발걸음입니다. 개방형 질문에 대한 효과적인 답변 능력은 다양한 분야에서 혁신적인 응용을 가능하게 할 것입니다. 특히, 최신 정보를 요구하는 분야나 다양한 관점의 답변이 필요한 분야에서 O$^2$-Searcher의 활용 가능성은 무궁무진합니다. 앞으로 O$^2$-Searcher가 어떻게 발전하고 활용될지 기대됩니다.


*이 기사는 AI가 생성한 내용으로, 일부 정보가 실제와 다를 수 있습니다. 정확한 확인을 위해 추가적인 검증을 권장드립니다.

Reference

[arxiv] O$^2$-Searcher: A Searching-based Agent Model for Open-Domain Open-Ended Question Answering

Published:  (Updated: )

Author: Jianbiao Mei, Tao Hu, Daocheng Fu, Licheng Wen, Xuemeng Yang, Rong Wu, Pinlong Cai, Xing Gao, Yu Yang, Chengjun Xie, Botian Shi, Yong Liu, Yu Qiao

http://arxiv.org/abs/2505.16582v1