혁신적인 추천 시스템 R2Rec: LLM 기반 추론으로 성능과 해석력을 극대화하다


Zhao, Xu, Li 등 연구진이 개발한 R2Rec은 LLM 기반 추천 시스템으로, 상호작용 사고 추론과 2단계 학습 파이프라인을 통해 기존 모델 대비 압도적인 성능 향상과 높은 해석력을 달성했습니다. 실제 데이터셋 실험 결과, 평균 10.48%의 HitRatio@1 향상과 131.81%의 성능 향상을 기록했습니다.

related iamge

최근 대규모 언어 모델(LLM)의 발전으로, 강력한 의미 이해와 프롬프트 유연성을 활용한 추천 시스템 연구가 활발히 진행되고 있습니다. 기존 연구는 사용자-아이템 상호작용이나 메타데이터를 프롬프트에 인코딩하는 방식을 사용했지만, Zhao, Xu, Li 등 연구진은 한 단계 더 나아간 혁신적인 추천 시스템 R2Rec (Reason-to-Recommend) 을 제시했습니다.

R2Rec의 핵심은 상호작용 사고(Interaction-of-Thought) 추론입니다. 연구진은 사용자-아이템 그래프에서 상호작용 체인을 추출하여, 이를 단계적인 사고 과정으로 변환하는 점진적 마스크 프롬프팅 전략을 고안했습니다. 이는 LLM이 암묵적인 패턴을 기반으로 단계별 의사결정을 시뮬레이션할 수 있도록 합니다. 마치 사람이 추천 과정을 논리적으로 생각하는 것처럼 말이죠.

R2Rec은 두 단계의 학습 파이프라인을 통해 성능을 향상시킵니다. 먼저, 지도 학습을 통해 고품질 추적 데이터로부터 기본적인 추론 능력을 학습합니다. 이후, 강화 학습을 통해 보상 신호를 사용하여 추론 과정을 개선합니다. 이는 명시적인 감독 데이터가 부족한 문제를 효과적으로 해결합니다.

세 개의 실제 데이터셋을 이용한 실험 결과, R2Rec은 기존의 추천 시스템 및 LLM 기반 기준 모델들을 압도하는 성능을 보였습니다. 평균 10.48%의 HitRatio@1 향상131.81%의 성능 향상을 달성한 것입니다. 뿐만 아니라, 명시적인 추론 체인을 통해 의사결정 과정을 투명하게 보여줌으로써 해석력을 크게 향상시켰습니다. 이는 블랙박스처럼 작동하는 기존 모델과 큰 차별점입니다.

R2Rec의 코드는 https://anonymous.4open.science/r/R2Rec-7C5D 에서 확인할 수 있습니다. 이 연구는 LLM을 활용한 추천 시스템의 새로운 지평을 열었을 뿐만 아니라, 추천 시스템의 투명성과 해석력 향상에도 크게 기여할 것으로 기대됩니다.


*이 기사는 AI가 생성한 내용으로, 일부 정보가 실제와 다를 수 있습니다. 정확한 확인을 위해 추가적인 검증을 권장드립니다.

Reference

[arxiv] Reason-to-Recommend: Using Interaction-of-Thought Reasoning to Enhance LLM Recommendation

Published:  (Updated: )

Author: Keyu Zhao, Fengli Xu, Yong Li

http://arxiv.org/abs/2506.05069v1