LLM 추천 시스템의 강건성을 위한 혁신: RETURN 프레임워크
Ning, Fan, Li 등 연구진이 발표한 RETURN 프레임워크는 외부 협업 신호를 활용하여 LLM 기반 추천 시스템의 악의적인 데이터에 대한 취약성을 해결하는 혁신적인 방법을 제시합니다. 플러그 앤 플레이 방식으로 강건성을 향상시키는 RETURN은 실제 데이터 세트에서 효과를 입증하며, LLM 기반 추천 시스템의 안전성과 신뢰성을 높이는 데 크게 기여할 것으로 기대됩니다.

최근 거대 언어 모델(LLM) 기반 추천 시스템이 개인 맞춤형 추천 프레임워크에 혁명을 일으키며 주목받고 있습니다. 하지만 기존 LLM 기반 시스템은 사소한 변화에도 매우 취약하다는 문제점이 드러났습니다. Ning, Fan, Li 등 연구진은 이러한 취약성의 부정적 영향을 완화하기 위한 획기적인 해결책을 제시했습니다.
그들의 연구는 공격자가 삽입한 악의적인 협업 지식을 사용자의 과거 상호작용에서 제거하는 데 초점을 맞춥니다. 핵심 전략은 외부 협업 신호를 활용하는 것입니다. 즉, 아이템 간의 공동 발생 정보를 기반으로 한 협업 신호를 활용하여 악의적인 데이터를 식별하고 제거하거나 대체하는 것입니다.
연구진은 이러한 아이디어를 바탕으로 RETURN이라는 새로운 프레임워크를 제안했습니다. RETURN은 외부 협업 신호를 검색하여 악성 사용자 프로필을 정화하고 LLM 기반 추천 시스템의 강건성을 플러그 앤 플레이 방식으로 향상시키는 것을 목표로 합니다.
RETURN의 작동 방식은 다음과 같습니다.
- 외부 지식 검색을 통한 변조 위치 파악: 협업 아이템 그래프에서 외부 지식을 검색하여 사용자의 과거 상호작용 시퀀스 내의 잠재적 변조를 식별합니다.
- 협업 지식 검색을 통한 변조 정화: 삭제 또는 대체 전략을 사용하여 변조를 제거합니다.
- 강건한 앙상블 추천 전략: 최종 강건한 예측을 생성하기 위해 강건한 앙상블 추천 전략을 도입합니다.
세 개의 실제 데이터 세트에 대한 광범위한 실험을 통해 RETURN의 효과가 입증되었습니다. 이는 LLM 기반 추천 시스템의 보안 및 신뢰성을 향상시키는 데 중요한 발걸음이 될 것으로 기대됩니다. 이 연구는 LLM 기반 추천 시스템의 안전성과 신뢰성을 높이기 위한 새로운 가능성을 제시하며, 향후 연구에서 더욱 발전된 기술이 개발될 것으로 예상됩니다. 특히, 다양한 공격 유형에 대한 강건성을 높이는 연구가 추가적으로 필요할 것으로 보입니다.
Reference
[arxiv] Retrieval-Augmented Purifier for Robust LLM-Empowered Recommendation
Published: (Updated: )
Author: Liangbo Ning, Wenqi Fan, Qing Li
http://arxiv.org/abs/2504.02458v1