혁신적인 추천 시스템 등장: 연속 토큰 확산 기반의 DeftRec
Qu, Fan, Lin 등 연구진이 개발한 DeftRec은 연속적인 토큰을 사용하여 기존 LLM 기반 추천 시스템의 한계를 극복한 혁신적인 프레임워크입니다. 잡음 제거 확산 모델과 사전 훈련된 LLM을 활용하여 사용자 선호도를 정확하게 파악하고 효과적인 추천을 생성합니다.

최근 몇 년간, 대규모 언어 모델(LLM) 기반 추천 시스템(RecSys)이 급부상하고 있습니다. 하지만 기존 연구는 LLM의 이산적인 특성에 맞춰 사용자-아이템 상호작용을 이산 공간에서 표현하는 데 초점을 맞춰왔습니다. 이는 정보 손실과 제한된 어휘 크기라는 문제점을 안고 있습니다. Qu, Fan, Lin 등 연구진은 이러한 한계를 극복하기 위해 획기적인 DeftRec 프레임워크를 제안했습니다.
DeftRec의 핵심은 연속적인 토큰을 사용하는 것입니다. 연속적인 데이터를 활용하면 이산화 과정에서 발생하는 정보 손실을 최소화하고, 표현력을 크게 향상시킬 수 있습니다. 연구진은 먼저 마스킹 연산과 가산 K-방식 아키텍처를 갖춘 강력한 토크나이저를 도입하여 사용자와 아이템의 복잡한 상호 관계를 연속적인 토큰으로 표현합니다.
하지만 단순히 연속적인 토큰을 사용하는 것만으로는 부족합니다. 여기서 핵심적인 역할을 하는 것이 바로 잡음 제거 확산 모델입니다. DeftRec은 사전 훈련된 LLM로부터 추론된 내용을 조건으로 사용하여 연속적인 도메인 내에서 사용자 선호도를 처리합니다. 특히, 잡음 제거 과정에서 음성 상호작용까지 고려하여 사용자 선호도에 대한 포괄적인 이해를 구축합니다. 이를 통해 더욱 효과적이고 정확한 추천 생성이 가능해집니다.
마지막으로, 연속적인 토큰을 출력으로 받아 점수 기반 검색을 통해 손쉽게 추천 결과를 생성합니다. 광범위한 실험 결과, DeftRec은 기존 및 최신 LLM 기반 RecSys를 능가하는 성능을 보여주었습니다. 이는 LLM 기반 추천 시스템의 새로운 지평을 여는 중요한 결과입니다. DeftRec은 단순한 기술적 진보를 넘어, 사용자 맞춤형 추천 시스템의 미래를 한층 더 가깝게 만들었습니다. 앞으로 이 기술이 어떻게 발전하고 다양한 분야에 적용될지 기대됩니다. 하지만 동시에, 연속적인 토큰 처리의 계산 비용 및 LLM 의존성과 같은 잠재적인 과제 또한 고려해야 할 것입니다.
Reference
[arxiv] Generative Recommendation with Continuous-Token Diffusion
Published: (Updated: )
Author: Haohao Qu, Wenqi Fan, Shanru Lin
http://arxiv.org/abs/2504.12007v1