범용 아이템 토크나이징 기반 전이 가능한 생성형 추천 시스템: UTGRec


Bowen Zheng 등 연구팀이 개발한 UTGRec은 다중 모달 대규모 언어 모델과 트리 구조 코드북을 이용, 범용 아이템 토크나이저를 구현하여 전이 가능한 생성형 추천 시스템을 구축했습니다. 이중 경량 디코더와 협업 신호 통합 기법을 통해 우수한 성능을 달성했으며, 다양한 도메인에서의 적용 가능성을 입증했습니다.

related iamge

생성형 추천 시스템의 새로운 지평을 열다: UTGRec

최근 생성형 추천 시스템(Generative Recommendation)이 주목받고 있습니다. 기존 방법들은 아이템 토크나이저와 생성형 추천기가 특정 도메인에 종속되어 새로운 도메인에 적용하기 어려웠습니다. 하지만 정(Zheng) 박사 연구팀은 이러한 한계를 극복하는 획기적인 방법, UTGRec (Universal Item Tokenization for Transferable Generative Recommendation) 을 제시했습니다.

핵심: 범용성과 전이 학습

UTGRec의 핵심은 다중 모달 대규모 언어 모델(MLLM) 을 활용한 범용 아이템 토크나이저입니다. 기존의 도메인 특화 방식을 벗어나, 트리 구조 코드북을 통해 아이템 콘텐츠를 효과적으로 이산화(discretize)하여 다양한 도메인에 적용 가능한 코드 시퀀스로 변환합니다. 이를 통해 아이템의 풍부한 의미 정보를 포착하고, 도메인 간 전이 학습의 효율성을 극대화했습니다.

혁신적인 두 가지 기법

연구팀은 범용 아이템 토크나이저의 성능을 향상시키기 위해 두 가지 핵심 기법을 도입했습니다.

  1. 이중 경량 디코더 (Dual Lightweight Decoders): 아이템 텍스트와 이미지를 이산 표현에서 재구성하여 콘텐츠에 내재된 일반적인 지식을 포착합니다. 이는 토크나이저가 도메인에 상관없이 일반적인 의미를 학습할 수 있도록 돕습니다.
  2. 협업 신호 통합 (Collaborative Knowledge Integration): 함께 발생하는 아이템은 유사하다고 가정하고, 공동 발생 정렬 및 재구성을 통해 협업 신호를 통합합니다. 이는 다양한 사용자의 선호도를 반영하여 추천의 정확도를 높입니다.

놀라운 실험 결과

UTGRec은 네 개의 공개 데이터셋을 이용한 광범위한 실험에서 기존의 추천 시스템(전통적 및 생성형)을 능가하는 우수한 성능을 보였습니다. 이는 UTGRec의 범용성과 전이 학습 능력을 명확하게 증명하는 결과입니다.

미래를 위한 전망

UTGRec은 생성형 추천 시스템의 발전에 중요한 이정표를 제시했습니다. 다양한 도메인에 손쉽게 적용 가능한 추천 시스템을 개발하는 데 크게 기여할 것으로 기대되며, 앞으로 더욱 발전된 생성형 추천 시스템의 등장을 예고합니다. 이 연구는 단순히 기술적 진보를 넘어, 더욱 개인화되고 효율적인 추천 경험을 제공하는 미래를 향한 한 걸음입니다.


*이 기사는 AI가 생성한 내용으로, 일부 정보가 실제와 다를 수 있습니다. 정확한 확인을 위해 추가적인 검증을 권장드립니다.

Reference

[arxiv] Universal Item Tokenization for Transferable Generative Recommendation

Published:  (Updated: )

Author: Bowen Zheng, Hongyu Lu, Yu Chen, Wayne Xin Zhao, Ji-Rong Wen

http://arxiv.org/abs/2504.04405v2