범용 아이템 토크나이징 기반 전이 가능한 생성형 추천 시스템 UTGRec


본 기사는 Zheng 박사 연구팀이 개발한 범용 아이템 토크나이징 기반 전이 가능한 생성형 추천 시스템 UTGRec에 대해 소개합니다. 멀티모달 거대 언어 모델과 혁신적인 학습 전략을 통해 다양한 도메인에 적용 가능한 추천 시스템을 구축한 UTGRec은 향후 다양한 분야에서 활용될 것으로 기대됩니다.

related iamge

획기적인 생성형 추천 시스템: UTGRec 소개

최근 생성형 추천 시스템이 주목받고 있습니다. 기존의 아이템 토크나이저와 생성형 추천기는 특정 도메인에 한정되어 새로운 분야에 적용하기 어려웠습니다. Zheng 박사 연구팀(Bowen Zheng, Hongyu Lu, Yu Chen, Wayne Xin Zhao, Ji-Rong Wen)은 이러한 한계를 극복하기 위해 UTGRec (Universal item Tokenization for Transferable Generative Recommendation) 을 제안했습니다.

핵심 기술: 범용 아이템 토크나이저

UTGRec의 핵심은 멀티모달 거대 언어 모델(MLLM) 을 활용한 범용 아이템 토크나이저입니다. MLLM을 이용하여 풍부한 아이템 의미를 인코딩하고, 트리 구조의 코드북을 통해 콘텐츠 표현을 코드로 변환합니다. 이를 통해 다양한 도메인의 아이템을 효과적으로 표현할 수 있습니다.

핵심 전략: 이중 경량 디코더와 공동 발생 정렬

UTGRec은 두 가지 핵심 기술을 통해 범용 아이템 토크나이저 학습을 향상시킵니다.

  • 이중 경량 디코더(Dual Lightweight Decoders): 아이템 텍스트와 이미지를 이산 표현으로부터 재구성하여 콘텐츠에 내재된 일반적인 지식을 포착합니다. 이는 단순히 아이템을 코드로 변환하는 것을 넘어, 아이템의 본질적인 특징을 더욱 정확하게 학습하는 데 기여합니다.
  • 공동 발생 정렬 및 재구성(Co-occurrence Alignment and Reconstruction): 함께 발생하는 아이템은 유사하다고 가정하고, 공동 발생 신호를 통합하여 토크나이저 학습의 정확도를 높입니다. 이는 다양한 아이템 간의 관계를 효과적으로 학습할 수 있도록 합니다.

종합적인 학습 프레임워크

UTGRec은 여러 도메인에서 전이 가능한 생성형 추천기를 사전 학습 및 적응시키는 공동 학습 프레임워크를 제시합니다. 이는 단순히 각 도메인에 맞춰 모델을 따로 학습하는 것보다 훨씬 효율적이며, 새로운 도메인에 대한 적용이 쉽습니다.

실험 결과

네 개의 공개 데이터셋을 이용한 실험 결과, UTGRec은 기존의 추천 시스템보다 뛰어난 성능을 보였습니다. 이는 UTGRec의 범용성과 전이 학습 능력을 입증합니다.

결론

UTGRec은 다양한 도메인에 적용 가능한 혁신적인 생성형 추천 시스템으로, 멀티모달 거대 언어 모델과 독창적인 학습 전략을 통해 추천 시스템의 새로운 지평을 열었습니다. 앞으로 더욱 다양한 분야에서 UTGRec의 활용 가능성을 기대해 볼 수 있습니다.🎉


*이 기사는 AI가 생성한 내용으로, 일부 정보가 실제와 다를 수 있습니다. 정확한 확인을 위해 추가적인 검증을 권장드립니다.

Reference

[arxiv] Universal Item Tokenization for Transferable Generative Recommendation

Published:  (Updated: )

Author: Bowen Zheng, Hongyu Lu, Yu Chen, Wayne Xin Zhao, Ji-Rong Wen

http://arxiv.org/abs/2504.04405v1