대규모 언어 모델 기반 다중 모달 세션 추천 시스템: 전이 패턴 증류의 힘


본 기사는 쑤 자지에 등 연구진의 논문을 바탕으로, 대규모 언어 모델(LLM)을 활용한 다중 모달 세션 기반 추천 시스템(MSBR)의 혁신적인 접근 방식인 TPAD 프레임워크를 소개합니다. TPAD는 전이 패턴 증류를 통해 LLM의 의미론적 추론 능력을 활용하여 데이터 부족 문제와 콜드 스타트 문제를 해결하고, 개인화된 추천 성능을 향상시킵니다.

related iamge

쇼핑 세션 속 숨겨진 패턴을 읽는 AI: 다중 모달 세션 추천의 혁신

온라인 쇼핑에서 사용자의 다음 구매 상품을 예측하는 세션 기반 추천(SBR)은 이미 익숙한 기술입니다. 하지만 기존 SBR은 데이터 부족과 콜드 스타트 문제에 직면해왔습니다. 이러한 한계를 극복하기 위해 등장한 것이 바로 다중 모달 세션 기반 추천(MSBR)입니다. 여기에 최근 주목받는 대규모 언어 모델(LLM)을 접목하면 어떻게 될까요?

쑤 자지에(Jiajie Su) 등 연구진은 LLM을 활용하여 MSBR의 성능을 획기적으로 향상시키는 새로운 방법을 제시했습니다. 논문 "다중 모달 세션 기반 추천을 위한 대규모 언어 모델에 전이 패턴 증류 (Distilling Transitional Pattern to Large Language Models for Multimodal Session-based Recommendation)"에서 연구진은 LLM의 의미론적 추론 능력에 주목, LLM 기반 MSBR 프레임워크인 TPAD를 제안했습니다.

TPAD: 전이 패턴과 다중 모달 지식의 조화

TPAD는 LLM의 인지 능력을 활용하여 다중 모달 정보를 종합적으로 표현하는 데 초점을 맞춥니다. 하지만 이 과정에는 두 가지 중요한 과제가 있습니다. 첫째, LLM이 전이 패턴과 고유한 다중 모달 지식을 모두 이해하도록 하는 방법, 둘째, 두 가지 특징을 하나의 통합된 LLM로 정렬하여 불일치를 최소화하면서 표현의 유용성을 극대화하는 방법입니다.

TPAD는 이러한 과제를 해결하기 위해 지식-MLLM전이-MLLM이라는 두 개의 병렬 LLM을 활용합니다. 지식-MLLM은 아이템의 지식을 반영하는 특징을 해석하고, 전이-MLLM은 세션 내의 전이와 관련된 특징을 추출합니다. 여기서 핵심은 상호 정보 추정 이론을 활용한 전이 패턴 정렬 모듈입니다. 이 모듈은 두 MLLM을 통합하여 분포 불일치를 줄이고, 전이 패턴을 모달 표현에 증류합니다.

실제 데이터로 입증된 효과

실제 데이터 세트를 사용한 광범위한 실험을 통해 TPAD의 효과가 입증되었습니다. TPAD는 기존 방법보다 향상된 추천 성능을 보여주며, LLM 기반 MSBR의 새로운 가능성을 제시합니다. 이는 단순히 상품 정보를 나열하는 것이 아니라, 사용자의 쇼핑 행동 패턴을 심층적으로 이해하고, 더욱 개인화된 추천을 제공하는 혁신적인 시스템으로 이어질 수 있습니다.

결론적으로, 이 연구는 LLM을 활용한 MSBR의 발전에 중요한 이정표를 제시합니다. 전이 패턴 증류라는 새로운 관점을 통해 다중 모달 정보의 통합과 LLM의 효율적인 활용 방안을 제시함으로써, 향후 개인 맞춤형 추천 시스템 발전에 크게 기여할 것으로 기대됩니다.


*이 기사는 AI가 생성한 내용으로, 일부 정보가 실제와 다를 수 있습니다. 정확한 확인을 위해 추가적인 검증을 권장드립니다.

Reference

[arxiv] Distilling Transitional Pattern to Large Language Models for Multimodal Session-based Recommendation

Published:  (Updated: )

Author: Jiajie Su, Qiyong Zhong, Yunshan Ma, Weiming Liu, Chaochao Chen, Xiaolin Zheng, Jianwei Yin, Tat-Seng Chua

http://arxiv.org/abs/2504.10538v1