짧은 비디오 추천을 위한 혁신적인 탐색 과정 생성 모델 등장!
Chao Feng, Yanze Zhang, Chenghao Zhang 연구팀의 SCAM 모델은 사용자의 시청 행동을 기반으로 짧은 비디오 콘텐츠를 이해하고, 세그먼트 기반 분석 및 Transformer 아키텍처를 통해 시청 시간 예측 정확도를 높였습니다. 산업 규모 데이터셋에서 우수한 성능을 입증하여 짧은 비디오 추천 시스템의 발전에 기여할 것으로 기대됩니다.

짧은 비디오 추천의 미래를 엿보다: SCAM 모델의 혁신
최근 짧은 비디오 플랫폼의 급성장과 함께, 사용자에게 최적의 비디오를 추천하는 기술이 그 어느 때보다 중요해졌습니다. 기존의 다중 모달 특징 기반 추천 모델들은 복잡하고 계산량이 많다는 한계를 가지고 있었습니다. 하지만, 최근 Chao Feng, Yanze Zhang, Chenghao Zhang 연구팀이 발표한 논문, **"Generate the browsing process for short-video recommendation"**은 이러한 한계를 뛰어넘는 혁신적인 모델을 제시합니다.
SCAM: 사용자 참여 피드백을 활용한 세그먼트 콘텐츠 인식 모델
연구팀은 Segment Content Aware Model via User Engagement Feedback (SCAM) 이라는 새로운 모델을 제안했습니다. SCAM의 가장 큰 특징은 복잡한 다중 모달 데이터 없이도 사용자의 시청 행동을 통해 비디오 콘텐츠를 암묵적으로 모델링한다는 점입니다. 기존 모델들이 이미지, 오디오, 텍스트 등 다양한 데이터를 분석하는 것과 달리, SCAM은 사용자들이 실제로 어떤 영상을 얼마나 오랫동안 시청했는지에 집중합니다.
세그먼트 기반 분석과 Transformer 아키텍처의 조화
SCAM은 비디오를 지속 시간을 기준으로 여러 세그먼트로 나누어 분석합니다. 그리고 Transformer와 유사한 아키텍처를 사용하여 세그먼트 간의 순차적 의존성을 효과적으로 포착합니다. 이를 통해 단순히 전체 비디오의 시청 시간만 고려하는 것이 아니라, 사용자들이 어떤 부분에 더 집중했는지, 어떤 순서로 시청했는지까지 파악하여 더욱 정확한 추천이 가능해집니다. 또한, 이러한 세그먼트 기반 접근 방식은 지속 시간 편향을 완화하는 데에도 효과적입니다. 즉, 긴 비디오라고 무조건 좋은 추천이라고 판단하지 않고, 사용자의 실제 참여도를 고려한다는 의미입니다.
산업 규모 데이터셋에서 검증된 성능
연구팀은 산업 규모 데이터셋과 공개 데이터셋을 사용하여 SCAM의 성능을 널리 검증했습니다. 실험 결과, SCAM은 기존 최고 성능 모델들을 뛰어넘는 시청 시간 예측 정확도를 보였습니다. 이는 SCAM의 확장성과 효율성을 입증하는 중요한 결과입니다.
결론: 짧은 비디오 추천의 새로운 지평
SCAM 모델은 짧은 비디오 추천 분야에 새로운 가능성을 제시합니다. 사용자 참여 데이터를 효율적으로 활용하고, 세그먼트 기반 분석과 Transformer 아키텍처를 통해 더욱 정확하고 개인화된 추천 시스템을 구축할 수 있게 되었습니다. 이는 단순히 기술적 발전을 넘어, 사용자 경험 향상과 플랫폼 성장에 크게 기여할 것으로 예상됩니다. 앞으로 SCAM 모델이 어떻게 발전하고 적용될지 주목할 필요가 있습니다.
Reference
[arxiv] Generate the browsing process for short-video recommendation
Published: (Updated: )
Author: Chao Feng, Yanze Zhang, Chenghao Zhang
http://arxiv.org/abs/2504.08771v1