쾌속 진화하는 숏폼 비디오 플랫폼의 미래: KuaiMod로 풀어내는 콘텐츠 조정의 새로운 지평
본 기사는 중국 과학원 연구진이 개발한 숏폼 비디오 플랫폼 콘텐츠 조정 프레임워크 KuaiMod에 대해 소개합니다. KuaiMod는 VLM과 CoT 추론을 활용하여 높은 정확도와 빠른 적응 속도를 제공하며, 실제 플랫폼 적용 결과 사용자 신고율 감소 및 DAU/AUT 증가 효과를 보였습니다. 공개된 벤치마크 데이터셋은 향후 연구에 중요한 기여를 할 것으로 예상됩니다.

폭발적으로 성장하는 숏폼 비디오 플랫폼(SVP)은 특히 미성년자에게 유해한 콘텐츠를 조정하는 데 어려움을 겪고 있습니다. 이러한 콘텐츠의 확산은 사회적 재앙으로 이어질 수 있습니다. 기존의 수동 검토 방식은 인적 자원의 한계와 주관적인 판단에 따른 편향성 문제를 안고 있으며, 자동화된 시스템은 정교한 콘텐츠 이해 부족으로 인해 정확도가 떨어지는 단점을 가지고 있습니다. 또한, 산업적 규제는 빠르게 변화하는 트렌드에 적응하지 못하는 어려움을 겪습니다.
중국 과학원 등의 연구진이 발표한 논문 "VLM as Policy: Common-Law Content Moderation Framework for Short Video Platform"은 이러한 문제점을 해결하기 위한 혁신적인 해결책을 제시합니다. 바로 KuaiMod 입니다. KuaiMod는 대규모 비전 언어 모델(VLM)과 Chain-of-Thought(CoT) 추론을 활용하여, 희소한 사용자 피드백을 바탕으로 동영상 유해성을 정확하게 모델링하고, 빠르게 변화하는 트렌드에 맞춰 동적으로 조정 정책을 수립할 수 있도록 설계되었습니다.
KuaiMod는 크게 세 가지 구성 요소로 이루어져 있습니다:
- 훈련 데이터 구축: 실제 사용자 및 검토자의 피드백을 바탕으로 구축된 SVP 콘텐츠 조정 벤치마크를 활용합니다. 이 벤치마크는 https://kuaimod.github.io 에서 공개되어 다른 연구자들의 활용을 지원합니다.
- 오프라인 적응: VLM과 CoT 추론을 통해 스파스한 사용자 피드백으로부터 효과적으로 학습합니다.
- 온라인 배포 및 개선: 실시간으로 정책을 업데이트하고 성능을 개선합니다.
KuaiMod의 성능은 오프라인 실험과 대규모 온라인 A/B 테스트를 통해 검증되었습니다. KuaiMod는 벤치마크에서 최고의 조정 성능을 달성했으며, Kuaishou 플랫폼에 적용된 결과 사용자 신고율을 20% 감소시키고, 동시에 일일 활성 사용자(DAU)와 앱 사용 시간(AUT)을 증가시키는 성과를 보였습니다.
이 연구는 단순한 기술적 발전을 넘어, 윤리적이고 효율적인 콘텐츠 조정 시스템 구축에 대한 중요한 시사점을 제공합니다. KuaiMod는 급변하는 숏폼 비디오 시장에서 콘텐츠 조정의 새로운 지평을 열 것으로 기대됩니다. 특히, 공개된 벤치마크 데이터셋은 향후 이 분야의 연구 발전에 크게 기여할 것으로 예상됩니다.
Reference
[arxiv] VLM as Policy: Common-Law Content Moderation Framework for Short Video Platform
Published: (Updated: )
Author: Xingyu Lu, Tianke Zhang, Chang Meng, Xiaobei Wang, Jinpeng Wang, YiFan Zhang, Shisong Tang, Changyi Liu, Haojie Ding, Kaiyu Jiang, Kaiyu Tang, Bin Wen, Hai-Tao Zheng, Fan Yang, Tingting Gao, Di Zhang, Kun Gai
http://arxiv.org/abs/2504.14904v1