딥러닝 기반 광고 전환율 예측의 혁신: 심층 계층적 앙상블 네트워크(DHEN)의 실전 활용
본 기사는 심층 계층적 앙상블 네트워크(DHEN)를 이용한 광고 전환율(CVR) 예측 연구에 대한 최신 동향을 소개합니다. 연구진은 다중 작업 학습 프레임워크, 온사이트/오프사이트 데이터 통합, 그리고 자기 지도 학습 보조 손실 함수를 통해 기존 방식보다 뛰어난 성능을 달성했습니다. 이 연구는 광고 추천 시스템의 정확성과 효율성을 크게 향상시킬 것으로 기대됩니다.

클릭률(CTR)과 전환율(CVR) 예측은 광고 추천 시스템의 성공에 매우 중요한 역할을 합니다. 최근 심층 계층적 앙상블 네트워크(DHEN) 가 CTR 예측에서 뛰어난 성능을 보이며 주목받고 있지만, 오프사이트 전환 광고 환경에서의 CVR 예측 성능은 아직 명확하지 않았습니다. 오프사이트 전환 광고란, 구매, 장바구니 추가, 회원 가입 등 사용자의 제3자 웹사이트 또는 앱에서의 행동 확률에 입찰하는 광고를 말합니다.
Zhuang Jinfeng 등 14명의 연구자들은 DHEN을 CVR 예측에 효과적으로 적용하기 위한 실용적인 문제점들을 해결하는 데 집중했습니다. 연구진은 DHEN의 구조적 한계를 극복하기 위해 다음 세 가지 핵심적인 공헌을 제시했습니다.
다중 작업 학습 프레임워크: 단일 DHEN 백본 모델 아키텍처를 사용하여 모든 CVR 작업을 예측하는 다중 작업 학습 프레임워크를 제안했습니다. 이는 DHEN이 실제 환경에서 효율적으로 작동하도록 하는 방법에 대한 상세한 연구를 포함합니다. 어떤 Feature-crossing modules(MLP, DCN, Transformer 등)을 포함해야 하는지, DHEN의 최적 깊이와 폭은 어떻게 설정해야 하는지, 각 Feature-crossing module의 하이퍼파라미터는 어떻게 선택해야 하는지 등 실제 적용에 필요한 중요한 질문에 답하고자 노력했습니다.
온사이트 및 오프사이트 데이터 통합: 실시간 온사이트 사용자 행동 시퀀스와 오프사이트 전환 이벤트 시퀀스를 모두 활용하여 CVR 예측 모델을 구축했습니다. 각 데이터의 중요성에 대한 ablation study(특정 요소를 제거하여 성능 변화를 측정하는 방법)를 통해 최적의 모델 구성을 도출했습니다. 이는 다양한 데이터 소스의 강점을 결합하여 예측 정확도를 높이는 전략입니다.
자기 지도 학습 기반 보조 손실 함수: CVR 예측에서 레이블 부족 문제를 해결하기 위해 입력 시퀀스에서 미래 행동을 예측하는 자기 지도 학습 보조 손실 함수를 제안했습니다. 이는 데이터의 제약을 극복하고 예측 성능을 향상시키는 혁신적인 접근 방식입니다.
이 연구는 사전 훈련된 사용자 개인화 기능을 사용한 기존의 단일 기능 교차 모듈과 비교하여 최첨단 성능을 달성했습니다. 이 연구 결과는 광고 전환율 예측 분야에 실질적인 영향을 미칠 것으로 기대되며, 더욱 정확하고 효율적인 광고 추천 시스템 개발에 기여할 것으로 예상됩니다.
결론적으로, Zhuang Jinfeng 등의 연구는 DHEN을 실제 CVR 예측 문제에 적용하는 데 있어 발생하는 다양한 어려움을 해결하고, 최첨단 성능을 달성하는 실용적인 전략들을 제시했습니다. 다중 작업 학습, 다양한 데이터 소스 활용, 그리고 자기 지도 학습 등의 혁신적인 기법들을 통해 광고 전환율 예측의 새로운 지평을 열었습니다.
Reference
[arxiv] On the Practice of Deep Hierarchical Ensemble Network for Ad Conversion Rate Prediction
Published: (Updated: )
Author: Jinfeng Zhuang, Yinrui Li, Runze Su, Ke Xu, Zhixuan Shao, Kungang Li, Ling Leng, Han Sun, Meng Qi, Yixiong Meng, Yang Tang, Zhifang Liu, Qifei Shen, Aayush Mudgal
http://arxiv.org/abs/2504.08169v1