MixBridge: 이종 이미지-이미지 백도어 공격의 새로운 지평을 열다
MixBridge는 Schrödinger Bridge 기반 확산 모델을 이용하여 이종 이미지-이미지 백도어 공격을 가능하게 하는 새로운 프레임워크입니다. Divide-and-Merge 전략과 WRS를 통해 여러 백도어 트리거를 효과적으로 삽입하고 은폐성을 높였으며, 다양한 생성 작업에서 효과를 입증했습니다.

최근 인공지능(AI) 모델의 보안 취약성에 대한 우려가 커지고 있는 가운데, Qin Shixi 등 6명의 연구진이 발표한 논문 "MixBridge: Heterogeneous Image-to-Image Backdoor Attack through Mixture of Schrödinger Bridges"는 AI 모델의 백도어 공격에 대한 새로운 시각을 제시합니다. 이 논문은 기존의 단일 백도어 공격 방식의 한계를 넘어, 복잡하고 임의의 입력 분포를 갖는 이미지-이미지(I2I) 작업에서 다양한 이종 백도어 트리거를 심는 방법을 제시하고 있습니다.
기존의 백도어 공격 연구는 주로 단일 공격 시나리오와 가우시안 노이즈 입력 모델에 초점을 맞춰왔습니다. 하지만 MixBridge는 Schrödinger Bridge 기반 확산 모델을 이용하여 임의의 입력 분포에 대한 백도어 공격을 가능하게 합니다. 이는 기존 연구에서 필요했던 확률 미분 방정식 수정과 같은 복잡한 과정을 없애고, 더욱 유연한 백도어 공격 도구를 제공합니다.
하지만 하나의 모델에 여러 백도어 트리거를 삽입하려는 시도는 예상치 못한 문제를 야기합니다. 연구진의 이론적 분석에 따르면, 이 경우 모델은 양성 분포와 백도어 분포의 기하 평균을 따르게 되어, 백도어 작업 간 성능 충돌이 발생합니다. 이 문제를 해결하기 위해 연구진은 Divide-and-Merge 전략을 제시합니다. 이 전략은 각각의 목표에 대해 모델을 독립적으로 사전 훈련한 후 (Divide), 이들을 통합된 모델로 통합하는 (Merge) 방식입니다. 여기에 Weight Reallocation Scheme (WRS) 를 추가하여 MixBridge의 은폐성을 더욱 강화했습니다.
다양한 생성 작업에 대한 실험 결과는 MixBridge의 효과를 입증합니다. 이 연구는 AI 모델의 보안에 대한 새로운 위협을 제기하며, 향후 AI 시스템의 안전성 및 신뢰성 확보를 위한 보다 강력한 방어 기술 개발의 필요성을 강조합니다. MixBridge의 등장은 AI 보안 분야에 새로운 도전과 동시에, 더욱 발전된 방어 기술 개발을 위한 중요한 이정표가 될 것입니다.
Reference
[arxiv] MixBridge: Heterogeneous Image-to-Image Backdoor Attack through Mixture of Schrödinger Bridges
Published: (Updated: )
Author: Shixi Qin, Zhiyong Yang, Shilong Bao, Shi Wang, Qianqian Xu, Qingming Huang
http://arxiv.org/abs/2505.08809v1