딥러닝 모델 보안의 혁신: 암호화 기반 ChainMarks 워터마킹 기술


Brian Choi, Shu Wang, Isabelle Choi, Kun Sun 연구팀이 개발한 ChainMarks는 암호화 체인과 몬테카를로 방법을 활용하여 기존 DNN 워터마킹의 취약점을 극복하고, 높은 안정성과 보안성을 제공하는 혁신적인 기술입니다. 실험 결과, 기존 기술 대비 우수한 성능을 입증하였으며, 딥러닝 모델의 지적 재산권 보호에 중요한 역할을 할 것으로 기대됩니다.

related iamge

최근 딥러닝(DNN) 모델의 광범위한 사용으로 모델 소유권 보호를 위한 동적 워터마킹 기술의 중요성이 커지고 있습니다. 하지만 기존 워터마킹 기법들은 워터마크 제거 및 모호성 공격에 취약하다는 한계를 드러냈습니다. 워터마크 존재 여부 판단 기준 또한 모호하여 공격 성공 가능성을 높였습니다.

Brian Choi, Shu Wang, Isabelle Choi, Kun Sun 연구팀은 이러한 문제점을 해결하기 위해 암호화 체인을 도입한 안전하고 강력한 DNN 워터마킹 기법인 ChainMarks를 제시했습니다. ChainMarks는 두 가지 핵심 요소를 통해 기존 기술의 한계를 극복합니다.

첫째, 암호화 체인을 활용한 안전한 트리거 입력 생성: 비밀 키에 반복적으로 해시 함수를 적용하여 트리거 입력을 워터마크 데이터셋으로 생성합니다. 여기서 트리거 입력과 연관된 목표 레이블은 모델 소유자의 디지털 서명을 통해 생성됩니다. 이는 워터마크 자체를 암호화하여 무단 복제 및 변조를 방지하는 핵심 전략입니다.

둘째, 이중 단계 몬테카를로 방법론을 통한 정확한 워터마크 검증: 트리거 입력의 예측 레이블을 목표 레이블과 비교하여 소유권을 확인합니다. 특히, 특정 모델의 분류 확률을 고려한 정확한 결정 임계값을 사용하여 워터마크 존재 확률을 더욱 높입니다. 이는 단순 비교를 넘어, 통계적 방법론을 도입하여 워터마크 검출의 신뢰성을 획기적으로 향상시킨 점입니다.

연구팀의 실험 결과, ChainMarks는 기존 최첨단 워터마킹 기법보다 훨씬 높은 안정성과 보안성을 보였습니다. 같은 수준의 워터마크 정확도를 유지하면서도, 더 높은 워터마크 존재 확률을 보장하여 실질적인 활용 가치를 더욱 높였습니다. 이는 마치 견고한 성벽과 정교한 감시 시스템을 동시에 갖춘 모델 보안 시스템과 같습니다.

ChainMarks는 딥러닝 모델의 지적 재산권 보호에 새로운 지평을 열었습니다. 향후 딥러닝 기술의 발전과 더불어, ChainMarks와 같은 강력한 보안 기술의 중요성은 더욱 커질 것으로 예상됩니다.


*이 기사는 AI가 생성한 내용으로, 일부 정보가 실제와 다를 수 있습니다. 정확한 확인을 위해 추가적인 검증을 권장드립니다.

Reference

[arxiv] ChainMarks: Securing DNN Watermark with Cryptographic Chain

Published:  (Updated: )

Author: Brian Choi, Shu Wang, Isabelle Choi, Kun Sun

http://arxiv.org/abs/2505.04977v1