PoLO: 체인 기반 워터마킹으로 학습 증명과 소유권 증명을 동시에 확보하다
PoLO는 체인 기반 워터마킹을 이용하여 학습 증명(PoL)과 소유권 증명(PoO)을 통합적으로 해결하는 새로운 프레임워크입니다. 기존 방식보다 효율적이고 개인정보 보호에 강하며, 높은 검증 정확도를 자랑합니다.

PoLO: 학습 증명과 소유권 증명의 새로운 지평을 열다
머신러닝 모델의 공유와 아웃소싱이 증가하면서, 모델 학습에 대한 노력을 증명하는 Proof-of-Learning (PoL) 과 모델 소유권을 확보하는 Proof-of-Ownership (PoO) 의 중요성이 커지고 있습니다. 특히 신뢰할 수 없는 제3자가 모델을 학습시키는 경우, 보호, 귀속, 보상을 위해 PoL과 PoO가 동시에 강화되어야 합니다.
하지만 기존 연구는 PoL과 PoO를 별도로 다루는 경우가 많았습니다. 이는 위조 및 개인정보 유출에 대한 취약성을 높이고 검증 오버헤드를 증가시키는 결과를 초래했습니다.
중국과학원 소속 Deng Haiyu 등 8명의 연구진이 발표한 논문 “PoLO: Proof-of-Learning and Proof-of-Ownership at Once with Chained Watermarking”은 이러한 문제점을 해결하기 위해 PoLO, 즉 체인 기반 워터마킹을 이용한 통합 프레임워크를 제안합니다.
PoLO: 체인의 힘으로 보안과 효율성을 동시에 확보
PoLO는 학습 과정을 세분화된 단위(shard)로 나누고 각 단위에 고유한 워터마킹을 삽입합니다. 각 워터마킹은 이전 단위의 해시값을 사용하여 생성되므로, 이전 단위의 학습 과정을 증명하는 역할을 합니다. 이러한 체인 구조는 개별 단위의 위조를 어렵게 만들어 전체 학습 과정의 무결성을 보장합니다.
전체 워터마킹 세트는 PoL로, 마지막 워터마킹은 PoO로 사용됩니다. PoLO는 기존의 경사도 기반 추적 방식(gradient-based trajectory tracing)의 PoL 방식과 달리, 검증 과정에서 학습 데이터가 노출되는 문제를 해결하고, 워터마킹 기반 PoO 방식의 소유권 보장 수준을 유지하면서 더욱 효율적이고 개인정보 보호가 강화된 검증을 제공합니다.
놀라운 성능: 99%의 검출 정확도와 90% 이상의 공격 방어율
실험 결과, PoLO는 소유권 검증에서 99%의 워터마킹 검출 정확도를 달성했습니다. 또한, 기존 방식 대비 검증 비용을 1.510% 수준으로 줄였으며, 데이터 프라이버시도 효과적으로 보호했습니다. PoLO 위조에는 정상적인 증명 생성보다 1.14배 많은 자원이 필요하며, 공격 후에도 원본 증명의 검출 정확도는 90% 이상을 유지했습니다.
결론: 새로운 시대의 학습 증명과 소유권 증명
PoLO는 체인 기반 워터마킹을 통해 PoL과 PoO를 동시에 효율적이고 안전하게 달성하는 획기적인 방법을 제시합니다. 향후 머신러닝 모델의 안전한 공유와 거래에 중요한 역할을 할 것으로 기대됩니다. 이는 단순한 기술적 진보를 넘어, AI 시대의 신뢰와 투명성 확보에 기여하는 중요한 발걸음입니다.
Reference
[arxiv] PoLO: Proof-of-Learning and Proof-of-Ownership at Once with Chained Watermarking
Published: (Updated: )
Author: Haiyu Deng, Yanna Jiang, Guangsheng Yu, Qin Wang, Xu Wang, Baihe Ma, Wei Ni, Ren Ping Liu
http://arxiv.org/abs/2505.12296v1