잊혀질 권리 보장을 위한 혁신적인 AI 언러닝 프레임워크: PRUNE
중국과학원 연구진이 개발한 PRUNE은 기존 신경망에 패치를 적용하여 데이터를 제거하는 새로운 AI 언러닝 프레임워크입니다. 최소한의 패치로 데이터를 효율적이고 검증 가능하게 삭제하며, 모델 성능 저하 없이 효율성과 메모리 소비를 개선했습니다. 개인정보보호 규제 강화에 따른 '잊혀질 권리' 보장에 중요한 기술적 해결책을 제시합니다.

최근 개인정보보호 규제가 강화되면서, AI 모델 훈련에 사용된 개인 데이터를 삭제하는 '잊혀질 권리'에 대한 요구가 커지고 있습니다. 기존의 AI 언러닝 방법들은 남은 데이터로 모델을 재훈련해야 하는데, 이는 비용이 많이 들고 검증이 어려운 단점이 있습니다. 하지만 중국과학원 자동화연구소의 연구진(Xuran Li, Jingyi Wang 외)이 개발한 PRUNE (Patching based Repair framework for Unlearning) 은 이러한 문제를 해결할 획기적인 해결책을 제시합니다.
PRUNE은 기존 신경망에 '패치'를 적용하여 특정 데이터를 '잊게' 만드는 새로운 언러닝 방식입니다. 신경망 복구 연구에서 영감을 얻어, 최소한의 패치를 통해 원하는 데이터를 제거하면서도, 그 효과를 검증 가능하게 만드는 것이 핵심입니다. 단일 데이터 포인트 삭제에서 나아가, 여러 데이터 포인트 또는 전체 클래스를 언러닝하기 위해서는 대표 데이터 포인트들을 선택적으로 제거하는 반복적인 접근 방식을 사용합니다.
다양한 데이터셋을 이용한 실험 결과, PRUNE은 기존 방법들에 비해 효율성과 메모리 소비 면에서 경쟁력을 갖추면서, 모델 성능 저하를 최소화하는 것으로 나타났습니다. 이는 개인정보 보호와 AI 모델 성능을 동시에 달성할 수 있는 중요한 발전으로 평가됩니다.
PRUNE의 핵심 특징:
- 기존 신경망에 '패치'를 적용하는 혁신적인 언러닝 방식
- 최소한의 패치로 데이터 제거 및 검증 가능성 확보
- 대표 데이터 포인트 선택적 제거를 통한 효율적인 다중 데이터 또는 클래스 언러닝
- 기존 방법 대비 효율성 및 메모리 소비 개선, 모델 성능 유지
이 연구는 단순히 기술적인 발전을 넘어, AI 시대의 윤리적 문제 해결에 중요한 전환점을 제시할 것으로 기대됩니다. 앞으로 PRUNE이 더욱 발전하여, AI 시스템의 신뢰성과 투명성을 높이는 데 기여할 수 있기를 기대합니다. 더불어, 개인정보 보호에 대한 사회적 요구와 기술적 발전 사이의 균형을 맞추는 데 중요한 역할을 할 것으로 예상됩니다.
Reference
[arxiv] PRUNE: A Patching Based Repair Framework for Certifiable Unlearning of Neural Networks
Published: (Updated: )
Author: Xuran Li, Jingyi Wang, Xiaohan Yuan, Peixin Zhang, Zhan Qin, Zhibo Wang, Kui Ren
http://arxiv.org/abs/2505.06520v2