침묵의 유출: 악성 질문 없이 RAG 시스템의 지식을 빼내는 새로운 공격 기법 등장


본 기사는 악성 질문 없이 RAG 시스템의 지식을 추출하는 새로운 공격 기법 IKEA에 대한 최신 연구 결과를 소개합니다. IKEA는 기존 방어 기법을 우회하며 높은 성공률을 보여 AI 시스템 보안에 대한 심각한 우려를 제기합니다.

related iamge

최근, Yuhao Wang 등 연구진이 발표한 논문 "Silent Leaks: Implicit Knowledge Extraction Attack on RAG Systems through Benign Queries"는 인공지능(AI) 분야에 충격을 안겨주었습니다. Retrieval-Augmented Generation (RAG) 시스템, 즉 외부 지식 베이스를 활용하여 대규모 언어 모델(LLM)의 성능을 향상시키는 시스템의 심각한 취약성을 드러냈기 때문입니다.

기존의 지식 추출 공격은 악성 프롬프트 주입이나 시스템 탈옥과 같은 공격적인 방법에 의존하여 쉽게 탐지될 수 있었습니다. 하지만 이번 연구에서 제시된 Implicit Knowledge Extraction Attack (IKEA) 는 이러한 한계를 뛰어넘습니다. IKEA는 자연스러운 질문만을 사용하여 RAG 시스템의 개인정보를 빼내는 놀라운 기술입니다.

IKEA는 어떻게 작동할까요? 먼저, '앵커 개념' 이라는 것을 활용하여 자연스러운 질문을 생성합니다. 그리고 두 가지 핵심 메커니즘을 통해 RAG 시스템의 민감한 지식을 효과적으로 추출합니다.

  • 경험 반영 샘플링(Experience Reflection Sampling): 과거 질문과 답변 패턴을 기반으로 앵커 개념을 샘플링하여 RAG 문서와 관련성이 높은 질문을 생성합니다.
  • 신뢰 영역 유도 변이(Trust Region Directed Mutation): 유사성 제약 조건 하에서 앵커 개념을 반복적으로 변형하여 임베딩 공간을 더욱 효과적으로 활용합니다.

실험 결과는 놀라웠습니다. IKEA는 다양한 방어 기법 하에서도 기존 방법보다 추출 효율성은 80% 이상, 공격 성공률은 90% 이상 높은 성능을 보였습니다. 더욱이, IKEA를 통해 추출된 지식으로 구축된 대체 RAG 시스템은 기존 방법에 비해 여러 평가 과제에서 압도적인 성능을 보였습니다. 이는 RAG 시스템의 심각한 개인정보 유출 위험을 시사합니다.

이 연구는 단순한 기술적 발견을 넘어, AI 시스템의 보안 및 개인정보 보호에 대한 근본적인 질문을 던집니다. 우리는 이제 RAG 시스템뿐 아니라, 더욱 정교하고 은밀한 공격에 대비해야 할 필요성을 절감하게 되었습니다. IKEA의 등장은 AI 시스템의 안전하고 윤리적인 개발을 위한 새로운 도전 과제를 제시하는 동시에, 더욱 강력한 보안 기술 개발을 위한 촉매제가 될 것입니다. 앞으로 AI 시스템의 보안에 대한 연구가 더욱 활발히 진행될 것으로 예상됩니다.


*이 기사는 AI가 생성한 내용으로, 일부 정보가 실제와 다를 수 있습니다. 정확한 확인을 위해 추가적인 검증을 권장드립니다.

Reference

[arxiv] Silent Leaks: Implicit Knowledge Extraction Attack on RAG Systems through Benign Queries

Published:  (Updated: )

Author: Yuhao Wang, Wenjie Qu, Yanze Jiang, Zichen Liu, Yue Liu, Shengfang Zhai, Yinpeng Dong, Jiaheng Zhang

http://arxiv.org/abs/2505.15420v1