🚨LLM 기반 닀쀑 μ—μ΄μ „νŠΈ μ‹œμŠ€ν…œμ˜ IP 유좜 μœ„ν˜‘: MASLEAK 곡격 ν”„λ ˆμž„μ›Œν¬ 뢄석 🚨


LLM 기반 닀쀑 μ—μ΄μ „νŠΈ μ‹œμŠ€ν…œ(MAS)의 μ§€μ μž¬μ‚°(IP) 유좜 μœ„ν—˜μ„±μ„ 닀룬 μ—°κ΅¬μ—μ„œ, MASLEAKμ΄λΌλŠ” μƒˆλ‘œμš΄ 곡격 ν”„λ ˆμž„μ›Œν¬κ°€ μ†Œκ°œλ˜μ—ˆμŠ΅λ‹ˆλ‹€. 이 ν”„λ ˆμž„μ›Œν¬λŠ” μ‹€μ œ ν™˜κ²½μ—μ„œ 높은 성곡λ₯ μ„ κΈ°λ‘ν•˜μ—¬, LLM 기반 MAS의 λ³΄μ•ˆ 취약성을 κ°•μ‘°ν•˜κ³  ν–₯ν›„ λ³΄μ•ˆ κ°•ν™”μ˜ ν•„μš”μ„±μ„ μ‹œμ‚¬ν•©λ‹ˆλ‹€.

related iamge

LLM 기반 닀쀑 μ—μ΄μ „νŠΈ μ‹œμŠ€ν…œμ˜ 치λͺ…적인 약점: IP 유좜 μœ„ν˜‘κ³Ό MASLEAK

졜근 λŒ€κ·œλͺ¨ μ–Έμ–΄ λͺ¨λΈ(LLM)의 λ°œμ „μœΌλ‘œ λ³΅μž‘ν•œ μž‘μ—…μ„ μˆ˜ν–‰ν•˜κΈ° μœ„ν•΄ μ—¬λŸ¬ μ—μ΄μ „νŠΈκ°€ ν˜‘μ—…ν•˜λŠ” 닀쀑 μ—μ΄μ „νŠΈ μ‹œμŠ€ν…œ(MAS)이 κΈ‰λΆ€μƒν–ˆμŠ΅λ‹ˆλ‹€. ν•˜μ§€λ§Œ MAS의 λ³΅μž‘ν•œ ꡬ쑰와 μ—μ΄μ „νŠΈ κ°„ μƒν˜Έμž‘μš©μ€ 지적 μž¬μ‚°(IP) λ³΄ν˜Έμ— λŒ€ν•œ μ‹¬κ°ν•œ 우렀λ₯Ό λΆˆλŸ¬μΌμœΌν‚€κ³  μžˆμŠ΅λ‹ˆλ‹€.

Liwen Wang λ“± 연ꡬ진은 μ΄λŸ¬ν•œ μœ„ν˜‘μ— λŒ€ν•œ 획기적인 연ꡬ κ²°κ³Όλ₯Ό λ°œν‘œν–ˆμŠ΅λ‹ˆλ‹€. 그듀은 MASμ—μ„œ λ―Όκ°ν•œ 정보λ₯Ό μΆ”μΆœν•˜λ„λ‘ μ„€κ³„λœ μƒˆλ‘œμš΄ 곡격 ν”„λ ˆμž„μ›Œν¬, MASLEAK을 μ†Œκ°œν–ˆμŠ΅λ‹ˆλ‹€. MASLEAK은 κ³΅κ²©μžκ°€ MAS의 κ΅¬μ‘°λ‚˜ μ—μ΄μ „νŠΈ ꡬ성에 λŒ€ν•œ 사전 지식이 μ—†λŠ” μ‹€μ œ λΈ”λž™λ°•μŠ€ ν™˜κ²½μ„ λŒ€μƒμœΌλ‘œ ν•©λ‹ˆλ‹€. κ³΅κ²©μžλŠ” 곡개 APIλ₯Ό 톡해 MAS와 μƒν˜Έ μž‘μš©ν•˜μ—¬ 곡격 쿼리(q)λ₯Ό μ œμΆœν•˜κ³  μ΅œμ’… μ—μ΄μ „νŠΈμ˜ 좜λ ₯을 κ΄€μ°°ν•˜λŠ” λ°©μ‹μœΌλ‘œ μž‘λ™ν•©λ‹ˆλ‹€.

MASLEAK의 μž‘λ™ 방식은 컴퓨터 μ›œμ˜ μ „νŒŒ 및 감염 κ³Όμ •μ—μ„œ μ˜κ°μ„ λ°›μ•˜μŠ΅λ‹ˆλ‹€. 즉, MAS의 각 μ—μ΄μ „νŠΈλ‘œλΆ€ν„° 응닡을 μœ λ„, μ „νŒŒ, μœ μ§€ν•˜μ—¬ 독점 ꡬ성 μš”μ†Œ(μ—μ΄μ „νŠΈ 수, μ‹œμŠ€ν…œ ν† ν΄λ‘œμ§€, μ‹œμŠ€ν…œ ν”„λ‘¬ν”„νŠΈ, μž‘μ—… μ§€μΉ¨, 도ꡬ μ‚¬μš© λ“±)λ₯Ό λͺ¨λ‘ λ“œλŸ¬λ‚΄λŠ” κ²ƒμž…λ‹ˆλ‹€.

연ꡬ진은 810개의 MAS μ• ν”Œλ¦¬μΌ€μ΄μ…˜μœΌλ‘œ κ΅¬μ„±λœ 졜초의 ν•©μ„± 데이터 μ„ΈνŠΈλ₯Ό κ΅¬μΆ•ν•˜κ³ , Coze 및 CrewAI와 같은 μ‹€μ œ MAS μ• ν”Œλ¦¬μΌ€μ΄μ…˜μ— λŒ€ν•œ MASLEAK의 μ„±λŠ₯을 ν‰κ°€ν–ˆμŠ΅λ‹ˆλ‹€. κ·Έ κ²°κ³Ό, MASLEAK은 μ‹œμŠ€ν…œ ν”„λ‘¬ν”„νŠΈ 및 μž‘μ—… 지침에 λŒ€ν•΄ 평균 87%의 성곡λ₯ , μ‹œμŠ€ν…œ μ•„ν‚€ν…μ²˜μ— λŒ€ν•΄ 92%의 높은 정확도λ₯Ό λ‹¬μ„±ν–ˆμŠ΅λ‹ˆλ‹€. 이것은 LLM 기반 MAS의 λ³΄μ•ˆ 취약성이 맀우 심각함을 μ‹œμ‚¬ν•˜λŠ” κ²°κ³Όμž…λ‹ˆλ‹€.

λ³Έ μ—°κ΅¬λŠ” MAS의 IP 유좜 μœ„ν—˜μ„±μ„ λͺ…ν™•νžˆ λ³΄μ—¬μ£ΌλŠ” λ™μ‹œμ—, ν–₯ν›„ λ³΄μ•ˆ κ°•ν™” λ°©μ•ˆ λ§ˆλ ¨μ„ μœ„ν•œ μ€‘μš”ν•œ μ‹œμ‚¬μ μ„ μ œκ³΅ν•©λ‹ˆλ‹€. LLM 기반 MAS의 λ°œμ „κ³Ό ν•¨κ»˜, μ΄λŸ¬ν•œ μœ„ν˜‘μ— λŒ€ν•œ 지속적인 연ꡬ와 λŒ€μ‘μ±… 개발이 μ ˆμ‹€νžˆ ν•„μš”ν•©λ‹ˆλ‹€.


*이 κΈ°μ‚¬λŠ” AIκ°€ μƒμ„±ν•œ λ‚΄μš©μœΌλ‘œ, 일뢀 정보가 μ‹€μ œμ™€ λ‹€λ₯Ό 수 μžˆμŠ΅λ‹ˆλ‹€. μ •ν™•ν•œ 확인을 μœ„ν•΄ 좔가적인 검증을 ꢌμž₯λ“œλ¦½λ‹ˆλ‹€.

Reference

[arxiv] IP Leakage Attacks Targeting LLM-Based Multi-Agent Systems

Published: Β (Updated: )

Author: Liwen Wang, Wenxuan Wang, Shuai Wang, Zongjie Li, Zhenlan Ji, Zongyi Lyu, Daoyuan Wu, Shing-Chi Cheung

http://arxiv.org/abs/2505.12442v2