π¨LLM κΈ°λ° λ€μ€ μμ΄μ νΈ μμ€ν μ IP μ μΆ μν: MASLEAK 곡격 νλ μμν¬ λΆμ π¨
LLM κΈ°λ° λ€μ€ μμ΄μ νΈ μμ€ν (MAS)μ μ§μ μ¬μ°(IP) μ μΆ μνμ±μ λ€λ£¬ μ°κ΅¬μμ, MASLEAKμ΄λΌλ μλ‘μ΄ κ³΅κ²© νλ μμν¬κ° μκ°λμμ΅λλ€. μ΄ νλ μμν¬λ μ€μ νκ²½μμ λμ μ±κ³΅λ₯ μ κΈ°λ‘νμ¬, LLM κΈ°λ° MASμ 보μ μ·¨μ½μ±μ κ°μ‘°νκ³ ν₯ν 보μ κ°νμ νμμ±μ μμ¬ν©λλ€.

LLM κΈ°λ° λ€μ€ μμ΄μ νΈ μμ€ν μ μΉλͺ μ μΈ μ½μ : IP μ μΆ μνκ³Ό MASLEAK
μ΅κ·Ό λκ·λͺ¨ μΈμ΄ λͺ¨λΈ(LLM)μ λ°μ μΌλ‘ 볡μ‘ν μμ μ μννκΈ° μν΄ μ¬λ¬ μμ΄μ νΈκ° νμ νλ λ€μ€ μμ΄μ νΈ μμ€ν (MAS)μ΄ κΈλΆμνμ΅λλ€. νμ§λ§ MASμ 볡μ‘ν ꡬ쑰μ μμ΄μ νΈ κ° μνΈμμ©μ μ§μ μ¬μ°(IP) 보νΈμ λν μ¬κ°ν μ°λ €λ₯Ό λΆλ¬μΌμΌν€κ³ μμ΅λλ€.
Liwen Wang λ± μ°κ΅¬μ§μ μ΄λ¬ν μνμ λν νκΈ°μ μΈ μ°κ΅¬ κ²°κ³Όλ₯Ό λ°ννμ΅λλ€. κ·Έλ€μ MASμμ λ―Όκ°ν μ 보λ₯Ό μΆμΆνλλ‘ μ€κ³λ μλ‘μ΄ κ³΅κ²© νλ μμν¬, MASLEAKμ μκ°νμ΅λλ€. MASLEAKμ 곡격μκ° MASμ ꡬ쑰λ μμ΄μ νΈ κ΅¬μ±μ λν μ¬μ μ§μμ΄ μλ μ€μ λΈλλ°μ€ νκ²½μ λμμΌλ‘ ν©λλ€. 곡격μλ κ³΅κ° APIλ₯Ό ν΅ν΄ MASμ μνΈ μμ©νμ¬ κ³΅κ²© 쿼리(q)λ₯Ό μ μΆνκ³ μ΅μ’ μμ΄μ νΈμ μΆλ ₯μ κ΄μ°°νλ λ°©μμΌλ‘ μλν©λλ€.
MASLEAKμ μλ λ°©μμ μ»΄ν¨ν° μμ μ ν λ° κ°μΌ κ³Όμ μμ μκ°μ λ°μμ΅λλ€. μ¦, MASμ κ° μμ΄μ νΈλ‘λΆν° μλ΅μ μ λ, μ ν, μ μ§νμ¬ λ μ κ΅¬μ± μμ(μμ΄μ νΈ μ, μμ€ν ν ν΄λ‘μ§, μμ€ν ν둬ννΈ, μμ μ§μΉ¨, λꡬ μ¬μ© λ±)λ₯Ό λͺ¨λ λλ¬λ΄λ κ²μ λλ€.
μ°κ΅¬μ§μ 810κ°μ MAS μ ν리μΌμ΄μ μΌλ‘ ꡬμ±λ μ΅μ΄μ ν©μ± λ°μ΄ν° μΈνΈλ₯Ό ꡬμΆνκ³ , Coze λ° CrewAIμ κ°μ μ€μ MAS μ ν리μΌμ΄μ μ λν MASLEAKμ μ±λ₯μ νκ°νμ΅λλ€. κ·Έ κ²°κ³Ό, MASLEAKμ μμ€ν ν둬ννΈ λ° μμ μ§μΉ¨μ λν΄ νκ· 87%μ μ±κ³΅λ₯ , μμ€ν μν€ν μ²μ λν΄ 92%μ λμ μ νλλ₯Ό λ¬μ±νμ΅λλ€. μ΄κ²μ LLM κΈ°λ° MASμ 보μ μ·¨μ½μ±μ΄ λ§€μ° μ¬κ°ν¨μ μμ¬νλ κ²°κ³Όμ λλ€.
λ³Έ μ°κ΅¬λ MASμ IP μ μΆ μνμ±μ λͺ νν 보μ¬μ£Όλ λμμ, ν₯ν 보μ κ°ν λ°©μ λ§λ ¨μ μν μ€μν μμ¬μ μ μ 곡ν©λλ€. LLM κΈ°λ° MASμ λ°μ κ³Ό ν¨κ», μ΄λ¬ν μνμ λν μ§μμ μΈ μ°κ΅¬μ λμμ± κ°λ°μ΄ μ μ€ν νμν©λλ€.
Reference
[arxiv] IP Leakage Attacks Targeting LLM-Based Multi-Agent Systems
Published: Β (Updated: )
Author: Liwen Wang, Wenxuan Wang, Shuai Wang, Zongjie Li, Zhenlan Ji, Zongyi Lyu, Daoyuan Wu, Shing-Chi Cheung
http://arxiv.org/abs/2505.12442v2