๐Ÿšจ AI ๋ณด์•ˆ์˜ ์ˆจ๊ฒจ์ง„ ์ทจ์•ฝ์ : ํ”„๋กฌํ”„ํŠธ ์ฃผ์ž… ๊ณต๊ฒฉ๊ณผ CAPTURE ๋ฒค์น˜๋งˆํฌ


๋ณธ ๊ธฐ์‚ฌ๋Š” Gauri Kholkar์™€ Ratinder Ahuja์˜ ์—ฐ๊ตฌ "CAPTURE: Context-Aware Prompt Injection Testing and Robustness Enhancement"๋ฅผ ๋ฐ”ํƒ•์œผ๋กœ, AI ๋ณด์•ˆ์˜ ์ฃผ์š” ์œ„ํ˜‘์ธ ํ”„๋กฌํ”„ํŠธ ์ฃผ์ž… ๊ณต๊ฒฉ๊ณผ ๊ธฐ์กด ๋ฐฉ์ง€ ๋ชจ๋ธ์˜ ํ•œ๊ณ„์ , ๊ทธ๋ฆฌ๊ณ  ์ƒˆ๋กœ์šด ๋ฒค์น˜๋งˆํฌ CAPTURE์˜ ์ค‘์š”์„ฑ์„ ์„ค๋ช…ํ•ฉ๋‹ˆ๋‹ค. ์‹ค์ œ ๊ณต๊ฒฉ ์‹œ๋‚˜๋ฆฌ์˜ค์— ๋Œ€ํ•œ ๋ชจ๋ธ์˜ ์ทจ์•ฝ์„ฑ์„ ๋“œ๋Ÿฌ๋‚ด๊ณ , ์˜คํƒ๊ณผ ๋ฏธํƒ์˜ ๊ท ํ˜•์„ ๊ณ ๋ คํ•œ ๋ณด๋‹ค ๊ฐ•๋ ฅํ•˜๊ณ  ํšจ์œจ์ ์ธ ํ”„๋กฌํ”„ํŠธ ์ฃผ์ž… ๋ฐฉ์ง€ ๊ธฐ์ˆ  ๊ฐœ๋ฐœ์˜ ํ•„์š”์„ฑ์„ ๊ฐ•์กฐํ•ฉ๋‹ˆ๋‹ค.

related iamge

AI ๋ณด์•ˆ์˜ ์ˆจ๊ฒจ์ง„ ์ทจ์•ฝ์ : ํ”„๋กฌํ”„ํŠธ ์ฃผ์ž… ๊ณต๊ฒฉ๊ณผ CAPTURE ๋ฒค์น˜๋งˆํฌ

์ธ๊ณต์ง€๋Šฅ(AI) ์‹œ๋Œ€, ๊ฑฐ๋Œ€ ์–ธ์–ด ๋ชจ๋ธ(LLM)์€ ์šฐ๋ฆฌ ์‚ถ์˜ ๊นŠ์ˆ™ํ•œ ๊ณณ๊นŒ์ง€ ํŒŒ๊ณ ๋“ค์—ˆ์Šต๋‹ˆ๋‹ค. ํ•˜์ง€๋งŒ ๊ทธ ํŽธ๋ฆฌํ•จ ๋’ค์—๋Š” ์น˜๋ช…์ ์ธ ์œ„ํ˜‘์ด ๋„์‚ฌ๋ฆฌ๊ณ  ์žˆ์Šต๋‹ˆ๋‹ค. ๋ฐ”๋กœ ํ”„๋กฌํ”„ํŠธ ์ฃผ์ž…(Prompt Injection) ๊ณต๊ฒฉ์ž…๋‹ˆ๋‹ค. ์•…์˜์ ์ธ ํ”„๋กฌํ”„ํŠธ๋ฅผ ํ†ตํ•ด AI ์‹œ์Šคํ…œ์„ ์กฐ์ข…, ์˜ˆ์ƒ์น˜ ๋ชปํ•œ ๊ฒฐ๊ณผ๋ฅผ ๋งŒ๋“ค์–ด๋‚ด๋Š” ์ด ๊ณต๊ฒฉ์€ AI ๋ณด์•ˆ์˜ ์‹ฌ๊ฐํ•œ ๋ฌธ์ œ๋กœ ๋– ์˜ค๋ฅด๊ณ  ์žˆ์Šต๋‹ˆ๋‹ค.

Gauri Kholkar์™€ Ratinder Ahuja๋Š” ์ตœ๊ทผ ๋…ผ๋ฌธ "CAPTURE: Context-Aware Prompt Injection Testing and Robustness Enhancement"์—์„œ ์ด ๋ฌธ์ œ์— ๋Œ€ํ•œ ์‹ฌ์ธต์ ์ธ ๋ถ„์„ ๊ฒฐ๊ณผ๋ฅผ ๋ฐœํ‘œํ–ˆ์Šต๋‹ˆ๋‹ค. ๊ธฐ์กด์˜ ํ”„๋กฌํ”„ํŠธ ์ฃผ์ž… ๋ฐฉ์ง€ ๋ชจ๋ธ๋“ค์€ ์ •์ ์ธ ๊ณต๊ฒฉ ์‹œ๋‚˜๋ฆฌ์˜ค์—๋งŒ ์ดˆ์ ์„ ๋งž์ถ”์–ด ์‹ค์ œ ์ƒํ™ฉ์—์„œ๋Š” ํšจ๊ณผ๊ฐ€ ๋–จ์–ด์ง„๋‹ค๋Š” ์ ์„ ์ง€์ ํ•ฉ๋‹ˆ๋‹ค. ๋งˆ์น˜ ํ›ˆ๋ จ๋ฐ›์€ ๋ณต์„œ๊ฐ€ ์‹ค์ „ ๊ฒฝํ—˜์ด ๋ถ€์กฑํ•ด ์ œ๋Œ€๋กœ ์‹ธ์šฐ์ง€ ๋ชปํ•˜๋Š” ๊ฒƒ๊ณผ ๊ฐ™์Šต๋‹ˆ๋‹ค.

์ด๋“ค์€ ์ด๋Ÿฌํ•œ ๋ฌธ์ œ๋ฅผ ํ•ด๊ฒฐํ•˜๊ธฐ ์œ„ํ•ด CAPTURE๋ผ๋Š” ์ƒˆ๋กœ์šด ๋ฒค์น˜๋งˆํฌ๋ฅผ ์ œ์‹œํ–ˆ์Šต๋‹ˆ๋‹ค. CAPTURE๋Š” ์ƒํ™ฉ ์ธ์‹ ๊ธฐ๋Šฅ์„ ๊ฐ–์ถ˜ ๋ฒค์น˜๋งˆํฌ๋กœ, ์ตœ์†Œํ•œ์˜ ์˜ˆ์‹œ๋งŒ์œผ๋กœ๋„ ๊ณต๊ฒฉ ๊ฐ์ง€ ๋Šฅ๋ ฅ๊ณผ ๊ณผ๋„ํ•œ ๋ฐฉ์–ด ๊ฒฝํ–ฅ(์˜คํƒ)์„ ํ‰๊ฐ€ํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค. ์‹คํ—˜ ๊ฒฐ๊ณผ, ๊ธฐ์กด ๋ชจ๋ธ๋“ค์€ ์ ๋Œ€์  ์ƒํ™ฉ์—์„œ๋Š” ๋†’์€ ๋ฏธํƒ๋ฅ ์„, ์ผ๋ฐ˜์ ์ธ ์ƒํ™ฉ์—์„œ๋Š” ๋†’์€ ์˜คํƒ๋ฅ ์„ ๋ณด์˜€์Šต๋‹ˆ๋‹ค. ์ด๋Š” ๋งˆ์น˜ ๊ฒฝ๊ณ„๊ฐ€ ๋„ˆ๋ฌด ํ—ˆ์ˆ ํ•ด์„œ ๋„๋‘‘์ด ๋“œ๋‚˜๋“ค ์ˆ˜๋„ ์žˆ๊ณ , ๊ฒฝ๊ณ„๊ฐ€ ๋„ˆ๋ฌด ์‚ผ์—„ํ•ด์„œ ์•„๊ตฐ๊นŒ์ง€ ๋ง‰๋Š” ์–ด์ฒ˜๊ตฌ๋‹ˆ์—†๋Š” ์ƒํ™ฉ๊ณผ ๊ฐ™์Šต๋‹ˆ๋‹ค.

CAPTURE ๋ฒค์น˜๋งˆํฌ๋Š” ๊ธฐ์กด ๋ชจ๋ธ์˜ ํ•œ๊ณ„๋ฅผ ๋ช…ํ™•ํžˆ ๋“œ๋Ÿฌ๋ƒˆ์Šต๋‹ˆ๋‹ค. ๋†’์€ ๋ฏธํƒ๋ฅ ์€ ์‹ค์ œ ๊ณต๊ฒฉ์— ์ทจ์•ฝํ•จ์„, ๋†’์€ ์˜คํƒ๋ฅ ์€ ์‹œ์Šคํ…œ์˜ ํšจ์œจ์„ฑ ์ €ํ•˜๋ฅผ ์˜๋ฏธํ•ฉ๋‹ˆ๋‹ค.

์ด ์—ฐ๊ตฌ๋Š” AI ๋ณด์•ˆ์— ๋Œ€ํ•œ ์ƒˆ๋กœ์šด ์‹œ๊ฐ์„ ์ œ์‹œํ•ฉ๋‹ˆ๋‹ค. ๋‹จ์ˆœํžˆ ๊ณต๊ฒฉ์„ ๋ง‰๋Š” ๊ฒƒ๋ฟ ์•„๋‹ˆ๋ผ, ์˜คํƒ๊ณผ ๋ฏธํƒ์˜ ๊ท ํ˜•์„ ๋งž์ถ”๋Š” ๊ฒƒ์ด ์ค‘์š”ํ•˜๋‹ค๋Š” ์ ์„ ๊ฐ•์กฐํ•ฉ๋‹ˆ๋‹ค. ํ–ฅํ›„ ๋ณด๋‹ค ์ •๊ตํ•˜๊ณ  ํšจ์œจ์ ์ธ ํ”„๋กฌํ”„ํŠธ ์ฃผ์ž… ๋ฐฉ์ง€ ๊ธฐ์ˆ  ๊ฐœ๋ฐœ์ด ์‹œ๊ธ‰ํ•˜๋ฉฐ, CAPTURE ๋ฒค์น˜๋งˆํฌ๋Š” ๊ทธ๋Ÿฌํ•œ ๊ธฐ์ˆ  ๊ฐœ๋ฐœ์— ์ค‘์š”ํ•œ ๊ธฐ์ค€์ด ๋  ๊ฒƒ์ž…๋‹ˆ๋‹ค. AI ์‹œ๋Œ€์˜ ์•ˆ์ „ํ•œ ๋ฏธ๋ž˜๋ฅผ ์œ„ํ•ด, ์šฐ๋ฆฌ๋Š” ์ง€์†์ ์ธ ์—ฐ๊ตฌ์™€ ๊ฐœ์„  ๋…ธ๋ ฅ์„ ๋ฉˆ์ถœ ์ˆ˜ ์—†์Šต๋‹ˆ๋‹ค.


*์ด ๊ธฐ์‚ฌ๋Š” AI๊ฐ€ ์ƒ์„ฑํ•œ ๋‚ด์šฉ์œผ๋กœ, ์ผ๋ถ€ ์ •๋ณด๊ฐ€ ์‹ค์ œ์™€ ๋‹ค๋ฅผ ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค. ์ •ํ™•ํ•œ ํ™•์ธ์„ ์œ„ํ•ด ์ถ”๊ฐ€์ ์ธ ๊ฒ€์ฆ์„ ๊ถŒ์žฅ๋“œ๋ฆฝ๋‹ˆ๋‹ค.

Reference

[arxiv] CAPTURE: Context-Aware Prompt Injection Testing and Robustness Enhancement

Published: ย (Updated: )

Author: Gauri Kholkar, Ratinder Ahuja

http://arxiv.org/abs/2505.12368v1