๐จ AI ๋ณด์์ ์จ๊ฒจ์ง ์ทจ์ฝ์ : ํ๋กฌํํธ ์ฃผ์ ๊ณต๊ฒฉ๊ณผ CAPTURE ๋ฒค์น๋งํฌ
๋ณธ ๊ธฐ์ฌ๋ Gauri Kholkar์ Ratinder Ahuja์ ์ฐ๊ตฌ "CAPTURE: Context-Aware Prompt Injection Testing and Robustness Enhancement"๋ฅผ ๋ฐํ์ผ๋ก, AI ๋ณด์์ ์ฃผ์ ์ํ์ธ ํ๋กฌํํธ ์ฃผ์ ๊ณต๊ฒฉ๊ณผ ๊ธฐ์กด ๋ฐฉ์ง ๋ชจ๋ธ์ ํ๊ณ์ , ๊ทธ๋ฆฌ๊ณ ์๋ก์ด ๋ฒค์น๋งํฌ CAPTURE์ ์ค์์ฑ์ ์ค๋ช ํฉ๋๋ค. ์ค์ ๊ณต๊ฒฉ ์๋๋ฆฌ์ค์ ๋ํ ๋ชจ๋ธ์ ์ทจ์ฝ์ฑ์ ๋๋ฌ๋ด๊ณ , ์คํ๊ณผ ๋ฏธํ์ ๊ท ํ์ ๊ณ ๋ คํ ๋ณด๋ค ๊ฐ๋ ฅํ๊ณ ํจ์จ์ ์ธ ํ๋กฌํํธ ์ฃผ์ ๋ฐฉ์ง ๊ธฐ์ ๊ฐ๋ฐ์ ํ์์ฑ์ ๊ฐ์กฐํฉ๋๋ค.

AI ๋ณด์์ ์จ๊ฒจ์ง ์ทจ์ฝ์ : ํ๋กฌํํธ ์ฃผ์ ๊ณต๊ฒฉ๊ณผ CAPTURE ๋ฒค์น๋งํฌ
์ธ๊ณต์ง๋ฅ(AI) ์๋, ๊ฑฐ๋ ์ธ์ด ๋ชจ๋ธ(LLM)์ ์ฐ๋ฆฌ ์ถ์ ๊น์ํ ๊ณณ๊น์ง ํ๊ณ ๋ค์์ต๋๋ค. ํ์ง๋ง ๊ทธ ํธ๋ฆฌํจ ๋ค์๋ ์น๋ช ์ ์ธ ์ํ์ด ๋์ฌ๋ฆฌ๊ณ ์์ต๋๋ค. ๋ฐ๋ก ํ๋กฌํํธ ์ฃผ์ (Prompt Injection) ๊ณต๊ฒฉ์ ๋๋ค. ์ ์์ ์ธ ํ๋กฌํํธ๋ฅผ ํตํด AI ์์คํ ์ ์กฐ์ข , ์์์น ๋ชปํ ๊ฒฐ๊ณผ๋ฅผ ๋ง๋ค์ด๋ด๋ ์ด ๊ณต๊ฒฉ์ AI ๋ณด์์ ์ฌ๊ฐํ ๋ฌธ์ ๋ก ๋ ์ค๋ฅด๊ณ ์์ต๋๋ค.
Gauri Kholkar์ Ratinder Ahuja๋ ์ต๊ทผ ๋ ผ๋ฌธ "CAPTURE: Context-Aware Prompt Injection Testing and Robustness Enhancement"์์ ์ด ๋ฌธ์ ์ ๋ํ ์ฌ์ธต์ ์ธ ๋ถ์ ๊ฒฐ๊ณผ๋ฅผ ๋ฐํํ์ต๋๋ค. ๊ธฐ์กด์ ํ๋กฌํํธ ์ฃผ์ ๋ฐฉ์ง ๋ชจ๋ธ๋ค์ ์ ์ ์ธ ๊ณต๊ฒฉ ์๋๋ฆฌ์ค์๋ง ์ด์ ์ ๋ง์ถ์ด ์ค์ ์ํฉ์์๋ ํจ๊ณผ๊ฐ ๋จ์ด์ง๋ค๋ ์ ์ ์ง์ ํฉ๋๋ค. ๋ง์น ํ๋ จ๋ฐ์ ๋ณต์๊ฐ ์ค์ ๊ฒฝํ์ด ๋ถ์กฑํด ์ ๋๋ก ์ธ์ฐ์ง ๋ชปํ๋ ๊ฒ๊ณผ ๊ฐ์ต๋๋ค.
์ด๋ค์ ์ด๋ฌํ ๋ฌธ์ ๋ฅผ ํด๊ฒฐํ๊ธฐ ์ํด CAPTURE๋ผ๋ ์๋ก์ด ๋ฒค์น๋งํฌ๋ฅผ ์ ์ํ์ต๋๋ค. CAPTURE๋ ์ํฉ ์ธ์ ๊ธฐ๋ฅ์ ๊ฐ์ถ ๋ฒค์น๋งํฌ๋ก, ์ต์ํ์ ์์๋ง์ผ๋ก๋ ๊ณต๊ฒฉ ๊ฐ์ง ๋ฅ๋ ฅ๊ณผ ๊ณผ๋ํ ๋ฐฉ์ด ๊ฒฝํฅ(์คํ)์ ํ๊ฐํ ์ ์์ต๋๋ค. ์คํ ๊ฒฐ๊ณผ, ๊ธฐ์กด ๋ชจ๋ธ๋ค์ ์ ๋์ ์ํฉ์์๋ ๋์ ๋ฏธํ๋ฅ ์, ์ผ๋ฐ์ ์ธ ์ํฉ์์๋ ๋์ ์คํ๋ฅ ์ ๋ณด์์ต๋๋ค. ์ด๋ ๋ง์น ๊ฒฝ๊ณ๊ฐ ๋๋ฌด ํ์ ํด์ ๋๋์ด ๋๋๋ค ์๋ ์๊ณ , ๊ฒฝ๊ณ๊ฐ ๋๋ฌด ์ผ์ํด์ ์๊ตฐ๊น์ง ๋ง๋ ์ด์ฒ๊ตฌ๋์๋ ์ํฉ๊ณผ ๊ฐ์ต๋๋ค.
CAPTURE ๋ฒค์น๋งํฌ๋ ๊ธฐ์กด ๋ชจ๋ธ์ ํ๊ณ๋ฅผ ๋ช ํํ ๋๋ฌ๋์ต๋๋ค. ๋์ ๋ฏธํ๋ฅ ์ ์ค์ ๊ณต๊ฒฉ์ ์ทจ์ฝํจ์, ๋์ ์คํ๋ฅ ์ ์์คํ ์ ํจ์จ์ฑ ์ ํ๋ฅผ ์๋ฏธํฉ๋๋ค.
์ด ์ฐ๊ตฌ๋ AI ๋ณด์์ ๋ํ ์๋ก์ด ์๊ฐ์ ์ ์ํฉ๋๋ค. ๋จ์ํ ๊ณต๊ฒฉ์ ๋ง๋ ๊ฒ๋ฟ ์๋๋ผ, ์คํ๊ณผ ๋ฏธํ์ ๊ท ํ์ ๋ง์ถ๋ ๊ฒ์ด ์ค์ํ๋ค๋ ์ ์ ๊ฐ์กฐํฉ๋๋ค. ํฅํ ๋ณด๋ค ์ ๊ตํ๊ณ ํจ์จ์ ์ธ ํ๋กฌํํธ ์ฃผ์ ๋ฐฉ์ง ๊ธฐ์ ๊ฐ๋ฐ์ด ์๊ธํ๋ฉฐ, CAPTURE ๋ฒค์น๋งํฌ๋ ๊ทธ๋ฌํ ๊ธฐ์ ๊ฐ๋ฐ์ ์ค์ํ ๊ธฐ์ค์ด ๋ ๊ฒ์ ๋๋ค. AI ์๋์ ์์ ํ ๋ฏธ๋๋ฅผ ์ํด, ์ฐ๋ฆฌ๋ ์ง์์ ์ธ ์ฐ๊ตฌ์ ๊ฐ์ ๋ ธ๋ ฅ์ ๋ฉ์ถ ์ ์์ต๋๋ค.
Reference
[arxiv] CAPTURE: Context-Aware Prompt Injection Testing and Robustness Enhancement
Published: ย (Updated: )
Author: Gauri Kholkar, Ratinder Ahuja
http://arxiv.org/abs/2505.12368v1