๐จ AI๊ฐ ๊ตญ๊ฐ ์๋ณด๋ฅผ ์ํํ๋ค๋ฉด? ๐ค ์๋ก์ด ์ฌ๊ณ ๊ด๋ฆฌ ์ฒด๊ณ ์ ์!
Alejandro Ortega์ ๋ ผ๋ฌธ์ AI ๊ธฐ์ ์ ๋ฐ์ ์ผ๋ก ์ธํ ๊ตญ๊ฐ ์๋ณด ์ํ ์ฆ๊ฐ์ ๋ํ ์ฐ๋ ค๋ฅผ ์ ๊ธฐํ๊ณ , ๊ธฐ์กด ์๋ณด ์ค์ ์์คํ ์ ์ฌ๊ณ ๊ด๋ฆฌ ์ฒด๊ณ๋ฅผ ๋ฐํ์ผ๋ก ํ ์๋ก์ด AI ์ฌ๊ณ ๊ด๋ฆฌ ์ฒด๊ณ๋ฅผ ์ ์ํฉ๋๋ค. ์ด ์ฒด๊ณ๋ AI ์ฌ๊ณ ์ ์ ์, ์ ๋ถ ๊ธฐ๊ด์ ๋ํ ๋ณด๊ณ ์๋ฌด, ์์ ์ ์ฐจ ๊ฐ์ ๋ฑ์ ํฌํจํ๋ฉฐ, AI ๊ธฐ์ ์ ๋ฐ์ ๊ณผ ํจ๊ป ๊ตญ๊ฐ ์๋ณด ์ ๋ต์ ์ฌ์ ๋ฆฝ์ด ํ์ํจ์ ๊ฐ์กฐํฉ๋๋ค.

AI, ๊ตญ๊ฐ ์๋ณด์ ์๋ก์ด ์ํ์ผ๋ก ๋ ์ค๋ฅด๋ค
์ต๊ทผ AI ๊ธฐ์ ์ ๋ฐ์ ์ ๊ตญ๊ฐ ์๋ณด์ ๋ํ ์๋ก์ด ์ํ์ ์ ๊ธฐํ๊ณ ์์ต๋๋ค. ์ ์์ ์ธ ํ์์๊ฐ AI๋ฅผ ์ด์ฉํ์ฌ ์ค์ ๊ตญ๊ฐ ๊ธฐ๋ฐ ์์ค์ ๋ํ ์ฌ์ด๋ฒ ๊ณต๊ฒฉ์ ์ฝ๊ฒ ์ํํ๊ฑฐ๋, ์์จ์ฃผํ AI ์์คํ ์ ํต์ ๋ฅผ ์์คํ๋ ๋ฑ์ ์ํ์ด ์ฆ๊ฐํ๊ณ ์์ต๋๋ค. ๋ฏธ๊ตญ ์ฐ๋ฐฉ ์ ๋ฒ์๋ค๋ ์ด๋ฌํ ์ํ์ ๋์ํ๊ธฐ ์ํด AI ์ฌ๊ณ ๊ด๋ฆฌ ์ฒด๊ณ๋ฅผ ๊ตฌ์ถํ๋ ค๋ ์์ง์์ ๋ณด์ด๊ณ ์์ต๋๋ค.
Alejandro Ortega๋ ์ด๋ฌํ ์ํฉ์ ๋ถ์ํ์ฌ, ๊ตญ๊ฐ ์๋ณด์ ์ฌ๊ฐํ ์ํ์ด ๋๋ AI ์์คํ ์ ๋ํ ๋ฒ์ ์๋ฌด๋ฅผ ๋ถ์ฌํ๋ ์ฌํ ๋ฐฐ์น AI ์ฌ๊ณ ๊ด๋ฆฌ ์ฒด๊ณ๋ฅผ ์ ์ํ๋ ๋ ผ๋ฌธ์ ๋ฐํํ์ต๋๋ค. ๋ ผ๋ฌธ์์๋ '์๋ณด ์ค์ ์์คํ '(security-critical)์ด๋ผ๋ ๊ฐ๋ ์ ๋์ ํ์ฌ ์์๋ ฅ, ํญ๊ณต, ์๋ช ๊ณผํ ๋ฑ ๊ธฐ์กด์ ๊ณ ์ํ ์์คํ ๊ณผ AI๋ฅผ ๋์ผ์ ์์์ ๊ด๋ฆฌํด์ผ ํจ์ ์ฃผ์ฅํฉ๋๋ค. ํต์ฌ์ ์ฒจ๋จ AI ๊ฐ๋ฐ์ '์๋ณด ์ค์ ์์คํ '์ผ๋ก ๋ถ๋ฅํ๊ณ , ๊ธฐ์กด ์์คํ ์ ์ฌ๊ณ ๊ด๋ฆฌ ์ฒด๊ณ๋ฅผ AI์ ์ ์ฉํ๋ ๊ฒ์ ๋๋ค.
AI ์ฌ๊ณ ๊ด๋ฆฌ ์ฒด๊ณ: 3๋จ๊ณ ์ ๋ต
Ortega์ ์ ์์ ํฌ๊ฒ ์ธ ๋จ๊ณ๋ก ๊ตฌ์ฑ๋ฉ๋๋ค.
1๋จ๊ณ: AI ์ฌ๊ณ ์ ์ ๋ฐ '๊ตญ๊ฐ ์๋ณด ์ฌ๋ก' ์ ์: ์ฒจ๋จ AI ์์คํ ๋ฐฐํฌ ์ ์ ์ ๊ณต์ ์ฒด๊ฐ '๊ตญ๊ฐ ์๋ณด ์ฌ๋ก'๋ฅผ ์ ์ํด์ผ ํฉ๋๋ค. ์ด๋ AI ์์คํ ์ด ๊ตญ๊ฐ ์๋ณด์ ๋ฏธ์น ์ ์๋ ์ํ์ ์ฌ์ ์ ํ๊ฐํ๊ณ ๊ด๋ฆฌํ๊ธฐ ์ํ ํ์ ๋จ๊ณ์ ๋๋ค.
2๋จ๊ณ ๋ฐ 3๋จ๊ณ: ์ ๋ถ ๊ธฐ๊ด์ ๋ํ ์ฌ๊ณ ๋ณด๊ณ ๋ฐ ์์ ์ ์ฐจ ๊ฐ์ : AI ์ ๊ณต์ ์ฒด๋ ์ฌ๊ณ ๋ฐ์ ์ ์ ๋ถ ๊ธฐ๊ด์ ์ฆ์ ๋ณด๊ณ ํด์ผ ํ๋ฉฐ, ์ ๋ถ ๊ธฐ๊ด์ ํฅํ ๊ตญ๊ฐ ์๋ณด ์ํ์ ๋ฐฉ์งํ๊ธฐ ์ํด ์ ๊ณต์ ์ฒด์ ์์ ๋ฐ ๋ณด์ ์ ์ฐจ ๊ฐ์ ์ ์ ๊ทน์ ์ผ๋ก ์ฐธ์ฌํด์ผ ํฉ๋๋ค.
์ด๋ ๊ธฐ์กด ์์๋ ฅ, ํญ๊ณต ๋ฑ ์๋ณด ์ค์ ์์คํ ์ ์ฌ๊ณ ๊ด๋ฆฌ ์ฒด๊ณ์ ์ ์ฌํ ์ ๊ทผ ๋ฐฉ์์ ๋๋ค. ๋ ผ๋ฌธ์์๋ ๊ฐ์์ AI ์ฌ์ด๋ฒ ์ฌ๊ณ ์๋๋ฆฌ์ค๋ฅผ ์ ์ํ์ฌ ์ ์๋ ์ฒด๊ณ์ ํจ์ฉ์ฑ์ ๋ณด์ฌ์ค๋๋ค.
์์ฌ์ : AI ์๋์ ๊ตญ๊ฐ ์๋ณด ์ ๋ต ์ฌ์ ๋ฆฝ
Ortega์ ์ฐ๊ตฌ๋ AI ์๋์ ๊ตญ๊ฐ ์๋ณด ์ ๋ต์ ์ฌ์ ๋ฆฝํด์ผ ํ ํ์์ฑ์ ๊ฐ์กฐํฉ๋๋ค. ๋จ์ํ ๊ธฐ์ ๋ฐ์ ์๋ง ์ง์คํ ๊ฒ์ด ์๋๋ผ, ๊ทธ ๊ธฐ์ ์ด ๊ฐ์ ธ์ฌ ์ ์๋ ์ํ์ ์ฌ์ ์ ์์ธกํ๊ณ ๊ด๋ฆฌํ๋ ์ฒด๊ณ๋ฅผ ๊ตฌ์ถํ๋ ๊ฒ์ด ์ค์ํฉ๋๋ค. AI ๊ธฐ์ ์ ๋ฐ์ ๊ณผ ํจ๊ป, ์ด์ ๋ํ ์์ ํ๊ณ ์ฑ ์์๋ ๊ด๋ฆฌ ์ฒด๊ณ์ ๊ตฌ์ถ ๋ํ ํ์์ ์ธ ๊ณผ์ ๋ก ๋ ์ค๋ฅด๊ณ ์์ต๋๋ค. ์ด ๋ ผ๋ฌธ์ ์ด๋ฌํ ๊ณผ์ ์ ๋ํ ์ค์ํ ํด๊ฒฐ ๋ฐฉ์์ ์ ์ํ๊ณ ์์ผ๋ฉฐ, ์์ผ๋ก ๊ด๋ จ ์ ์ฑ ๋ฐ ๊ธฐ์ ๊ฐ๋ฐ์ ํฐ ์ํฅ์ ๋ฏธ์น ๊ฒ์ผ๋ก ์์๋ฉ๋๋ค.
Reference
[arxiv] A proposal for an incident regime that tracks and counters threats to national security posed by AI systems
Published: ย (Updated: )
Author: Alejandro Ortega
http://arxiv.org/abs/2503.19887v1