🚨 좩격! ν…μŠ€νŠΈ-λΉ„λ””μ˜€ 생성 AI, μ•…μ˜μ  곡격에 μ·¨μ•½ν•˜λ‹€?! 🚨


λ³Έ κΈ°μ‚¬λŠ” ν…μŠ€νŠΈ-λΉ„λ””μ˜€ 생성 AI λͺ¨λΈμ˜ λ³΄μ•ˆ 취약성을 μ§€μ ν•˜λŠ” μ΅œμ‹  연ꡬ κ²°κ³Όλ₯Ό μ†Œκ°œν•©λ‹ˆλ‹€. 쀑ꡭ 연ꡬ진이 κ°œλ°œν•œ BadVideo 백도어 곡격 ν”„λ ˆμž„μ›Œν¬λŠ” 곡간-μ‹œκ°„μ  νŠΉμ§• μ‘°ν•© 및 동적 μš”μ†Œ λ³€ν™˜μ„ 톡해 μ•…μ„± μ½˜ν…μΈ λ₯Ό μ€λ°€νžˆ μ‚½μž…ν•˜λ©°, κΈ°μ‘΄ μ½˜ν…μΈ  κ²€μ—΄ μ‹œμŠ€ν…œμ„ μš°νšŒν•  수 μžˆλ‹€λŠ” 사싀을 λ³΄μ—¬μ€λ‹ˆλ‹€. μ΄λŠ” AI 기술의 λ°œμ „κ³Ό ν•¨κ»˜ 사이버 λ³΄μ•ˆμ˜ μ€‘μš”μ„±μ„ λ‹€μ‹œ ν•œλ²ˆ κ°•μ‘°ν•˜λŠ” 연ꡬ κ²°κ³Όμž…λ‹ˆλ‹€.

related iamge

ν…μŠ€νŠΈλ‘œ μ˜μƒ λ§Œλ“œλŠ” AI, 생각보닀 μœ„ν—˜ν•  수 μžˆλ‹€λŠ” κ²½κ³ !

졜근 κΈ‰μ†λ„λ‘œ λ°œμ „ν•˜κ³  μžˆλŠ” ν…μŠ€νŠΈ-λΉ„λ””μ˜€(T2V) 생성 λͺ¨λΈ. μ˜ν™”, ꡐ윑, λ§ˆμΌ€νŒ… λ“± λ‹€μ–‘ν•œ λΆ„μ•Όμ—μ„œ ν™œμš©λ˜κ³  μžˆμ§€λ§Œ, κ·Έ μ–΄λ‘μš΄ 면이 λ“œλŸ¬λ‚¬μŠ΅λ‹ˆλ‹€. 쀑ꡭ과학원 λ“± 연ꡬ진이 λ°œν‘œν•œ λ…Όλ¬Έ "BadVideo: Stealthy Backdoor Attack against Text-to-Video Generation" 에 λ”°λ₯΄λ©΄, T2V λͺ¨λΈμ€ μ•…μ˜μ μΈ 곡격에 μ·¨μ•½ν•˜λ‹€λŠ” 사싀이 λ°ν˜€μ‘ŒμŠ΅λ‹ˆλ‹€.

μˆ¨κ²¨μ§„ μœ„ν˜‘, BadVideo

연ꡬ진은 BadVideo λΌλŠ” μƒˆλ‘œμš΄ 백도어 곡격 ν”„λ ˆμž„μ›Œν¬λ₯Ό μ„ λ³΄μ˜€μŠ΅λ‹ˆλ‹€. 이 곡격은 T2V λͺ¨λΈμ΄ μƒμ„±ν•˜λŠ” μ˜μƒμ— ν…μŠ€νŠΈ ν”„λ‘¬ν”„νŠΈμ— λͺ…μ‹œλ˜μ§€ μ•Šμ€ λΆˆν•„μš”ν•œ 정보(ν™˜κ²½ μš”μ†Œ, λΆ€μˆ˜μ  개체, μΆ”κ°€ μ„ΈλΆ€ 정보 λ“±)κ°€ λ§Žλ‹€λŠ” 점을 μ•…μš©ν•©λ‹ˆλ‹€. 즉, 마치 λˆˆμ†μž„μ²˜λŸΌ μ•…μ„± μ½˜ν…μΈ λ₯Ό 숨겨 μ‚½μž…ν•˜λŠ” 것이죠.

BadVideo의 핡심 μ „λž΅μ€ 두 κ°€μ§€μž…λ‹ˆλ‹€.

  1. 곡간-μ‹œκ°„μ  μ‘°ν•© (Spatio-Temporal Composition): λ‹€μ–‘ν•œ 곡간 및 μ‹œκ°„μ  νŠΉμ§•μ„ κ²°ν•©ν•˜μ—¬ μ•…μ„± 정보λ₯Ό μ•”ν˜Έν™”ν•©λ‹ˆλ‹€. 마치 μŠ€ν…Œκ°€λ…Έκ·Έλž˜ν”Όμ²˜λŸΌ, 보이지 μ•ŠλŠ” 곳에 정보λ₯Ό μˆ¨κΈ°λŠ” 것이죠.
  2. 동적 μš”μ†Œ λ³€ν™˜ (Dynamic Element Transformation): μ‹œκ°„μ— 따라 λΆˆν•„μš”ν•œ μš”μ†Œλ₯Ό λ³€ν˜•ν•˜μ—¬ μ•…μ„± 정보λ₯Ό μ „λ‹¬ν•©λ‹ˆλ‹€. λ‹¨μˆœνžˆ ν•œ μž₯면에 μˆ¨κΈ°λŠ” 것이 μ•„λ‹ˆλΌ, μ˜μƒ 전체에 걸쳐 μ€λ°€ν•˜κ²Œ 정보λ₯Ό μ „λ‹¬ν•˜λŠ” κ²ƒμž…λ‹ˆλ‹€.

κΈ°μ‘΄ μ‹œμŠ€ν…œ 무λ ₯ν™” 및 심각성

λ†€λΌμš΄ 점은 BadVideoκ°€ 기쑴의 μ½˜ν…μΈ  κ²€μ—΄ μ‹œμŠ€ν…œμ„ μš°νšŒν•œλ‹€λŠ” κ²ƒμž…λ‹ˆλ‹€. κΈ°μ‘΄ μ‹œμŠ€ν…œμ€ 주둜 κ°œλ³„ ν”„λ ˆμž„μ˜ 곡간 정보λ₯Ό λΆ„μ„ν•˜λŠ”λ°, BadVideoλŠ” μ‹œκ°„μ  차원을 ν™œμš©ν•˜μ—¬ 이λ₯Ό ν”Όν•΄κ°‘λ‹ˆλ‹€. 마치 μˆ¨λ°”κΌ­μ§ˆμ„ ν•˜λŠ” κ²ƒμ²˜λŸΌ 말이죠.

μ‹€ν—˜ κ²°κ³Ό, BadVideoλŠ” 높은 성곡λ₯ μ„ λ³΄μ˜€μœΌλ©°, μ›λž˜ 의미λ₯Ό μœ μ§€ν•˜λ©΄μ„œλ„ κΉ¨λ—ν•œ μž…λ ₯에 λŒ€ν•œ μ„±λŠ₯도 μš°μˆ˜ν•˜κ²Œ μœ μ§€ν–ˆμŠ΅λ‹ˆλ‹€. μ΄λŠ” T2V λͺ¨λΈμ˜ 취약성을 λͺ…ν™•νžˆ λ³΄μ—¬μ£ΌλŠ” κ²°κ³Όμž…λ‹ˆλ‹€. μ΄λŠ” λ‹¨μˆœν•œ 기술적 λ¬Έμ œκ°€ μ•„λ‹Œ, μ‹¬κ°ν•œ λ³΄μ•ˆ μœ„ν˜‘μœΌλ‘œ μ΄μ–΄μ§ˆ 수 μžˆμŒμ„ μ‹œμ‚¬ν•©λ‹ˆλ‹€.

μ•žμœΌλ‘œμ˜ 과제

이 μ—°κ΅¬λŠ” T2V λͺ¨λΈμ˜ 취약성을 λ³΄μ—¬μ£ΌλŠ” λ™μ‹œμ—, ν–₯ν›„ AI λ³΄μ•ˆ κ°•ν™”μ˜ ν•„μš”μ„±μ„ κ°•μ‘°ν•©λ‹ˆλ‹€. λ‹¨μˆœνžˆ 기술 λ°œμ „μ—λ§Œ 집쀑할 것이 μ•„λ‹ˆλΌ, 잠재적인 μœ„ν—˜κ³Ό μ•…μš© κ°€λŠ₯성에 λŒ€ν•œ λ©΄λ°€ν•œ 검토와 λŒ€μ‘μ±… 마련이 μ‹œκΈ‰ν•©λ‹ˆλ‹€. μ—°κ΅¬νŒ€μ˜ ν”„λ‘œμ νŠΈ νŽ˜μ΄μ§€ (https://wrt2000.github.io/BadVideo2025/)μ—μ„œ 더 μžμ„Έν•œ 정보λ₯Ό 확인할 수 μžˆμŠ΅λ‹ˆλ‹€.


*이 κΈ°μ‚¬λŠ” AIκ°€ μƒμ„±ν•œ λ‚΄μš©μœΌλ‘œ, 일뢀 정보가 μ‹€μ œμ™€ λ‹€λ₯Ό 수 μžˆμŠ΅λ‹ˆλ‹€. μ •ν™•ν•œ 확인을 μœ„ν•΄ 좔가적인 검증을 ꢌμž₯λ“œλ¦½λ‹ˆλ‹€.

Reference

[arxiv] BadVideo: Stealthy Backdoor Attack against Text-to-Video Generation

Published: Β (Updated: )

Author: Ruotong Wang, Mingli Zhu, Jiarong Ou, Rui Chen, Xin Tao, Pengfei Wan, Baoyuan Wu

http://arxiv.org/abs/2504.16907v1