π¨ 좩격! ν μ€νΈ-λΉλμ€ μμ± AI, μ μμ 곡격μ μ·¨μ½νλ€?! π¨
λ³Έ κΈ°μ¬λ ν μ€νΈ-λΉλμ€ μμ± AI λͺ¨λΈμ 보μ μ·¨μ½μ±μ μ§μ νλ μ΅μ μ°κ΅¬ κ²°κ³Όλ₯Ό μκ°ν©λλ€. μ€κ΅ μ°κ΅¬μ§μ΄ κ°λ°ν BadVideo λ°±λμ΄ κ³΅κ²© νλ μμν¬λ 곡κ°-μκ°μ νΉμ§ μ‘°ν© λ° λμ μμ λ³νμ ν΅ν΄ μ μ± μ½ν μΈ λ₯Ό μλ°ν μ½μ νλ©°, κΈ°μ‘΄ μ½ν μΈ κ²μ΄ μμ€ν μ μ°νν μ μλ€λ μ¬μ€μ 보μ¬μ€λλ€. μ΄λ AI κΈ°μ μ λ°μ κ³Ό ν¨κ» μ¬μ΄λ² 보μμ μ€μμ±μ λ€μ νλ² κ°μ‘°νλ μ°κ΅¬ κ²°κ³Όμ λλ€.

ν μ€νΈλ‘ μμ λ§λλ AI, μκ°λ³΄λ€ μνν μ μλ€λ κ²½κ³ !
μ΅κ·Ό κΈμλλ‘ λ°μ νκ³ μλ ν μ€νΈ-λΉλμ€(T2V) μμ± λͺ¨λΈ. μν, κ΅μ‘, λ§μΌν λ± λ€μν λΆμΌμμ νμ©λκ³ μμ§λ§, κ·Έ μ΄λμ΄ λ©΄μ΄ λλ¬λ¬μ΅λλ€. μ€κ΅κ³Όνμ λ± μ°κ΅¬μ§μ΄ λ°νν λ Όλ¬Έ "BadVideo: Stealthy Backdoor Attack against Text-to-Video Generation" μ λ°λ₯΄λ©΄, T2V λͺ¨λΈμ μ μμ μΈ κ³΅κ²©μ μ·¨μ½νλ€λ μ¬μ€μ΄ λ°νμ‘μ΅λλ€.
μ¨κ²¨μ§ μν, BadVideo
μ°κ΅¬μ§μ BadVideo λΌλ μλ‘μ΄ λ°±λμ΄ κ³΅κ²© νλ μμν¬λ₯Ό μ 보μμ΅λλ€. μ΄ κ³΅κ²©μ T2V λͺ¨λΈμ΄ μμ±νλ μμμ ν μ€νΈ ν둬ννΈμ λͺ μλμ§ μμ λΆνμν μ 보(νκ²½ μμ, λΆμμ κ°μ²΄, μΆκ° μΈλΆ μ 보 λ±)κ° λ§λ€λ μ μ μ μ©ν©λλ€. μ¦, λ§μΉ λμμμ²λΌ μ μ± μ½ν μΈ λ₯Ό μ¨κ²¨ μ½μ νλ κ²μ΄μ£ .
BadVideoμ ν΅μ¬ μ λ΅μ λ κ°μ§μ λλ€.
- 곡κ°-μκ°μ μ‘°ν© (Spatio-Temporal Composition): λ€μν κ³΅κ° λ° μκ°μ νΉμ§μ κ²°ν©νμ¬ μ μ± μ 보λ₯Ό μνΈνν©λλ€. λ§μΉ μ€ν κ°λ Έκ·ΈλνΌμ²λΌ, 보μ΄μ§ μλ κ³³μ μ 보λ₯Ό μ¨κΈ°λ κ²μ΄μ£ .
- λμ μμ λ³ν (Dynamic Element Transformation): μκ°μ λ°λΌ λΆνμν μμλ₯Ό λ³ννμ¬ μ μ± μ 보λ₯Ό μ λ¬ν©λλ€. λ¨μν ν μ₯λ©΄μ μ¨κΈ°λ κ²μ΄ μλλΌ, μμ μ 체μ κ±Έμ³ μλ°νκ² μ 보λ₯Ό μ λ¬νλ κ²μ λλ€.
κΈ°μ‘΄ μμ€ν 무λ ₯ν λ° μ¬κ°μ±
λλΌμ΄ μ μ BadVideoκ° κΈ°μ‘΄μ μ½ν μΈ κ²μ΄ μμ€ν μ μ°ννλ€λ κ²μ λλ€. κΈ°μ‘΄ μμ€ν μ μ£Όλ‘ κ°λ³ νλ μμ κ³΅κ° μ 보λ₯Ό λΆμνλλ°, BadVideoλ μκ°μ μ°¨μμ νμ©νμ¬ μ΄λ₯Ό νΌν΄κ°λλ€. λ§μΉ μ¨λ°κΌμ§μ νλ κ²μ²λΌ λ§μ΄μ£ .
μ€ν κ²°κ³Ό, BadVideoλ λμ μ±κ³΅λ₯ μ 보μμΌλ©°, μλ μλ―Έλ₯Ό μ μ§νλ©΄μλ κΉ¨λν μ λ ₯μ λν μ±λ₯λ μ°μνκ² μ μ§νμ΅λλ€. μ΄λ T2V λͺ¨λΈμ μ·¨μ½μ±μ λͺ νν 보μ¬μ£Όλ κ²°κ³Όμ λλ€. μ΄λ λ¨μν κΈ°μ μ λ¬Έμ κ° μλ, μ¬κ°ν 보μ μνμΌλ‘ μ΄μ΄μ§ μ μμμ μμ¬ν©λλ€.
μμΌλ‘μ κ³Όμ
μ΄ μ°κ΅¬λ T2V λͺ¨λΈμ μ·¨μ½μ±μ 보μ¬μ£Όλ λμμ, ν₯ν AI 보μ κ°νμ νμμ±μ κ°μ‘°ν©λλ€. λ¨μν κΈ°μ λ°μ μλ§ μ§μ€ν κ²μ΄ μλλΌ, μ μ¬μ μΈ μνκ³Ό μ μ© κ°λ₯μ±μ λν λ©΄λ°ν κ²ν μ λμμ± λ§λ ¨μ΄ μκΈν©λλ€. μ°κ΅¬νμ νλ‘μ νΈ νμ΄μ§ (https://wrt2000.github.io/BadVideo2025/)μμ λ μμΈν μ 보λ₯Ό νμΈν μ μμ΅λλ€.
Reference
[arxiv] BadVideo: Stealthy Backdoor Attack against Text-to-Video Generation
Published: Β (Updated: )
Author: Ruotong Wang, Mingli Zhu, Jiarong Ou, Rui Chen, Xin Tao, Pengfei Wan, Baoyuan Wu
http://arxiv.org/abs/2504.16907v1