π₯λ‘ π₯λ₯Ό μ‘λλ€! LVLMsμ μ λμ μμ μ νλ₯Ό μν νμ μ μΈ λ°©λ², F3 μκ°
λ³Έ κΈ°μ¬λ μ€κ΅κ³Όνμ μλνμ°κ΅¬μ μ°κ΅¬μ§μ΄ κ°λ°ν LVLMs μ λμ μμ μ ν νλ μμν¬ F3λ₯Ό μκ°ν©λλ€. 'λΆλ‘ λΆμ λλ€' μ λ΅μ μ¬μ©νμ¬ μ λμ μμμ λ Έμ΄μ¦λ₯Ό μ£Όμ , λͺ¨λΈ μ±λ₯μ ν₯μμν€λ F3λ νλ ¨μ΄ νμ μκ³ ν¨μ¨μ μ΄λΌλ μ₯μ μ κ°μ§κ³ μμΌλ©°, AI μμ€ν μ μμ μ± ν₯μμ κΈ°μ¬ν κ²μΌλ‘ κΈ°λλ©λλ€.

μΈκ³΅μ§λ₯μ μ¨κ²¨μ§ μ·¨μ½μ κ³Ό νμ μ μΈ ν΄κ²°μ± : F3
μ΅κ·Ό λλΆμ λ°μ μ μ΄λ£¬ λκ·λͺ¨ λΉμ -μΈμ΄ λͺ¨λΈ(LVLMs)μ λ€μν λ©ν°λͺ¨λ¬ λΉμ -μΈμ΄ μμ μμ λλΌμ΄ μ±λ₯μ 보μ¬μ£Όκ³ μμ΅λλ€. νμ§λ§ μ΄λ¬ν λͺ¨λΈλ€μ μκ°μ μ λμ 곡격μ μ¬μ ν μ·¨μ½νλ©°, μ΄λ λͺ¨λΈ μ±λ₯μ ν¬κ² μ νμν¬ μ μμ΅λλ€. μ΄λ¬ν μ λμ μμλ₯Ό μ ννλ ν¨κ³Όμ μΈ λ°©λ² κ°λ°μ μλμ μΌλ‘ λΆμ‘±ν μν©μ΄μμ΅λλ€.
κ·Έλ°λ°, μ€κ΅κ³Όνμ μλνμ°κ΅¬μμ Yudong Zhang λ± μ°κ΅¬μ§μ΄ λ°νν λ Όλ¬Έ βFighting Fire with Fire (F3): A Training-free and Efficient Visual Adversarial Example Purification Method in LVLMsβμ μ΄ λ¬Έμ μ λν νκΈ°μ μΈ ν΄κ²°μ± μ μ μν©λλ€.
'λΆλ‘ λΆμ λλ€' μ λ΅: F3μ ν΅μ¬
μ°κ΅¬μ§μ μμ€μ μ΄κ²λ 'λΆλ‘ λΆμ λλ€' μ λ΅μ νμ©νλ μλ‘μ΄ μ λμ μμ μ ν νλ μμν¬, F3μ μκ°νμ΅λλ€. F3λ μ λμ μμμ μλμ μΌλ‘ κ°λ¨ν μλ(perturbation)μ λμ νμ¬ μ ν΄ν μν₯μ μννλ λ°©μμ λλ€. 무μμλ‘ μλλ μ λμ μμμμ μΆμΆν κ΅μ°¨ λͺ¨λ¬ μ΄ν μ (cross-modal attentions)μ μ°Έμ‘° λμμΌλ‘ νμ©νμ¬, μ λμ μμμ λ Έμ΄μ¦λ₯Ό μ£Όμ ν¨μΌλ‘μ¨ μ΄ν μ μ ν¨κ³Όμ μΌλ‘ κ°μ νκ³ , λ³΄λ€ κΉ¨λνκ³ μ λ’°ν μ μλ λͺ¨λΈ μΆλ ₯μ μ»μ΅λλ€.
νλ ¨ μμ΄λ ν¨μ¨μ μΈ μ ν: F3μ μ₯μ
F3μ κ°μ₯ ν° μ₯μ μ νλ ¨μ΄ νμ μλ€λ κ²μ λλ€. μ΄λ ꡬνμ΄ κ°λ¨νκ³ , κΈ°μ‘΄ μ ν λ°©λ²κ³Ό λΉκ΅νμ¬ μ»΄ν¨ν ν¨μ¨μ±μ΄ ν¬κ² ν₯μλμλ€λ κ²μ μλ―Έν©λλ€. μ΄λ¬ν νΉμ§μ κ°λ ₯ν μ±λ₯κ³Ό μ΄μ ν¨μ¨μ±μ΄ λͺ¨λ μ€μν λκ·λͺ¨ μ°μ μμ© λΆμΌμ F3λ₯Ό νΉν μ ν©νκ² λ§λλλ€. 곡κ°μ μΌλ‘ μ½λλ₯Ό 곡μ ν μμ μ΄λΌκ³ νλ, κ³§ νμ©ν΄λ³Ό μ μκ² λ€μ.
λ―Έλλ₯Ό ν₯ν ν κ±Έμ: LVLMsμ μμ μ± ν보
μ΄ μ°κ΅¬λ LVLMsμ μμ μ±μ ν₯μμν€λ λ° μ€μν μ§μ μ μ΄λ£¨μμ΅λλ€. F3λ μ λμ 곡격μΌλ‘λΆν° LVLMsμ 보νΈνλ μ€μ©μ μ΄κ³ ν¨μ¨μ μΈ λ°©λ²μ μ μνλ©°, λμ± μμ νκ³ μ λ’°ν μ μλ AI μμ€ν ꡬμΆμ κΈ°μ¬ν κ²μΌλ‘ κΈ°λλ©λλ€. μμΌλ‘ F3κ° AI κΈ°μ λ°μ μ μ΄λ€ μν₯μ λ―ΈμΉ μ§, κ·Έλ¦¬κ³ λμ± λ°μ λ κΈ°μ λ€μ΄ λ±μ₯ν μ§ κΈ°λν΄λ³Ό λ§ ν©λλ€. μ°κ΅¬μ§μ λμμλ λ Έλ ₯μ λ°μλ₯Ό 보λ λλ€!
Reference
[arxiv] Fighting Fire with Fire (F3): A Training-free and Efficient Visual Adversarial Example Purification Method in LVLMs
Published: Β (Updated: )
Author: Yudong Zhang, Ruobing Xie, Yiqing Huang, Jiansheng Chen, Xingwu Sun, Zhanhui Kang, Di Wang, Yu Wang
http://arxiv.org/abs/2506.01064v1