π¨ RAG κΈ°λ° LLM, μμ νμ§ μμ μ μλ€λ 좩격μ μΈ μ°κ΅¬ κ²°κ³Ό!
Bang An, Shiyue Zhang, Mark Dredze μ°κ΅¬μ§μ μ°κ΅¬μ λ°λ₯΄λ©΄, RAG(Retrieval-Augmented Generation) νλ μμν¬λ LLMμ μμ μ±μ μ ν΄ν μ μμΌλ©°, κΈ°μ‘΄μ μμ μ± νκ° λ°©λ²μ RAG νκ²½μμ ν¨κ³Όμ μ΄μ§ μλ€λ μ¬μ€μ΄ λ°νμ‘μ΅λλ€. RAG LLMμ μμ μ± ν보λ₯Ό μν μλ‘μ΄ μ°κ΅¬ λ° ν μ€νΈ λ°©λ²μ κ°λ°μ΄ μκΈν©λλ€.

RAG κΈ°λ° LLM, κ³Όμ° μμ ν κΉμ? π€
μ΅κ·Ό, μΈκ³΅μ§λ₯(AI) λΆμΌμμ λ¨κ±°μ΄ κ°μμΈ λκ·λͺ¨ μΈμ΄ λͺ¨λΈ(LLM)μ μμ μ± ν보λ₯Ό μν λ Έλ ₯μ΄ νλ°ν μ§νλκ³ μμ΅λλ€. μμ μ± λ―ΈμΈ μ‘°μ , νκ°, μ λμ ν μ€νΈ λ± λ€μν λ°©λ²λ€μ΄ λμλκ³ μμ£ . νμ§λ§, Retrieval-Augmented Generation (RAG) νλ μμν¬μ κ΄λ²μν μ¬μ©μλ λΆκ΅¬νκ³ , AI μμ μ± μ°κ΅¬λ νμ€ LLMμ μ§μ€λμ΄ μμ΄ RAGμ μμ μ± νλ‘ν λ³νμ λν μ΄ν΄λ λ§€μ° λΆμ‘±ν μ€μ μ λλ€.
Bang An, Shiyue Zhang, Mark Dredze λ± μ°κ΅¬μ§μ 11κ°μ LLMμ λμμΌλ‘ RAGμ λΉRAG νλ μμν¬λ₯Ό λΉκ΅ λΆμνλ νκΈ°μ μΈ μ°κ΅¬λ₯Ό μννμ΅λλ€. κ·Έ κ²°κ³Όλ 좩격μ μ΄μμ΅λλ€. μ°κ΅¬μ§μ RAGκ° λͺ¨λΈμ λ μμ νκ² λ§λ€κ³ μμ μ± νλ‘νμ λ°κΏ μ μλ€λ μ¬μ€μ λ°νλΈ κ²μ λλ€! π±
λμ± λλΌμ΄ κ²μ, μμ ν λͺ¨λΈκ³Ό μμ ν λ¬Έμλ₯Ό κ²°ν©νλλΌλ μμ νμ§ μμ κ²°κ³Όκ° μμ±λ μ μλ€λ μ μ λλ€. μ΄λ RAGμ λ΄λΆ μλ λ°©μμ λν κΉμ΄ μλ μ΄ν΄κ° νμν¨μ μμ¬ν©λλ€. λ¨μν μμ ν λ°μ΄ν°λ₯Ό μ¬μ©νλ€κ³ ν΄μ μμ ν κ²°κ³Όκ° λ³΄μ₯λλ κ²μ΄ μλλΌλ μ μ λͺ μ¬ν΄μΌ ν©λλ€.
λΏλ§ μλλΌ, μ°κ΅¬μ§μ κΈ°μ‘΄μ μ λμ ν μ€νΈ λ°©λ²μ΄ RAG νκ²½μμλ ν¨κ³Όκ° λ¨μ΄μ§λ€λ μ¬μ€ λν νμΈνμ΅λλ€. μ΄λ RAG LLMμ νΉνλ μλ‘μ΄ μμ μ± μ°κ΅¬ λ° μ λμ ν μ€νΈ λ°©λ²μ κ°λ°μ΄ μκΈν¨μ μλ―Έν©λλ€. κΈ°μ‘΄μ λ°©λ²λ‘ μΌλ‘λ RAG LLMμ μμ μ±μ μ λλ‘ νκ°ν μ μλ€λ κ²μ μλ―Ένλ―λ‘, μλ‘μ΄ μ κ·Ό λ°©μμ΄ νμν©λλ€.
μ΄ μ°κ΅¬λ RAG κΈ°λ° LLMμ μμ μ±μ λν μ°λ¦¬μ μΈμμ μμ ν λ°κΏλμμ΅λλ€. RAGμ νΈλ¦¬μ±λ§μ κ³ λ €ν΄μλ μλλ©°, μμ μ±μ ν보νκΈ° μν μΆκ°μ μΈ μ°κ΅¬μ λ Έλ ₯μ΄ μ μ€ν νμν©λλ€. AI κΈ°μ μ λ°μ κ³Ό ν¨κ» μμ μ±μ λν κ³ λ―Ό λν κΉμ΄μ ΈμΌ ν μμ μ λλ€. μμΌλ‘ RAG LLMμ μμ μ± ν보λ₯Ό μν μλ‘μ΄ ν¨λ¬λ€μμ΄ μ μλ μ§ κ·μΆκ° μ£Όλͺ©λ©λλ€.
Reference
[arxiv] RAG LLMs are Not Safer: A Safety Analysis of Retrieval-Augmented Generation for Large Language Models
Published: Β (Updated: )
Author: Bang An, Shiyue Zhang, Mark Dredze
http://arxiv.org/abs/2504.18041v1