π¨μ½λ λ λ! μμ© λκ·λͺ¨ μΈμ΄ λͺ¨λΈμ νλ‘κ·Έλλ° μμ μ μ©μ μνμ±
λ³Έ κΈ°μ¬λ LLM(λκ·λͺ¨ μΈμ΄ λͺ¨λΈ)μ νλ‘κ·Έλλ° μμ νμ©μ λ°λ₯Έ μ ν΄μ±μ λΆμν μ°κ΅¬ κ²°κ³Όλ₯Ό μκ°ν©λλ€. μ°κ΅¬μ§μ LLMμ μ ν΄μ± νκ°λ₯Ό μν νλ μμν¬λ₯Ό μ μνκ³ , λͺ¨λΈ ν¬κΈ°, μν€ν μ², μ λ ¬ μ λ΅ λ±μ΄ μ ν΄ μ½ν μΈ μμ±μ λ―ΈμΉλ μν₯μ λΆμνμ΅λλ€. κ²°κ³Όμ μΌλ‘, μΌλΆ LLMμ μ ν΄μ±μ΄ λμμΌλ©°, λ ν° λͺ¨λΈμ΄ λ μ μ©νκ³ μμ νλ€λ μ¬μ€μ λ°κ²¬νμ΅λλ€. μ΄λ LLMμ μ± μκ° μλ κ°λ°κ³Ό νμ©μ μν νμ μ λ ¬ μ λ΅μ μ€μμ±μ μμ¬ν©λλ€.

κ°λ°μλ€μ λ λ ν μ‘°λ ₯μ? νΉμ μνν λꡬ? LLMμ μλ©΄μ±
μ΅κ·Ό κ°λ°μλ€μ μ½λ© μμ μ λλ λκ·λͺ¨ μΈμ΄ λͺ¨λΈ(LLM) κΈ°λ° μ루μ μ μ μ λ μμ‘΄νκ³ μμ΅λλ€. νμ§λ§ μ΄λ¬ν νΈλ¦¬ν¨ λ€μλ μ μμ μΈ μ€μ©μΌλ‘ μΈν μνμ΄ λμ¬λ¦¬κ³ μμ΅λλ€. Ali Al-Kaswanμ λΉλ‘―ν μ°κ΅¬μ§μ μ΅κ·Ό λ°νν λ Όλ¬Έ, "Code Red! On the Harmfulness of Applying Off-the-shelf Large Language Models to Programming Tasks"μμ μ΄λ¬ν μνμ±μ μ¬μΈ΅μ μΌλ‘ λΆμνκ³ , κ·Έ ν΄κ²°μ± μ λͺ¨μνμ΅λλ€.
LLMμ μ ν΄μ± νκ°: ν¬κ΄μ μΈ νλ μμν¬
μ°κ΅¬μ§μ μννΈμ¨μ΄ μμ§λμ΄λ§ λΆμΌμμ LLMμ μ μ¬μ μνμ±μ νκ°νκΈ° μν ν¬κ΄μ μΈ νλ μμν¬λ₯Ό μ μνμ΅λλ€. λ¨Όμ , μ μ¬μ μΌλ‘ μ ν΄ν μννΈμ¨μ΄ μμ§λμ΄λ§ μλ리μ€μ λΆλ₯ 체κ³λ₯Ό κ°λ°νκ³ , μ΄λ₯Ό λ°νμΌλ‘ ν둬ννΈ λ°μ΄ν°μ μ μμ±νμ΅λλ€. μ¬λ¬ μ’ λ₯μ LLM(μ€νμμ€ λ° ν΄λ‘μ¦λμμ€ λͺ¨λΈ, λ²μ© λ° μ½λ μ μ© LLM)μ μΆλ ₯μ λΆλ₯νλ μλ νκ°κΈ°λ₯Ό μ€κ³νκ³ κ²μ¦νμ¬, κ° λͺ¨λΈμ μ ν΄μ±μ 체κ³μ μΌλ‘ νκ°νμ΅λλ€.
λͺ¨λΈ ν¬κΈ°, μν€ν μ², κ·Έλ¦¬κ³ μ λ ¬ μ λ΅μ μν₯
μ°κ΅¬μ§μ λͺ¨λΈμ ν¬κΈ°, μν€ν μ² κ³μ΄, μ λ ¬ μ λ΅μ΄ μ ν΄ μ½ν μΈ μμ± κ²½ν₯μ λ―ΈμΉλ μν₯μ μ‘°μ¬νμ΅λλ€. λλκ²λ, κ·Έ κ²°κ³Όλ λ€μν LLMμ μ ν΄μ±μ λν μλΉν μ°¨μ΄λ₯Ό 보μ¬μ£Όμμ΅λλ€. Openhermesμ κ°μ νΉμ λͺ¨λΈ λ° λͺ¨λΈ κ³μ΄μ λ€λ₯Έ λͺ¨λΈλ³΄λ€ μ ν΄μ±μ΄ λ λμμΌλ©°, μ½λ μ μ© λͺ¨λΈμ΄ λ²μ© λͺ¨λΈλ³΄λ€ λ λμ μ±λ₯μ 보μ΄μ§λ μμμ΅λλ€. λμ±μ΄, μΌλΆ λ―ΈμΈ μ‘°μ λ λͺ¨λΈμ μ€κ³ μ νμΌλ‘ μΈν΄ κΈ°λ³Έ λͺ¨λΈλ³΄λ€ μ±λ₯μ΄ νμ ν μ νλμμ΅λλ€.
λ°λ©΄, λ ν° λͺ¨λΈμ λ μ μ©νκ³ μ ν΄ μ 보λ₯Ό μ 곡ν κ°λ₯μ±μ΄ λ μ μ κ²μΌλ‘ λνλ¬μ΅λλ€. μ΄λ μννΈμ¨μ΄ μμ§λμ΄λ§ μμ μ κ³ μ ν κ³Όμ μ λ§μΆ νμ μ λ ¬ μ λ΅μ μ€μμ±μ κ°μ‘°νλ κ²°κ³Όμ λλ€.
κ²°λ‘ : μ± μκ° μλ LLM κ°λ°κ³Ό νμ©μ νμμ±
μ΄ μ°κ΅¬λ LLMμ νΈλ¦¬μ±κ³Ό ν¨κ» μ‘΄μ¬νλ μνμ±μ λͺ νν 보μ¬μ€λλ€. LLMμ μμ νκ³ μ€λ¦¬μ μΈ μ¬μ©μ μν΄μλ μννΈμ¨μ΄ μμ§λμ΄λ§ λΆμΌμ νΉμμ±μ κ³ λ €ν νμ μ λ ¬ μ λ΅ κ°λ°κ³Ό μ§μμ μΈ λͺ¨λν°λ§μ΄ νμμ μ λλ€. λ¨μν ν¬κΈ°λ§ ν€μ°λ κ²μ΄ μλλΌ, μ ν΄μ±μ μ΅μννλ λ°©ν₯μΌλ‘ λͺ¨λΈμ μ€κ³νκ³ , κ°λ°μλ€μ΄ μ΄λ¬ν λꡬλ₯Ό μ± μκ° μκ² μ¬μ©ν μ μλλ‘ κ΅μ‘νκ³ μ§μνλ κ²μ΄ μ€μν κ³Όμ λ‘ λ¨μ΅λλ€.
μ°Έκ³ : μ΄ κΈ°μ¬λ μ 곡λ μ 보λ₯Ό λ°νμΌλ‘ μμ±λμμΌλ©°, μ°κ΅¬μ μΈλΆμ μΈ λ΄μ©μ μ λ Όλ¬Έμ μ°Έκ³ νμκΈ° λ°λλλ€.
Reference
[arxiv] Code Red! On the Harmfulness of Applying Off-the-shelf Large Language Models to Programming Tasks
Published: Β (Updated: )
Author: Ali Al-Kaswan, Sebastian Deatc, BegΓΌm KoΓ§, Arie van Deursen, Maliheh Izadi
http://arxiv.org/abs/2504.01850v1