획기적인 AI 연구: 지속적 학습에서 재앙적 망각 극복
본 연구는 대규모 언어 모델(LLM)의 재앙적 망각 문제를 해결하기 위해 함수 벡터(FV)를 활용한 새로운 훈련 방법론을 제시합니다. 다양한 과제에 따른 망각 패턴 분석과 이론적, 실증적 분석을 통해 망각의 원인을 규명하고, FV 기반 정규화 기법을 통해 망각을 효과적으로 완화하는 것을 실험적으로 증명했습니다.

잊지 않는 AI, 가능할까요? 재앙적 망각 극복의 혁신적인 연구 성과
최근 급속한 발전을 거듭하는 인공지능, 특히 대규모 언어 모델(LLM)은 새로운 과제를 학습할 때 기존에 학습한 정보를 잊어버리는 '재앙적 망각(Catastrophic Forgetting, CF)' 문제에 직면하고 있습니다. Jiang Gangwei 등 연구진은 이러한 문제 해결에 새로운 돌파구를 마련했습니다.
기존 연구는 주로 단일 훈련 시퀀스를 통해 망각 패턴을 분석하는 데 그쳤지만, 이번 연구는 다양한 과제들이 모델 행동에 미치는 복잡한 영향을 면밀히 분석했습니다. 그 결과, 모델의 망각은 특정 훈련 과제와 모델 자체 모두에 영향을 받는다는 사실을 밝혀냈습니다.
연구진은 LLM에서 함수의 압축된 표현인 함수 벡터(FV) 를 도입하여 망각을 해석했습니다. FV는 모델 의존적인 CF 발생 지표 역할을 합니다. 이를 통해 이론적 및 실증적 분석을 거쳐, LLM에서의 CF는 주로 과제 처리 기능의 덮어쓰기가 아닌 기능 활성화 편향으로 인해 발생한다는 것을 밝혔습니다.
이러한 통찰력을 바탕으로, 연구진은 FV를 안정화시키고 망각을 완화하기 위한 정규화 기법을 통합한 새로운 함수 벡터 기반 훈련 방법론을 제시했습니다. 네 가지 벤치마크에 대한 실험 결과, 제안된 훈련 방법의 효과가 입증되었으며, CF와 모델 기능 역학에 대한 이론적 틀을 뒷받침했습니다. 연구진은 가까운 시일 내에 코드를 공개할 계획입니다.
이 연구는 LLM의 지속적 학습 능력 향상에 중요한 전기를 마련했습니다. 단순히 새로운 기술을 학습하는 것을 넘어, 과거 지식을 유지하고 통합하는 능력을 향상시켜 AI의 더욱 발전된 형태를 기대하게 합니다. 이는 AI의 실용성과 신뢰성을 높이는 데 크게 기여할 것으로 예상됩니다. 향후 연구 결과가 더욱 기대되는 부분입니다.
Reference
[arxiv] Unlocking the Power of Function Vectors for Characterizing and Mitigating Catastrophic Forgetting in Continual Instruction Tuning
Published: (Updated: )
Author: Gangwei Jiang, Caigao Jiang, Zhaoyi Li, Siqiao Xue, Jun Zhou, Linqi Song, Defu Lian, Yin Wei
http://arxiv.org/abs/2502.11019v1