놀라운 AI 학습법: 미리 계획하고 답하는 LLM, LEPA 등장!
장진, 성홍, 양지린, 고양, 장충제 연구팀이 개발한 LEPA 알고리즘은 LLM에 추상적 계획 수립 능력을 부여하여 문제 해결 능력과 일반화 성능을 크게 향상시켰습니다. 인간의 사고 과정을 모방한 이 혁신적인 접근 방식은 LLM의 자기 지도 학습 분야에 새로운 가능성을 제시합니다.

거대 언어 모델(LLM)의 자기 학습 혁명: LEPA 알고리즘
최근 인공지능 분야에서 거대 언어 모델(LLM)의 자기 지도 학습이 큰 주목을 받고 있습니다. LLM이 스스로 생성한 데이터를 활용하여 성능을 향상시키는 기술인데요, 하지만 기존의 접근 방식에는 한계가 있었습니다. 단순히 문제 해결 과정을 단계별로 나열하는 데 그쳐, 다양한 유사 문제에 적용 가능한 추상적인 메타 지식을 학습하지 못했던 것이죠.
장진, 성홍, 양지린, 고양, 장충제 연구팀은 인간의 문제 해결 방식에서 영감을 얻어 혁신적인 자기 학습 알고리즘 LEPA(LEarning to Plan before Answering) 를 개발했습니다. LEPA는 인간처럼 복잡한 문제를 해결하기 전에 추상적인 계획을 세우는 과정을 LLM에 학습시키는 알고리즘입니다. 이는 단순히 답을 생성하는 것에서 나아가, 문제 해결의 핵심 전략을 미리 파악하고, 불필요한 정보에 휘둘리지 않도록 돕는 획기적인 접근 방식입니다.
LEPA의 작동 방식은 다음과 같습니다. 먼저 문제를 분석하여 예측 계획(anticipatory plan) 을 수립합니다. 이 계획을 바탕으로 문제 해결 과정을 생성하고, 자기 반성을 통해 계획을 지속적으로 개선합니다. 결국 정확한 해결책을 도출하는 데 효과적인 계획을 학습하게 되는 것이죠. 모델 최적화 과정에서는 개선된 계획과 그에 따른 해결책을 모두 예측하도록 LLM을 훈련합니다.
연구 결과, LEPA는 다양한 자연어 추론 벤치마크에서 기존 알고리즘에 비해 월등한 성능을 보였습니다. 이는 단순히 문제 해결 과정을 암기하는 것이 아니라, 추상적인 계획을 통해 문제의 본질을 이해하고 일반화하는 능력을 갖추었음을 의미합니다. LEPA의 등장은 LLM의 자기 학습 방식에 새로운 지평을 열었으며, 더욱 강력하고 일반적인 인공지능 개발의 가능성을 보여줍니다. 앞으로 LEPA가 어떻게 발전하고 다양한 분야에 적용될지 기대됩니다.
핵심: LEPA는 문제 해결 전에 추상적 계획을 세우는 인간의 사고 과정을 모방하여 LLM의 성능을 획기적으로 향상시킨 알고리즘입니다. 이는 단순히 단계별 해결책을 제시하는 것에서 벗어나, 문제의 본질을 파악하고 일반화하는 능력을 향상시키는 데 기여합니다.
Reference
[arxiv] Learning to Plan Before Answering: Self-Teaching LLMs to Learn Abstract Plans for Problem Solving
Published: (Updated: )
Author: Jin Zhang, Flood Sung, Zhilin Yang, Yang Gao, Chongjie Zhang
http://arxiv.org/abs/2505.00031v1