LLM 기반 휴리스틱 함수: 고전적 계획 문제의 새로운 지평을 열다
본 연구는 LLM을 활용하여 Python 코드 형태의 도메인 종속적 휴리스틱 함수를 생성함으로써 고전적 계획 문제 해결 능력을 크게 향상시킨 연구 결과를 발표했습니다. 기존 최첨단 알고리즘을 능가하는 성능과 Python 기반의 효율성은 LLM 기반 계획의 새로운 가능성을 제시하며, 향후 인공지능 연구의 발전에 크게 기여할 것으로 예상됩니다.

최근 대규모 언어 모델(LLM)은 다양한 인공지능 문제에서 놀라운 능력을 보여주고 있습니다. 하지만, 계획 작업에 대한 자세한 정의가 주어지더라도 안정적으로 계획을 수립하는 데는 어려움을 겪습니다. 사고 연쇄 프롬프팅, 미세 조정, 명시적 추론과 같은 기존의 LLM 계획 능력 개선 시도는 여전히 잘못된 계획을 생성하고 더 큰 작업으로 일반화하는 데 실패하는 경우가 많습니다.
하지만 브라질 상파울루 대학교의 Augusto B. Corrêa, André G. Pereira, 그리고 Jendrik Seipp 연구팀은 LLM을 사용하여 분포 외 작업에서도 정확한 계획을 생성하는 방법을 제시했습니다. 이들의 연구는 Python 코드 형태의 도메인 종속적 휴리스틱 함수를 LLM을 이용하여 생성하고, 탐욕적 최선우선 탐색(greedy best-first search) 내에서 훈련 작업 집합에서 평가하여 가장 강력한 휴리스틱 함수를 선택하는 방식을 제시합니다.
그 결과, LLM이 생성한 휴리스틱 함수는 기존의 최첨단 도메인 독립적 휴리스틱 함수보다 훨씬 더 많은 미지의 테스트 작업을 해결했습니다. 심지어 도메인 종속적 계획에 대한 가장 강력한 학습 알고리즘과도 경쟁력을 갖추었습니다. 특히, 이러한 결과는 연구팀의 개념 증명 구현이 최적화되지 않은 Python 플래너를 기반으로 하고 기준 알고리즘이 모두 고도로 최적화된 C++ 코드를 기반으로 한다는 점을 고려할 때 더욱 주목할 만합니다. 일부 도메인에서는 LLM이 생성한 휴리스틱 함수가 기준 알고리즘보다 더 적은 상태를 확장하여, 단순히 계산 효율성뿐 아니라 정보량 측면에서도 우수함을 입증했습니다.
결론적으로, 이 연구는 LLM을 사용하여 계획 휴리스틱 함수 프로그램 집합을 샘플링하면 LLM의 계획 능력을 크게 향상시킬 수 있음을 보여줍니다. 이는 고전적 계획 문제 해결에 있어 새로운 가능성을 제시하며, 향후 인공지능 분야의 발전에 크게 기여할 것으로 기대됩니다. Python 코드를 활용한 접근 방식은 직관적이고 재현성이 높아, 다른 연구자들의 후속 연구에도 긍정적인 영향을 미칠 것으로 예상됩니다.
단, 연구 결과는 아직 초기 단계이며, 더 많은 실험과 검증이 필요합니다.
Reference
[arxiv] Classical Planning with LLM-Generated Heuristics: Challenging the State of the Art with Python Code
Published: (Updated: )
Author: Augusto B. Corrêa, André G. Pereira, Jendrik Seipp
http://arxiv.org/abs/2503.18809v1