로컬 LLM 기반의 확장 가능한 로봇 자율성: Gideon 프레임워크의 혁신


본 기사는 로컬 LLM을 활용한 로봇 자율성 향상을 위한 혁신적인 프레임워크 Gideon을 소개합니다. Gideon은 대규모 데이터셋 생성 및 신경 기호 계획 적용을 통해 단일 및 다중 도메인에서 높은 유효 계획 비율을 달성, 확장성 및 효율성을 모두 만족시키는 로봇 자율성의 새로운 가능성을 제시합니다.

related iamge

로컬 LLM로 로봇 자율성의 한계를 뛰어넘다: Gideon 프레임워크 소개

로봇 자율성 분야에서 PDDL 기반의 기호적 작업 계획은 여전히 중요한 역할을 합니다. 하지만 동적인 인간-로봇 협업 환경에서는 확장성, 재계획 요구, 계획 생성 지연 등의 어려움에 직면합니다. 기존의 GPT-3와 같은 대규모 언어 모델(LLM)을 활용한 신경 기호 프레임워크는 이러한 문제를 해결하려는 시도였지만, 폐쇄형 원격 모델에 대한 의존으로 인해 제3자 종속성, 일관되지 않은 응답 시간, 제한된 계획 길이 및 복잡성, 다중 도메인 확장성 문제 등의 한계를 드러냈습니다.

이러한 한계를 극복하기 위해 Nicholas Attolino, Alessio Capitanelli, Fulvio Mastrogiovanni 연구팀은 Gideon이라는 혁신적인 프레임워크를 제시했습니다. Gideon은 현대적이고 더 작은 크기의 로컬 LLM을 활용하여 확장된 컨텍스트 길이를 제공합니다. 핵심은 새로운 문제 생성기입니다. 이 생성기는 어떤 도메인이든 현실적인 도메인-문제-계획 튜플의 대규모 데이터셋을 체계적으로 생성합니다. 또한, Gideon은 로컬 LLM에 신경 기호 계획을 적용하여 장치 내 실행과 다중 도메인 지원을 위한 확장된 컨텍스트를 가능하게 합니다.

놀라운 실험 결과: 확장성과 효율성의 증명

Gideon의 성능은 단일 도메인과 다중 도메인 시나리오에서 검증되었습니다. Qwen-2.5 1.5B 모델을 사용한 단일 도메인 실험(8,000개~32,000개의 샘플로 학습)에서는 66.1%(32,000개 모델)의 유효 계획 비율을 달성했습니다. 더욱 놀라운 것은 16,000개의 샘플로 진행된 다중 도메인 실험에서 70.6%라는 더 높은 유효 계획 비율을 기록했다는 점입니다. 이는 다양한 도메인에 대한 확장성을 입증하고, 데이터 다양성이 학습 효율에 긍정적인 영향을 미친다는 것을 보여줍니다.

물론, 장기 계획과 작은 모델 크기로 인해 Gideon의 학습 효율은 기존 대규모 LLM 기반 모델보다 낮습니다. 하지만 Gideon이 기존 모델보다 약 120배 작은 모델 크기임에도 불구하고, 추론 효율성, 확장성, 다중 도메인 적응성 측면에서 상당한 이점을 제공한다는 점을 고려하면 매우 의미있는 결과입니다. 또한, Gideon의 간소화된 데이터 생성 파이프라인을 통해 학습 비효율성을 완화할 수 있습니다.

결론: 로봇 자율성의 새로운 지평

Gideon은 로컬 LLM을 활용하여 로봇 자율성의 새로운 지평을 열었습니다. 확장성, 효율성, 다중 도메인 적응성을 모두 만족시키는 Gideon은 인간-로봇 협업 분야에 혁신적인 변화를 가져올 것으로 기대됩니다. 향후 연구에서는 더욱 다양한 도메인과 복잡한 작업에 대한 Gideon의 적용 가능성을 탐구할 필요가 있습니다.


*이 기사는 AI가 생성한 내용으로, 일부 정보가 실제와 다를 수 있습니다. 정확한 확인을 위해 추가적인 검증을 권장드립니다.

Reference

[arxiv] Achieving Scalable Robot Autonomy via neurosymbolic planning using lightweight local LLM

Published:  (Updated: )

Author: Nicholas Attolino, Alessio Capitanelli, Fulvio Mastrogiovanni

http://arxiv.org/abs/2505.08492v2