REMAC: 로봇 조작의 미래를 여는 자기 진화형 다중 에이전트 협업
Puzhen Yuan 등 연구진이 개발한 REMAC은 자기 반성과 자기 진화 기능을 갖춘 다중 에이전트 협업 프레임워크로, 장기간 로봇 조작의 성공률과 효율성을 크게 향상시켰습니다. RoboCasa 기반의 실험 결과, 기존 최첨단 모델 대비 성공률 40%, 효율성 52.7% 향상을 달성했습니다.

최근 비전-언어 모델(VLMs)의 발전은 로봇 계획, 특히 장기간에 걸친 작업 수행 능력을 크게 향상시켰습니다. 하지만 기존 방법들은 환경에 대한 사전 지식이나 세심하게 설계된 작업별 프롬프트에 의존하는 경향이 있어, 예측 불가능한 상황 변화에 취약했습니다. 예를 들어, 당근을 전자레인지에 넣으려는 로봇이 문이 닫혀있는 것을 발견하는 상황을 생각해보세요. 이러한 문제는 적응성과 효율성이라는 두 가지 중요한 과제를 제기합니다.
이러한 문제를 해결하기 위해, Puzhen Yuan 등 연구진은 REMAC이라는 새로운 프레임워크를 제안했습니다. REMAC은 지속적인 자기 반성과 자기 진화를 통해 효율적이고, 장면에 구애받지 않는 다중 로봇 장기 작업 계획 및 실행을 가능하게 합니다.
REMAC의 핵심은 두 가지 모듈에 있습니다. 첫째, 자기 반성 모듈은 작업 진행 상황을 평가하고 계획을 개선하기 위해 반복적으로 사전 및 사후 조건을 확인합니다. 둘째, 자기 진화 모듈은 장면 특유의 추론을 바탕으로 계획을 동적으로 조정합니다. 이를 통해 REMAC은 다음과 같은 장점을 제공합니다.
- 복잡한 프롬프트 설계 없이 로봇이 환경을 탐색하고 추론할 수 있습니다.
- 로봇은 잠재적인 계획 오류를 반영하고 작업별 통찰력을 바탕으로 계획을 조정할 수 있습니다.
- 반복적인 과정을 거쳐, 로봇은 다른 로봇을 호출하여 작업을 병렬적으로 수행하여 효율성을 극대화할 수 있습니다.
연구진은 RoboCasa를 기반으로 4가지 작업 범주, 27가지 작업 스타일, 50개 이상의 다양한 물체를 포함하는 다중 에이전트 환경을 구축하여 REMAC의 효과를 검증했습니다. DeepSeek-R1, o3-mini, QwQ, Grok3 등 최첨단 추론 모델과 비교한 결과, REMAC은 단일 로봇 기준 대비 평균 성공률을 40%, 실행 효율을 52.7% 향상시키는 우수한 성능을 보였습니다.
REMAC은 단순한 로봇 제어 시스템을 넘어, 스스로 학습하고 발전하는 지능형 시스템으로서 로봇 공학의 새로운 지평을 열 것으로 기대됩니다. 향후 다양한 환경 및 작업에 REMAC을 적용하고, 더욱 발전된 자기 학습 및 적응 능력을 구현하는 연구가 진행될 것으로 예상됩니다.
Reference
[arxiv] REMAC: Self-Reflective and Self-Evolving Multi-Agent Collaboration for Long-Horizon Robot Manipulation
Published: (Updated: )
Author: Puzhen Yuan, Angyuan Ma, Yunchao Yao, Huaxiu Yao, Masayoshi Tomizuka, Mingyu Ding
http://arxiv.org/abs/2503.22122v1