EcoAgent: 모바일 자동화의 미래를 여는 에지-클라우드 협업 멀티 에이전트 프레임워크
EcoAgent는 클라우드와 에지 기반 에이전트의 협업을 통해 모바일 자동화의 효율성과 성능을 획기적으로 개선한 프레임워크입니다. 전처리 모듈과 반성 모듈을 통해 MLLM 토큰 소비량을 줄이고 작업 성공률을 높여 실용적인 모바일 자동화를 가능하게 합니다.

모바일 자동화의 혁신: EcoAgent 등장
최근 급격한 발전을 거듭하고 있는 모바일 자동화 분야에서, Biao Yi를 비롯한 7명의 연구진이 개발한 EcoAgent 프레임워크가 주목받고 있습니다. (멀티모달) 대규모 언어 모델((M)LLMs) 기반의 클라우드 기반 모바일 에이전트는 강력한 추론 능력을 제공하지만, 높은 지연 시간과 비용이라는 난관에 직면합니다. 반면, 미세 조정된 (M)SLMs는 에지 배포가 가능하지만 일반적인 기능이 저하되고 복잡한 작업 처리에 어려움을 겪습니다.
EcoAgent: 클라우드와 에지의 완벽한 조화
EcoAgent는 이러한 문제점을 해결하기 위해 클라우드 기반 계획 에이전트(Planning Agent) 와 에지 기반 실행 에이전트(Execution Agent) , 관찰 에이전트(Observation Agent) 의 협업을 통해 작동하는 혁신적인 프레임워크입니다. 클라우드 기반 계획 에이전트는 전반적인 작업 계획을 세우고, 에지 기반 실행 에이전트는 실제 작업을 수행합니다. 관찰 에이전트는 작업 결과를 검증하고, 필요에 따라 계획 에이전트에 피드백을 제공합니다.
효율성 극대화를 위한 핵심 기술
EcoAgent의 핵심은 바로 효율성입니다. 관찰 에이전트는 전처리 모듈(Pre-Understanding Module) 을 사용하여 화면 이미지를 간결한 텍스트로 압축함으로써 토큰 사용량을 크게 줄입니다. 이는 MLLM의 연산량을 감소시켜 속도와 효율성을 향상시키는 중요한 요소입니다. 또한, 실패 시에는 반성 모듈(Reflection Module) 을 통해 화면 히스토리를 검색하고 계획을 재수립하여 작업 성공률을 높입니다. AndroidWorld를 이용한 실험 결과, EcoAgent는 MLLM 토큰 소비량을 크게 줄이면서 높은 작업 성공률을 유지하여 효율적이고 실용적인 모바일 자동화를 가능하게 한다는 것을 증명했습니다.
미래를 향한 발걸음
EcoAgent는 단순한 기술적 진보를 넘어, 모바일 자동화 분야의 패러다임을 바꿀 잠재력을 가지고 있습니다. 클라우드와 에지의 장점을 결합한 효율적인 아키텍처, 그리고 첨단 기술을 활용한 지능형 시스템은 모바일 자동화의 새로운 가능성을 열어줄 것입니다. 앞으로 EcoAgent가 어떻게 발전하고, 어떤 영역에 활용될지 기대됩니다.
Reference
[arxiv] EcoAgent: An Efficient Edge-Cloud Collaborative Multi-Agent Framework for Mobile Automation
Published: (Updated: )
Author: Biao Yi, Xavier Hu, Yurun Chen, Shengyu Zhang, Hongxia Yang, Fan Wu, Fei Wu
http://arxiv.org/abs/2505.05440v1