드라이브MoE: 종단간 자율주행을 위한 전문가 혼합 모델의 혁신


양젠제 등 연구진이 개발한 DriveMoE는 MoE 아키텍처를 활용하여 종단간 자율주행의 성능을 획기적으로 향상시킨 모델입니다. 시각 및 행동 전문화를 통해 복잡한 주행 상황에 대한 강인성을 높였으며, Bench2Drive 평가에서 최첨단 성능을 달성했습니다. 코드와 모델 공개를 통해 자율주행 기술 발전에 크게 기여할 것으로 기대됩니다.

related iamge

드라이브MoE: 종단간 자율주행의 새로운 지평을 열다

자율주행 기술의 최전선에서 끊임없는 혁신이 이루어지고 있습니다. 특히, 다양하고 복잡한 주행 상황, 예측 불가능한 돌발 상황에 대한 대처 능력은 자율주행 시스템의 성패를 좌우하는 핵심 요소입니다. 최근 양젠제(Zhenjie Yang) 등 연구진이 발표한 논문 "DriveMoE: Mixture-of-Experts for Vision-Language-Action Model in End-to-End Autonomous Driving"은 이러한 문제에 대한 획기적인 해결책을 제시합니다.

MoE(Mixture-of-Experts) 아키텍처의 도입: 인간의 인지 능력을 모방하다

본 연구는 대규모 언어 모델(LLM)에서 성공적으로 활용된 MoE 아키텍처를 자율주행 분야에 최초로 적용한 사례입니다. MoE는 특정 작업에 특화된 여러 전문가 모듈을 활용하여 문제를 해결하는 방식으로, 마치 인간의 뇌가 특정 영역에 전문화된 기능을 수행하는 것과 유사합니다. DriveMoE는 Scene-Specialized Vision MoE (장면 특화 시각 MoE)와 Skill-Specialized Action MoE (기술 특화 행동 MoE)라는 두 가지 주요 모듈로 구성됩니다.

  • Scene-Specialized Vision MoE: 운전 상황에 따라 필요한 카메라 정보만 선택적으로 처리하여 효율성을 높입니다. 마치 인간 운전자가 중요한 시각적 단서에만 집중하는 것과 같습니다. 불필요한 정보 처리를 최소화하여 시스템의 부하를 줄이고, 더욱 정확하고 빠른 의사결정을 가능하게 합니다.
  • Skill-Specialized Action MoE: 다양한 주행 행동(예: 급격한 회전, 차선 변경 등)에 특화된 전문가 모듈을 활성화하여 복잡한 상황에 대한 대응 능력을 향상시킵니다. 이를 통해 기존 모델의 단점인 '모드 평균화' 문제를 해결하고, 각 상황에 최적화된 행동 전략을 선택할 수 있습니다.

Drive-π₀: 기존 모델을 뛰어넘는 성능

DriveMoE는 기존의 Drive-π₀ (embodied AI 분야의 VLA 모델)을 기반으로 개발되었습니다. Bench2Drive 폐쇄 루프 평가 실험에서 DriveMoE는 최첨단(SOTA) 성능을 달성하여 MoE 아키텍처의 효과를 입증했습니다. 이는 단순히 새로운 아키텍처를 제안하는 것을 넘어, 실제 자율주행 환경에서 그 효용성을 검증했다는 점에서 큰 의미를 가집니다.

미래를 향한 발걸음: 코드와 모델 공개

연구진은 DriveMoE와 Drive-π₀의 코드와 모델을 공개하여, 자율주행 기술 발전에 대한 긍정적인 영향을 미칠 것으로 기대됩니다. 이를 통해 다른 연구자들이 DriveMoE를 기반으로 더욱 발전된 자율주행 시스템을 개발하고, 자율주행 기술의 전반적인 발전에 기여할 수 있을 것입니다. DriveMoE는 단순한 기술적 진보를 넘어, 자율주행 기술의 미래를 향한 중요한 이정표가 될 것입니다.


*이 기사는 AI가 생성한 내용으로, 일부 정보가 실제와 다를 수 있습니다. 정확한 확인을 위해 추가적인 검증을 권장드립니다.

Reference

[arxiv] DriveMoE: Mixture-of-Experts for Vision-Language-Action Model in End-to-End Autonomous Driving

Published:  (Updated: )

Author: Zhenjie Yang, Yilin Chai, Xiaosong Jia, Qifeng Li, Yuqian Shao, Xuekai Zhu, Haisheng Su, Junchi Yan

http://arxiv.org/abs/2505.16278v1