센서 데이터만으로 자율주행 가능해진다면? Raw2Drive: 혁신적인 강화학습 기반 자율주행 기술


Yang Zhenjie 등 연구팀의 Raw2Drive는 모델 기반 강화학습을 통해 원시 센서 데이터만으로 자율주행을 가능하게 한 혁신적인 기술입니다. CARLA 시뮬레이터에서 최첨단 성능을 달성하며 자율주행 기술 발전에 크게 기여할 것으로 기대됩니다.

related iamge

자율주행 기술의 핵심 과제 중 하나는 복잡하고 예측 불가능한 실제 도로 환경에서 안전하고 효율적으로 주행하는 것입니다. 기존의 모방 학습(IL) 방식은 데이터 편향과 인과 관계 모호성 문제에 직면해 왔습니다. 하지만 최근, Yang Zhenjie를 비롯한 연구팀이 발표한 Raw2Drive는 이러한 한계를 극복할 가능성을 제시하며 주목받고 있습니다.

Raw2Drive는 모델 기반 강화학습(MBRL) 을 활용하여, 원시 센서 데이터만으로 자율주행을 제어하는 혁신적인 기술입니다. 기존 MBRL 방식은 특권 정보(privileged information)를 필요로 했지만, Raw2Drive는 이를 극복하고 원시 센서 데이터를 직접 입력으로 사용합니다. 이는 마치 인간 운전자가 눈과 귀로 얻은 정보만으로 운전하는 것과 유사합니다.

연구팀은 먼저 특권 정보를 사용하는 보조적인 세계 모델(privileged world model)과 신경망 계획자(neural planner)를 효율적으로 학습시켰습니다. 이후, **'지도 메커니즘(Guidance Mechanism)'**이라는 독창적인 방법을 통해 원시 센서 데이터를 사용하는 세계 모델을 학습시켜, 두 세계 모델 간의 일관성을 유지했습니다. 결국, 원시 센서 세계 모델은 특권 세계 모델의 사전 지식을 활용하여 원시 센서 기반 정책(policy) 학습을 효과적으로 안내합니다.

CARLA 시뮬레이터 버전 2.0 환경에서의 실험 결과, Raw2Drive는 기존 기술들을 뛰어넘는 성능을 달성했습니다. 특히 CARLA Leaderboard 2.0 및 Bench2Drive에서 최첨단 성능을 기록하며 그 우수성을 입증했습니다. 이는 RL 기반의 엔드-투-엔드 자율주행 방법론 중 CARLA 리더보드에 이름을 올린 유일한 사례라는 점에서 더욱 의미가 큽니다.

이번 연구는 자율주행 분야에 새로운 가능성을 열었습니다. 더 이상 복잡한 데이터 전처리나 특권 정보에 의존하지 않고, 원시 센서 데이터만으로도 안전하고 효율적인 자율주행이 가능하다는 것을 보여주었기 때문입니다. 하지만, 실제 도로 환경 적용을 위해서는 추가적인 연구와 검증이 필요하며, 예상치 못한 상황에 대한 대처 능력 향상 등의 과제도 남아있습니다. 하지만 Raw2Drive는 자율주행 기술의 혁신을 향한 중요한 이정표가 될 것임이 분명합니다.


*이 기사는 AI가 생성한 내용으로, 일부 정보가 실제와 다를 수 있습니다. 정확한 확인을 위해 추가적인 검증을 권장드립니다.

Reference

[arxiv] Raw2Drive: Reinforcement Learning with Aligned World Models for End-to-End Autonomous Driving (in CARLA v2)

Published:  (Updated: )

Author: Zhenjie Yang, Xiaosong Jia, Qifeng Li, Xue Yang, Maoqing Yao, Junchi Yan

http://arxiv.org/abs/2505.16394v1