도라에몽(DORAEMON): 미지의 환경을 자유롭게 누비는 로봇 내비게이션 시스템의 탄생
인간의 인지 능력을 모방한 새로운 로봇 내비게이션 시스템 '도라에몽(DORAEMON)'이 개발되었습니다. 제로샷 자율 주행에 성공하며 기존 기술의 한계를 뛰어넘었고, 새로운 평가 지표 AORI를 통해 내비게이션 지능을 더욱 정확하게 평가할 수 있게 되었습니다.

가정용 서비스 로봇의 꿈, 바로 미지의 환경에서도 자유롭게 이동하는 능력입니다. 하지만 낮은 단계의 경로 계획과 높은 단계의 장면 이해가 동시에 필요하다는 점 때문에 이는 쉽지 않은 과제였습니다. 최근 등장한 비전-언어 모델(VLM) 기반 제로샷 접근 방식은 사전 지도나 특정 장면에 대한 훈련 데이터 의존도를 줄였지만, 여전히 공간-시간적 불연속성, 비체계적인 메모리 표현, 그리고 부족한 작업 이해 등의 문제점을 안고 있었습니다.
하지만 이제 희망이 보입니다! Tianjun Gu 등 연구진이 개발한 도라에몽(DORAEMON: Decentralized Ontology-aware Reliable Agent with Enhanced Memory Oriented Navigation) 이 바로 그 해답입니다. 도라에몽은 인간의 뛰어난 길 찾기 능력을 모방하여, 이러한 문제들을 혁신적으로 해결하는 새로운 인공지능 기반 내비게이션 프레임워크입니다.
인간의 뇌를 본뜬 이중 시스템: 복측류와 배측류
도라에몽은 인간의 시각 정보 처리 시스템을 모방한 '복측류(Ventral Stream)'와 '배측류(Dorsal Stream)'로 구성되어 있습니다. 마치 인간의 뇌처럼 말이죠! 배측류는 계층적 의미-공간 융합 및 토폴로지 맵을 사용하여 시간적, 공간적 불연속성 문제를 해결합니다. 복측류는 RAG-VLM 및 Policy-VLM을 결합하여 더욱 정확하고 효율적인 의사결정을 내립니다. 여기에 안전하고 효율적인 탐색을 보장하는 Nav-Ensurance 기술까지 더해져, 완벽에 가까운 내비게이션 시스템을 완성했습니다.
놀라운 성능: 기존 기술을 압도하다
도라에몽은 HM3D, MP3D, GOAT 데이터셋에서 놀라운 성능을 보여주었습니다. 성공률(SR)과 경로 길이 가중 성공률(SPL) 지표에서 기존 방식을 압도적으로 앞질렀습니다. 뿐만 아니라, 연구진은 내비게이션 지능을 더욱 정확하게 평가하기 위해 새로운 지표인 AORI(Autonomous Navigation Intelligence) 를 제안했습니다.
혁신적인 제로샷 자율주행
가장 중요한 점은 도라에몽이 사전 지도 생성이나 사전 훈련 없이도 제로샷 자율 주행에 성공했다는 것입니다. 이는 로봇의 활용 가능성을 획기적으로 높이는 혁신적인 성과입니다. 도라에몽의 등장은 가정용 서비스 로봇, 자율주행 자동차 등 다양한 분야에 혁신적인 변화를 가져올 것으로 기대됩니다. 미래의 로봇들이 도라에몽처럼 자유롭고 안전하게 우리 주변을 누빌 날이 머지않았습니다! 🎉
Reference
[arxiv] DORAEMON: Decentralized Ontology-aware Reliable Agent with Enhanced Memory Oriented Navigation
Published: (Updated: )
Author: Tianjun Gu, Linfeng Li, Xuhong Wang, Chenghua Gong, Jingyu Gong, Zhizhong Zhang, Yuan Xie, Lizhuang Ma, Xin Tan
http://arxiv.org/abs/2505.21969v2