단일 시범 학습으로 로봇에게 영리한 손재주를 가르치다: AdaDexGrasp
본 연구는 단일 시범 학습을 통해 로봇의 다양한 물체 파지 기술을 효율적으로 학습하고 적응적으로 적용하는 AdaDexGrasp 프레임워크를 제시합니다. 강화학습과 커리큘럼 학습, 비전-언어 모델을 활용하여 높은 성공률을 달성하였으며, 실제 로봇 손에도 적용 가능성을 보였습니다.

로봇이 사람처럼 물건을 자유자재로 잡는 기술, 꿈만 같았던 이야기가 현실로 다가오고 있습니다. Liangzhi Shi 등 연구진이 발표한 논문 "Learning Adaptive Dexterous Grasping from Single Demonstrations" 에서는 놀랍게도 단 한 번의 시범만으로 로봇이 다양한 물체를 능숙하게 잡는 기술을 습득하는 AdaDexGrasp 프레임워크를 소개합니다.
한 번의 시범, 무한한 가능성
기존 로봇 학습은 방대한 데이터와 반복적인 훈련을 필요로 했습니다. 하지만 AdaDexGrasp는 단 한 번의 사람 시범으로 다양한 잡는 기술을 학습합니다. 연구진은 강화학습(Reinforcement Learning, RL) 과정에 사람의 시범 동작에 가까운 상태를 유도하는 보상 함수를 도입하여 학습 효율을 극대화했습니다. 단순히 시범을 따라하는 것을 넘어, 탐색의 유연성까지 확보하여 더욱 효과적인 학습이 가능해졌습니다. 마치 사람이 한 번 보여주는 것만으로 기술을 익히는 것처럼 말이죠.
커리큘럼 학습과 비전-언어 모델의 조화
단일 시범으로는 다양한 상황에 대처하기 어렵다는 한계를 극복하기 위해 연구진은 커리큘럼 학습(Curriculum Learning) 을 도입했습니다. 물체의 자세 변화를 점진적으로 증가시켜 로봇이 다양한 상황에 대한 강건성을 높였습니다. 또한, 비전-언어 모델(Vision-Language Model, VLM) 을 활용하여 사용자의 지시를 이해하고, 상황에 맞는 최적의 잡는 기술을 선택하는 시스템을 구축했습니다. 저수준의 학습된 기술과 고수준의 사용자 의도를 연결하는 다리가 마련된 셈입니다.
현실 세계에서의 놀라운 성과
AdaDexGrasp는 시뮬레이션과 실제 환경 모두에서 성공적으로 작동했습니다. 특히, PSYONIC Ability Hand라는 실제 로봇 손에 학습된 정책을 적용한 결과, 다양한 물체에 대해 90%의 성공률을 달성했습니다. 이는 기존 방식을 압도적으로 뛰어넘는 성과로, AdaDexGrasp의 실용성을 입증합니다.
미래를 향한 발걸음
AdaDexGrasp는 로봇 학습의 새로운 지평을 열었습니다. 단순한 기술적 진보를 넘어, 인간과 로봇의 협업을 더욱 원활하게 만들고, 로봇이 인간의 일상생활에 더욱 깊이 관여할 수 있는 가능성을 제시합니다. 앞으로의 연구를 통해 더욱 발전된 로봇 기술이 우리의 삶을 풍요롭게 만들어 줄 것이 기대됩니다.
Reference
[arxiv] Learning Adaptive Dexterous Grasping from Single Demonstrations
Published: (Updated: )
Author: Liangzhi Shi, Yulin Liu, Lingqi Zeng, Bo Ai, Zhengdong Hong, Hao Su
http://arxiv.org/abs/2503.20208v1