촉각 피드백 기반 로봇 조작의 혁신: 반응형 확산 정책(RDP) 등장


본 기사는 시각 및 촉각 정보를 통합한 로봇 조작 기술에 대한 최신 연구 결과를 소개합니다. 연구진은 저렴한 비용의 텔레오퍼레이션 시스템과 새로운 알고리즘(RDP)을 개발하여 실시간 촉각 피드백에 기반한 민첩한 로봇 조작을 가능하게 했습니다. 이 연구는 다양한 분야에서 로봇 활용의 폭을 넓힐 것으로 기대됩니다.

related iamge

인간은 시각과 촉각을 사용하여 복잡한 접촉 기반 작업을 수행하며, 환경 변화에 대한 빠른 적응과 접촉력의 적응적 제어와 같은 매우 민첩한 능력을 보여줍니다. 하지만 로봇에게 이러한 능력을 부여하는 것은 여전히 어려운 과제입니다.

기존의 시각적 모방 학습(IL) 방식은 복잡한 행동을 모델링하기 위해 행동을 여러 단위로 나누는 방식을 사용하지만, 이는 단위 실행 중 실시간 촉각 피드백에 즉각적으로 반응하는 능력이 부족합니다. 더욱이 대부분의 원격 조작 시스템은 미세한 촉각/힘 피드백을 제공하는 데 어려움을 겪어 수행 가능한 작업의 범위가 제한됩니다.

한 학(Han Xue) 등 8명의 연구진은 이러한 문제점들을 해결하기 위해 증강 현실(AR)을 통해 실시간 촉각 피드백을 제공하는 저렴한 비용의 원격 조작 시스템인 TactAR과, 접촉 기반 조작 기술 학습을 위한 새로운 알고리즘인 반응형 확산 정책(RDP) 을 제시했습니다.

RDP는 두 가지 수준의 계층 구조를 사용합니다. 첫째, 저주파수에서 잠재 공간에서 고차원 행동 단위를 예측하는 느린 잠재 확산 정책과, 둘째, 고주파수에서 폐쇄 루프 촉각 피드백 제어를 위한 빠른 비대칭 토크나이저입니다. 이러한 설계는 통합된 프레임워크 내에서 복잡한 궤적 모델링과 빠른 반응 행동을 모두 가능하게 합니다.

세 가지 복잡한 접촉 기반 작업에 대한 광범위한 평가를 통해 RDP는 촉각/힘 피드백에 대한 빠른 반응을 통해 최첨단 시각적 IL 기준선보다 성능을 크게 향상시켰음을 보여줍니다. 또한 실험 결과 RDP는 다양한 촉각/힘 센서에 적용될 수 있음을 보여줍니다. 자세한 내용은 https://reactive-diffusion-policy.github.io 에서 확인할 수 있습니다.

이 연구는 로봇이 인간처럼 민첩하고 정교한 접촉 기반 작업을 수행하는데 한 걸음 더 다가가는 중요한 발걸음입니다. 저렴한 비용의 시스템과 효과적인 알고리즘의 조합은 다양한 분야에서 로봇 활용의 폭을 넓힐 것으로 기대됩니다. 하지만 향후 연구에서는 더욱 다양한 환경과 작업에 대한 적용 가능성 및 안정성 검증이 필요할 것입니다.


*이 기사는 AI가 생성한 내용으로, 일부 정보가 실제와 다를 수 있습니다. 정확한 확인을 위해 추가적인 검증을 권장드립니다.

Reference

[arxiv] Reactive Diffusion Policy: Slow-Fast Visual-Tactile Policy Learning for Contact-Rich Manipulation

Published:  (Updated: )

Author: Han Xue, Jieji Ren, Wendi Chen, Gu Zhang, Yuan Fang, Guoying Gu, Huazhe Xu, Cewu Lu

http://arxiv.org/abs/2503.02881v2