낯선 이에서 조력자로: 구현 에이전트-사용자 적응을 위한 빠른 욕구 정렬
본 연구는 LLM 기반의 사용자 에이전트를 활용한 가정 보조 시뮬레이션 환경 HA-Desire와, 욕구 기반 정신적 추론 및 반성 기반 의사소통 모듈을 포함한 새로운 프레임워크 FAMER를 제시하여 구현 에이전트의 사용자 욕구 적응 능력을 크게 향상시켰습니다. 실험 결과는 작업 실행 및 의사소통 효율성 향상을 입증하며, 인간-AI 협업 시스템 발전에 기여할 것으로 기대됩니다.

최근 구현 에이전트는 복잡한 물리적 작업 수행 능력이 크게 향상되었지만, 실제 응용 분야에서는 단순 작업 실행을 넘어서는 능력이 요구됩니다. 바로 낯선 에이전트 및 인간 사용자와의 협업입니다. 사용자의 목표는 종종 모호하고 암묵적이기 때문에, 모호한 지시를 해석하고 숨겨진 욕구를 파악하는 것이 효과적인 지원에 필수적입니다. 따라서 구현 에이전트에게 빠르고 정확한 욕구 정렬은 매우 중요한 능력이 되었습니다.
왕위안페이 등 연구진은 이 문제에 대한 해결책으로 혁신적인 연구를 발표했습니다. 그들은 먼저 LLM(대규모 언어 모델) 기반의 현실적인 가치 중심 목표 선택 및 의사소통을 보이는 인간 사용자 에이전트를 통합한 가정 보조 시뮬레이션 환경인 HA-Desire를 개발했습니다. 이 시뮬레이션에서 에이전트는 사용자의 잠재적 욕구를 추론하고 이에 적응하기 위해 사용자와 상호 작용해야 합니다.
이를 달성하기 위해 연구진은 FAMER라는 새로운 프레임워크를 제시했습니다. FAMER은 사용자 의도를 파악하고 욕구와 무관한 행동을 걸러내는 욕구 기반 정신적 추론 메커니즘을 도입했습니다. 또한, 중복 질문을 줄이는 반성 기반 의사소통 모듈을 설계하고, 정보 재사용을 개선하고 불필요한 탐색을 줄이기 위해 목표 관련 정보 추출과 메모리 지속성을 통합했습니다.
광범위한 실험 결과, FAMER 프레임워크는 작업 실행 및 의사소통 효율성을 크게 향상시켜 구현 에이전트가 복잡한 구현 환경에서 사용자 특정 욕구에 신속하게 적응할 수 있음을 보여주었습니다. 이는 인간과의 상호작용이 필수적인 다양한 실제 환경에서 구현 에이전트의 활용 가능성을 크게 높이는 획기적인 결과입니다. 앞으로 더욱 발전된 기술을 통해 인간과 AI의 협력이 더욱 원활해질 것으로 기대됩니다. 하지만 동시에, AI 에이전트의 욕구 파악 및 적응에 대한 윤리적, 사회적 함의에 대한 심도있는 논의가 필요할 것입니다.
Reference
[arxiv] From Strangers to Assistants: Fast Desire Alignment for Embodied Agent-User Adaptation
Published: (Updated: )
Author: Yuanfei Wang, Xinju Huang, Fangwei Zhong, Yaodong Yang, Yizhou Wang, Yuanpei Chen, Hao Dong
http://arxiv.org/abs/2505.22503v1