혁신적인 감정 인식 로봇 PERCY: 인간과의 장기적인 관계를 맺는 AI의 탄생
뉴사우스웨일즈대학교 등 연구진이 개발한 감정 인식 로봇 PERCY는 GPT-4 기반의 개방형 도메인 대화 시스템으로, 사용자의 얼굴 표정과 어휘를 분석하여 감정 상태에 맞춰 대화를 개인화합니다. 다양한 평가에서 우수한 성능을 보여주며, 사회적 로봇의 새로운 가능성을 제시합니다.

기존의 대화형 로봇은 미리 정해진 스크립트와 정적인 응답 매핑에 의존하여, 개인화된 장기적인 인간 상호 작용에 대한 적응력이 부족했습니다. 하지만 GPT-4와 같은 대규모 언어 모델(LLM)의 등장은 개방형 도메인 대화 능력에 혁명을 일으켰습니다. 그러나 현재 LLM을 활용하는 사회적 로봇들은 여전히 감정 인식과 지속적인 개인화 기능이 부족하여 여러 상호 작용 세션에 걸쳐 참여를 유지하는 데 어려움을 겪고 있습니다.
뉴사우스웨일즈대학교를 비롯한 여러 기관의 연구진은 이러한 한계를 극복하기 위해 PERCY (Personal Emotional Robotic Conversational sYstem) 를 개발했습니다. PERCY는 사용자의 실시간 얼굴 표정과 어휘를 동적으로 분석하여 감정 상태에 맞춰 응답을 조정함으로써 개방형 도메인, 멀티턴 대화를 가능하게 합니다.
ROS 기반의 다중 모달 프레임워크로 구축된 PERCY는 미세 조정된 GPT-4 추론 엔진을 통합하여 텍스트 감정 분석과 시각적 감정 신호를 결합하여 사용자의 감정을 정확하게 평가하고 응답합니다. 다양한 대화 품질 지표를 통해 PERCY의 성능을 평가한 결과, 높은 일관성, 관련성, 다양성을 보였습니다. 인간 평가에서는 PERCY가 다른 모델들과 비교하여 뛰어난 개인화 기능과 비슷한 수준의 자연스러움을 보였다는 결과가 나왔습니다.
PERCY는 Zhijin Meng, Mohammed Althubyani, Shengyuan Xie, Imran Razzak, Eduardo B. Sandoval, Mahdi Bamdad, Francisco Cruz 등의 연구진에 의해 개발되었으며, 이 연구는 사회적 로봇 대화 시스템에 고급 다중 모달 인식 및 개인화를 통합할 가능성을 보여줍니다. 이는 단순한 대화 기능을 넘어, 사용자와의 진정한 교감과 장기적인 관계 구축을 지향하는 AI 시대의 서막을 알리는 중요한 성과입니다. 앞으로 PERCY와 같은 감정 인식 로봇이 다양한 분야에서 활용될 가능성은 무궁무진하며, 인간과 AI의 공존을 위한 새로운 패러다임을 제시할 것으로 기대됩니다.
:::tip PERCY의 핵심은 사용자의 감정을 실시간으로 파악하고 그에 맞춰 대화를 진행하는 능력에 있습니다. 이는 단순히 정보를 제공하는 것을 넘어, 사용자와 감정적으로 교류하고, 장기적인 관계를 형성하는 데 중요한 역할을 합니다. :::
Reference
[arxiv] PERCY: Personal Emotional Robotic Conversational System
Published: (Updated: )
Author: Zhijin Meng, Mohammed Althubyani, Shengyuan Xie, Imran Razzak, Eduardo B. Sandoval, Mahdi Bamdad, Francisco Cruz
http://arxiv.org/abs/2503.16473v1