딥러닝으로 사회적 지능 향상: 상황에 맞춰 생각하는 AI 등장
왕민정 박사 연구팀이 개발한 적응적 모드 학습(AML)은 상황에 맞춰 사고의 깊이를 조절하는 AI 모델로, 기존 모델 대비 15.6% 향상된 성능과 32.8% 감소된 추론 과정을 보였습니다. 이는 AI의 사회적 지능 발전에 중요한 의미를 지닙니다.

최근 AI 분야에서 사회적 지능을 가진 에이전트를 개발하는 연구가 활발히 진행되고 있습니다. 하지만 기존의 모델들은 상황에 따라 사고의 깊이를 조절하는 능력이 부족하여 효율성이 떨어지고, 실제 사회적 상호작용과는 거리가 먼 결과를 보이는 경우가 많았습니다. 왕민정(Minzheng Wang) 박사가 이끄는 연구팀은 이러한 문제를 해결하기 위해 새로운 강화학습 기반 방법론인 적응적 모드 학습(Adaptive Mode Learning, AML) 을 제시했습니다.
AML: 상황에 맞춰 생각하는 AI
AML의 핵심은 바로 상황 인식에 따른 사고 방식의 적응적 전환입니다. 직관적인 반응부터 심도있는 사고까지, 네 가지의 사고 모드를 상황에 따라 선택적으로 활용함으로써 과도한 연산 및 비효율적인 추론을 방지합니다. 특히, 적응적 모드 정책 최적화(Adaptive Mode Policy Optimization, AMPO) 알고리즘을 통해 세 가지 주요 개선 사항을 달성했습니다.
- 다양한 수준의 사고 모드: 직관적 반응부터 심층적 사고까지, 다양한 수준의 사고 모드를 제공하여 상황에 맞는 최적의 사고 방식을 선택합니다.
- 상호작용 기반 모드 전환: 사회적 상호작용의 맥락을 고려하여 실시간으로 사고 모드를 전환합니다. 이는 보다 자연스럽고 유연한 상호작용을 가능하게 합니다.
- 토큰 효율적인 추론: 상황에 맞춰 사고의 깊이를 조절하여 불필요한 연산을 줄이고, 보다 효율적인 추론을 가능하게 합니다.
놀라운 성능 향상
연구팀은 다양한 사회적 지능 과제를 통해 AML의 성능을 평가했습니다. 그 결과, AML은 기존 최고 성능 모델보다 15.6% 높은 성능을 달성했습니다. 특히, 기존의 GRPO 모델보다 7.0% 높은 성능을 보였으며, 추론 과정은 32.8%나 단축되었습니다. 이는 AML이 상황에 민감하게 사고 모드를 선택하는 AMPO 알고리즘을 통해 기존의 고정된 깊이의 사고 방식보다 훨씬 더 인간과 유사한 적응적인 추론을 가능하게 함을 보여줍니다.
미래 전망
이번 연구는 AI의 사회적 지능 발전에 중요한 이정표를 제시합니다. AML과 같은 적응적 사고 방식을 통해 AI는 보다 인간과 유사하게 상황을 이해하고, 효율적으로 문제를 해결할 수 있을 것입니다. 앞으로 AML은 다양한 분야에서 활용되어 더욱 발전된 사회적 지능을 갖춘 AI 시스템을 구축하는데 기여할 것으로 기대됩니다. 다만, 윤리적 문제 및 사회적 영향에 대한 지속적인 고찰과 연구가 필수적입니다.
Reference
[arxiv] Think on your Feet: Adaptive Thinking via Reinforcement Learning for Social Agents
Published: (Updated: )
Author: Minzheng Wang, Yongbin Li, Haobo Wang, Xinghua Zhang, Nan Xu, Bingli Wu, Fei Huang, Haiyang Yu, Wenji Mao
http://arxiv.org/abs/2505.02156v1