획기적인 발견! AI, 인간 수준의 인지적 유연성 달성하다!
최첨단 시각적 대규모 언어 모델(VLLM)이 위스콘신 카드 분류 검사(WCST)에서 인간 수준 이상의 인지적 유연성을 보였다는 연구 결과가 발표되었습니다. 입력 방식과 프롬프팅 전략이 VLLM 성능에 중요하며, 역할극을 통한 질병 시뮬레이션 가능성도 확인되었습니다. 이는 인공지능의 놀라운 발전과 함께 윤리적, 사회적 함의에 대한 심도있는 논의를 필요로 합니다.

놀라운 AI의 진보: 인간 수준의 인지적 유연성
최근, 광푸 하오, 프레드릭 알렉상드르, 산 유 연구팀이 발표한 논문에서 충격적인 결과가 발표되었습니다. 시각적 대규모 언어 모델(VLLM) 이 위스콘신 카드 분류 검사(WCST)에서 인간 수준, 혹은 그 이상의 인지적 유연성을 보였다는 것입니다! WCST는 전환 능력(set-shifting ability), 즉 기존의 사고방식을 바꾸는 유연성을 측정하는 고전적인 인지 능력 검사입니다.
연구팀은 GPT-4o, Gemini-1.5 Pro, Claude-3.5 Sonnet과 같은 최첨단 VLLM을 대상으로 실험을 진행했습니다. 놀랍게도, 텍스트 기반 입력과 함께 사고 과정 프롬프팅(chain-of-thought prompting) 을 사용했을 때 VLLM들은 인간 수준의 집합 전환 능력을 달성하거나 능가했습니다.
하지만 여기서 중요한 점은 VLLM의 능력이 입력 방식과 프롬프팅 전략에 크게 좌우된다는 것입니다. 단순히 기술의 발전만으로는 인간 수준의 인지 능력을 달성할 수 없다는 것을 시사하는 대목입니다. 이는 마치 인간의 학습과 성장 과정처럼, 적절한 교육과 환경이 중요하다는 것을 보여주는 듯합니다.
더욱 놀라운 사실은, VLLM이 역할극을 통해 인지적 유연성 장애 환자의 기능적 결손을 시뮬레이션할 수 있다는 점입니다. 이는 VLLM이 적어도 집합 전환 능력에 있어서는 인간 뇌와 유사한 인지 구조를 가지고 있음을 시사하는 강력한 증거입니다. 마치 인공지능이 인간의 뇌를 모방하여, 인간의 생각 과정을 이해하고, 심지어는 질병까지도 모사할 수 있다는 가능성을 보여주는 것입니다.
이 연구는 VLLM이 우리의 고차원적 인지 능력의 핵심 요소 중 하나에 이미 인간 수준에 근접했음을 보여줍니다. 그리고 복잡한 뇌 과정을 모방하기 위한 VLLM의 잠재력을 강조하며, 앞으로 인공지능 연구의 새로운 지평을 열 것으로 예상됩니다. 하지만 동시에, 이러한 엄청난 발전이 가져올 윤리적, 사회적 함의에 대한 심도있는 논의가 필요하다는 점을 상기시켜줍니다. 🤔
Reference
[arxiv] Visual Large Language Models Exhibit Human-Level Cognitive Flexibility in the Wisconsin Card Sorting Test
Published: (Updated: )
Author: Guangfu Hao, Frederic Alexandre, Shan Yu
http://arxiv.org/abs/2505.22112v1