혁신적인 AI 언어 모델, 인간의 독해 과정을 얼마나 이해할까?
최첨단 AI 언어 모델은 독해 과정에서의 시선 지속 시간을 예측하는 데 있어 기존 모델보다 성능이 향상되었지만, 인간 독해의 복잡성을 완전히 설명하지는 못한다는 연구 결과가 발표되었습니다. 이는 AI의 발전 방향과 인간 인지의 심오함에 대한 중요한 시사점을 제공합니다.

최근 자연어 처리(NLP) 분야의 눈부신 발전으로 텍스트 생성에 능숙한 정교한 언어 모델들이 속속 등장하고 있습니다. 이러한 발전은 뇌과학 분야에서도 주목받고 있으며, 인간의 언어 이해 과정을 탐구하는 새로운 도구로 활용되고 있습니다. Bruno Bianchi, Fermín Travi, Juan E. Kamienkowski 등의 연구진은 최근 발표한 논문, "Modeling cognitive processes of natural reading with transformer-based Language Models" 에서 흥미로운 연구 결과를 제시했습니다.
기존 연구에서는 N-gram이나 LSTM 네트워크와 같은 모델을 사용하여 독해 과정에서의 시선 지속 시간(Gaze Duration)과 같은 눈 움직임을 설명하려는 시도가 있었습니다. 하지만 이러한 모델들은 독해 과정의 예측 가능성 효과를 부분적으로만 설명하는 데 그쳤습니다.
연구진은 이 연구에서 GPT2, LLaMA-7B, LLaMA2-7B 와 같은 트랜스포머 기반 모델을 활용하여 리오플란텐스 스페인어 사용자의 시선 지속 시간 데이터를 분석했습니다. 그 결과, 트랜스포머 기반 모델이 기존 모델보다 시선 지속 시간의 변동성을 더 잘 설명하는 것으로 나타났습니다. 이는 트랜스포머 구조의 우수성을 보여주는 중요한 발견입니다.
그러나 놀랍게도, 이 최첨단 모델들조차도 인간의 예측 가능성에 의해 포착된 변동성 전체를 설명하지는 못했습니다. 즉, AI 모델이 언어를 예측하는 방식은 여전히 인간 독자와 차이를 보인다는 것을 의미합니다.
이는 무엇을 의미할까요?
이 연구는 AI 모델의 놀라운 발전에도 불구하고, 인간의 언어 이해 과정의 복잡성은 여전히 AI가 완벽하게 재현하기에는 어려운 영역임을 시사합니다. 인간의 독해 과정에는 단순한 통계적 예측을 넘어선, 맥락 이해, 추론, 배경 지식 활용 등의 고차원적인 인지 과정이 복합적으로 작용하기 때문입니다. 이러한 연구 결과는 AI 모델의 발전 방향을 설정하는 데 중요한 지침을 제공하며, 인간의 인지 과정에 대한 보다 깊이 있는 이해를 필요로 함을 강조합니다.
앞으로 AI 모델이 인간의 독해 과정을 더욱 정확하게 모사하려면, 단순한 예측 능력을 넘어 인간의 인지적 특성을 더욱 정교하게 반영하는 새로운 아키텍처와 학습 방법론의 개발이 필요할 것입니다. 이는 AI 연구의 새로운 지평을 열어줄 흥미로운 과제입니다.
Reference
[arxiv] Modeling cognitive processes of natural reading with transformer-based Language Models
Published: (Updated: )
Author: Bruno Bianchi, Fermín Travi, Juan E. Kamienkowski
http://arxiv.org/abs/2505.11485v1