AI의 창의성, 인간을 넘어설 수 있을까? - 개념 융합을 통한 비전-언어 모델의 창의성 탐구


본 연구는 비전-언어 모델(VLMs)의 결합적 창의성을 '개념 융합' 관점에서 분석하고, 새로운 평가 프레임워크(IEI)와 VLMs의 창의성 향상 방안을 제시합니다. 실험 결과, 최고 수준의 VLMs는 인간의 평균적 이해 능력을 뛰어넘었지만 전문가 수준에는 미치지 못했으며, IEI 프레임워크를 활용하면 VLMs의 창의적 생성 능력을 향상시킬 수 있음을 보여줍니다.

related iamge

AI의 창의성, 인간을 넘어설 수 있을까?

최근 GPT-4V와 DALL-E 3와 같은 비전-언어 모델(VLMs)의 발전은 놀랍습니다. 하지만 이들의 출력물이 단순한 패턴 매칭인지, 아니면 진정한 창의성의 발현인지에 대한 논쟁은 계속되고 있습니다. 중국과학원의 Yongqian Peng을 비롯한 연구팀은 인간의 창의성, 특히 기존 개념을 결합하여 새로운 아이디어를 창출하는 '결합적 창의성'에 대한 흥미로운 연구 결과를 발표했습니다. 그들의 논문, "Probing and Inducing Combinational Creativity in Vision-Language Models"은 이 분야의 중요한 이정표가 될 것입니다.

인간 수준의 이해와 한계

연구팀은 인지과학에서 영감을 얻어, '개념 융합'이라는 관점에서 VLMs의 결합적 창의성을 조사했습니다. 그들은 창의적 과정을 세 가지 수준(입력 공간 식별, 공유 속성 추출, 새로운 의미 함축 도출)으로 분해하는 '식별-설명-함축(IEI)' 프레임워크를 제안했습니다. 666개의 예술가가 만든 시각적 혼합물로 구성된 CreativeMashup 데이터셋을 사용하여 광범위한 실험을 진행한 결과, 최고 수준의 VLMs는 이해 과제에서 평균적인 인간의 수행 능력을 뛰어넘었지만, 전문가 수준에는 미치지 못했습니다. 즉, AI는 인간 수준의 이해력에 근접했지만, 아직 전문가의 깊이 있는 통찰력에는 도달하지 못했다는 의미입니다.

AI 창의성 향상의 실마리: IEI 프레임워크

하지만 희망적인 부분도 있습니다. 생성 과제에서 IEI 프레임워크를 생성 파이프라인에 통합함으로써 VLMs의 창의적 품질을 크게 향상시킬 수 있음을 확인했습니다. 이는 AI의 창의성 향상을 위한 구체적인 방법론을 제시한 중요한 발견입니다. 단순히 데이터 패턴을 모방하는 것을 넘어, AI 스스로 새로운 의미를 생성하고 결합할 수 있도록 돕는 IEI 프레임워크는 AI 창의성 연구의 새로운 지평을 열었습니다.

미래를 위한 전망

이 연구는 인공 창의성을 평가하기 위한 이론적 토대를 마련하고, VLMs에서 창의적 생성을 개선하기 위한 실질적인 지침을 제공합니다. 이는 단순한 기술적 진보를 넘어, AI가 인간의 창의성을 이해하고, 심지어 능가할 수 있는 가능성을 보여주는 흥미로운 연구입니다. 그러나 AI의 창의성이 인간의 창의성을 완전히 대체할 수 있을지는 여전히 미지수입니다. 앞으로 더욱 심도 있는 연구를 통해 AI 창의성의 본질과 한계를 명확히 규명하는 것이 중요합니다. 이 연구는 그러한 여정의 중요한 첫걸음이 될 것입니다. 🎉


*이 기사는 AI가 생성한 내용으로, 일부 정보가 실제와 다를 수 있습니다. 정확한 확인을 위해 추가적인 검증을 권장드립니다.

Reference

[arxiv] Probing and Inducing Combinational Creativity in Vision-Language Models

Published:  (Updated: )

Author: Yongqian Peng, Yuxi Ma, Mengmeng Wang, Yuxuan Wang, Yizhou Wang, Chi Zhang, Yixin Zhu, Zilong Zheng

http://arxiv.org/abs/2504.13120v1