마인크래프트에서 현실처럼 움직이는 AI: 실시간 상호작용 월드 모델 MineWorld 등장!


중국과 영국 연구진이 공동 개발한 MineWorld는 마인크래프트 기반의 실시간 상호작용 월드 모델로, 시각-행동 자기회귀 트랜스포머와 평행 디코딩 알고리즘을 통해 실시간 상호작용을 가능하게 합니다. 오픈소스로 공개되어 AI 연구에 큰 기여를 할 것으로 기대됩니다.

related iamge

마인크래프트가 AI 연구의 놀이터가 되다: MineWorld의 혁신적인 도약

인공지능이 점점 더 현실 세계와 상호작용하는 방식이 정교해지고 있습니다. 이러한 흐름 속에서 중국과 영국의 연구진이 공동으로 개발한 MineWorld는 게임 마인크래프트를 활용하여 새로운 지평을 열었습니다. MineWorld는 단순한 게임 모델이 아닌, 실시간으로 작동하는 상호작용형 월드 모델입니다. 이는 마치 마인크래프트 세계에 인공지능이 실제로 존재하고, 플레이어와 상호작용하는 듯한 경험을 제공합니다.

시각과 행동의 조화: 자기회귀 트랜스포머의 활약

MineWorld의 핵심은 시각-행동 자기회귀 트랜스포머에 있습니다. 이 모델은 게임 화면(시각 정보)과 플레이어의 행동(행동 정보)을 입력으로 받아 다음 순간의 게임 화면을 예측합니다. 단순히 화면을 복사하는 것이 아니라, 플레이어의 행동에 따라 변화하는 게임 세계를 실시간으로 생성하는 겁니다. 이를 위해 연구진은 이미지와 행동을 모두 컴퓨터가 이해할 수 있는 토큰으로 변환하는 토크나이저 기술을 사용했습니다. 마치 마인크래프트 세계의 언어를 AI가 배우는 과정과 같습니다.

속도와 정확성의 조화: 평행 디코딩 알고리즘의 위력

실시간 상호작용이 중요한 MineWorld는 평행 디코딩 알고리즘이라는 혁신적인 기술을 통해 초당 4~7프레임의 속도를 구현했습니다. 이는 AI가 마인크래프트 세계를 실시간으로 탐색하고, 플레이어의 행동에 즉각적으로 반응할 수 있음을 의미합니다. 단순히 이미지의 질을 높이는 것뿐 아니라, 플레이어의 행동에 대한 반응의 정확성을 높이는 새로운 평가 지표까지 제시하며 기존 기술들을 뛰어넘는 성능을 선보였습니다.

오픈소스 공개: AI 연구의 새로운 가능성

가장 중요한 점은 MineWorld의 코드와 모델이 오픈소스로 공개되었다는 것입니다. 이는 전 세계의 연구자들에게 새로운 가능성을 열어줄 것입니다. MineWorld를 기반으로 더욱 정교하고 복잡한 AI 시스템을 개발하고, 인공지능이 현실 세계와 상호 작용하는 방식을 더욱 발전시킬 수 있을 것으로 기대됩니다.

Guo Junliang 등 연구진의 이번 연구는 AI와 게임의 융합을 통해 상호작용 지능 분야에 큰 발전을 가져왔습니다. MineWorld는 단순한 기술적 진보를 넘어, 미래 인공지능 기술의 방향을 제시하는 중요한 이정표가 될 것입니다.


*이 기사는 AI가 생성한 내용으로, 일부 정보가 실제와 다를 수 있습니다. 정확한 확인을 위해 추가적인 검증을 권장드립니다.

Reference

[arxiv] MineWorld: a Real-Time and Open-Source Interactive World Model on Minecraft

Published:  (Updated: )

Author: Junliang Guo, Yang Ye, Tianyu He, Haoyu Wu, Yushu Jiang, Tim Pearce, Jiang Bian

http://arxiv.org/abs/2504.08388v1