스타크래프트 II 정복을 위한 새로운 지평: AVA 에이전트 등장!


AVA는 시각 및 언어 정보를 활용하여 인간과 유사한 방식으로 StarCraft II를 플레이하는 혁신적인 AI 에이전트입니다. 기존 MARL 방법과 달리, 기초 모델을 활용하여 별도의 훈련 없이도 복잡한 전술적 행동을 수행하며, 인간 중심의 AI 개발에 새로운 가능성을 제시합니다.

related iamge

인간처럼 생각하고 행동하는 AI 에이전트: AVA

최근, 인간의 게임 플레이 경험과 유사한 방식으로 StarCraft II를 플레이하는 혁신적인 AI 에이전트 AVA가 등장했습니다. Weiyu Ma를 비롯한 연구팀이 개발한 AVA는 기존의 추상적인 상태 표현에 의존하는 방법과는 달리, RGB 시각 정보와 자연어 관찰을 직접 활용합니다. 이를 통해 인간처럼 게임 상황을 이해하고, 전략 및 전술을 수립할 수 있습니다.

AVA의 핵심 구성 요소:

AVA는 다음 세 가지 핵심 구성 요소로 이루어져 있습니다.

  1. 시각-언어 모델 (Vision-Language Model): 특수한 자기 주의 메커니즘을 통해 전략적 유닛 타겟팅 및 전장 평가를 수행합니다. 마치 인간 플레이어가 전장을 직접 보고 판단하는 것과 같습니다.
  2. 검색 기반 생성 시스템 (Retrieval-Augmented Generation System): StarCraft II 관련 지식을 활용하여 전술적 결정을 내립니다. 데이터베이스에서 필요한 정보를 찾고, 이를 바탕으로 전략을 세우는 방식입니다.
  3. 역할 기반 작업 분배 시스템 (Dynamic Role-Based Task Distribution System): 여러 에이전트 간의 협력을 가능하게 합니다. 각 에이전트가 특정 역할을 맡아 효율적으로 작업을 수행하도록 합니다.

기존 방식과의 차별점:

기존의 다중 에이전트 강화 학습(MARL) 방법들은 방대한 훈련 데이터와 반복적인 학습 과정이 필요합니다. 반면 AVA는 Qwen-VL과 GPT-4o와 같은 기초 모델을 활용하여 별도의 훈련 없이도 복잡한 전술적 행동을 수행할 수 있다는 점에서 혁신적입니다. 이는 개발 시간과 비용을 크게 절감하고, 더욱 인간 친화적인 AI 에이전트 개발을 가능하게 합니다.

AVACraft 환경과 성능:

연구팀은 21개의 다중 모달 StarCraft II 시나리오를 포함하는 AVACraft 환경에서 AVA의 성능을 평가했습니다. 그 결과, AVA는 기존 MARL 방법들과 비교하여 동등한 성능을 달성했습니다. 이는 AVA가 단순히 게임을 플레이하는 것을 넘어, 전략적이고 복잡한 의사결정을 내릴 수 있음을 보여줍니다.

미래를 위한 발걸음:

AVA는 인간과 유사한 방식으로 StarCraft II를 플레이하는 AI 에이전트 개발에 중요한 이정표를 제시합니다. 이 연구는 멀티모달 게임 AI 분야의 발전에 크게 기여할 뿐만 아니라, 인간과 공존하는 AI 개발에 대한 새로운 가능성을 제시합니다. GitHub에서 AVA의 구현 내용을 확인할 수 있습니다 (https://github.com/camel-ai/VLM-Play-StarCraft2).


*이 기사는 AI가 생성한 내용으로, 일부 정보가 실제와 다를 수 있습니다. 정확한 확인을 위해 추가적인 검증을 권장드립니다.

Reference

[arxiv] AVA: Attentive VLM Agent for Mastering StarCraft II

Published:  (Updated: )

Author: Weiyu Ma, Yuqian Fu, Zecheng Zhang, Bernard Ghanem, Guohao Li

http://arxiv.org/abs/2503.05383v3