MLZero: 엔드-투-엔드 머신러닝 자동화의 혁신


MLZero는 LLM 기반의 멀티 에이전트 시스템으로, 다양한 데이터 유형에 대한 엔드-투-엔드 머신러닝 자동화를 가능하게 합니다. 인지적 지각 모듈과 강화된 코드 생성 프로세스를 통해 기존 AutoML 시스템의 한계를 극복하고, 여러 벤치마크에서 최고의 성능을 달성했습니다.

related iamge

MLZero: 엔드-투-엔드 머신러닝 자동화의 새 지평을 열다

머신러닝(ML) 자동화는 꾸준히 발전해왔지만, 특히 다양한 데이터 유형을 다룰 때는 여전히 많은 수동 구성과 전문가의 개입이 필요했습니다. 하지만 이제 MLZero가 등장했습니다! Haoyang Fang 등 13명의 연구자들이 개발한 MLZero는 대규모 언어 모델(LLM) 기반의 혁신적인 멀티 에이전트 프레임워크로, 최소한의 인간 개입으로 다양한 데이터 유형에 걸쳐 엔드-투-엔드 ML 자동화를 가능하게 합니다.

MLZero의 핵심은 인지적 지각 모듈입니다. 이 모듈은 다양한 형태의 원시 데이터를 효과적으로 처리하여, 후속 작업 흐름을 안내하는 지각적 맥락을 생성합니다. 이는 기존 AutoML 시스템의 주요 약점을 해결하는 중요한 부분입니다. 또한, LLM의 환각 코드 생성이나 오래된 API 지식 등의 한계를 극복하기 위해, 세만틱 및 에피소딕 메모리를 활용한 반복적인 코드 생성 프로세스를 강화했습니다.

그 결과는 놀랍습니다. MLZero는 MLE-Bench Lite에서 경쟁 시스템들을 모두 제치고 성공률과 솔루션 품질 모두에서 최고의 성능을 보이며 6개의 금메달을 획득했습니다. 더 나아가, 다양한 데이터 유형에 걸친 25개 이상의 더욱 어려운 과제를 포함하는 다중 모달 AutoML 에이전트 벤치마크에서도 MLZero는 성공률 0.92(+263.6%)와 평균 순위 2.28을 기록하며 경쟁 방법들을 압도했습니다. 특히, 8B라는 비교적 작은 LLM을 사용하면서도 기존 풀 사이즈 시스템들을 능가하는 성능을 보였다는 점이 주목할 만합니다.

MLZero는 단순한 자동화 시스템을 넘어, 인간의 전문 지식에 대한 의존도를 낮추고, 머신러닝의 접근성을 크게 높이는 혁신적인 기술입니다. 이는 향후 다양한 분야에서 머신러닝의 활용을 가속화할 잠재력을 지니고 있습니다. 앞으로 MLZero가 어떻게 발전하고, 어떤 새로운 가능성을 열어갈지 기대됩니다.


*이 기사는 AI가 생성한 내용으로, 일부 정보가 실제와 다를 수 있습니다. 정확한 확인을 위해 추가적인 검증을 권장드립니다.

Reference

[arxiv] MLZero: A Multi-Agent System for End-to-end Machine Learning Automation

Published:  (Updated: )

Author: Haoyang Fang, Boran Han, Nick Erickson, Xiyuan Zhang, Su Zhou, Anirudh Dagar, Jiani Zhang, Ali Caner Turkmen, Cuixiong Hu, Huzefa Rangwala, Ying Nian Wu, Bernie Wang, George Karypis

http://arxiv.org/abs/2505.13941v1