AIMO-2 우승 솔루션: 인공지능 수학 올림피아드의 새로운 지평
AIMO-2 우승 솔루션은 대규모 데이터셋, 코드 실행 통합, 생성적 솔루션 선택이라는 세 가지 핵심 전략을 통해 수학적 추론 모델 분야에 획기적인 발전을 가져왔으며, OpenMathReasoning 데이터셋 공개를 통해 더 많은 연구를 촉진할 것으로 기대됩니다.

2025년, AI 수학 올림피아드 - 진보상 2 (AIMO-2) 대회에서 놀라운 결과가 발표되었습니다. Ivan Moshkov를 비롯한 8명의 연구진이 제출한 논문 “AIMO-2 Winning Solution: Building State-of-the-Art Mathematical Reasoning Models with OpenMathReasoning dataset”은 최첨단 수학적 추론 모델 구축에 대한 혁신적인 접근 방식을 제시하며 우승을 차지했습니다.
이 연구의 핵심은 세 가지 축으로 요약됩니다. 첫째, 대규모 고품질 수학 문제 데이터셋의 구축입니다. 무려 540,000개의 독창적인 문제와 320만 개의 장문 풀이를 포함하는 OpenMathReasoning 데이터셋은 올림피아드 수준의 문제까지 포함하여 그 규모와 질적인 면에서 기존 연구를 압도합니다. 이는 수학적 추론 모델의 성능 향상에 결정적인 역할을 했습니다.
둘째, 코드 실행과 장문 추론 모델의 통합입니다. 연구진은 반복적인 학습, 생성, 품질 필터링을 통해 코드 실행을 모델에 통합하는 획기적인 방법을 개발했습니다. 이를 통해 170만 개의 고품질 Tool-Integrated Reasoning 솔루션을 확보하여 모델의 추론 능력을 비약적으로 향상시켰습니다. 이는 단순히 문제를 푸는 것을 넘어, 문제 해결 과정에 대한 깊이 있는 이해를 가능하게 하는 중요한 발전입니다.
셋째, 생성적 솔루션 선택 (GenSelect) 기법입니다. 여러 후보 솔루션 중 가장 유망한 솔루션을 선택하는 이 기법은 단순한 다수결 투표 방식보다 훨씬 효율적임을 증명했습니다. 이를 통해 모델의 정확도와 효율성을 크게 높일 수 있었습니다.
이러한 세 가지 핵심 전략을 바탕으로 연구진은 여러 수학적 추론 벤치마크에서 최고 성능을 달성했습니다. 더욱 중요한 것은, 연구진이 OpenMathReasoning 데이터셋과 코드, 모델을 상업적으로 허용되는 라이선스 하에 공개했다는 점입니다. 이는 수학적 추론 모델 연구 분야의 발전에 크게 기여할 것으로 예상됩니다. AIMO-2 우승은 단순한 경쟁의 승리 이상으로, 인공지능과 수학의 융합을 통해 새로운 가능성을 열어젖힌 쾌거라 할 수 있습니다. 이 연구는 향후 AI 모델 개발에 있어 데이터셋의 중요성, 코드 실행 통합의 필요성, 그리고 효율적인 솔루션 선택 기법의 가치를 명확히 보여주는 중요한 사례로 자리매김할 것입니다.
Reference
[arxiv] AIMO-2 Winning Solution: Building State-of-the-Art Mathematical Reasoning Models with OpenMathReasoning dataset
Published: (Updated: )
Author: Ivan Moshkov, Darragh Hanley, Ivan Sorokin, Shubham Toshniwal, Christof Henkel, Benedikt Schifferer, Wei Du, Igor Gitman
http://arxiv.org/abs/2504.16891v1