흐름도로 코드 생성? AI의 새로운 도전: Flow2Code 벤치마크 등장!
본 기사는 흐름도 기반 코드 생성 능력 평가를 위한 새로운 벤치마크 Flow2Code에 대해 소개합니다. 15개의 프로그래밍 언어와 다양한 유형의 흐름도를 포함하는 방대한 데이터셋과, 13개의 다중 모달 LLM을 이용한 실험 결과를 바탕으로 현재 LLM의 한계와 지도 학습 기법의 효과를 분석합니다. Flow2Code의 공개를 통해 흐름도 기반 코드 생성 분야의 발전에 기여할 것으로 예상됩니다.

흐름도로 코드 생성? AI의 새로운 도전: Flow2Code 벤치마크 등장!
최근 급부상하고 있는 대규모 언어 모델(LLM)은 코드 생성 분야에서 놀라운 성과를 보여주고 있습니다. 하지만 기존의 벤치마크들은 흐름도를 기반으로 코드를 생성하는 능력을 제대로 평가하지 못했습니다. 이러한 한계를 극복하기 위해 등장한 것이 바로 Flow2Code입니다.
He Mengliang 등 연구진이 개발한 Flow2Code는 흐름도 기반 코드 생성 능력을 평가하기 위한 획기적인 벤치마크입니다. 무려 15개의 프로그래밍 언어를 지원하며, 5,622개의 코드 조각과 이에 대응하는 16,866개의 흐름도를 포함하는 방대한 데이터셋을 자랑합니다. 흥미로운 점은 흐름도의 유형이 코드, UML, 의사코드 세 가지로 다양하다는 것입니다. 이를 통해 LLM의 다양한 흐름도 이해 및 코드 생성 능력을 포괄적으로 평가할 수 있습니다.
연구진은 13개의 다중 모달 LLM을 이용하여 Flow2Code를 실험했습니다. 결과는 어땠을까요? 현재의 LLM들은 흐름도를 완벽하게 이해하고 코드로 변환하는 데에는 아직 어려움을 겪고 있다는 사실이 밝혀졌습니다. 하지만 놀랍게도 지도 학습 기법(Supervised fine-tuning) 을 사용하면 모델의 성능이 크게 향상되는 것을 확인했습니다. 이는 향후 연구 방향을 제시하는 중요한 발견입니다.
더욱 고무적인 사실은 Flow2Code의 코드와 데이터셋이 GitHub (https://github.com/hml-github/Flow2Code) 를 통해 공개되었다는 것입니다. 이를 통해 전 세계 연구자들이 흐름도 기반 코드 생성 기술 연구에 더욱 박차를 가할 수 있을 것으로 기대됩니다. Flow2Code는 단순한 벤치마크를 넘어, AI 코드 생성 기술의 새로운 지평을 열어줄 촉매제가 될 것으로 예상됩니다. 앞으로 어떤 놀라운 발전이 이루어질지 기대하며 지켜보겠습니다.
Reference
[arxiv] Flow2Code: Evaluating Large Language Models for Flowchart-based Code Generation Capability
Published: (Updated: )
Author: Mengliang He, Jiayi Zeng, Yankai Jiang, Wei Zhang, Zeming Liu, Xiaoming Shi, Aimin Zhou
http://arxiv.org/abs/2506.02073v1