CoSIL: LLM 기반 소프트웨어 문제 해결의 혁신


LLM 기반 소프트웨어 문제 해결 기술 CoSIL이 기존 방식의 한계를 뛰어넘는 놀라운 성능 향상을 기록하며 소프트웨어 개발의 혁신을 주도하고 있습니다. 훈련이나 색인 없이 동적으로 그래프를 생성하고 컨텍스트를 효율적으로 관리하는 CoSIL의 혁신적인 접근 방식은 앞으로 소프트웨어 엔지니어링 분야에 큰 영향을 미칠 것으로 예상됩니다.

related iamge

최근 급속도로 발전하는 대규모 언어 모델(LLM)은 자율적인 소프트웨어 엔지니어링 분야에 혁신을 가져왔습니다. 특히, 개발자를 돕는 소프트웨어 엔지니어링 에이전트의 등장은 이러한 변화를 더욱 가속화하고 있습니다. 자동 프로그램 수정을 위한 이러한 에이전트의 핵심은 바로 '문제 위치 파악(Issue Localization)'입니다. 정확한 패치 생성을 위해서는 문제의 근원을 정확히 찾는 것이 필수적이죠.

하지만 기존의 문제 위치 파악 방법들은 LLM의 컨텍스트 창 길이 제한이라는 큰 벽에 부딪혔습니다. 간결하면서도 효과적인 컨텍스트와 충분히 포괄적인 검색 공간을 동시에 확보하는 것이 어려웠던 것이죠. 이러한 한계를 극복하기 위해 등장한 것이 바로 CoSIL(Software Issue Localization via LLM-Driven Code Repository Graph Searching) 입니다.

Jiang Zhonghao 등 6명의 연구자들이 개발한 CoSIL은 훈련이나 색인 없이도 강력한 기능을 제공하는 LLM 기반의 간단하면서도 효과적인 함수 수준 문제 위치 파악 방법입니다. CoSIL은 모듈 호출 그래프를 통해 검색 공간을 줄이고, 반복적인 함수 호출 그래프 검색을 통해 관련 컨텍스트를 얻습니다. 또한, 컨텍스트 가지치기를 통해 검색 방향을 제어하고 컨텍스트를 효율적으로 관리합니다. 특히, 호출 그래프는 검색 중에 LLM에 의해 동적으로 생성되기 때문에 사전 파싱이 필요 없습니다.

실험 결과는 놀랍습니다. Qwen2.5 Coder 32B를 사용하여 SWE bench Lite와 SWE bench Verified에서 각각 43%와 44.6%의 Top-1 위치 파악 성공률을 달성했습니다. 이는 기존 방법보다 8.6%에서 최대 98.2%까지 성능이 향상된 것입니다! 더욱 놀라운 것은, CoSIL을 패치 생성 단계에 적용했을 때 해결률이 9.3%에서 31.5%까지 추가로 향상되었다는 점입니다.

CoSIL은 LLM의 잠재력을 극대화하여 소프트웨어 개발의 효율성을 획기적으로 높일 수 있는 혁신적인 기술입니다. 소프트웨어 엔지니어링의 미래를 엿볼 수 있는 중요한 연구 성과라고 할 수 있습니다.


*이 기사는 AI가 생성한 내용으로, 일부 정보가 실제와 다를 수 있습니다. 정확한 확인을 위해 추가적인 검증을 권장드립니다.

Reference

[arxiv] CoSIL: Software Issue Localization via LLM-Driven Code Repository Graph Searching

Published:  (Updated: )

Author: Zhonghao Jiang, Xiaoxue Ren, Meng Yan, Wei Jiang, Yong Li, Zhongxin Liu

http://arxiv.org/abs/2503.22424v1