혁신적인 AI 구조적 디코딩: ZapFormat으로 속도와 정확성을 동시에 잡다!


Sun Xintong 등 연구진이 개발한 ZapFormat 알고리즘은 Earley 알고리즘 기반의 동적 가지치기 전략을 통해 LLM의 구조적 제약 준수 문제를 효과적으로 해결합니다. Formatron이라는 오픈소스 엔진을 통해 최대 2배의 속도 향상과 높은 정확도를 동시에 달성하며, 다양한 LLM 아키텍처에서 활용 가능합니다.

related iamge

AI의 구조적 제약: 딜레마를 넘어서

최근 급부상한 대규모 언어 모델(LLM)은 놀라운 성능을 보여주지만, 출력 결과가 엄격한 구조적 또는 문법적 제약을 준수하도록 하는 것은 여전히 어려운 과제입니다. 특히 함수 호출이나 특정 도메인 언어(DSL) 생성과 같은 분야에서는 이러한 제약 준수가 매우 중요합니다.

기존의 제약된 디코딩 방법들은 모든 토큰의 유효성을 검사해야 하기 때문에 상당한 연산 비용이 발생했습니다. 하지만, 선(Sun Xintong) 등 연구진이 개발한 ZapFormat은 이러한 문제를 해결할 혁신적인 해결책을 제시합니다.

ZapFormat: Earley 알고리즘 기반의 동적 가지치기

ZapFormat은 Earley 알고리즘을 기반으로 하는 새로운 동적 가지치기 전략을 사용합니다. 실시간으로 유효하지 않거나 중복된 Earley 상태를 식별하고 제거하여, Earley 알고리즘의 메모리 점유 공간을 크게 줄입니다. 뿐만 아니라, 상태 캐시를 사용하여 많은 쿼리에 대한 구조적 생성 속도를 높입니다.

연구진은 ZapFormat을 Formatron이라는 새로운 제약된 디코딩 엔진에 구현했습니다. Formatron은 기존의 최적화 기법들도 통합하고 있습니다. JSON 생성, JSON 스키마 검증, 의미 분석 등 다양한 구조적 생성 작업에 대한 실험 결과, Formatron은 기존 최고 성능의 구현 방식에 비해 최대 2배의 속도 향상을 달성하면서, 동시에 높은 정확도를 유지하는 것을 보여주었습니다. 무엇보다도, Formatron은 다양한 LLM 아키텍처에 적용 가능하다는 장점이 있습니다.

Formatron: 오픈소스로 공개되는 혁신

더욱 획기적인 것은, 연구진이 Formatron을 오픈소스(https://github.com/Dan-wanna-M/formatron)로 공개했다는 점입니다. 이를 통해 더 많은 연구자와 개발자들이 이 기술을 활용하고, AI 기반 응용 프로그램의 효율성과 정확성을 높이는 데 기여할 수 있게 되었습니다.

결론: AI의 미래를 향한 한 걸음

ZapFormat과 Formatron은 LLM의 구조적 제약 문제에 대한 실질적인 해결책을 제시하며, AI 기술의 발전에 크게 기여할 것으로 기대됩니다. 이 연구는 AI 분야의 효율성과 정확성을 동시에 높이는 혁신적인 사례로써, 앞으로의 연구 방향에 중요한 영향을 미칠 것입니다. 본 연구의 오픈소스 공개는 AI 기술의 민주화에도 크게 기여할 것으로 예상됩니다.


*이 기사는 AI가 생성한 내용으로, 일부 정보가 실제와 다를 수 있습니다. 정확한 확인을 위해 추가적인 검증을 권장드립니다.

Reference

[arxiv] Earley-Driven Dynamic Pruning for Efficient Structured Decoding

Published:  (Updated: )

Author: Xintong Sun, Chi Wei, Minghao Tian, Shiwen Ni

http://arxiv.org/abs/2506.01151v1