GenEdit: 기업용 Text-to-SQL의 혁신적인 해결책
GenEdit은 사용자 피드백을 통해 지속적으로 개선되는 기업용 Text-to-SQL 시스템입니다. 연산자 복합과 지식 집합 편집을 통해 복잡한 SQL 생성을 효율적으로 처리하며, 기업 환경에 최적화된 솔루션을 제공합니다.

최근 대규모 언어 모델(LLM)의 발전으로 Text-to-SQL 기술이 데이터 접근을 민주화하고 있습니다. 하지만 기업 환경에서는 특정 비즈니스 지식 반영, 복잡한 쿼리 처리, 지속적인 개선 요구 등의 어려움으로 인해 실제 배포가 쉽지 않습니다.
이러한 문제를 해결하기 위해 Karime Maamari, Connor Landy, Amine Mhedhbi 연구팀이 GenEdit을 개발했습니다. GenEdit은 사용자 피드백을 통해 지속적으로 개선되는 Text-to-SQL 생성 시스템입니다. 기업 특유의 지식 집합을 구축 및 유지하고, SQL 생성을 분해하는 연산자 파이프라인을 사용하며, 피드백을 통해 미래의 SQL 생성을 개선합니다.
GenEdit의 핵심은 두 가지 모듈에 있습니다.
(i) 분해된 SQL 생성: GenEdit은 연산자 복합(Compounding Operators) 를 활용하여 지식 검색을 개선하고, 생성을 안내하는 사고 과정 단계(chain-of-thought steps)로 계획을 만듭니다. 먼저 원래 SQL 쿼리를 하위 문장, 절 또는 하위 쿼리로 분해하여 관련 예시를 검색합니다. 그리고 지침과 스키마 요소도 검색합니다. 검색된 상황 정보를 사용하여 자연어로 쿼리를 생성하는 방법에 대한 단계별 계획을 생성합니다. 마지막으로, 이 계획을 사용하여 SQL을 생성하여 모델 추론의 필요성을 최소화하고 복잡한 SQL 생성을 향상시킵니다. 필요한 경우 구문 및 의미 오류를 기반으로 쿼리를 다시 생성합니다.
(ii) 사용자 피드백 기반 지식 집합 편집: GenEdit은 대화형 코파일럿을 통해 지식 집합 편집을 제안하여 사용자가 피드백을 반복하고 필요에 따라 SQL 쿼리를 다시 생성할 수 있도록 합니다. 각 생성은 생성 프롬프트를 업데이트하는 단계별 편집을 사용합니다. 피드백이 제출되면 회귀 테스트를 통과하고 승인을 받은 후 병합되어 향후 생성을 개선합니다.
GenEdit은 기업 환경에서 Text-to-SQL의 실질적인 문제를 해결하고, 사용자 피드백을 통해 지속적으로 발전하는 능력을 보여줍니다. 이는 Text-to-SQL 기술의 기업 도입을 가속화하는 데 중요한 발걸음이 될 것입니다. 앞으로 GenEdit의 발전과 실제 기업 적용 사례가 기대됩니다.
Reference
[arxiv] GenEdit: Compounding Operators and Continuous Improvement to Tackle Text-to-SQL in the Enterprise
Published: (Updated: )
Author: Karime Maamari, Connor Landy, Amine Mhedhbi
http://arxiv.org/abs/2503.21602v1