획기적인 AI 기반 쿼리 추출 시스템, Xpose 등장!
아하나 프라단과 자얀트 하리사가 개발한 Xpose는 기존의 숨겨진 쿼리 추출(HQE) 기술의 한계를 극복하고, 대규모 언어 모델(LLM)을 활용한 양방향 엔지니어링으로 복잡한 SQL 쿼리까지 정확하게 추출하는 획기적인 시스템입니다. TPCH 및 STACK 벤치마크에서 우수한 성능을 검증받았으며, 데이터베이스 관련 산업에 큰 영향을 미칠 것으로 예상됩니다.

AI가 복잡한 SQL 쿼리를 척척 해결한다면?
최근 아하나 프라단과 자얀트 하리사가 발표한 논문 "Xpose: Bi-directional Engineering for Hidden Query Extraction"은 데이터베이스와 결과 인스턴스를 연결하는 SQL 쿼리를 생성하는 쿼리 역공학(QRE) 분야에 혁신을 불러일으켰습니다. 특히, 기존의 QRE 기술이 단순한 쿼리만 처리할 수 있었던 것과 달리, Xpose는 복잡한 쿼리까지 정확하게 추출하는 능력을 선보였습니다.
기존 기술의 한계를 뛰어넘다
기존의 숨겨진 쿼리 추출(HQE) 도구들은 데이터베이스 변이 및 생성 기술에 기반하여 평이한 쿼리만 추출할 수 있었습니다. 즉, 키 기반 등가 조인 및 접속 산술 필터 조건자만 처리 가능하여, 쿼리 구조와 연산자 측면에서 제한적이었습니다.
하지만 Xpose는 이러한 한계를 극복했습니다. 연합 커넥터, 대수적 필터 조건자, 값과 조건자 모두에 대한 분리를 포함하여 역공학 범위를 크게 확장했습니다. 이는 TPCH 벤치마크와 같은 현실적인 복잡한 쿼리 처리에 중요한 발전입니다.
LLM의 활용: 순방향 엔지니어링의 힘
Xpose의 가장 혁신적인 부분은 바로 대규모 언어 모델(LLM) 의 활용입니다. Xpose는 LLM을 이용하여 불투명 애플리케이션의 비즈니스 설명을 추출 가이드로 변환하는 "순방향 엔지니어링(FE)" 모듈을 도입했습니다. FE 모듈은 하위 쿼리의 중첩, 외부 조인, 스칼라 함수와 같은 일반적인 구조를 인식합니다. 이는 마치 숙련된 개발자가 쿼리의 윤곽을 잡아주는 것과 같습니다. FE가 쿼리의 큰 그림을 제시하면, 역방향 엔지니어링(RE)이 세부적인 내용을 채워넣는 방식입니다.
놀라운 성능: 실제 벤치마크에서 검증
Xpose는 E-TPCH(TPCH 벤치마크에 연합, 다양한 조인 유형, 하위 쿼리가 포함된 쿼리 추가)와 실제 환경의 STACK 벤치마크에서 평가되었습니다. 실험 결과, Xpose의 양방향 엔지니어링 접근 방식은 이러한 복잡한 쿼리를 정확하게 추출하여 HQE 적용 범위를 크게 확장하는 획기적인 결과를 보였습니다.
미래를 향한 도약
Xpose는 단순한 기술적 발전을 넘어, 데이터베이스 보안, 벤더 마이그레이션 등 다양한 산업 분야에 혁신을 가져올 잠재력을 가지고 있습니다. AI 기반 쿼리 추출 기술의 발전은 데이터 분석과 관리의 효율성을 높일 뿐만 아니라, 더욱 안전하고 효과적인 데이터 활용을 가능하게 할 것입니다. Xpose의 등장은 이러한 미래를 향한 중요한 한 걸음입니다.
Reference
[arxiv] Xpose: Bi-directional Engineering for Hidden Query Extraction
Published: (Updated: )
Author: Ahana Pradhan, Jayant Haritsa
http://arxiv.org/abs/2504.10898v1