BQSched: 강화학습 기반의 비침투적 배치 쿼리 스케줄러 등장!
Chenhao Xu 등 연구진이 개발한 BQSched는 강화학습을 이용하여 배치 쿼리 스케줄링 문제를 해결하는 비침투적 스케줄러입니다. 어텐션 메커니즘과 IQ-PPO 알고리즘을 통해 쿼리 패턴을 효과적으로 학습하고, 적응형 마스킹, 쿼리 클러스터링, 증분 시뮬레이터 등의 최적화 전략을 통해 성능을 향상시킵니다. TPC-DS 벤치마크 실험 결과, 기존 방식 대비 평균 34%의 처리 시간 단축 효과를 보였습니다.

대규모 기업 데이터 파이프라인의 혁신: BQSched
대부분의 대기업은 운영 데이터를 처리하기 위해 미리 정의된 데이터 파이프라인을 구축하고 주기적으로 실행합니다. 이때 다양한 작업을 위한 SQL 쿼리가 사용되죠. 이 파이프라인의 전반적인 처리 시간(makespan)을 최소화하는 핵심 과제는 바로 병렬 쿼리의 효율적인 스케줄링입니다.
기존의 솔루션들은 쿼리 간 복잡한 상호작용을 표현하기 어려워 단순 휴리스틱 규칙에 의존해왔습니다. 하지만 최근 강화학습(Reinforcement Learning, RL) 기반 방법들이 등장하며 이러한 복잡한 패턴을 피드백으로부터 학습할 가능성을 열었습니다. 하지만, 방대한 스케줄링 공간, 높은 샘플링 비용, 낮은 샘플 활용도 등의 어려움이 존재했습니다.
Chenhao Xu 외 연구진의 획기적인 해결책: BQSched
이러한 과제를 해결하기 위해 Chenhao Xu, Chunyu Chen, Jinglin Peng, Jiannan Wang, Jun Gao 연구진은 BQSched라는 혁신적인 솔루션을 제안합니다. BQSched는 비침투적인(non-intrusive) RL 기반 배치 병렬 쿼리 스케줄러입니다.
BQSched는 다음과 같은 핵심적인 특징을 가지고 있습니다:
- 어텐션 기반 상태 표현: 복잡한 쿼리 패턴을 포착하기 위해 어텐션 메커니즘을 활용한 상태 표현을 설계했습니다. 개별 쿼리의 특징을 효과적으로 학습할 수 있습니다.
- IQ-PPO 알고리즘: 개별 쿼리 완료에 대한 풍부한 정보를 활용하여 Proximal Policy Optimization (PPO) 알고리즘을 개선한 IQ-PPO를 제안했습니다. 이를 통해 학습 효율을 극대화합니다.
- 세 가지 최적화 전략: 액션 공간을 효율적으로 줄이는 적응형 마스킹, 대규모 쿼리 집합을 처리하기 위한 스케줄링 이득 기반 쿼리 클러스터링, 샘플링 비용을 줄이는 증분 시뮬레이터를 도입했습니다.
놀라운 성능 향상
TPC-DS 벤치마크를 사용한 실험 결과, BQSched는 기존 휴리스틱 전략 및 기존 RL 기반 스케줄러에 비해 배치 쿼리의 전반적인 처리 시간을 평균 34% 및 13% 감소시켰습니다. 이러한 결과는 BQSched의 뛰어난 효율성, 안정성, 확장성, 적응성을 보여줍니다.
BQSched는 RL을 활용한 비침투적 배치 쿼리 스케줄러로써, 대규모 기업의 데이터 파이프라인 효율 향상에 크게 기여할 것으로 기대됩니다. 이는 데이터 분석 및 처리 분야에 혁신적인 발전을 가져올 뿐만 아니라, 강화학습 기술의 실제 적용 가능성을 다시 한번 확인시켜주는 중요한 결과입니다.
Reference
[arxiv] BQSched: A Non-intrusive Scheduler for Batch Concurrent Queries via Reinforcement Learning
Published: (Updated: )
Author: Chenhao Xu, Chunyu Chen, Jinglin Peng, Jiannan Wang, Jun Gao
http://arxiv.org/abs/2504.19142v1