지리적으로 분산된 데이터센터의 전력 비용 최소화: 혁신적인 ECMWS 알고리즘
Shuang Wang 등 연구진이 개발한 ECMWS 알고리즘은 지리적으로 분산된 데이터센터(GDCs)의 전력 비용을 15% 이상 절감하는 획기적인 성과를 달성했습니다. 그래프 임베딩 모델과 정책 네트워크를 활용한 4단계 프로세스를 통해 워크플로우 스케줄링의 효율성을 극대화했습니다.

끊임없이 증가하는 데이터센터 전력 비용의 딜레마
전 세계적으로 지리적으로 분산된 데이터센터(GDCs)는 방대한 워크플로우 애플리케이션을 위한 컴퓨팅 및 스토리지 서비스를 제공합니다. 하지만 이는 곧 막대한 전력 비용으로 이어지며, 지역 및 시간에 따라 요금이 변동하는 문제점을 안고 있습니다. 워크플로우 애플리케이션의 마감일 제약을 충족하면서 전력 비용을 줄이는 것은 GDCs 운영의 핵심 과제입니다.
서버의 실행 시간, 전력 소모량, 그리고 전력 가격은 모두 복잡하게 얽혀있습니다. 특히 GDCs의 이기종 컴퓨팅 자원 환경에서 서버 주파수가 다른 워크플로우의 완료 시간을 예측하는 것은 매우 어려운 일입니다. 더욱이 전력 가격은 지역마다 다르고, 시간에 따라 동적으로 변하기 때문에 문제의 복잡성은 더욱 가중됩니다.
혁신적인 해결책: ECMWS 알고리즘의 등장
Shuang Wang 등 연구진은 이러한 문제를 해결하기 위해 전력 비용 인식 다중 워크플로우 스케줄링 알고리즘(ECMWS) 을 개발했습니다. 고정 주파수 및 전력을 가진 GDCs 서버를 위한 지리적으로 분산된 시스템 아키텍처를 개발하고, ECMWS를 제안한 것입니다. ECMWS는 크게 네 단계로 구성됩니다.
- 워크플로우 순서 지정: 효율적인 처리 순서를 결정합니다.
- 마감일 분할: 워크플로우의 마감일을 효과적으로 분할합니다.
- 작업 순서 지정: 각 워크플로우 내 작업들의 최적 실행 순서를 결정합니다.
- 자원 할당: 각 작업에 적합한 서버 자원을 할당합니다.
ECMWS는 두 가지 그래프 임베딩 모델과 정책 네트워크를 구성하여 마르코프 의사결정 과정(MDP)을 해결합니다. 다양한 워크플로우 인스턴스에 대한 매개변수와 알고리즘 구성 요소를 통계적으로 보정하여 최적의 성능을 달성합니다.
놀라운 성과: 15% 이상의 전력 비용 절감
다양한 워크플로우 인스턴스를 사용한 실험 결과, ECMWS는 기존 최첨단 알고리즘에 비해 15% 이상의 전력 비용 절감 효과를 보였습니다. 동시에 계산 시간 또한 허용 가능한 수준을 유지했습니다. 소스 코드는 https://gitee.com/public-artifacts/ecmws-experiments 에서 확인할 수 있습니다. 이 연구는 GDCs의 효율적인 운영 및 경제적인 운영에 크게 기여할 것으로 기대됩니다. 지속 가능한 데이터센터 운영을 위한 중요한 이정표가 될 것입니다.
Reference
[arxiv] Electricity Cost Minimization for Multi-Workflow Allocation in Geo-Distributed Data Centers
Published: (Updated: )
Author: Shuang Wang, He Zhang, Tianxing Wu, Yueyou Zhang, Wei Emma Zhang, Quan Z. Sheng
http://arxiv.org/abs/2504.20105v1