AI 그린퍼런싱: 헤론을 활용한 친환경 모듈형 데이터센터로의 AI 추론 라우팅
본 논문은 AI 컴퓨팅의 급증하는 전력 수요에 대응하여 풍력 에너지를 활용하는 친환경적인 데이터센터 운영 방안을 제시합니다. Heron이라는 지능형 라우팅 시스템을 통해 AI 워크로드를 최적화하고 에너지 효율을 극대화함으로써, 기존 기술 대비 최대 80%의 성능 향상을 달성했습니다.

급증하는 AI 전력 수요와 풍부한 풍력 에너지: AI 컴퓨팅의 고전력 밀도와 추론 작업 증가로 인해 AI 전력 수요가 전례 없이 증가하고 있습니다. 반면, 풍력 발전은 그리드 접속 대기열에 막혀 활용되지 못하는 풍부한 에너지를 보유하고 있습니다.
획기적인 해결책: AI 워크로드를 풍력 발전소로! 이 논문에서는 AI 워크로드를 풍력 발전소에 위치한 모듈형 컴퓨팅 클러스터로 가져오는 혁신적인 아이디어를 제시합니다. 이를 통해 저렴하고 친환경적인 에너지를 직접 활용하는 경제적으로 실행 가능한 방안을 제시합니다. 무려 600만 개 이상의 고성능 GPU를 배치할 수 있는 가능성을 열어줍니다!
Heron: 지능형 워크로드 라우터: 연구팀은 Heron이라는 시스템을 개발했습니다. Heron은 풍력 발전량 변동을 고려하여 AI 추론 워크로드를 효율적으로 라우팅하는 소프트웨어 라우터입니다. 풍력 발전소 간의 전력 생성의 상호 보완성을 활용하여 AI 컴퓨팅의 총 처리량을 극대화합니다.
실증 결과: 놀라운 성능 향상! Azure의 코딩 및 대화 생성 추적 데이터와 실제 풍력 발전량 데이터를 1주일간 분석한 결과, Heron은 기존 최고 기술 대비 AI 컴퓨팅의 총 처리량을 최대 80%까지 향상시키는 것으로 나타났습니다. 이는 Heron의 효율성과 실용성을 명확하게 입증하는 결과입니다.
미래 전망: 이 연구는 AI 컴퓨팅의 지속가능성을 위한 중요한 전기를 마련했습니다. Heron과 같은 지능형 시스템의 발전은 탄소 배출 감소와 AI 기술 발전을 동시에 달성하는 데 크게 기여할 것으로 예상됩니다. 앞으로 더 많은 연구를 통해 Heron의 기능과 적용 범위가 확장되고, 더욱 친환경적이고 효율적인 AI 인프라 구축에 활용될 것으로 기대됩니다.
연구진: Tella Rajashekhar Reddy, Palak, Rohan Gandhi, Anjaly Parayil, Chaojie Zhang, Mike Shepperd, Liangcheng Yu, Jayashree Mohan, Srinivasan Iyengar, Shivkumar Kalyanaraman, Debopam Bhattacherjee
Reference
[arxiv] AI Greenferencing: Routing AI Inferencing to Green Modular Data Centers with Heron
Published: (Updated: )
Author: Tella Rajashekhar Reddy, Palak, Rohan Gandhi, Anjaly Parayil, Chaojie Zhang, Mike Shepperd, Liangcheng Yu, Jayashree Mohan, Srinivasan Iyengar, Shivkumar Kalyanaraman, Debopam Bhattacherjee
http://arxiv.org/abs/2505.09989v1