CASS: 놀라운 GPU 코드 변환 기술의 등장


Ahmed Heakl 등이 개발한 CASS는 CUDA와 HIP, Nvidia SASS와 AMD RDNA3 간의 코드 변환을 지원하는 대규모 GPU 코드 변환 시스템으로, 7만 개 이상의 검증된 코드 쌍과 높은 변환 정확도를 자랑합니다. 오픈소스로 공개되어 GPU 아키텍처 간 호환성 문제 해결에 크게 기여할 것으로 기대됩니다.

related iamge

GPU 아키텍처의 벽을 허무는 혁신, CASS

최근, AI 분야의 괄목할 만한 성과가 발표되었습니다. Ahmed Heakl 등 6명의 연구원이 주도한 연구에서, CUDA와 AMD의 HIP, 그리고 Nvidia SASS와 AMD RDNA3 간의 코드 변환을 가능하게 하는 획기적인 시스템인 CASS가 공개되었습니다. 이는 GPU 아키텍처 간의 호환성 문제로 인한 개발의 어려움을 획기적으로 해결할 가능성을 제시하는 쾌거입니다.

7만 개 이상의 검증된 코드 쌍: CASS의 압도적인 규모

CASS는 단순한 아이디어가 아닙니다. 무려 7만 개가 넘는 검증된 코드 쌍을 포함하는 대규모 데이터셋과 모델 스위트를 제공합니다. 이는 소스 레벨(CUDA ↔ HIP)과 어셈블리 레벨(Nvidia SASS ↔ AMD RDNA3) 모두를 지원하며, 호스트와 디바이스 코드를 모두 포함합니다. 이러한 방대한 데이터는 CASS의 정확성과 신뢰성을 뒷받침하는 핵심 요소입니다.

95% 소스 변환 정확도: 놀라운 성능

CASS는 단순히 코드를 변환하는 것을 넘어, 놀라운 성능을 보여줍니다. **소스 코드 변환 정확도는 무려 95%에 달하며, 어셈블리 코드 변환 정확도 역시 37.5%**를 기록했습니다. 이는 GPT-4o, Claude, Hipify 등 기존의 최첨단 상용 솔루션을 크게 능가하는 결과입니다. 더욱 놀라운 것은, 생성된 코드가 테스트 케이스의 85% 이상에서 기존 코드와 동일한 성능을 보인다는 점입니다. 실행 시간과 메모리 사용량까지도 효율적으로 유지하는 CASS의 성능은 실제 응용에 대한 기대감을 높입니다.

CASS-Bench: 엄격한 평가를 위한 벤치마크

CASS의 성능 평가를 위해, 연구팀은 16개 GPU 도메인을 아우르는 CASS-Bench 벤치마크를 개발했습니다. 정확한 성능 비교를 위해 정확한 실행 결과를 제공하는 이 벤치마크는 CASS의 성능을 객관적으로 평가하는 데 중요한 역할을 합니다.

오픈소스 공개: 더 나은 미래를 위한 협력

연구팀의 노력은 여기서 그치지 않습니다. CASS의 모든 데이터, 모델, 평가 도구는 Hugging Face와 GitHub를 통해 오픈소스로 공개되었습니다. 이는 GPU 컴파일러 도구, 바이너리 호환성, LLM 기반 하드웨어 변환 분야의 발전을 가속화하는 데 중요한 기여를 할 것으로 예상됩니다. 전 세계 개발자들이 CASS를 활용하여 더욱 혁신적인 기술을 개발하고, GPU 아키텍처 간의 호환성 문제를 해결해 나가는 모습을 기대해 볼 수 있습니다. 이 연구는 단순한 기술적 발전을 넘어, 더욱 개방적이고 협력적인 연구 환경을 조성하는 데 기여할 것입니다.


*이 기사는 AI가 생성한 내용으로, 일부 정보가 실제와 다를 수 있습니다. 정확한 확인을 위해 추가적인 검증을 권장드립니다.

Reference

[arxiv] CASS: Nvidia to AMD Transpilation with Data, Models, and Benchmark

Published:  (Updated: )

Author: Ahmed Heakl, Sarim Hashmi, Gustavo Bertolo Stahl, Seung Hun Eddie Han, Salman Khan, Abdulrahman Mahmoud

http://arxiv.org/abs/2505.16968v1