NeuroSim V1.5: AI 가속기 설계의 혁신을 이끄는 차세대 시뮬레이터
본 기사는 AI 가속기 설계의 핵심 기술인 NeuroSim V1.5의 주요 특징과 성능 향상에 대해 소개합니다. NeuroSim V1.5는 TensorRT 통합, 유연한 노이즈 주입, 다양한 메모리 지원, 향상된 시뮬레이션 속도 등의 개선을 통해 ACIM 가속기 설계 및 검증을 위한 강력한 도구로 자리매김할 것으로 예상됩니다.

AI 가속기의 혁명: NeuroSim V1.5 등장
인공지능(AI)의 눈부신 발전은 기존의 폰 노이만 아키텍처의 한계를 여실히 드러냈습니다. 컴퓨팅 유닛과 메모리 간 빈번한 데이터 전송은 심각한 에너지 소모와 지연 현상을 초래하며, AI의 확장성을 저해하는 주요 요인으로 작용합니다. 이러한 문제를 해결하기 위해 등장한 것이 바로 Analog Computing-in-Memory (ACIM) 입니다. ACIM은 메모리 어레이 내에서 직접 곱셈-누적(MAC) 연산을 수행하여 데이터 이동을 최소화하고, 에너지 효율과 속도를 획기적으로 향상시킵니다.
하지만, 강력한 ACIM 가속기를 설계하려면 소자 및 회로 수준의 비이상적인 요소들을 정확하게 모델링하는 것이 필수적입니다. 이러한 어려움을 극복하기 위해 James Read 등 연구진이 개발한 NeuroSim V1.5는 획기적인 발전을 이루었습니다.
NeuroSim V1.5의 핵심 개선 사항은 다음과 같습니다.
- TensorRT와의 완벽한 통합: Transformer를 포함한 더욱 다양한 신경망 지원을 가능하게 합니다. 이는 기존 NeuroSim의 한계를 넘어 AI 모델의 적용 범위를 넓혔다는 점에서 큰 의미가 있습니다.
- 유연한 노이즈 주입 방법론: SPICE 시뮬레이션 또는 실리콘 측정 데이터를 손쉽게 통합할 수 있습니다. 이는 실제 하드웨어의 특성을 정확하게 반영하여 보다 현실적인 시뮬레이션을 가능하게 합니다.
- 다양한 메모리 지원: 최신 비휘발성 커패시티브 메모리를 포함한 다양한 메모리 지원을 통해 설계자의 선택의 폭을 넓혔습니다.
- 6.5배 향상된 실행 속도: 최적화된 동작 시뮬레이션을 통해 개발 시간을 단축시키고 효율성을 높였습니다.
NeuroSim V1.5는 정확도와 하드웨어 효율성을 동시에 고려한 체계적인 설계 공간 탐색을 가능하게 합니다. 여러 사례 연구를 통해 주요 설계 매개변수를 최적화하면서도 네트워크 정확도를 유지하는 방법을 보여줍니다. 고정밀 노이즈 모델링과 효율적인 시뮬레이션을 결합한 NeuroSim V1.5는 차세대 ACIM 가속기의 설계 및 검증에 있어 획기적인 도약을 가져올 것입니다.
NeuroSim의 모든 버전은 https://github.com/neurosim/NeuroSim 에서 오픈소스로 이용 가능합니다. 이를 통해 더 많은 연구자들이 NeuroSim을 활용하여 AI 가속기 분야의 발전에 기여할 수 있을 것으로 기대됩니다. AI 시대의 혁신을 이끌 NeuroSim V1.5의 활약을 기대해 봅니다!
Reference
[arxiv] NeuroSim V1.5: Improved Software Backbone for Benchmarking Compute-in-Memory Accelerators with Device and Circuit-level Non-idealities
Published: (Updated: )
Author: James Read, Ming-Yen Lee, Wei-Hsing Huang, Yuan-Chun Luo, Anni Lu, Shimeng Yu
http://arxiv.org/abs/2505.02314v1