71.2μW 초저전력 음성 인식 가속기: 에지 AI 시대의 혁신
Yang과 Chang 연구팀이 개발한 71.2μW 초저전력 음성 인식 가속기는 알고리즘 및 하드웨어 최적화를 통해 에지 디바이스의 실시간 음성 인식을 가능하게 합니다. TSMC 28nm 공정 기반으로 100kHz에서 동작하며, 뛰어난 에너지 효율과 면적 효율을 자랑합니다.

Yang과 Chang이 이끄는 연구팀이 71.2μW의 초저전력으로 구동되는 음성 인식 가속기를 개발하는 쾌거를 이루었습니다! 이는 에지 디바이스에서 실시간 음성 인식을 가능하게 하는 혁신적인 기술로, AI의 활용 범위를 획기적으로 확장할 것으로 기대됩니다.
이 가속기의 핵심은 알고리즘과 하드웨어의 공동 최적화에 있습니다. 연구팀은 2개의 순환층, 1개의 완전 연결층을 가진 컴팩트한 재귀형 스파이킹 신경망을 설계하고, 낮은 시간 단계(1 또는 2)를 사용하여 전력 소모를 최소화했습니다. 2.79MB에 달하는 모델은 프루닝(Pruning) 과 4비트 고정 소수점 양자화를 통해 96.42% 축소되어 0.1MB로 줄어들었습니다. 이는 모델의 크기를 획기적으로 줄여 메모리 사용량을 절감하는 동시에, 연산 효율 또한 높였습니다.
하드웨어 측면에서는 mixed-level pruning, zero-skipping, merged spike 기술을 활용하여 복잡도를 90.49% 감소시켰습니다. 특히, 병렬 시간 단계 실행(parallel time-step execution) 기법은 시간 단계 간 데이터 의존성을 해결하고, 가중치 공유를 통한 가중치 버퍼 전력 절약을 가능하게 합니다. 스파스 스파이크 활동을 활용한 입력 방송(input broadcasting) 기법은 제로 연산을 제거하여 추가적인 전력 절약 효과를 가져왔습니다.
TSMC 28nm 공정으로 구현된 이 가속기는 100kHz에서 실시간으로 동작하며, 71.2μW의 초저전력 소모를 달성했습니다. 이는 기존 최첨단 기술을 능가하는 성과입니다. 500MHz에서 28.41 TOPS/W의 에너지 효율과 1903.11 GOPS/mm²의 면적 효율을 기록하여 뛰어난 성능을 입증했습니다.
이 연구는 에지 디바이스에서의 AI 활용에 새로운 가능성을 제시하며, 특히 배터리 구동 장치의 실시간 AI 애플리케이션 개발에 크게 기여할 것으로 예상됩니다. 향후 초저전력 AI 기술 발전에 중요한 이정표가 될 것으로 기대됩니다.
Reference
[arxiv] A 71.2-$μ$W Speech Recognition Accelerator with Recurrent Spiking Neural Network
Published: (Updated: )
Author: Chih-Chyau Yang, Tian-Sheuan Chang
http://arxiv.org/abs/2503.21337v1