FastCar: 엣지 기기에서 초고속 자동 회귀 비디오 생성의 혁신
중국과학원 연구팀이 개발한 FastCar 프레임워크는 엣지 기기에서의 자동 회귀 비디오 생성 속도를 획기적으로 향상시켰습니다. 시간적 중복성을 활용한 캐시 기반 재생 전략과 FPGA 하드웨어 가속기를 결합하여 기존 방식보다 2.1배 이상 빠른 디코딩 속도와 향상된 에너지 효율을 달성했습니다. 이는 고해상도 장시간 비디오 생성을 위한 중요한 발전입니다.

딥러닝의 새로운 지평을 열다: FastCar
자동 회귀(AR) 모델은 언어 생성 분야에서 큰 성공을 거두었으며, 최근 뛰어난 샘플링 효율성으로 인해 시각적 생성 작업에도 적용되고 있습니다. 하지만 비디오 생성은 이미지 생성보다 훨씬 많은 토큰이 필요하며, 이로 인해 디코딩 단계에서 상당한 오버헤드가 발생합니다.
중국과학원 연구팀의 Shen Xuan 박사를 비롯한 14명의 연구자들은 이러한 문제점을 해결하기 위해 FastCar 프레임워크를 개발했습니다. FastCar는 AR 비디오 생성의 디코딩 단계를 가속화하는 혁신적인 방법으로, 두 가지 주요 관찰 결과에 기반합니다.
- 디코딩 단계에서 MLP 모듈이 추론 지연 시간에 가장 큰 영향을 미침
- 인접 프레임의 MLP 출력에 높은 시간적 중복성이 존재함
FastCar는 이러한 시간적 중복성을 활용하여 계산량을 줄이는 캐시 기반 재생 전략을 채택했습니다. 시간적 주의 점수(TAS) 를 도입하여 재생 전략을 적용할지 여부를 결정하고, 이를 위한 이론적 분석과 정당성을 제시했습니다. 더 나아가, TAS 기반의 동적 자원 스케줄링(DRS)을 사용하는 FPGA 하드웨어 가속기를 개발하여 자원 활용도와 추론 속도를 향상시켰습니다.
실험 결과, FastCar는 기존의 희소 주의 접근 방식보다 2.1배 이상 빠른 디코딩 속도와 높은 에너지 효율을 달성했습니다. 또한, FastCar와 희소 주의를 결합하여 희소 주의의 성능을 향상시키고, 고해상도 장시간 비디오 생성에 유리한 독특한 장점을 보여주었습니다. 이는 엣지 기기에서의 실시간 고품질 비디오 생성을 위한 중요한 발걸음입니다. GitHub에서 공개된 코드를 통해 FastCar를 직접 경험해볼 수 있습니다. (https://github.com/shawnricecake/fast-car)
결론적으로, FastCar는 엣지 기기에서의 고해상도 장시간 비디오 생성의 효율성을 획기적으로 개선한 혁신적인 기술이며, 앞으로 비디오 생성 분야의 발전에 크게 기여할 것으로 기대됩니다. 특히, 자원 제약이 있는 환경에서 고품질 비디오를 실시간으로 처리해야 하는 다양한 응용 분야에 널리 활용될 수 있을 것입니다.
Reference
[arxiv] FastCar: Cache Attentive Replay for Fast Auto-Regressive Video Generation on the Edge
Published: (Updated: )
Author: Xuan Shen, Weize Ma, Yufa Zhou, Enhao Tang, Yanyue Xie, Zhengang Li, Yifan Gong, Quanyi Wang, Henghui Ding, Yiwei Wang, Yanzhi Wang, Pu Zhao, Jun Lin, Jiuxiang Gu
http://arxiv.org/abs/2505.14709v1