텐센트, 초고속 3D 모델 생성 기술 FlashVDM 공개: 속도와 품질 모두 잡았다!
텐센트 연구팀이 개발한 FlashVDM은 3D 형태 생성 속도를 획기적으로 향상시킨 기술로, 기존 VDM의 한계를 극복하고 품질 저하 없이 추론 시간을 대폭 단축했습니다. Progressive Flow Distillation과 혁신적인 VAE 디코더를 통해 Hunyuan3D-2 Turbo를 구현, 재구성 시간 45배 이상, 생성 시간 32배 이상 단축을 달성했습니다. 깃허브 공개를 통해 누구나 활용 가능합니다.

3D 모델 생성 기술의 발전이 눈부시지만, 여전히 속도가 걸림돌이었습니다. 하지만 텐센트 연구팀이 이러한 한계를 극복하는 획기적인 기술, FlashVDM을 공개하며 업계에 큰 파장을 일으키고 있습니다. Zeqiang Lai를 비롯한 13명의 연구진은 "Vecset Diffusion Model(VDM)을 활용한 초고속 3D 형태 생성" 논문을 통해 FlashVDM의 놀라운 성능을 공개했습니다.
기존 VDM의 한계 극복: 속도와 품질의 조화
기존의 Vecset Diffusion Model (VDM)은 고해상도 3D 형태 생성에 있어 뛰어난 성능을 보였지만, 속도 문제가 발목을 잡았습니다. 특히, 확산 샘플링과 VAE 디코딩 과정의 속도 향상이 시급한 과제였습니다. FlashVDM은 바로 이러한 문제점을 해결하기 위해 등장했습니다.
FlashVDM의 핵심 기술: Progressive Flow Distillation과 혁신적인 VAE 디코더
FlashVDM은 DiT(Diffusion with Implicit Transformer)의 확산 샘플링을 5단계로 줄이면서도 기존과 동등한 품질을 유지하는 Progressive Flow Distillation 기술을 도입했습니다. 이는 일관성 증류를 안정화시킴으로써 가능해졌습니다. 뿐만 아니라, Adaptive KV Selection, Hierarchical Volume Decoding, 그리고 Efficient Network Design을 갖춘 새로운 VAE 디코더를 통해 연산량(FLOPs)을 획기적으로 줄였습니다. vecset의 지역성과 형태 표면의 희소성을 활용하여 디코딩 오버헤드를 최소화한 것이 특징입니다.
Hunyuan3D-2 Turbo: FlashVDM의 위력
FlashVDM을 Hunyuan3D-2에 적용하여 탄생한 Hunyuan3D-2 Turbo는 재구성 시간을 45배 이상, 생성 시간을 32배 이상 단축시키는 놀라운 성과를 보였습니다. 이는 기존 최첨단 기술과 비교해도 손색없는 품질을 유지하면서 달성한 결과로, FlashVDM의 효율성을 단적으로 보여줍니다.
깃허브 공개: 누구나 활용 가능
FlashVDM의 코드와 모델은 깃허브 (https://github.com/Tencent/FlashVDM)를 통해 공개되어, 누구나 자유롭게 활용할 수 있습니다. 이를 통해 3D 모델 생성 분야의 혁신적인 발전이 더욱 가속화될 것으로 기대됩니다. 텐센트의 이러한 공개는 기술 발전에 대한 적극적인 기여이자, 향후 AI 및 3D 모델링 분야의 지형 변화를 예고하는 중요한 사건입니다.
Reference
[arxiv] Unleashing Vecset Diffusion Model for Fast Shape Generation
Published: (Updated: )
Author: Zeqiang Lai, Yunfei Zhao, Zibo Zhao, Haolin Liu, Fuyun Wang, Huiwen Shi, Xianghui Yang, Qinxiang Lin, Jinwei Huang, Yuhong Liu, Jie Jiang, Chunchao Guo, Xiangyu Yue
http://arxiv.org/abs/2503.16302v1