DreamActor-M1: 홀리스틱하고 표현력 넘치는 강력한 인체 이미지 애니메이션
DreamActor-M1은 하이브리드 가이드 방식과 점진적 학습 전략을 통해 기존 이미지 기반 인체 애니메이션의 한계를 극복한 혁신적인 모델입니다. 얼굴 표정과 몸짓을 정교하게 제어하고, 다양한 크기의 이미지에 적용 가능하며, 장기간의 시간적 일관성을 유지하여 자연스럽고 표현력이 풍부한 애니메이션 생성을 가능하게 합니다.

꿈을 현실로: DreamActor-M1이 제시하는 인체 이미지 애니메이션의 새로운 지평
최근 이미지 기반 인체 애니메이션 기술은 놀라운 발전을 이루었지만, 여전히 세밀한 제어, 다양한 크기의 적응성, 장기간의 시간적 일관성 측면에서 한계를 가지고 있습니다. 이러한 한계는 애니메이션의 표현력과 안정성을 저해하는 주요 원인이 됩니다.
Luo Yuxuan 등 6명의 연구진이 개발한 DreamActor-M1은 이러한 문제점을 해결하기 위해 하이브리드 가이드 방식을 활용한 확산 트랜스포머(DiT) 기반 프레임워크를 제시합니다. 이는 단순히 움직임만 재현하는 것이 아니라, 훨씬 더 자연스럽고 감정이 풍부한 애니메이션을 생성하는 것을 목표로 합니다.
DreamActor-M1의 핵심 강점:
홀리스틱 제어: 암묵적 얼굴 표현, 3D 머리 구체, 3D 신체 골격을 통합한 하이브리드 제어 신호를 사용하여 얼굴 표정과 몸 동작을 정교하게 제어합니다. 이는 단순한 모션 재현을 넘어, 인물의 개성과 감정까지 생생하게 표현하는 것을 가능하게 합니다.
다중 스케일 적응성: 초상화부터 전신까지 다양한 크기와 자세의 이미지를 처리하기 위해, 다양한 해상도와 크기의 데이터를 사용한 점진적 학습 전략을 채택했습니다. 이는 하나의 모델로 다양한 상황에 유연하게 대처할 수 있음을 의미합니다.
장기간 시간적 일관성: 연속된 프레임의 움직임 패턴과 보완적인 시각적 참조를 통합하여, 복잡한 움직임 중에도 보이지 않는 영역에 대한 장기간의 시간적 일관성을 유지합니다. 이는 애니메이션의 자연스러움과 현실감을 크게 향상시키는 요소입니다.
괄목할 만한 성능:
실험 결과, DreamActor-M1은 기존 최첨단 기술을 능가하는 성능을 보였으며, 초상화, 상반신, 전신 생성 모두에서 장기간의 일관성을 유지하며 표현력이 풍부한 결과물을 제공합니다. 프로젝트 페이지에서 더 자세한 정보와 결과물을 확인할 수 있습니다.
DreamActor-M1은 인체 이미지 애니메이션 기술의 새로운 가능성을 열었습니다. 앞으로 이 기술이 게임, 영화, 가상현실 등 다양한 분야에서 활용되어 더욱 몰입감 있고 현실적인 경험을 제공할 것으로 기대됩니다.
Reference
[arxiv] DreamActor-M1: Holistic, Expressive and Robust Human Image Animation with Hybrid Guidance
Published: (Updated: )
Author: Yuxuan Luo, Zhengkun Rong, Lizhen Wang, Longhao Zhang, Tianshu Hu, Yongming Zhu
http://arxiv.org/abs/2504.01724v1