시간적 일관성 변조를 통한 효율적인 신경망 비디오 표현: NVTM
신승준, 김수지, 오덕완 연구팀이 개발한 NVTM은 기존 비디오 처리 기술의 한계를 극복하고, 빠른 속도와 높은 효율성을 동시에 달성한 혁신적인 신경망 기반 비디오 표현 방식입니다. 다양한 비디오 처리 작업에서 우수한 성능을 입증하며, 향후 비디오 기술 발전에 크게 기여할 것으로 기대됩니다.

혁신적인 비디오 처리 기술, NVTM 등장!
최근 신승준, 김수지, 오덕완 연구팀이 발표한 논문 "시간적 일관성 변조를 통한 효율적인 신경망 비디오 표현(Efficient Neural Video Representation with Temporally Coherent Modulation)"은 비디오 처리 분야에 새로운 이정표를 제시했습니다. 기존 암묵적 신경망 표현(INR) 방식의 속도 제한을 극복하고, 비디오의 동적 특성을 효과적으로 포착하는 NVTM(Neural Video Representation with Temporally Coherent Modulation)이 바로 그 주인공입니다.
기존 기술의 한계 극복:
기존의 그리드 기반 INR 방식은 빠른 인코딩 속도를 제공했지만, 비디오의 동적인 특성을 고려하지 못해 매개변수 효율성이 낮고 비트 전송률이 높다는 단점이 있었습니다. NeRV 스타일의 방법에 비해 매개변수 효율성이 떨어지고 비트레이트가 높았죠. 연구팀은 이러한 문제점을 해결하기 위해 NVTM을 개발했습니다.
NVTM: 시간적 일관성을 고려한 혁신적인 접근 방식:
NVTM은 공간-시간 3D 비디오 데이터를 흐름 정보를 포함한 일련의 2D 그리드로 분해하여 비디오 표현을 빠르게 학습하고 매개변수를 효율적으로 사용합니다. 시간적으로 대응하는 픽셀을 한 번에 처리하여 인코딩 속도를 획기적으로 향상시켰습니다. NeRV 스타일의 방법보다 3배 이상 빠른 속도를 달성했으며, UVG(Dynamic) 데이터셋에서는 기존 그리드 기반 방식보다 PSNR/LPIPS에서 평균 1.54dB/0.019 향상, MCL-JCV(Dynamic) 데이터셋에서는 평균 1.84dB/0.013 향상이라는 놀라운 결과를 보였습니다. (매개변수는 10% 감소)
다양한 작업에서 우수한 성능 검증:
NVTM은 비디오 압축 작업에서도 H.264, HEVC와 같은 표준 방식에 필적하는 성능을 보였습니다. 뿐만 아니라 초고해상도, 프레임 보간, 비디오 복원 등 다양한 작업에서도 기존 방식을 뛰어넘는 우수한 성능을 입증했습니다. 자세한 내용은 프로젝트 페이지 (https://sujiikim.github.io/NVTM/)에서 확인할 수 있습니다.
결론:
NVTM은 비디오 처리 분야의 혁신적인 기술로, 향후 고품질 비디오 처리 및 압축 기술 발전에 크게 기여할 것으로 기대됩니다. 빠른 속도, 높은 효율성, 우수한 성능을 모두 갖춘 NVTM은 앞으로 다양한 응용 분야에서 활용될 가능성이 높습니다.
Reference
[arxiv] Efficient Neural Video Representation with Temporally Coherent Modulation
Published: (Updated: )
Author: Seungjun Shin, Suji Kim, Dokwan Oh
http://arxiv.org/abs/2505.00335v1