#딥러닝 기반 이미지 컬러라이제이션의 혁신: 객체 단위 정밀 색상 제어 기술 등장!
An Yanru 등 연구진은 객체 단위 정밀 색상 제어가 가능한 새로운 이미지 컬러라이제이션 방법론 MT-Color를 제시했습니다. 픽셀 단위 마스크 어텐션, 멀티 인스턴스 샘플링 전략, 그리고 새로운 데이터셋 GPT-color를 통해 색상 번짐 및 결합 오류 문제를 해결하고 기존 방법 대비 우수한 성능을 달성했습니다.

딥러닝 기반 이미지 컬러라이제이션의 혁신: 객체 단위 정밀 색상 제어 기술 등장!
최근 딥러닝을 이용한 이미지 컬러라이제이션 기술이 급속도로 발전하고 있습니다. 특히 확산 모델(diffusion model)의 발전은 이미지 컬러라이제이션 모델의 성능 향상에 크게 기여했습니다. 하지만 기존 모델들은 여전히 색상 번짐(color bleeding)이나 색상 결합 오류(color binding error)와 같은 문제점을 안고 있으며, 객체(instance) 단위의 정밀한 색상 제어에는 어려움을 겪고 있었습니다.
An Yanru 등 연구진이 발표한 논문 "Controllable Image Colorization with Instance-aware Texts and Masks"는 이러한 문제점을 해결하기 위해 MT-Color 라는 새로운 컬러라이제이션 방법론을 제시했습니다. MT-Color는 사용자가 제공하는 정보를 바탕으로 개별 객체 단위의 정밀한 색상 제어를 가능하게 합니다.
핵심 기술: 픽셀 단위 마스크 어텐션 및 멀티 인스턴스 샘플링
색상 번짐 문제 해결을 위해 연구진은 잠재 특징(latent features)과 조건부 회색 이미지 특징을 교차 어텐션(cross-attention)을 통해 통합하는 픽셀 단위 마스크 어텐션 메커니즘을 고안했습니다. 세분화 마스크(segmentation masks)를 사용하여 교차 어텐션 마스크를 생성, 서로 다른 객체 간의 픽셀 정보 교환을 방지합니다. 또한, 각 객체의 인스턴스 마스크와 텍스트 표현을 추출하여 잠재 특징과 융합하는 인스턴스 마스크 및 텍스트 안내 모듈을 도입했습니다. 셀프 어텐션(self-attention) 마스크를 사용하여 특정 객체의 텍스트가 다른 영역의 컬러라이제이션에 영향을 미치는 것을 방지, 색상 결합 오류를 줄입니다. 여기에 더해, 각 객체 영역을 개별적으로 샘플링한 후 결과를 융합하는 멀티 인스턴스 샘플링 전략을 적용했습니다.
GPT-color: 새로운 인스턴스 레벨 컬러라이제이션 데이터셋
연구진은 기존 이미지 데이터셋에 대규모 비주얼 랭귀지 모델을 활용하여 인스턴스 레벨 컬러라이제이션 작업에 특화된 새로운 데이터셋 GPT-color를 구축했습니다. 이를 통해 더욱 정확하고 효과적인 모델 학습이 가능해졌습니다.
놀라운 성능: 정성적, 정량적 실험 결과
정성적 및 정량적 실험 결과, MT-Color 모델과 GPT-color 데이터셋은 기존 방법 및 데이터셋보다 뛰어난 성능을 보였습니다. 이 연구는 딥러닝 기반 이미지 컬러라이제이션 기술의 한 단계 도약을 보여주는 중요한 결과물입니다. 향후 이미지 편집, 콘텐츠 생성 등 다양한 분야에서 활용될 가능성이 높습니다.
🎉 이 혁신적인 기술이 앞으로 어떻게 활용될지 기대됩니다! 🎉
Reference
[arxiv] Controllable Image Colorization with Instance-aware Texts and Masks
Published: (Updated: )
Author: Yanru An, Ling Gui, Qiang Hu, Chunlei Cai, Tianxiao Ye, Xiaoyun Zhang, Yanfeng Wang
http://arxiv.org/abs/2505.08705v1