텍스트만으론 부족하다! 이미지까지 활용한 AI 개념 삭제 기술 등장!


Feiran Li 등 연구진이 개발한 Co-Erasing은 텍스트와 이미지를 결합하여 AI 이미지 생성 모델의 원치 않는 콘텐츠 생성 문제를 효과적으로 해결하는 기술입니다. 시각적 감독과 텍스트 기반 이미지 개념 개선 전략을 통해 기존 방식보다 높은 효율성과 사용성을 달성했으며, 코드 공개를 통해 AI 기술의 윤리적 발전에 기여할 것으로 기대됩니다.

related iamge

AI 이미지 생성 모델의 윤리적 문제 해결에 한 발짝 더 다가선 연구 결과가 발표되었습니다. Feiran Li 등 연구진이 개발한 'Co-Erasing' 이라는 획기적인 기술은, 기존의 텍스트 기반 개념 삭제 방식의 한계를 극복하고 이미지까지 활용하여 더욱 효과적이고 안전한 AI 이미지 생성을 가능하게 합니다.

텍스트와 이미지의 만남: Co-Erasing의 핵심

기존 텍스트-이미지 확산 모델은 원치 않는 콘텐츠 생성을 막기 위해 개념 삭제 기술이 사용되어 왔습니다. 하지만, 수동으로 작성된 텍스트 프롬프트에 의존하는 기존 방식은 삭제 효율성을 높이는 동시에 다른 양성 개념에 대한 영향을 최소화하는 것이 어려웠습니다. 이러한 어려움은 텍스트와 이미지 모달리티 간의 고유한 차이점에서 비롯됩니다. 텍스트 프롬프트에서 이미지 생성 과정으로 복잡하게 얽힌 개념 지식을 전달하는 것이 어려웠던 것이죠.

Co-Erasing은 이 문제를 해결하기 위해 시각적 감독을 직접 통합합니다. 텍스트 프롬프트와 해당 프롬프트로 유도된 원치 않는 이미지를 함께 사용하여 개념을 정의하고, 부정적 지도를 통해 생성 확률을 낮추는 방식입니다. 이를 통해 텍스트와 이미지 간의 지식 격차를 효과적으로 해소하여 삭제 효율성을 크게 향상시켰습니다.

뿐만 아니라, 텍스트 기반 이미지 개념 개선 전략을 통해 모델이 특정 텍스트 개념과 가장 관련된 시각적 특징에 집중하도록 유도하여 다른 양성 개념에 대한 방해를 최소화합니다. 마치 섬세한 외과 수술처럼, 원치 않는 부분만 정교하게 제거하는 셈이죠.

놀라운 성능과 공개된 코드

포괄적인 실험 결과, Co-Erasing은 기존 최첨단 삭제 방식보다 효율성과 사용성 측면에서 압도적인 성능 향상을 보였습니다. 더욱 놀라운 점은, 연구진이 GitHub에 코드를 공개하여 누구든 이 기술을 활용하고 발전시킬 수 있도록 했습니다. 이는 AI 기술의 윤리적 발전에 기여하는 중요한 행보라고 할 수 있습니다.

Co-Erasing은 AI 이미지 생성 기술의 안전성과 윤리성을 높이는 데 큰 기여를 할 것으로 기대됩니다. 텍스트와 이미지의 시너지를 통해 더욱 안전하고 책임감 있는 AI 시대를 열어갈 수 있을 것입니다.


*이 기사는 AI가 생성한 내용으로, 일부 정보가 실제와 다를 수 있습니다. 정확한 확인을 위해 추가적인 검증을 권장드립니다.

Reference

[arxiv] One Image is Worth a Thousand Words: A Usability Preservable Text-Image Collaborative Erasing Framework

Published:  (Updated: )

Author: Feiran Li, Qianqian Xu, Shilong Bao, Zhiyong Yang, Xiaochun Cao, Qingming Huang

http://arxiv.org/abs/2505.11131v1