획기적인 인공지능 모델, HumanAesExpert: 인간 이미지 미적 평가의 새 지평을 열다


본 기사는 인간 이미지 미적 평가(HIAA) 분야의 획기적인 연구 성과인 HumanAesExpert 모델과 HumanBeauty 데이터셋에 대한 소개입니다. 기존 연구의 한계를 극복하고, 12차원 미적 기준과 3가지 헤드, MetaVoter를 활용하여 높은 정확도를 달성한 이 모델은 HIAA 연구의 새로운 장을 열 것으로 기대됩니다.

related iamge

인공지능(AI)의 발전과 함께 이미지 미적 평가(IAA) 기술은 급속도로 발전하고 있습니다. 하지만 특히 인간 이미지 미적 평가(HIAA) 분야는 소셜 미디어, AI 워크플로우 등 다양한 분야에서 활용됨에도 불구하고 연구가 부족한 실정이었습니다.

이러한 연구 공백을 메우기 위해, Zhichao Liao를 비롯한 9명의 연구진은 획기적인 연구 성과를 발표했습니다. 그들은 HumanBeauty 라는, HIAA를 위해 특별히 제작된 최초의 데이터셋을 구축했습니다. 10만 8천 개의 고품질 인간 이미지에 대한 수동 주석이 포함된 HumanBeauty는 엄격한 기준으로 선별된 5만 개의 이미지와 공개 데이터셋에서 체계적으로 필터링된 5만 8천 개의 이미지로 구성되어 있으며, 특히 5만개의 이미지는 혁신적인 12차원 미적 기준을 활용하여 주석이 달렸습니다. 이는 단순한 '아름다움'을 넘어, 더욱 세분화되고 종합적인 미적 평가를 가능하게 합니다.

HumanBeauty 데이터셋을 기반으로 개발된 HumanAesExpert는 강력한 비전 언어 모델입니다. 이 모델은 전문가 헤드, 언어 모델링(LM) 헤드, 회귀 헤드를 결합하여 종합적이고 세분화된 HIAA를 수행합니다. 전문가 헤드는 인간의 미적 지식을 통합하여 모델의 평가 능력을 향상시키고, LM 헤드와 회귀 헤드는 다양한 관점에서의 평가를 가능하게 합니다.

더 나아가, 연구팀은 MetaVoter라는 새로운 방법을 도입했습니다. MetaVoter는 세 개의 헤드에서 나온 점수들을 통합하여 각 헤드의 강점을 균형 있게 조합함으로써 평가 정확도를 높입니다. 광범위한 실험 결과, HumanAesExpert는 기존 최첨단 모델들을 능가하는 성능을 보였습니다.

이 연구의 가장 큰 의의는 데이터셋, 모델, 코드를 모두 공개하여 HIAA 연구 공동체의 발전에 기여한다는 점입니다. 프로젝트 웹페이지를 통해 자세한 정보를 확인할 수 있습니다. 이 연구는 HIAA 분야의 혁신적인 발전을 가져올 뿐만 아니라, AI 기반 미적 평가 기술의 발전에도 큰 영향을 미칠 것으로 기대됩니다.


잠재적 사회적 영향: 소셜 미디어 플랫폼의 이미지 필터링, AI 기반 디자인 도구 개발, 미용 및 패션 산업 등 다양한 분야에 활용될 수 있습니다. 하지만, 미적 기준의 주관성과 편향성 문제에 대한 고려도 필요합니다.


*이 기사는 AI가 생성한 내용으로, 일부 정보가 실제와 다를 수 있습니다. 정확한 확인을 위해 추가적인 검증을 권장드립니다.

Reference

[arxiv] HumanAesExpert: Advancing a Multi-Modality Foundation Model for Human Image Aesthetic Assessment

Published:  (Updated: )

Author: Zhichao Liao, Xiaokun Liu, Wenyu Qin, Qingyu Li, Qiulin Wang, Pengfei Wan, Di Zhang, Long Zeng, Pingfa Feng

http://arxiv.org/abs/2503.23907v1