related iamge

딥러닝 과적합의 새로운 지표: OUI 가 등장하다!

본 기사는 과적합/과소적합 지표(OUI)를 활용하여 딥러닝 모델의 가중치 감소(Weight Decay) 하이퍼파라미터를 효율적으로 조정하는 새로운 연구에 대해 소개합니다. OUI는 검증 데이터 없이 훈련 과정 중 과적합 또는 과소적합 여부를 판단하여 최적의 가중치 감소 값을 빠르게 찾는 데 도움을 주며, 다양한 DNN 모델과 데이터셋에서 그 효과가 검증되었습니다.

related iamge

챗봇 시대의 그림자: LLM 추천 시스템 공격의 새로운 지평, CheatAgent

Ning Liang-bo 등 연구진이 개발한 CheatAgent는 LLM의 인간과 유사한 의사결정 능력을 활용하여 LLM 기반 추천 시스템을 공격하는 새로운 프레임워크입니다. 최소한의 입력 수정으로 최대의 영향을 미치는 공격 전략을 통해 블랙박스 추천 시스템을 효과적으로 공격하며, AI 시스템의 보안 강화 필요성을 강조합니다.

related iamge

뷰티 AI, 양면의 검: 아름다움을 넘어 심리적 영향까지

AI 기반 뷰티 도구가 자존감 저하 및 외모 개선 행동 증가와 관련이 있으며, 특히 여성에게 더 큰 영향을 미칠 수 있다는 연구 결과가 발표되었습니다. AI 개발 과정에서 윤리적 고려와 책임감 있는 디자인의 중요성을 강조합니다.

related iamge

멀티모달 언어 분석의 새로운 지평: 거대 언어 모델의 한계와 잠재력

Zhang 등(2025)의 연구는 MMLA라는 새로운 벤치마크를 통해 거대 언어 모델의 다중 모달 언어 분석 능력을 평가하고, 그 한계를 밝혔습니다. 61,000개 이상의 다중 모달 발화 데이터를 활용한 실험 결과, 미세 조정된 모델조차도 60~70%의 정확도에 그쳤습니다. 하지만 공개된 데이터셋과 코드는 향후 연구 발전에 기여할 것으로 기대됩니다.

related iamge

V$^2$R-Bench: 자연스러운 시각적 변화에 취약한 거대 비주얼 언어 모델의 실체

본 논문은 거대 비주얼 언어 모델(LVLM)의 시각적 변화에 대한 취약성을 밝히고, 이를 평가하기 위한 새로운 벤치마크 프레임워크 V$^2$R-Bench를 제시합니다. 연구 결과, 고성능 모델조차 간단한 작업에서 저조한 성능을 보이며 인간과 유사한 시각적 한계를 보이는 것으로 나타났습니다. 이는 LVLM의 아키텍처적 결함으로 인한 것으로 밝혀졌으며, 미래 LVLM 설계의 혁신을 위한 중요한 시사점을 제공합니다.