related iamge

중국어 음성 합성의 혁명: Audio Turing Test (ATT) 등장

메이투안 연구팀이 개발한 Audio Turing Test (ATT)는 기존 MOS 방식의 한계를 극복한 혁신적인 중국어 TTS 평가 시스템입니다. 다차원 평가 설계와 자동 평가 시스템 Auto-ATT를 통해 객관적이고 효율적인 평가를 가능하게 하며, Hugging Face를 통해 공개되어 널리 활용될 것으로 기대됩니다.

related iamge

15년간의 음악 여정, AI가 당신의 취향을 예측합니다: 사용자 중심 음악 추천 프레임워크

본 기사는 15년간의 음악 감상 데이터를 기반으로 한 사용자 중심 음악 추천 프레임워크에 대한 연구를 소개합니다. Last.fm과 Spotify 데이터를 활용하여 시간적 맥락을 고려한 추천 시스템을 개발, 사용자 참여도 증대와 설명 가능성 향상을 목표로 합니다. 현재는 '댄서빌리티' 예측으로 시작하지만, 향후 더욱 다양한 변수를 확장하여 개인 맞춤형 음악 추천 서비스의 새로운 지평을 열 것으로 기대됩니다.

related iamge

FALCON: 비전-언어 사전학습의 새로운 지평을 열다

김명수, 심성웅, 이병준 교수 연구팀이 개발한 FALCON은 비전-언어 사전학습(VLP)에서 거짓 음성 문제를 해결하는 혁신적인 학습 기반 미니배치 구성 전략입니다. ALBEF와 BLIP-2 프레임워크에서 우수한 성능 향상을 보이며 VLP 분야의 새로운 가능성을 제시합니다.

related iamge

엣지 환경 통합을 위한 다중 모달 다중 작업(M3T) 연합 기반 모델: 잠재력과 과제

본 논문은 엣지 환경에서 작동하는 임베디드 AI 시스템을 위한 새로운 패러다임인 연합 기반 모델(FFMs)을 제시합니다. FFMs는 다중 모달 다중 작업 기반 모델(M3T FMs)과 연합 학습(FL)을 결합하여 범용성과 개인화를 동시에 달성합니다. EMBODY 프레임워크를 통해 실제 구축을 위한 주요 과제를 분석하고 해결 방안을 제시하며, FFMs의 평가를 위한 프레임워크를 제안합니다.

related iamge

혁신적인 AI 편향 검출 알고리즘, RuleSHAP 등장!

Francesco Sovrano의 연구는 대규모 언어 모델(LLM)의 편향성을 효과적으로 검출하는 새로운 알고리즘 RuleSHAP을 제시합니다. 텍스트-서수 매핑 전략과 RuleFit 및 SHAP 알고리즘을 결합한 RuleSHAP은 기존 방법보다 월등히 향상된 성능을 보이며, AI의 윤리적 발전에 크게 기여할 것으로 기대됩니다.