related iamge

MixAT: LLM의 안전성을 위한 혁신적인 적대적 훈련 기법

Csaba Dékány 등 연구진이 개발한 MixAT는 기존 LLM의 적대적 공격 취약성 문제를 해결하기 위해 연속적 및 이산적 적대적 훈련을 결합한 혁신적인 방법입니다. ALO-ASR 지표를 통해 기존 방어보다 월등한 안전성(ALO-ASR < 20%)을 입증하였으며, 실제 환경 적용을 위한 다양한 분석을 통해 LLM의 안전성 향상에 크게 기여할 것으로 기대됩니다.

related iamge

AgentIF: 에이전트 시나리오에서 대규모 언어 모델의 지시 사항 준수 벤치마크

AgentIF는 실제 에이전트 애플리케이션의 복잡성을 반영한 새로운 LLM 벤치마크로, 긴 지시 사항과 다양한 제약 조건을 처리하는 능력을 평가합니다. 기존 LLM의 한계를 드러내고 향후 연구 방향을 제시하는 중요한 연구 결과입니다.

related iamge

FoMoH: 임상적으로 의미있는 기초 모델 평가 프레임워크 등장!

콜롬비아 대학교 연구팀이 500만 명 환자 데이터를 기반으로 기초 모델의 임상적 유용성을 평가한 FoMoH 프레임워크를 발표했습니다. 기존 지도학습보다 우수한 성능을 보이며, 의료 AI 발전에 중요한 이정표를 세웠습니다.

related iamge

NovelSeek: AI가 과학자가 되는 날 - 가설에서 검증까지 이어지는 폐쇄 루프 시스템

NovelSeek은 AI 기반 자율 과학 연구(ASR) 프레임워크로, 확장성, 상호 작용성, 효율성을 통해 다양한 과학 분야에서 혁신적인 성과를 달성하고 있습니다. 인간 전문가의 피드백을 통합하여 지속적인 개선을 이루는 NovelSeek은 과학 연구의 패러다임을 변화시킬 잠재력을 지니고 있습니다.

related iamge

딥러닝 최적화의 혁신: 'Polar Express' 알고리즘이 가져올 변화

본 기사는 딥러닝 최적화 알고리즘 'Polar Express'의 핵심 내용과 의미를 소개합니다. 기존 알고리즘의 한계를 극복하고 GPU 호환성과 수렴 속도를 향상시킨 'Polar Express'는 대규모 모델 학습에 혁신적인 변화를 가져올 것으로 예상됩니다.