related iamge

딥러닝의 혁명: 역전파를 뛰어넘는 확률적 변분 전파(SVP)

Yin과 Corradi의 SVP는 역전파의 한계를 극복하는 혁신적인 딥러닝 학습 방법으로, 계층적 변분 추론과 저차원 투영을 통해 확장성과 효율성을 크게 향상시키면서 경쟁력 있는 정확도를 달성했습니다.

related iamge

혁신적인 교차 언어 전이 학습: SALT로 LLM의 가능성을 넓히다

이승윤, 홍성태, 문현석, 임휘석 연구원은 새로운 교차 언어 전이 학습 기술 SALT를 개발했습니다. SALT는 타겟 언어 PLM의 임베딩을 재활용하여 LLM의 표현 능력을 향상시키고, 기존 방식보다 뛰어난 성능을 보여줍니다. 이는 다국어 LLM의 발전과 전 세계 정보 접근성 향상에 크게 기여할 것으로 기대됩니다.

related iamge

GDI-Bench: 시각 및 추론 분리 기반의 일반 문서 지능 벤치마크 등장

본 기사는 시각 및 추론 분리를 통해 문서 지능 모델의 성능을 종합적으로 평가하는 새로운 벤치마크 GDI-Bench와, 이를 기반으로 개발된 최첨단 모델 GDI-Model에 대한 소개입니다. GDI-Bench는 모델의 약점을 정확히 파악하고 개선 방향을 제시하여 문서 지능 분야의 발전에 기여할 것으로 기대됩니다.

related iamge

GUI 에이전트의 새로운 지평: GUI-G1의 혁신적인 접근 방식

Zhou 외 연구진은 GUI 에이전트의 R1-Zero 기반 학습 방식의 한계를 분석하고, 이를 개선하기 위한 세 가지 해결책(빠른 사고 템플릿, 박스 크기 제약, RL 목적 함수 수정)을 제시했습니다. 그 결과, GUI-G1-3B 모델은 기존 모델들을 능가하는 성능을 달성하여 GUI 에이전트 분야의 새로운 기술 수준을 제시했습니다.

related iamge

거대 언어 모델의 놀라운 능력: 암기일까, 알고리즘일까?

대규모 언어 모델의 인컨텍스트 학습(ICL) 메커니즘에 대한 연구 결과가 발표되었습니다. 연구는 ICL이 단순 암기 이상의 능력을 보이지만, 독립적인 심볼릭 알고리즘은 아님을 밝혔으며, 훈련 역학, 모델 성능, 해석 가능성 간의 상관관계를 규명했습니다.