related iamge

컨텍스트 기반 응답 생성의 혁신: Jensen-Shannon Divergence 기반의 새로운 접근법

본 기사는 Jensen-Shannon Divergence 기반의 새로운 RAG(Retrieval-Augmented Generation) 컨텍스트 어트리뷰션 방법인 ARC-JSD에 대한 연구 결과를 소개합니다. ARC-JSD는 기존 방법보다 높은 정확도와 효율성을 보이며, RAG 모델의 작동 원리에 대한 귀중한 통찰력을 제공합니다.

related iamge

혁신적인 AI 추론 프레임워크, Tool-Star 등장!

동관팅 박사 연구팀이 개발한 Tool-Star는 강화학습 기반의 LLM 추론 프레임워크로, 다중 도구 협업 추론을 가능하게 합니다. 도구 사용 데이터 부족 문제 해결을 위한 새로운 데이터 합성 파이프라인과 2단계 학습 프레임워크를 통해 LLM의 추론 능력을 획기적으로 향상시켰습니다. 다양한 벤치마크에서 효과와 효율성을 검증받았으며, GitHub에서 소스 코드를 확인할 수 있습니다.

related iamge

혁신적인 AI 추론 모델 FREESON: 검색 엔진 없이도 가능할까?

김채은, 김승원 연구팀의 FREESON은 기존 검색 증강 추론 모델의 한계를 극복하고 LRM이 자체적으로 지식을 검색하는 혁신적인 프레임워크입니다. CT-MCTS 알고리즘을 통해 5개의 QA 벤치마크에서 평균 14.4%의 성능 향상을 기록했습니다.

related iamge

AdvReal: 현실 세계 적대적 패치 생성 프레임워크와 객체 검출 시스템의 적대적 안전성 평가 적용

중국과학원 연구진이 개발한 AdvReal 프레임워크는 현실 세계의 다양한 조건을 고려하여 자율주행 시스템을 속이는 적대적 예제를 생성합니다. 8가지 객체 검출 모델에 대한 실험을 통해 우수한 성능을 검증했으며, GitHub를 통해 코드와 데모 영상을 공개하여 연구의 재현성을 높였습니다. 이는 AI 안전에 대한 중요한 연구 성과입니다.

related iamge

AceReason-Nemotron: 강화학습으로 수학 및 코드 추론의 한계를 뛰어넘다

양첸 등 연구진의 AceReason-Nemotron 논문은 대규모 강화학습(RL)을 통해 소규모/중규모 모델의 수학 및 코드 추론 능력을 획기적으로 향상시킨 연구 결과를 제시합니다. 수학 전용 RL 학습 후 코드 전용 RL 학습을 진행하는 효과적인 학습 전략과 검증 기반 데이터 정제 파이프라인을 통해 기존 최첨단 모델을 능가하는 성능을 달성했습니다. 이 연구는 AI 추론 모델 발전에 중요한 기여를 할 것으로 기대됩니다.