
놀라운 발견! 최소주의적 접근으로 LLM 추론 성능 향상시키다
단순한 거절 샘플링 기법(RAFT)이 복잡한 강화학습 알고리즘보다 LLM 추론 향상에 효과적이며, GRPO 알고리즘의 효과는 잘못된 응답 제거에 기인함을 밝히고, 새로운 Reinforce-Rej 알고리즘을 제시한 연구 결과를 소개합니다.

혁신적인 AI 기반 솔루션: 서버리스 컴퓨팅의 콜드 스타트 문제 해결
Alexandre Savi Fayam Mbala Mouen, Jerry Lacmou Zeutouo, Vianney Kengne Tchendji 세 연구원의 연구는 트랜스포머 모델을 이용하여 FaaS 아키텍처의 콜드 스타트 문제를 해결하는 혁신적인 방법을 제시합니다. Azure 공개 데이터셋을 사용한 실험 결과 최대 79%의 콜드 스타트 시간 단축 효과를 확인하여 서버리스 컴퓨팅의 성능 향상에 크게 기여할 것으로 기대됩니다.

챗봇의 혁명? 다음 토큰 너머를 보는 새로운 AI 모델, Trelawney
Abitha Thankaraj 등의 연구진이 발표한 Trelawney는 기존 언어 모델의 토큰 예측 방식 대신 목표 기반 학습 전략을 사용하여 계획, 추론, 스토리 생성 등 다양한 과제에서 성능을 향상시킨 혁신적인 AI 모델입니다. 장기 목표 생성 기능도 갖춰 AI의 인지 능력 발전에 중요한 이정표가 될 것으로 기대됩니다.

낡은 COBOL 코드, AI가 새 생명을 불어넣다: 자바로의 현대화 성공!
AI 기반 기술을 활용하여 레거시 COBOL 시스템을 Java로 효율적으로 현대화하는 방법에 대한 연구 결과가 발표되었습니다. 93%의 높은 정확도를 달성하며 수작업 및 기존 도구 대비 우수한 성능을 보였고, 금융권 등 레거시 시스템 의존도가 높은 산업에 큰 영향을 미칠 것으로 기대됩니다.

혁신적인 LLM 추론 최적화: 메모리 제약 조건 하에서의 유체역학 기반 온라인 스케줄링
본 연구는 대규모 언어 모델(LLM)의 추론 과정에서 발생하는 메모리 제약 문제를 해결하기 위해 유체역학적 근사를 기반으로 한 새로운 온라인 스케줄링 알고리즘 'WAIT'을 제시합니다. 이론적 분석과 실제 데이터를 이용한 실험을 통해 WAIT 알고리즘의 우수성을 입증하였으며, 기존 알고리즘에 비해 처리량 향상 및 지연 시간 단축 효과를 확인했습니다.