
StoryAnchors: 장편 서사를 위한 일관성 있는 다중 장면 스토리 프레임 생성의 혁신
Bo Wang 등 연구진이 개발한 StoryAnchors는 과거와 미래 문맥을 통합한 양방향 스토리 생성기로 시간적 일관성과 다양한 장면을 제공, GPT-4o 수준의 서사 일관성과 풍부함을 보여주는 혁신적인 스토리 프레임 생성 프레임워크입니다.

로봇 조작의 미래를 여는 혁신: LaDi-WM 세계 모델
황유항 박사 연구팀의 LaDi-WM은 잠재 공간 기반 확산 모델을 이용한 혁신적인 세계 모델로, 로봇의 예측 정확도와 조작 성능을 크게 향상시켰습니다. 합성 및 실제 환경에서 모두 우수한 성능을 보이며, 실제 세계 적용 가능성을 높였습니다.

사회적 언어 에이전트의 적응적 사고: AML 프레임워크의 혁신
Wang et al.(2025)의 연구는 사회적 언어 에이전트의 적응적 사고 능력 향상을 위한 AML 프레임워크를 제시합니다. 인지 제어 이론에 기반한 다층적 사고 모드와 AMPO 알고리즘을 통해 상황에 맞는 추론 깊이 조절 및 효율적인 토큰 사용을 가능하게 합니다. 실험 결과, GPT-4o 대비 15.6%, GRPO 대비 7.0% 향상된 성능을 달성하며 적응적 사고 모드의 우수성을 입증했습니다.

대규모 MARL의 혁신: Bi-level Mean Field(BMF) 등장!
Zheng 박사 연구팀이 제안한 Bi-level Mean Field (BMF) 방법은 대규모 MARL에서의 차원의 저주와 집계 노이즈 문제를 해결하는 혁신적인 접근 방식입니다. VAE 기반의 동적 그룹화와 이중 수준 상호 작용 모듈을 통해 에이전트 다양성을 효과적으로 고려하고, 기존 최고 성능 방법들을 능가하는 결과를 달성했습니다.

비디오로 강화된 오프라인 강화학습: 모델 기반 접근 방식의 혁신
Minting Pan 등 연구진이 개발한 VeoRL은 비디오 데이터를 활용한 모델 기반 오프라인 강화학습 방법으로, 로봇 조작, 자율 주행, 게임 등 다양한 분야에서 기존 방식 대비 100% 이상의 성능 향상을 보였습니다. 이는 비디오 데이터의 효과적인 활용을 통해 오프라인 강화학습의 한계를 극복하고 AI 시스템의 발전을 가속화할 중요한 연구 결과입니다.