MoRE-Brain: 뇌 네트워크 원리를 활용한 해석 가능하고 일반화 가능한 fMRI 시각 복호화
MoRE-Brain은 뇌 네트워크 원리를 활용한 혁신적인 fMRI 시각 복호화 모델로, 고해상도 이미지 복원과 더불어 뛰어난 해석 가능성과 일반화 성능을 제공합니다. CLIP과 확산 모델을 결합한 독창적인 아키텍처와 효율적인 교차 피험자 일반화 전략이 특징입니다.

MoRE-Brain: 혁신적인 fMRI 시각 복호화 모델 등장
인간의 시각적 경험을 fMRI로 해석하는 것은 인지과학과 뇌-컴퓨터 인터페이스 발전에 매우 중요합니다. 하지만 기존 모델들은 정확도 향상에만 집중하여, 뇌과학적 통찰을 얻기 위한 해석 가능성이 부족했습니다.
Wei Yuxiang 등 연구진이 개발한 MoRE-Brain은 이러한 한계를 극복하기 위해 고안된 획기적인 모델입니다. MoRE-Brain은 계층적 전문가 혼합(Mixture-of-Experts) 아키텍처를 도입하여, 기능적으로 관련된 복셀 그룹의 fMRI 신호를 각기 다른 전문가 네트워크가 처리하도록 설계되었습니다. 이는 마치 뇌의 특정 영역들이 각기 다른 역할을 수행하는 것과 유사합니다.
MoRE-Brain의 핵심:
- 뇌 네트워크 기반의 전문가 혼합 아키텍처: 뇌의 기능적 연결성을 모방하여, 더욱 생물학적으로 타당하고 효율적인 fMRI 해석을 가능하게 합니다. 이는 단순한 데이터 처리를 넘어, 실제 뇌의 작동 원리를 반영하려는 시도입니다.
- CLIP과 확산 모델의 결합: CLIP을 이용하여 fMRI 신호를 고차원 시각적 표현으로 변환하고, 미세 조정된 확산 모델을 통해 고품질 이미지를 생성합니다. 이는 정확도와 해석 가능성이라는 두 마리 토끼를 잡기 위한 전략입니다.
- 듀얼 스테이지 라우팅 메커니즘: 확산 과정에서 각 전문가 네트워크의 기여도를 동적으로 조절하여, 다양한 뇌 영역의 정보를 효과적으로 통합합니다. 이는 이미지의 의미적 및 공간적 속성을 정확히 제어할 수 있게 해줍니다.
- 뛰어난 일반화 성능: 핵심 전문가 네트워크는 공유하고, 피험자별 라우터만 조정하여 효율적인 교차 피험자 일반화를 달성합니다. 이는 모델의 범용성을 크게 높입니다.
결론:
MoRE-Brain은 고해상도 이미지 복원, 향상된 해석 가능성, 뛰어난 일반화 성능을 통해 fMRI 기반 시각 복호화 분야에 큰 진전을 가져왔습니다. 공개될 예정인 코드를 통해, 더 많은 연구자들이 MoRE-Brain을 활용하여 뇌의 신비를 풀어나가기를 기대합니다. (GitHub 링크)
(참고) 본 기사는 연구 논문의 내용을 바탕으로 작성되었으며, 과학적 사실에 기반합니다.
Reference
[arxiv] MoRE-Brain: Routed Mixture of Experts for Interpretable and Generalizable Cross-Subject fMRI Visual Decoding
Published: (Updated: )
Author: Yuxiang Wei, Yanteng Zhang, Xi Xiao, Tianyang Wang, Xiao Wang, Vince D. Calhoun
http://arxiv.org/abs/2505.15946v1