의료 영상 분석의 혁신: 자기 지도 학습 기반의 간편한 다중 인스턴스 학습
본 연구는 자기 지도 학습(SSL)을 활용한 인스턴스 기반 다중 인스턴스 학습(MIL) 방법이 의료 영상 분석, 특히 디지털 병리학 분야에서 기존의 임베딩 기반 방법보다 우수한 성능을 보임을 실험적으로 증명했습니다. 새로운 인스턴스 기반 MIL 방법의 제시와 SOTA 결과 달성은 향후 연구 방향을 제시하는 중요한 의미를 지닙니다.

전체 슬라이드 이미지(WSI) 분류에서 다중 인스턴스 학습(MIL)이 최고의 솔루션으로 떠올랐습니다. MIL은 각 슬라이드를 패치로 나누고, 이 패치들을 전역 레이블로 표시된 인스턴스의 집합으로 취급합니다. MIL에는 인스턴스 기반과 임베딩 기반의 두 가지 주요 접근 방식이 있습니다. 인스턴스 기반 방법은 각 패치를 독립적으로 분류한 후 패치 점수를 집계하여 가방 레이블을 예측하는 반면, 임베딩 기반 방법은 패치 임베딩을 집계한 후 가방 분류를 수행합니다.
인스턴스 기반 방법이 본질적으로 해석이 더 용이하지만, 과거에는 특징 추출기의 성능이 좋지 않아 임베딩 기반 MIL이 선호되었습니다. 그러나 최근 자기 지도 학습(SSL)을 사용하여 특징 임베딩의 품질이 급격히 향상되었습니다. 그럼에도 불구하고 많은 연구자들은 임베딩 기반 MIL의 우수성을 지지하고 있습니다.
Ali Mammadov 등 연구진은 이러한 상황을 더 자세히 조사하기 위해 4개의 데이터셋에서 710개의 실험을 수행하여 10가지 MIL 전략, 6가지 자기 지도 학습 방법(4가지 백본 사용), 4가지 기본 모델, 다양한 병리학 적응 기술을 비교했습니다. 특히, 병리학 분야에서는 사용된 적이 없는 4가지 인스턴스 기반 MIL 방법을 새롭게 제시했습니다.
이 광범위한 실험을 통해 연구진은 우수한 SSL 특징 추출기를 사용하면 매개변수가 매우 적은 간단한 인스턴스 기반 MIL이 복잡한 최첨단(SOTA) 임베딩 기반 MIL 방법과 비슷하거나 더 나은 성능을 얻는다는 것을 보여주었습니다. BRACS와 Camelyon16 데이터셋에서 새로운 SOTA 결과를 달성한 것입니다. 간단한 인스턴스 기반 MIL 방법은 임상의에게 자연스럽게 더 해석 가능하고 설명 가능하기 때문에, 이 연구 결과는 복잡한 임베딩 기반 MIL 방법보다는 WSI에 잘 적응된 SSL 방법에 더 많은 노력을 기울여야 함을 시사합니다. 이는 의료 영상 분석 분야에 있어 중요한 전환점이 될 수 있으며, 향후 연구의 방향을 제시하는 중요한 결과입니다.
핵심 내용:
- 자기 지도 학습(SSL)의 발전으로 인한 인스턴스 기반 MIL의 성능 향상
- 새로운 인스턴스 기반 MIL 방법 제시 및 SOTA 성능 달성
- 임상 적용을 위한 해석 가능성 및 설명 가능성 향상
Reference
[arxiv] Self-Supervision Enhances Instance-based Multiple Instance Learning Methods in Digital Pathology: A Benchmark Study
Published: (Updated: )
Author: Ali Mammadov, Loic Le Folgoc, Julien Adam, Anne Buronfosse, Gilles Hayem, Guillaume Hocquet, Pietro Gori
http://arxiv.org/abs/2505.01109v1