딥러닝의 '블랙박스'를 열다: 녹내장 진단에서 XAI와 임상 지식의 만남
한 원, 리찬 강, 용 리 연구팀은 XAI 기법을 활용하여 딥러닝 모델의 녹내장 진단 과정을 분석하고, 임상 지식과의 일관성을 통계적으로 검증했습니다. 다양한 딥러닝 모델과 CAM 기법을 통해 모델의 의사결정 과정을 시각화하고, 해부학적 구조에 대한 집중도와 예측 성능 간의 양의 상관관계를 밝혀냄으로써 딥러닝 모델의 신뢰성을 높였습니다.

최근 딥러닝은 의료 영상 분석 분야에서 놀라운 예측 성능을 보여주고 있지만, 그 결정 과정이 불투명한 '블랙박스'와 같은 한계로 인해 실제 의료 현장 적용에는 어려움을 겪고 있습니다. 특히 녹내장 진단과 같은 중요한 의학적 판단에는 딥러닝 모델의 신뢰성 확보가 필수적입니다.
한 원, 리찬 강, 용 리 연구팀은 이러한 문제를 해결하기 위해 획기적인 연구를 진행했습니다. 그들은 녹내장 진단을 위한 딥러닝 모델의 의사결정 과정을 설명 가능한 인공지능(XAI) 기법을 이용하여 투명하게 드러내고, 이를 임상의의 전문 지식과 비교 분석했습니다.
연구팀은 VGG-11, ResNet-18, DeiT-Tiny, Swin Transformer-Tiny 등 네 가지 딥러닝 모델을 개발하고, Grad-CAM, XGrad-CAM, Score-CAM, Eigen-CAM, Layer-CAM 등 다섯 가지 Class Activation Map (CAM) 기법을 활용하여 모델이 녹내장 진단에 어떤 영역에 집중하는지 시각화했습니다. 이를 통해 모델이 시각적으로 어떤 부분을 중요하게 판단하는지 분석했습니다. 특히 망막 사진에서 시신경 유두, 시신경 컵, 혈관 등 임상적으로 중요한 해부학적 구조에 대한 모델의 집중도를 분석했습니다.
흥미롭게도, 연구팀은 다섯 개의 공개 녹내장 데이터셋을 사용하여 모든 딥러닝 모델에서 모델이 집중하는 영역에 해부학적 구조가 전체 이미지보다 통계적으로 유의미하게 더 많이 포함되어 있음을 확인했습니다. 또한, 이러한 해부학적 구조에 대한 집중도와 모델의 예측 성능 사이에 양의 상관관계가 있음을 밝혀냈습니다. 이는 딥러닝 모델이 임상의와 유사한 영역에 집중하여 녹내장을 진단한다는 것을 의미하며, 쌍체 t-검정, Pearson 상관 검정, Spearman 상관 검정과 같은 엄격한 통계적 검정을 통해 검증되었습니다.
이 연구는 딥러닝 모델의 '블랙박스'를 열어 의료 현장에서의 신뢰도를 높이는 중요한 발걸음입니다. 딥러닝 모델의 결정 과정을 투명하게 제시함으로써 의료진의 의사결정을 지원하고, 딥러닝 기술에 대한 의료계의 우려를 해소하는 데 기여할 것으로 기대됩니다. 더욱이, 연구의 재현성을 위해 코드와 데이터셋은 GitHub에 공개되었습니다. 이는 AI 연구의 투명성과 신뢰도를 높이는 모범 사례로 평가받을 만합니다.
:exclamation: 이 연구는 단순히 기술적인 성과를 넘어, 인공지능 기술과 의료 현장의 협력을 통해 더 안전하고 정확한 의료 서비스를 제공할 수 있다는 가능성을 보여줍니다. 앞으로도 이러한 협력적인 연구를 통해 인공지능 기술이 의료 분야에 더욱 폭넓게 적용될 수 있기를 기대합니다.
Reference
[arxiv] Opening the black box of deep learning: Validating the statistical association between explainable artificial intelligence (XAI) and clinical domain knowledge in fundus image-based glaucoma diagnosis
Published: (Updated: )
Author: Han Yuan, Lican Kang, Yong Li
http://arxiv.org/abs/2504.04549v1