의료 영상 분할의 혁신: PG-SAM의 등장
중국과학원 등 연구팀이 개발한 PG-SAM은 의료 영상 분할에서 SAM의 한계를 극복, 의료 LLM과 세분화된 모달리티 정렬을 통해 최첨단 성능을 달성하고 코드를 공개하며 의료 AI 발전에 기여했습니다.

Segment Anything Model (SAM)은 놀라운 제로샷 성능을 보여주었지만, 의료 영상 분할에 적용 시 정확도와 강건성이 크게 떨어지는 문제점이 존재했습니다. 기존 연구들은 모달리티 융합을 통해 텍스트와 이미지 정보를 통합하여 더욱 상세한 사전 정보를 제공하려는 시도를 했지만, 중국과학원 자동화연구소, 텐센트, 그리고 다른 기관의 연구자들로 구성된 연구팀은 텍스트의 세분화 수준과 도메인 간격이 사전 정보의 정확도에 영향을 미친다는 점을 지적했습니다.
연구팀은 이러한 문제를 해결하기 위해 PG-SAM (Prior-Guided SAM)을 제안했습니다. PG-SAM은 세분화된 모달리티 사전 정렬기를 사용하여 전문적인 의료 지식을 활용, 모달리티 정렬을 개선합니다. 핵심은 의료 LLM에서 얻은 세분화된 텍스트를 통해 도메인 간격을 효율적으로 해결하고, 모달리티 정렬 후 사전 정보의 질을 향상시켜 더욱 정확한 분할을 가능하게 하는 데 있습니다.
뿐만 아니라, PG-SAM의 디코더는 다층 특징 융합 및 반복 마스크 최적화 연산을 통해 모델의 표현 능력을 향상시키고 언프롬프트 학습을 지원합니다. SAM에 고품질의 의미 정보를 효과적으로 제공하는 통합 파이프라인도 함께 제시되었습니다.
Synapse 데이터셋을 이용한 광범위한 실험 결과, PG-SAM은 최첨단 성능을 달성했습니다. 더욱 놀라운 것은 연구팀이 GitHub 에 코드를 공개하여 다른 연구자들의 활용과 발전을 도왔다는 점입니다. 이는 의료 영상 분석 분야의 발전에 크게 기여할 것으로 기대됩니다.
결론적으로, PG-SAM은 의료 영상 분할의 정확성과 효율성을 크게 향상시킨 획기적인 모델로, 의료 AI 분야의 혁신을 이끌어갈 중요한 기술적 진보로 평가받고 있습니다. 앞으로 PG-SAM을 기반으로 한 다양한 응용 연구와 발전이 기대됩니다.
Reference
[arxiv] PG-SAM: Prior-Guided SAM with Medical for Multi-organ Segmentation
Published: (Updated: )
Author: Yiheng Zhong, Zihong Luo, Chengzhi Liu, Feilong Tang, Zelin Peng, Ming Hu, Yingzhen Hu, Jionglong Su, Zongyuan Geand, Imran Razzak
http://arxiv.org/abs/2503.18227v2