최소침습 수술의 미래를 여는 AI: 대규모 언어 모델 기반 수술 행동 계획 (LLM-SAP)


본 기사는 최소침습 수술 분야에서 대규모 언어 모델(LLM)을 활용한 혁신적인 수술 행동 계획(SAP) 프레임워크인 LLM-SAP에 대한 연구 결과를 소개합니다. LLM-SAP는 수술 영상 데이터를 분석하여 미래 수술 행동을 예측하고, 수술 교육, 의사 결정 지원 등 다양한 분야에 활용될 수 있는 잠재력을 보여줍니다. 데이터 프라이버시 및 효율성 문제 해결을 위한 노력 또한 주목할 만하며, 향후 수술의 안전성과 효율성 향상에 기여할 것으로 기대됩니다.

related iamge

로봇 수술이 발전하고 있지만, 현재의 지능형 수술 시스템은 수술 중 예측 계획이 부족하다는 한계를 가지고 있습니다. 이러한 문제를 해결하기 위해, 연구진들은 수술 행동 계획 (Surgical Action Planning, SAP) 이라는 혁신적인 개념을 도입했습니다. SAP는 수술 영상 정보를 바탕으로 미래의 수술 행동을 계획하는 기술로, 수술 과정의 안내와 자동화를 향상시키는데 큰 가능성을 보여줍니다.

하지만, 수술 도구와 행동 간의 관계 이해, 수술 진행 상황 추적 등의 어려움이 존재합니다. 여기서 주목할 만한 것은 바로 대규모 언어 모델 (LLM) 의 활용입니다. 기존에는 주로 과거 분석에 집중되었던 LLM이 수술 영상 데이터 분석과 예측적 의사결정에 적용된 것은 매우 획기적인 시도입니다. Xu 등의 연구진은 LLM 기반 SAP 프레임워크인 LLM-SAP를 개발하여 이러한 도전에 응했습니다.

LLM-SAP는 수술 목표에 대한 자연어 프롬프트를 해석하여 미래의 수술 행동을 예측하고 텍스트 응답을 생성합니다. 이를 통해 수술 교육, 수술 중 의사결정 지원, 수술 과정 기록, 기술 분석 등 다양한 분야에 활용될 수 있습니다. 특히, 연구진은 근거리 기록 집중 메모리 모듈 (NHF-MM)프롬프트 생성기 라는 두 가지 혁신적인 모듈을 통합하여 LLM-SAP의 성능을 향상시켰습니다.

연구진은 CholecT50-SAP 데이터셋을 사용하여 Qwen2.5 및 Qwen2-VL과 같은 모델을 통해 LLM-SAP의 효과를 평가했습니다. 데이터 프라이버시 문제를 해결하기 위해 사전 훈련된 LLM을 제로샷으로 테스트하고, LoRA (Low-Rank Adaptation) 를 사용한 지도 학습 미세 조정(SFT)을 적용했습니다. 그 결과, Qwen2.5-72B-SFT 모델은 Qwen2.5-72B 모델보다 정확도가 19.3%나 향상되는 놀라운 성과를 보였습니다.

이 연구는 최소침습 수술의 미래를 위한 중요한 발걸음을 내딛었습니다. LLM-SAP의 성공은 AI 기반 수술 시스템의 발전에 새로운 가능성을 제시하며, 향후 수술의 안전성과 효율성을 크게 높일 것으로 기대됩니다. 하지만, LLM-SAP의 실제 임상 적용까지는 추가적인 연구와 검증이 필요하며, 데이터 편향이나 예상치 못한 오류 발생 가능성에 대한 지속적인 모니터링이 중요합니다.


*이 기사는 AI가 생성한 내용으로, 일부 정보가 실제와 다를 수 있습니다. 정확한 확인을 위해 추가적인 검증을 권장드립니다.

Reference

[arxiv] Surgical Action Planning with Large Language Models

Published:  (Updated: )

Author: Mengya Xu, Zhongzhen Huang, Jie Zhang, Xiaofan Zhang, Qi Dou

http://arxiv.org/abs/2503.18296v1