OpenTCM: 고전 한의학 지식의 디지털 혁명
본 기사는 Jinglin He 등 연구진이 개발한 OpenTCM 시스템에 대한 소개입니다. OpenTCM은 LLM과 지식 그래프를 결합하여 고전 한의학 지식 검색 및 진단을 지원하는 시스템으로, 중국어 특화 LLM과 전문가 검수를 통해 높은 정확도와 실용성을 확보했습니다.

중국 전통의학(TCM)은 오랜 역사와 방대한 지식을 자랑하지만, 그 복잡성과 접근성 문제로 현대 의료 시스템과의 통합에 어려움을 겪어왔습니다. 이러한 문제 해결에 도움이 될 획기적인 시스템이 등장했습니다. 바로 OpenTCM입니다. Jinglin He를 비롯한 연구진이 개발한 OpenTCM은 LLM(대규모 언어 모델) 기반 시스템으로, 고전 한의학 지식 그래프와 그래프 기반 검색 증강 생성(GraphRAG) 기술을 결합하여 한의학 지식 검색 및 진단을 지원합니다.
첫 번째 혁신: 연구진은 68권의 부인과 관련 고전 한의학 서적에서 373만 자가 넘는 고전 중국어 문자를 추출했습니다. 이 과정에서 한의학 및 부인과 전문가들의 도움을 받아 정확성을 높였습니다. 단순히 문자를 추출하는 것을 넘어, 전문가의 검수를 통해 데이터의 신뢰성을 확보한 점이 주목할 만합니다.
두 번째 혁신: DeepSeek과 Kimi와 같은 중국어 특화 LLM을 활용하여 48,000개 이상의 개체와 152,000개 이상의 상호 관계로 구성된 포괄적인 다중 관계 지식 그래프를 구축했습니다. 이는 단순한 키워드 매칭을 넘어, LLM의 심층적인 의미 이해 능력을 활용하여 한의학 개념 간의 복잡한 의미 관계를 모델링한 결과입니다. 중국어 특화 LLM을 사용함으로써 고전 한의학 문헌의 특수한 표현 방식을 정확하게 이해하고 처리할 수 있었다는 점이 핵심입니다. 그 결과, 98.55%의 정확도와 99.55%의 F1 점수를 달성하여 지식 그래프의 높은 품질을 입증했습니다.
세 번째 혁신: OpenTCM은 이렇게 구축된 지식 그래프와 통합되어 모델 미세 조정 없이도 정확한 약재 정보 검색과 진단 질문 응답을 가능하게 합니다. 실제 한의학 사용 사례에서 약재 정보 검색 과제에서는 평균 전문가 점수 4.5점, 진단 질문 응답 과제에서는 3.8점을 기록하며 기존 최첨단 솔루션을 능가하는 성능을 보였습니다. 이는 실제 임상 환경에서의 활용 가능성을 높이는 중요한 결과입니다.
OpenTCM은 단순한 정보 검색 시스템을 넘어, 고전 한의학의 방대한 지식을 현대 기술과 접목하여 의료 현장에 실질적인 도움을 제공하는 혁신적인 시스템입니다. 앞으로 한의학의 현대화와 세계화에 크게 기여할 것으로 기대됩니다.
Reference
[arxiv] OpenTCM: A GraphRAG-Empowered LLM-based System for Traditional Chinese Medicine Knowledge Retrieval and Diagnosis
Published: (Updated: )
Author: Jinglin He, Yunqi Guo, Lai Kwan Lam, Waikei Leung, Lixing He, Yuanan Jiang, Chi Chiu Wang, Guoliang Xing, Hongkai Chen
http://arxiv.org/abs/2504.20118v1