NaFM: 자연 생성물을 위한 혁신적인 기초 모델의 등장


NaFM은 자연 생성물의 고유한 특성을 고려한 혁신적인 기초 모델로, 다양한 하위 작업에서 최첨단 성능을 달성하며 신약 발견 분야의 패러다임 변화를 이끌 것으로 기대됩니다.

related iamge

NaFM: 자연 생성물 연구의 새로운 지평을 열다

미생물, 동물 또는 식물에서 생성되는 자연 생성물은 다양한 생물학적 활성을 가지고 있어 신약 발견에 매우 중요합니다. 하지만 기존의 딥러닝 기반 자연 생성물 연구는 특정 하위 작업에 맞춰 설계된 지도 학습 방식에 의존해 왔습니다. 이러한 '한 모델-한 작업' 방식은 일반화 능력이 부족하고 성능 향상에 한계가 있었습니다. 또한 기존의 분자 특성 분석 방법은 자연 생성물의 고유한 특성을 제대로 반영하지 못했습니다.

Ding Yuheng 등 연구진이 개발한 NaFM (Natural Product Foundation Model) 은 이러한 문제점을 해결하기 위해 자연 생성물의 고유한 특성에 맞춰 사전 학습된 기초 모델입니다. NaFM은 대조 학습과 마스크 그래프 학습 목표를 통합하는 혁신적인 사전 학습 전략을 사용합니다. 이를 통해 분자 골격의 진화 정보를 강조하면서 측쇄 정보까지 포착하는 것이 가능합니다.

NaFM은 자연 생성물 탐색 및 신약 발견과 관련된 다양한 하위 작업에서 최첨단(SOTA) 성능을 달성했습니다. 연구진은 합성 분자 중심의 기준 모델과의 비교를 통해 기존 모델이 자연 생성 과정에 대한 이해에 부족함을 보여주었습니다. 더 나아가 유전자 및 미생물 수준의 세밀한 분석을 통해 NaFM이 진화 정보를 포착하는 능력을 입증했습니다. 가상 스크리닝 실험에서도 NaFM은 효과적인 신약 후보 물질 발굴에 기여하는 정보 풍부한 자연 생성물 표현을 생성하는 것으로 나타났습니다.

NaFM의 핵심:

  • 자연 생성물 특화 사전 학습: 기존 모델의 한계를 극복하기 위해 자연 생성물의 고유 특성을 고려한 새로운 사전 학습 전략을 채택했습니다.
  • 대조 학습 및 마스크 그래프 학습: 분자 골격의 진화 정보와 측쇄 정보를 동시에 학습하여 더욱 정확하고 포괄적인 표현을 생성합니다.
  • 다양한 하위 작업 적용: 분류, 가상 스크리닝 등 다양한 작업에서 최첨단 성능을 달성하여 실용성을 입증했습니다.

NaFM은 자연 생성물 연구의 새로운 패러다임을 제시하며, 향후 신약 개발 및 관련 분야에 혁신적인 발전을 가져올 것으로 기대됩니다. 이 연구는 자연 생성물의 복잡한 특성을 이해하고 활용하는 데 중요한 이정표가 될 것입니다.


*이 기사는 AI가 생성한 내용으로, 일부 정보가 실제와 다를 수 있습니다. 정확한 확인을 위해 추가적인 검증을 권장드립니다.

Reference

[arxiv] NaFM: Pre-training a Foundation Model for Small-Molecule Natural Products

Published:  (Updated: )

Author: Yuheng Ding, Yusong Wang, Bo Qiang, Jie Yu, Qi Li, Yiran Zhou, Zhenmin Liu

http://arxiv.org/abs/2503.17656v1