AI 에이전트, 신약 개발의 미래를 혁신하다: DO Challenge 2025 경연 결과 발표


본 기사는 AI 에이전트를 이용한 신약 개발의 가능성을 다룬 연구 논문을 소개합니다. DO Challenge 2025 경연 결과를 바탕으로, AI 에이전트의 성과와 한계를 분석하고, 미래 신약 개발에 대한 전망을 제시합니다.

related iamge

최근 인공지능(AI), 특히 대규모 언어 모델(LLM) 기반의 자율 에이전트 시스템의 발전이 가속화되면서, 신약 개발 분야에 혁신적인 변화를 가져올 가능성이 주목받고 있습니다. Khachik Smbatyan을 비롯한 16명의 연구진이 발표한 논문 "AI 에이전트가 의약품 발견 파이프라인을 설계 및 구현할 수 있는가?" 에서는, AI 에이전트가 *실험적 시도에 대한 의존도를 줄이고 컴퓨터 기반 모델링을 개선함으로써 신약 개발을 가속화할 수 있다는 흥미로운 주장을 제기합니다.

이 연구진은 DO Challenge라는 새로운 벤치마크를 도입했습니다. DO Challenge는 가상 스크리닝 시나리오와 유사한 복잡한 문제에서 AI 에이전트의 의사결정 능력을 평가하기 위한 것입니다. AI 에이전트는 방대한 데이터셋에서 유망한 분자 구조를 식별하고, 화학 공간을 탐색하며, 모델을 선택하고, 제한된 자원을 관리하는 등 다양한 과제를 독립적으로 수행해야 합니다.

2025년에 개최된 DO Challenge 경연 대회는 인간 참가자들의 다양한 전략을 보여주는 흥미로운 결과를 제시했습니다. 특히, Deep Thought 다중 에이전트 시스템은 대부분의 인간 팀을 능가하는 뛰어난 성능을 보여주었습니다. Claude 3.7 Sonnet, Gemini 2.5 Pro, o3 등의 언어 모델은 주요 에이전트 역할에서 최고의 성능을 발휘했으며, GPT-4o, Gemini 2.0 Flash는 보조 역할에서 효과적임이 입증되었습니다.

하지만 연구진은 Deep Thought 시스템의 성능이 전문가가 설계한 솔루션에는 미치지 못했고, 높은 불안정성을 보였다는 점을 강조하며 AI 기반 방법론의 잠재력과 현재 한계를 동시에 지적했습니다. 이는 AI가 신약 개발 및 광범위한 과학 연구를 변혁할 수 있는 엄청난 가능성과 동시에, 아직 극복해야 할 기술적 과제가 남아있음을 시사합니다. 향후 연구를 통해 AI 에이전트의 안정성과 성능을 더욱 향상시킨다면, AI는 신약 개발의 속도와 효율성을 획기적으로 높일 수 있을 것으로 기대됩니다.


주요 언급 모델: Claude 3.7 Sonnet, Gemini 2.5 Pro, o3, GPT-4o, Gemini 2.0 Flash 주요 벤치마크: DO Challenge 주요 시스템: Deep Thought 다중 에이전트 시스템


*이 기사는 AI가 생성한 내용으로, 일부 정보가 실제와 다를 수 있습니다. 정확한 확인을 위해 추가적인 검증을 권장드립니다.

Reference

[arxiv] Can AI Agents Design and Implement Drug Discovery Pipelines?

Published:  (Updated: )

Author: Khachik Smbatyan, Tsolak Ghukasyan, Tigran Aghajanyan, Hovhannes Dabaghyan, Sergey Adamyan, Aram Bughdaryan, Vahagn Altunyan, Gagik Navasardyan, Aram Davtyan, Anush Hakobyan, Aram Gharibyan, Arman Fahradyan, Artur Hakobyan, Hasmik Mnatsakanyan, Narek Ginoyan, Garik Petrosyan

http://arxiv.org/abs/2504.19912v1