단백질 안정성 예측의 혁명: JanusDDG의 등장
JanusDDG는 단백질 서열 정보만으로 단일 및 다중 돌연변이의 안정성 변화를 정확하게 예측하는 혁신적인 딥러닝 프레임워크입니다. 양방향 교차 어텐션 메커니즘과 열역학적 제약 조건을 활용하여 기존 방법보다 높은 정확도를 달성, 신약 개발 등 다양한 분야에 기여할 것으로 기대됩니다.

단백질 안정성은 질병 관련 돌연변이를 이해하고 기능성 단백질을 설계하는 데 매우 중요한 요소입니다. 최근 단백질 언어 모델(PLM)의 발전은 계산 단백질 분석에 혁신을 가져왔지만, 돌연변이의 영향을 정확하게 예측하는 것은 여전히 어려운 과제였습니다.
이러한 과제에 도전장을 내민 연구팀이 있습니다! Guido Barducci를 비롯한 9명의 연구자들은 JanusDDG라는 획기적인 딥러닝 프레임워크를 개발했습니다. JanusDDG는 PLM으로부터 얻은 임베딩과 양방향 교차 어텐션 트랜스포머 아키텍처를 활용하여 단일 및 다중 잔기 돌연변이의 ΔΔG (자유 에너지 변화)를 예측합니다. 단순히 예측하는 데 그치지 않고, 반대칭성과 추이성과 같은 기본적인 열역학적 특성을 동시에 준수하도록 제약을 걸어 예측의 정확성을 높였습니다.
JanusDDG의 핵심은 기존의 자기 어텐션과 차별화되는 독창적인 교차 어텐션 메커니즘에 있습니다. JanusDDG는 쿼리(Q)와 값(V)을 야생형과 돌연변이 임베딩의 차이로 계산하고, 키(K)는 두 가지를 번갈아 사용합니다. 이러한 교차된 어텐션 메커니즘을 통해 돌연변이로 인한 변화를 포착하면서도 필수적인 맥락 정보를 보존할 수 있습니다.
실험 결과는 JanusDDG가 단백질 서열 정보만으로 ΔΔG를 예측하는 데 있어 최첨단 성능을 달성했음을 보여줍니다. 단일 및 다중 돌연변이 모두에서 구조 기반 방법과 동등하거나 그 이상의 정확도를 달성했습니다. 이는 단백질 구조 정보 없이도 정확한 예측이 가능하다는 것을 의미하며, 신약 개발 및 단백질 공학 분야에 엄청난 가능성을 열어줄 것으로 기대됩니다. JanusDDG의 등장은 단백질 안정성 예측 분야에 새로운 지평을 열었으며, 앞으로 더욱 발전된 연구를 통해 더욱 정확하고 효율적인 예측 모델이 개발될 것으로 예상됩니다.
JanusDDG는 단순한 기술적 발전을 넘어, 생명과학과 컴퓨터 과학의 융합을 통해 얻을 수 있는 엄청난 잠재력을 보여주는 성공적인 사례입니다.
Reference
[arxiv] JanusDDG: A Thermodynamics-Compliant Model for Sequence-Based Protein Stability via Two-Fronts Multi-Head Attention
Published: (Updated: )
Author: Guido Barducci, Ivan Rossi, Francesco Codicè, Cesare Rollo, Valeria Repetto, Corrado Pancotti, Virginia Iannibelli, Tiziana Sanavia, Piero Fariselli
http://arxiv.org/abs/2504.03278v1