"기존 데이터 없이 신약 개발" 혁신적 생성형AI 개발

단백질-분자 상호작용 패턴만으로 적합 약물 설계

입력 2024-04-18 08:22:34
- + 인쇄
신규 약물을 발굴하려면 질병의 원인이 되는 타겟 단백질에 특이적으로 결합하는 분자를 찾는 것이 핵심이다.

기존 약물설계 생성형AI는 이미 알려진 특정 단백질의 활성데이터를 학습에 활용하기 때문에 기존 약물과 유사하게 설계하는 경향이 있어 신약 개발에 약점이 됐다.

특히 사업성이 높은 계열 최초 타켓 단백질은 기존 데이터가 거의 없어 생성형AI 활용이 사실상 불가능하다.

KAIST는 화학과 김우연 교수팀이 활성데이터 없이 단백질과 분자의 상호작용을 고려해 타겟 단백질에 적합한 약물을 설계하는 생성형AI를 개발했다고 18일 밝혔다. 

연구팀은 생성형AI가 기존 데이터에 의존하는 것을 극복하고 단백질 구조 정보로만 분자를 설계할 수 있도록 했다.

이를 위해 타겟 단백질 약물 결합부위의 3차원 구조정보를 주형처럼 활용해 여기에 맞는 분자를 주조하듯 설계하는 방식을 활용했다.

단백질-분자 상호작용 패턴 기반 3차원 생성형AI 개념도. KAIST

특히 기존 단백질구조 기반 3차원 생성형AI 모델이 설계한 신규 단백질 대응 분자의 안정성과 결합력이 떨어지는 현상을 개선하는데 초점을 맞췄다.

이에 따라 연구팀은 설계한 분자가 단백질과 안정적으로 결합하기 위한 핵심 역할인 단백질-분자 상호작용에 주목, 생성형AI가 상호작용 패턴을 학습하고 분자 설계에 활용할 수 있게 설계하고 학습시켰다. 

그 결과 연구팀이 개발한 생성형AI 모델은 실제 실험 구조를 수천 개만 학습해도 기존 모델보다 월등한 성능을 발휘했다.

기존 모델은 부족한 학습 데이터를 보완하기 위해 10만~1,000만 개 수준의 가상 데이터를 활용했었다.

이번 연구 제1저자인 정원호 KAIST 화학과 박사과정은 “사전 지식을 인공지능 모델에 사용하는 전략은 상대적으로 데이터가 적은 과학분야에서 적극 사용됐다”며 “사용한 분자 간 상호작용 정보는 약물분자뿐 아니라 다양한 생체분자를 다루는 바이오분야에서 유용하게 적용될 수 있을 것”이라고 말했다.

한편 이번 연구결과는 국제학술지 ‘네이처 커뮤니케이션즈’ 3월 15일자에 게재됐다.

대덕특구=이재형 기자 jh@kukinews.com 기사모아보기