3bm-GPT는 생성형 AI GPT 모델을 활용해 3차원 단백질과 화합물 리간드 결합에 대한 분석 및 예측 결과를 정확하고 효율적으로 제공하는 인공지능 모델 학습 기법이다. 부족한 결합 정보로도 단백질 혹은 화합물의 특성을 도출해낼 수 있어 연구자들의 편의를 크게 증대할 것으로 예상된다. 또한, 생성형 AI를 결합 정보에 활용해 결합할 수 있는 물질 혹은 타깃 단백질을 탐색하는 데에 응용 가능할 것으로 기대된다.
현재 신테카바이오의 AI 언어 모델 실용화 단계 목표는 두 가지 질문에 대한 답변의 정확도를 높이는 것이다. 첫 번째는 100억 개의 화합물 라이브러리에서 약물 표적에 적합한 후보물질을 챗GPT 형식으로 질문을 하면 결과를 생성하는 것이며, 두 번째는 1억 개의 단백질 구조 라이브러리에서 최적화 후보물질의 선택적 결합(selectivity) 최적화를 위한 유도체를 만드는 것이다.
첫 번째 질문의 대답은 AI 언어 모델을 활용해 후보물질 발굴 단계에서 단백질 타깃 입력으로 100억 개 화합물 라이브러리 중 약 4%(400개)의 유효물질을 포함한 1만 개의 후보물질을 일관성 있게 생성한다. 이후, 신테카바이오의 몰드(mold) 및 물리 기반 파인 튜닝 AI 모델 딥매처(DeepMatcher)를 적용해 400개의 후보물질을 선별한다.
두 번째 질문의 대답은 AI 언어 모델에 약물 최적화(Lead-Optimization) 단계의 후보물질 입력으로 약 1억 개의 단백질 포켓(100만 개의 구조 * 각 100개의 모션 스냅샷) 라이브러리에서 타깃 단백질에는 잘 결합하지만 다른 단백질에는 결합하지 않는 선택적 결합을 위한 약 200개의 신규 작용기를 포함한 유도체를 생성한다. 이후, 파인튜닝용 AI 모델 딥매처를 적용해 40여 개의 최적화 유도체를 생성한다.
이로써 신테카바이오는 △AI 언어 모델 플랫폼 딥매처 △AI 바이오 슈퍼컴센터 △클라우드 플랫폼 등의 핵심역량을 더욱 강화하며, AI 신약개발 효율성을 극대화해 나갈 전망이다.
정종선 신테카바이오 대표이사는 “3bm-GPT 생성형 AI 국내 특허 등록을 통해 기술력 입증 및 언어 모델 기반 신약 발굴 및 최적화에 적용은 국내외 처음이기 때문에, 아직 신약의 불모지 영역인 퍼스트인클라스(first in class) 적용을 목표로 한다”며 “현재 한국과 미국에서 협상이 진행 중인 다수의 연구개발 서비스 프로젝트에 적용해 안정적이고 일관성 있는 신약개발 서비스 편의와 속도를 높일 수 있도록 만전을 기하겠다“고 말했다.
향후, 신테카바이오는 3bm-GPT 기술을 활용한 주요 논문 게재 및 기술 확장, 신규 서비스 기회 발굴에 주력할 예정이다.
김민주 기자
press@healthinnews.co.kr