과학 학술지의 양대 산맥인 네이처와 사이언스에 인공지능(AI)으로 단백질 구조 해독 시간을 획기적으로 단축했다는 연구 결과가 나왔다. 사람이 하면 1년도 더 걸리던 연구가 수분, 수시간 단위로 끝난다는 것이다. 과학계는 생명과학 연구와 치료제 개발에 획기적인 전기가 될 것이라고 기대하고 있다.
미국 워싱턴대의 데비이드 베이커 교수와 백민경 박사 연구진은 15일(현지 시각) 사이언스에 단백질의 구조는 물론 단백질 간의 결합 형태까지 예측할 수 있는 AI 프로그램인 로제타폴드(RoseTTAFold)를 공개했다. 같은 날 영국 AI 업체 딥마인드의 데미스 허사비스 대표와 존 점퍼 박사는 네이처에 단백질 구조 해독용 AI인 알파폴드2(AlphaFold2)의 세부 내용을 발표했다.
딥마인드는 알파폴드2는 일반적인 단백질의 입체 구조를 분 단위에 해독할 수 있으며, 아미노산이 2180개 연결된 대형 단백질 구조 역시 예측할 수 있다고 밝혔다. 워싱턴대 연구진은 로제타폴드로 이미 다른 연구자들이 보내온 4500여 종의 단백질 구조를 해독했다.
◇단백질의 3차원 열쇠, 자물쇠 구조 해독
단백질은 화학반응의 촉매인 효소에서부터 바이러스와 싸우는 항체, 신호 물질인 호르몬과 인슐린까지 인체의 모든 생명 현상에 관여한다. 생명체는 유전자 DNA를 구성하는 염기 네 가지가 배치된 순서에 따라 20가지의 아미노산을 다양하게 연결한다. 단백질이 집이라면 DNA는 설계도, 아미노산은 벽돌과 같다.
문제는 단백질이 아미노산 사슬로 있지 않고 접히면서 입체 구조를 형성하는 데 있다. 이래야 마치 열쇠와 자물쇠처럼 여러 단백질들이 서로 결합하면서 생명현상을 좌우한다. 아미노산 사슬들이 서로 접히면서 3차원 구조를 만드는 과정은 워낙 변수가 많아 유전정보만으로는 입체 구조를 예측하기 어려웠다. 대신 과학자들은 x선으로 단백질 결정 구조를 분석했다. 지금까지 이런 방법으로 단백질 10만여 종의 구조가 해독됐지만 이는 수십억 종의 전체 단백질에서 극히 일부분에 그친다.
영국의 딥마인드는 단백질 구조 예측에 AI를 도입해 파란을 일으켰다. 지난해 12월 딥마인드의 AI인 알파폴드2가 단백질 구조 예측 대회에서 과학자들이 실험으로 사전에 밝힌 것과 90% 가까이 일치하는 결과를 얻었다. 당시 사이언스는 “과학 연구의 게임 판도가 바뀌었다”고 했다.
◇AI끼리 내부 경쟁하며 해독 능력 발전
딥마인드 과학자들은 생명체에서 발견된 단백질 2억여 개 중 구조가 확인된 1만7000여 개의 정보를 알파폴드에 입력했다. AI는 이 정보를 토대로 유전정보와 단백질 입체 구조 사이의 연관 관계를 스스로 파악했다. 실험을 하지 않고도 단백질 구조를 알 수 있는 길이 열린 것이다. 실제로 지난해 알파폴드는 10년 동안 밝혀내지 못한 단백질 구조를 30분 만에 풀어냈다.
워싱턴대의 베이커 교수와 백민경 박사는 딥마인드의 연구에 기반해 자체 AI를 개발했다. 미지의 단백질이 주어지면 AI 로제타폴드는 단백질 데이터베이스에서 아미노산 서열이 비슷한 게 있는지 검색한다. 동시에 다른 AI는 단백질 내부에서 아미노산들이 연결되는 형태를 예측하고, 세 번째 AI는 입체 구조를 제시한다. 이 과정이 반복되면서 각각의 AI가 제시한 결과를 개선한다.
◇정확도는 딥마인드, 실용성은 워싱턴대
베이커 교수는 사이언스 인터뷰에서 알파폴드2가 더 정확하다고 인정했다. 하지만 벨기에 헨트대의 사바스 사비데스 교수는 사이언스에 “베이커 교수팀의 AI가 단백질 구조의 핵심과 특질을 더 잘 포착한다”고 평가했다. 로제타폴드가 개별 단백질의 3차원 구조뿐 아니라 여러 단백질의 결합 형태까지 예측한다는 것이다. 연구진에 따르면 전 세계 140여 연구 그룹이 코드 공유 플랫폼 깃허브(GitHub)에서 로제타폴드를 내려받았다.
한편 네이처는 사이언스 논문과 시간을 맞추려고 딥마인드 논문 발표를 서둘러 진행한 것으로 알려졌다. 지난 6월 베이커 교수가 로제타폴드 연구결과를 논문 사전 출판 사이트에 올리자 딥마인드의 허사비스 대표가 알파폴드2의 세부 내용이 논문으로 작성돼 평가 중이라고 소셜미디어에 밝혔다.
백민경 박사는 이날 사이언스 인터뷰에서 “우리 연구가 딥마인드의 성과에 기반을 뒀기 때문에 우리보다 뒤에 논문이 나오지 않은 것은 적절하다”고 평가했다. 백 박사는 서울대에서 박사학위를 받고 현재 워싱턴대에서 박사후 연구원으로 있다.