/게티이미지뱅크

북유럽 신화에 등장하는 신의 이름을 딴 ‘노른(Norn) 세포’는 1889년 안데스 산맥을 오른 한 산악가가 산에서 내려와 혈액 검사를 하면서 처음 존재가 알려졌다. 당시 그의 적혈구 수치는 약 42% 급증한 것으로 나타났다. 산소가 희박한 고산지대 활동을 위해, 산소를 운반하는 적혈구가 늘어난 것으로 추정됐다.

과학자들은 “호르몬이 원인일 것”이라는 가설을 세우고, 어떻게 인간의 적혈구 수가 극적으로 변화할 수 있는지 추적했다. 산소가 부족할 때 적혈구 수치를 높이는 호르몬은 그로부터 약 70년 후 소변 여과를 통해 발견됐고, 이 호르몬을 생성하는 신장 세포는 그로부터 50년 이상 지난 뒤에야 확인됐다. ‘노른 세포’로 명명된 이 세포를 인류가 발견하고 이해하는 데까지 120년 넘게 걸린 것이다.

그런데 인공지능(AI)은 수많은 세포 중에서 노른 세포를 단 6주 만에 스스로 찾아냈다. 주인공은 지난해 7월 스탠퍼드대에서 개발한 세포생물학 AI 모델 ‘UCE(Universal Cell Embedding)’다. 이 AI에 연구원들은 수백만개 세포의 화학적·유전적 구성에 대한 기초적인 데이터만 입력했다. ‘어떤 세포가 우리 눈에서 빛을 인식하는지’ ‘어떤 세포가 항체를 생성하는지’ 등에 관한 정보를 전혀 주지 않았음에도 AI는 스스로 세포끼리 유사성과 관계를 찾아내 세포가 인체에 미치는 영향을 밝혀냈다. UCE는 처음 접하는 세포도 척척 구분했고, 이런 과정을 통해 신장에 있는 노른 세포도 밝혀냈다. 스탠퍼드대는 “아무도 노른 세포가 신장에 존재한다는 사실을 AI에게 알려준 적이 없었다”며 “AI의 놀라운 발견”이라고 설명했다.

인간이 아직 규명하지 못한 세포의 신비를 밝혀줄 AI가 속속 등장하고 있다. 토론토대 학자들이 중심이 돼 개발한 scGPT, 하버드대와 MIT(매사추세츠공대) 연구진이 공동 개발한 진포머(Geneformer), 중국과학원이 만든 진컴퍼스(GeneCompass) 등 인간을 대신해 세포의 역할과 관계를 스스로 파악하는 AI가 지난해부터 잇따라 나오고 있다. 이러한 세포생물학 AI는 암과 같은 난치병에 대한 비밀을 밝힐 수 있고, 질병을 치료하는 방법도 알아내는 데 도움을 줄 것으로 기대된다.

그래픽=양진경

진포머는 3000만개의 세포 데이터와 세포생물학에 관한 연구 논문들을 학습한 AI다. 인간의 유전자가 세포에 어떻게 작용하는지 스스로 파악한다. 특정 유형의 심장 세포에서 TEAD4라는 유전자를 차단하면 심장 세포가 심각하게 파괴될 것이라고 예측하는 식이다. 예컨대 심장에 이상이 있는 사람과 건강한 사람의 심장 세포를 진포머에 제시하고 “심장 건강을 위해 어떤 조치를 취해야 하는가?”라고 질문하면, 진포머가 “심장에 작용하는 4가지 유전자 활동을 줄여야 한다”고 답을 내놓는다. 실제로 진포머 조언처럼 일부 유전자를 차단하면 심장 건강이 개선되는 것으로 밝혀졌다.

또 다른 AI 진컴퍼스는 인간과 쥐의 세포 데이터 1억2000만개를 학습해 유전자 발현 양상 등을 추적, 분석한다. 특정 유전자와 세포를 표적으로 삼아 치료하는 약물 개발에 활용되고 있다. scGPT는 세포의 상태와 유형을 예측하는 AI로, 희귀 세포 발굴 및 세포 수명 예측 등에 쓰일 수 있다.

이런 세포생물학 AI들은 인간 언어의 규칙을 찾아내 모사하는 챗GPT와 비슷한 원리다. 인간의 언어를 모사하는 챗GPT와 같은 대규모 언어 모델(LLM)은 인간이 아이를 가르치듯 언어를 가르쳐준 것이 아니다. 방대한 인간 언어 데이터 속에서 AI가 단어와 단어, 문장과 문장의 관계를 스스로 학습해 맥락을 찾아내고 답하는 원리다. 세포생물학 AI는 같은 원리로 인간 유전자와 세포의 관계를 찾아내는 것이다. 이를 통해 인간의 방대한 유전자·세포 연구에서 시간과 비용을 절감하고, 인간이 미처 찾지 못한 새로운 발견을 제시할 수 있는 시대가 온 것이다.

다만 이렇게 급속도로 발전하는 세포생물학 AI에 대한 우려도 나온다. 지난 2월 80여 명의 생물학자와 AI 전문가가 “세포생물학 AI를 규제해야 한다”는 서명 운동에 참여했다. AI의 생물학적 발견이 기존에 없는 생화학 무기를 만드는 데 사용될 수 있다는 우려다. 과학자들은 “AI는 새로운 생물학적 발견을 돕겠지만, 동시에 개인의 생체 정보가 유출되는 부작용이 있을 수도 있다”고 경고했다.