지난 23일(현지 시각) 사람의 Y염색체 염기 서열을 완전히 해독한 연구 논문 2편이 국제학술지 ‘네이처’에 발표됐다. 염색체는 사람의 모든 유전 정보를 담고 있는 물질이다. Y염색체는 남성을 결정하는 성(性)염색체인 XY염색체 중 하나를 말한다. 지난 2003년 인간 게놈 프로젝트를 통해 염색체 23쌍의 지도가 완성됐지만 Y염색체는 해독이 이뤄지지 않아 사실상 공백 상태였다. 이번 해독 연구로 인간의 모든 유전 정보를 담은 유전체 지도의 ‘마지막 퍼즐 조각’이 맞춰지면서 20년 만에 최종 완성본이 나온 것이다.

미국 국립보건원 산하 국립인간게놈연구소(NHGRI) 연구진은 유럽계 남성 1명의 Y염색체를 구성하는 염기 6246만29쌍을 해독했다. 동시에 미국 잭슨의학연구소에서는 아프리카계 21명을 포함해 남성 43명의 Y염색체를 동시에 분석해 비교했다. 이 중 이번에 완전 염기 서열이 해독된 것은 3명이었다.

그래픽=김성규

◇‘미지의 영역’ Y염색체 정복

23쌍의 사람 염색체 염기서열은 지난해까지 대부분 밝혀졌다. 염색체를 이루는 DNA는 A(아데닌), G(구아닌), C(시토신), T(티민) 4가지 염기(핵산)가 두 개씩 결합해 배열된 구조다. 세포 안에서 DNA 염기의 배열 순서에 따라 단백질이 만들어지고, 이 단백질이 우리 몸을 구성한다. 사람은 약 30억 쌍 염기로 이뤄졌고, 약 3만 개의 유전자가 인체의 모든 기능을 수행하는 단백질을 합성한다. 인간 게놈 지도를 통해 우리 몸속 세포가 어떤 순서로 염기 배열이 이뤄졌는지를 알게 됐고 이후에도 미처 해독하지 못한 부분에 대한 추가 연구가 진행됐다. 지난해에는 2억 쌍의 염기 서열 분석이 이뤄져 대부분의 DNA 염기가 해독됐다.

하지만 Y염색체는 절반 이상 염기서열이 알려지지 않았다. Y염색체는 성염색체에서 쌍을 이루는 X염색체를 비롯해 다른 염색체보다 크기가 작지만, 같은 염기서열이 반복되는 부위가 상대적으로 많기 때문이다. 유전자의 염기서열을 알아내려면 같은 DNA를 복제하듯 여러 개 만들고(증폭), DNA를 100~150개 염기 크기로 자른다. 잘려진 조각의 염기 순서를 하나씩 해독한 다음 그 조각들을 순서에 맞게 다시 이어 붙여 전체 염기 서열을 확인하는 식이다. 하지만 이럴 경우 중복된 염기서열에 대해서는 정확히 분석하기 어렵다. 잘라낸 부분이 어느 부분과 연결되는지 알아내기 어렵기 때문이다. 1000개가 넘는 그림 퍼즐을 맞출 때 퍼즐 조각에 그려진 무늬를 보고 맞춰야 하는데 100개 이상의 조각들이 비슷한 그림이라면 맞추기 어려운 것과 같은 원리다.

◇염기 10만개 이상 읽는 ‘나노포어’ 기술

연구진은 이런 문제를 해결하기 위해 영국 바이오기업 옥스퍼드 나노포어 테크놀로지가 개발한 최신 염기서열 분석 기법을 적용했다. 나노포어 기술은 DNA를 미생물의 세포막에 있는 나노미터(nm·1nm는 10억분의 1m) 크기의 작은 구멍(pore)에 통과시켜 염기 서열을 분석하는 방식이다. DNA 가닥을 조각내지 않고 구멍에 죽 넣어서 읽기 때문에 10만개 이상의 염기서열을 한 번에 해독할 수 있다. 최근에는 한 번에 최대 88만 개 염기를 해독했다는 연구 결과가 나오기도 했다. 과거 인간 게놈 프로젝트에 사용된 PCR 방식은 염기를 100~1000개밖에 읽지 못한다. DNA를 합성, 증폭하는 과정에서 일부 손상이 발생해 염기를 잘못 읽을 가능성도 있다.

나노포어 기술은 각 염기의 서로 다른 전기적 성질 차이를 이용해 오류 없이 정확하게 염기 종류를 가려낸다. 우선 미생물의 세포 바깥을 마이너스(-), 세포 안쪽은 플러스(+) 전하를 띠게 만든다. 그리고 단백질로 구성된 세포막의 미세 구멍에 DNA 가닥이 들어가게 한다. 세포 안팎의 전하 차이로 인해 이온(전하를 띤 원자)들도 세포 안으로 들어가는데 이때 작지만 일정한 크기의 전류가 발생한다. 이온이 구멍을 통해 흘러가는 과정에서 DNA의 염기와 충돌한다. 염기마다 띠고 있는 전하량이 다르기 때문에 어떤 염기와 부딪히는지에 따라 전류 변화량도 달라진다. 이온의 전류 흐름이 달라지는 정도에 따라 A ,C, T, G 염기를 구분할 수 있다. 나노포어 기술은 실시간 분석이 가능하기 때문에 코로나 같은 병원체를 탐지하거나 미생물 균주 특성 분석에 사용된다.

◇암·불임 등 남성 질환 치료 도움

연구진은 이 같은 최신 기술을 활용해 Y염색체에 단백질 합성에 관여하는 유전자가 106개 있다는 것을 확인했다. 기존 게놈 프로젝트에서 알아낸 것보다 41개 더 많은 규모다. 이 중 38개가 정자를 만드는 데 관여하는 것으로 추정되는 TSPY라는 유전자가 반복되는 부위다.

미 잭슨의학연구소는 다양한 인구 집단에 속한 남성 43명의 Y염색체를 분석한 결과, TSPY 유전자가 사람마다 숫자가 최대 39개 차이 나는 것을 확인했다. 이는 TSPY 유전자의 개수나 위치가 정자 생산력에 영향을 줄 수 있다는 것을 의미한다. Y염색체 염기 서열 분석은 불임뿐 아니라 암 치료에도 활용될 것으로 기대된다. 지난해 미국 세다시-시나이 메디컬 센터의 댄 데오도레스쿠 박사가 ‘네이처’에 발표한 논문에 따르면 Y염색체가 없는 쥐의 세포에서 암 종양이 더 빨리 성장하는 것으로 나타났다. Y염색체에 문제가 생기면 면역 기능에 관여하는 T림프구가 고갈돼 암 세포가 빨리 커진다는 것이다.

사상 첫 Y염색체 염기 서열 연구에는 한국인 과학자 2명의 활약이 있었다. 잭슨의학연구소의 대표 저자인 찰스리(한국명 이장철)는 이번 네이처 논문의 대표 저자다. 캐나다계 과학자인 리 박사는 지난 2004년 두 쌍이어야 정상인 사람의 유전자가 3쌍 이상이거나 하나 또는 아예 없는 이른바 ‘유전자 복제수 변이’를 처음 밝힌 공로로 노벨상 후보자에 올랐다. 국립인간게놈연구소 Y염색체 해독 논문에 제1저자로 이름을 올린 이아랑 박사는 정자 생산 관련 유전자 부위를 분석했다. 이 박사는 지난 2018년 나노포어 염기 서열 해독 기술을 획기적으로 개선하는 국제 공동 연구에 참여했다.