MIT선정 혁신 기술 ⑩DNA 인터넷

테크 M 테크M 편집부  | 2015.04.26 05:51

게놈의 글로벌 네트워크 형성으로 의학계 혁신



⑩DNA 인터넷
수많은 게놈으로 이루어진 글로벌 네트워크를 통해 의학계의 차세대 혁신이 일어날 전망이다.
· 혁신 : DNA 데이터베이스 간 교류를 가능케 하는 기술 표준
· 의의 : 수백만 환자들의 치료경험을 바탕으로 한 치료법을 처방 받을 수 있다.
· 키플레이어 - GA4GH
- 구글
- 개인게놈프로젝트


올해 여섯 살 된 노아는 이름을 알 수 없는 병을 앓고 있다. 담당 의료진은 노아와 같은 상태에 있는 사람이 세상에 있는지 알아보기 위해 올해부터 노아의 유전자 정보를 인터넷에서 전송할 예정이다.

같은 유전자를 가진 사람을 찾는다면 큰 도움이 될 수 있다. 노아는 발달장애를 갖고 있고, 보행기를 사용해야 하며 말할 수 있는 단어는 몇 개 되지 않는다. 상태는 점점 악화되고 있다. MRI 결과를 보면 소뇌의 크기가 줄어들고 있기 때문이다. 이스턴온타리오 아동병원의 유전질환 전문의들은 노아의 DNA 분석결과 아데닌, 구아닌, 사이토신, 티민 등으로 이루어진 수백만 염기 중에서 잘못된 부분을 찾아냈다. 이는 치료의 단초가 될 수 있지만, 증상과 DNA의 결함이 유사한 다른 아이를 찾지 못한다면 노아의 유전자에서 어떤 부분이 결정적인지 파악할 수 없다.

지난 1월 토론토의 프로그래머들은 다른 병원과 유전자 정보를 주고받을 수 있는 시스템을 시험하기 시작했다. 여기에 참여하는 마이애미, 볼티모어, 영국 케임브리지 등의 병원에서는 단일 유전자에 매우 드물게 일어나는 변이로 발병하는 멘델유전질환을 가진 아이들을 치료하고 있다. 매치메이커 익스체인지(MatchMaker Exchange)라는 이 시스템은 세계 곳곳의 환자들에 관한 DNA 정보를 자동으로 비교하는 새로운 방법이다.

데이비드 하우슬러 UC 산타크루즈 생물정보학과 교수는 이 프로젝트를 추진한 인물 중 한 명이다. 현재 하우슬러 교수는 게놈 서열분석이 최고의 정보교환 도구인 인터넷과 분리되어 있다는 문제를 해결하려고 노력 중이다. 환자 20만 명 이상의 게놈이 해독되어 있고, 앞으로 그 수가 수백만에 이를 것이기에 이러한 상황은 매우 안타깝다. 하우슬러 교수는 이 같은 게놈의 대규모 비교가 차세대 의학에 결정적 역할을 할 것이며, 지금은 과학자들이 이 과제를 수행할 준비가 덜 되어 있다고 본다. 그는 “신용카드는 세계 어디서나 사용할 수 있지만, 인터넷에서 생명과학 데이터를 찾는 것은 매우 어렵다. 따로 따로 잠겨 있는 미완의 상태”라고 설명한다. 게놈 정보는 하드디스크에 저장된 채 택배로 운반되는 경우가 많다.

하우슬러 교수는 비영리단체 ‘게놈학 및 보건을 위한 글로벌 연합(Global Alliance for Genomics and Health)’ 2013년 설립하고 기술이사로 재직하고 있다. GA4GH라는 복잡한 약자를 사용하는 이 단체는 구글 등 IT대기업을 포함해 수많은 회원사를 두고 있다. 지금까지 GA4GH는 DNA 정보를 인터넷에 전송하기 위한 프로토콜, 응용프로그램 인터페이스(API), 개선된 파일 형식 등을 개발했다. 하지만 GA4GH가 주로 다루는 것은 기술적 문제라기보다 과학자들이 유전자 데이터의 공유를 꺼리고 프라이버시 보호 법규로 인해 환자의 게놈 정보를 인터넷에 공개하는 것을 위험한 행위로 간주하는 사회적 문제라 할 수 있다.

최근 수많은 게놈을 동시에 연구하고 유전자 정보를 진료기록과 대조해야 한다는 압력이 점점 커지고 있다. 노아와 같이 DNA의 염기배열 하나가 잘못되어 병이 생기는 사례를 해결하거나 복잡한 유전자 결함으로 발생하는 질환을 유전학적으로 이해하기 위해서는 게놈 수백만 개 이상을 세밀히 살펴봐야 한다는 게 학계의 중론이다. 현재 단독으로 이만큼 방대한 양의 정보에 접근하거나 이를 수집할 만한 재정적 여력을 가진 연구소는 없다.

하우슬러 교수와 GA4GH에 소속된 연구진은 광범위하게 흩어져 있는 데이터를 통합할 수 있는 P2P 컴퓨터 네트워크에 문제 해결의 실마리가 있다고 본다. 예를 들어 GA4GH의 표준을 사용하면 한 연구자가 다른 병원에 검색을 요청할 때 정보를 어디까지, 누구와 공유할지 선택하는 것이 가능하다. 이러한 통제가 가능하다면 프라이버시에 관한 우려를 상당 부분 해소할 수 있다. 조금 더 복잡한 방식으로는 API가 저장중인 게놈을 다시 분석하는 등의 처리를 수행하도록 데이터베이스에 요청하고 그 결과를 받아볼 수도 있다.

필자가 하우슬러 교수를 만난 날, 그는 빛바랜 하와이풍 셔츠 차림으로 샌디에이고의 한 호텔 수영장에서 야외용 플라스틱 의자에 앉아 회의 중이었다. 호텔에서는 세계 최대의 유전학자 회의가 열릴 예정이었다. 하우슬러 교수는 게놈학이 게놈 프로젝트를 그만큼 영향력 있게 만들었던 개방적 접근법에서 멀어지고 있다고 우려했다. DNA 데이터에 더욱 많은 이들이 접근할 수 있다면 인터넷이 ‘네트워크 효과’를 통해 다양한 상업적 측면을 발전시킨 것과 같이 의학계도 큰 효과를 볼 수 있다는 기대도 덧붙였다. 그렇지 못하면 지나치게 복잡하고 정보 교환이 거의 이루어지지 않는 미국의 병원기록시스템 안에 DNA 데이터가 갇혀 버릴지 모른다.

정보공유를 위한 조치가 시급하다고 주장하는 이유 중 하나는 바로 게놈 데이터의 양이 폭발적으로 증가하고 있다는 사실이다. 가장 규모가 큰 연구소의 경우 1시간당 인간 게놈 2개의 서열분석을 확실히 완료할 수 있다.(최초의 게놈은 서열분석에 약 13년이 걸렸다.) 어림잡아 계산해보면 고속 DNA 서열분석장치를 이용할 경우 올 한 해 동안 세계에서 85PB(페타바이트)의 데이터를 생산할 수 있고, 2019년에는 두 배로 규모가 커지게 된다. 참고로 넷플릭스가 보유한 영화 원본의 용량을 모두 합하면 2.6PB다.

GA4GH의 표준을 기반으로 병원을 위한 오픈소스 소프트웨어를 개발하는 보스턴 소재 스타트업 큐로버스(Curoverse)의 CEO 아담 베리는 ‘이것은 기술적인 문제’라고 말한다. 그는 이렇게 말한다. “엑사바이트 단위에 이르는 데이터가 전 세계에 있는데, 아무도 이를 옮기려 하지 않는다. 이런 데이터를 전부 한 곳에 모아 검색해야 할까? 해답은 데이터 대신 검색의 장소를 이곳저곳으로 옮기는 것이다. 아직 이런 방식을 채택한 업계는 없다. 너무나 어려운 문제지만 인류의 삶을 획기적으로 바꿀 잠재력은 충분하다.”


오늘날 과학자들은 사실상 인간 유전자에서 일어나는 모든 변이를 기록해 그 차이로 어떤 결과가 나타나는지 파악하기 위한 프로젝트에 많은 역량을 쏟고 있다. 사람마다 약 300만 개의 DNA 위치, 다시 말해 유전자 배열 1000개당 1개가 다르다. 이러한 차이는 문제가 되지 않는 경우가 대부분이지만 노아와 같이 안타까운 질환이 발생하는 이유, 또는 평균 이상의 녹내장 발병률이 나타나는 이유를 설명해 줄 단초가 되기도 한다.

가까운 미래에 운이 나빠 암에 걸렸다고 가정해 보자. 의사가 모든 암이 특정 변이에 의해 발생한다는 것을 알고 있다면 종양에 대한 DNA 검사를 처방할 수도 있을 것이다. 환자의 종양과 같은 변이를 가진 모든 사람들에게 사용된 치료제, 치료경과, 생존기간 등을 살펴볼 수 있다면 어떤 치료법이 가장 잘 맞을지도 파악할 수 있다. 이처럼 생명을 살릴 수 있는 정보가 이미 상당량 확보돼도 접근할 수 없다는 게 현재 게놈학계의 비극이다. 다수의 유전자 정보 DB를 호스팅하는 생명공학정보회사 DNA 넥서스의 데이비드 셰이위츠 의학담당이사는 “제약요인은 기술적인 것이 아니라 인간 의지의 문제”라고 말한다.

지난 여름 GA4GH는 비콘(Beacon)이란 기초적 DNA 검색엔진을 운영하기 시작했다. 현재 비콘은 GA4GH의 프로토콜에 따라 이미 공개된 20개의 인간 게놈 DB에 대한 검색기능을 제공한다. 비콘은 한 가지 질문에 대한 예-아니오 식의 답변만 할 수 있다. 예를 들면 ‘1번 염색체의 1,520,301번째 위치가 T인 유전자가 있는가?’라고 질문하면 그에 대한 답을 주는 것이다. 하우슬러 교수는 이렇게 설명한다. “가장 기본적 질문은 ‘이런 변이가 존재하는가’라 될 것이다. 새로운 발견을 했을 때는 이런 변이를 가진 환자가 세계 최초인지를 알고 싶기 때문이다.”

비콘은 구글이 인터넷에 공개한 게놈 수백 개를 포함해 이미 수천 명의 유전자 정보에 접근할 수 있다. GA4GH의 공동설립자로는 얼마 전까지 미국 최대의 대학 DNA 서열분석기관인 MIT-하버드 브로드연구소 부소장으로 재직하다 현재 버텍스제약의 과학부분을 책임지는 데이비드 알트슐러 부사장이 있다. 필자가 브로드연구소에서 그의 사무실을 찾은 날, 화이트보드에는 여러 가계의 유전력을 나타내는 도표가 가득했고 한쪽에는 1990년대를 뒤흔든 음악공유 프로그램 ‘냅스터’의 이름이 파란 글씨로 진하게 적혀 있었다.

알트슐러 부사장이 대규모 유전자 데이터를 연결하려는 데는 그만한 이유가 있다. 그도 학자로서 오랫동안 당뇨병 같은 흔한 질병의 유전적 원인을 찾기 위해 노력했다. 보통 이러한 연구는 환자와 정상인의 DNA를 비교해 가장 흔히 발견되는 차이점을 파악하는 방식으로 이루어졌다. 그런데 유전학자들은 이런 방식으로는 해답을 찾기 어렵다는 사실, 즉 ‘당뇨병 유전자’나 ‘우울증 유전자’는 존재하지 않는다는 것을 깨닫게 되었다. 일반적으로 질병이 하나의 결정적 결함에 의해 발병하지 않으며, 질병의 발병 위험률은 수백 또는 수천 개의 DNA 변이의 조합에 따라 결정된다는 사실을 알게 된 것이다.

이러한 발견으로 커다란 통계적 난제가 발생했다. 지난해 6월 공동저자 300명의 이름으로 발표된 보고서를 브로드연구소는 정신분열증 환자 3만 6989명의 유전자를 연구했다. 정신분열증은 유전 가능성이 높은 질환이지만 연구자들이 찾아낸 108개의 유전자 영역으로는 발병 가능성의 극히 일부만 설명할 수 있었다. 알트슐러 부사장은 이러한 질환의 비밀을 밝히는데 대규모 유전자 연구가 여전히 좋은 방법이라고 믿고 있지만, 이를 위해서는 게놈 수백만 개가 필요할 것으로 본다.

원인을 밝히려는 대상이 흔한 질병이든 희귀한 질병이든 간에 이 같은 산술적인 결론은 분명하다. 따라서 데이터 공유는 더 이상 선택의 문제는 아닌 듯 보인다. 서던캘리포니아대에서 알츠하이머 연구 컨소시엄을 이끌고 있는 아서 토가 연구원은 “유효데이터 대비 무효데이터 비율 때문에 연구 방식에 엄청난 변화가 있을 것”이라고 말한다. “원하는 결과를 얻기 위해서는 환자 1만 명으로는 부족하고, 그 이상이 필요할 것이다. 이제는 과학자들이 필요에 의해 데이터 공유에 나설 것”이라는 설명이다.

물론 공유의 최대 장벽은 프라이버시 보호 문제다. 환자의 DNA 데이터가 보호되는 이유는 지문과 같이 누구의 것인지 식별이 가능하기 때문이며, 관련 의료기록도 개인의 소유이기 때문이다. 어떤 국가에서는 연구 목적으로도 개인정보 유출이 허용되지 않는다. 하지만 하우슬러 교수는 P2P 네트워크를 이용하면 데이터의 이동 없이 접근을 제어할 수 있어 이러한 문제를 피해갈 수 있다고 본다. 유럽과 미국에서는 자신의 게놈 정보를 공유하는 데 절반 이상이 동의한다는 조사 결과가 있다. 학계 일각에서는 페이스북의 프라이버시 보호 설정처럼 각자 무엇을 누구와 공유할 것인가를 결정하고 이후에도 변경할 수 있도록 환자동의서 양식을 유연하게 만들어야 한다고 본다. 대규모 환자인권단체 제네틱얼라이언스의 샤론 테리 대표는 “우리 회원들은 스스로 결정할 수 있기를 원하지만 프라이버시 문제로 크게 걱정하지는 않는다. 무엇보다 이들은 환자이기 때문”이라고 말한다.

데이터를 올바르게 공유하지 못한다면 게놈 혁명이 동력을 잃을 위험이 있다. 일부 연구자들은 이러한 징후가 이미 보인다고 말한다. 노아의 게놈 서열분석 팀을 지휘했던 킴 보이콧 박사에 따르면 연구진은 2010년 연구방법으로 서열분석을 채택한 후 바로 성과를 얻었다. 2011~2013년 사이 일군의 캐나다 유전학자들은 146개 질환에 대해 정확한 원인을 분자 수준으로 밝혀내 진단이 확정되지 않았던 사례의 55%를 해결하기도 했다.

보이콧 박사는 성공률이 이후 감소하는 것으로 보인다고 말한다. 이제 남은 것은 노아가 겪는 것과 같은 난치병뿐이며, 해결될 확률은 다른 질병의 절반에 불과하다. 보이콧 박사는 이렇게 설명한다. “이제 더 이상 동일 증상을 가진 환자 두 명을 찾는 것이 불가능하다. 그래서 데이터 공유가 필요하다. 성공률을 다시 끌어올리려면 더 많은 환자가 있어야 하고, 체계적인 공유가 이루어져야 한다.” 지난 1월 말 필자가 매치메이커 익스체인지가 아직도 일치하는 게놈을 못 찾았냐고 묻자 보이콧 박사는 소프트웨어가 작동을 완전히 마무리하려면 몇 주가 걸릴 수 있다고 설명했다. 그는 노아를 언급하며 이렇게 덧붙였다. “아직도 해결되기를 기다리고 있다. 그 결과가 이 아이에게는 가장 중요한 일이다.”
글 안토니오 레갈라도


▶미래를 여는 테크 플랫폼 '테크엠' 바로가기◀
▶이케아는 가구가 아니다, 사물인터넷의 새 강자다
▶[O2O⑩] 결제솔루션 4대 천왕 삼성, 애플, 구글, 알리바바
▶MIT선정 혁신 기술 ⑥대규모 해수담수화
▶수수료 걱정 날려준 핀테크 기업, 트랜스퍼와이즈
▶[테크&가젯①] 배터리 일체형 샀다면…급속충전·보조배터리

베스트 클릭

  1. 1 "번개탄 검색"…'선우은숙과 이혼' 유영재, 정신병원 긴급 입원
  2. 2 유영재 정신병원 입원에 선우은숙 '황당'…"법적 절차 그대로 진행"
  3. 3 법원장을 변호사로…조형기, 사체유기에도 '집행유예 감형' 비결
  4. 4 '개저씨' 취급 방시혁 덕에... 민희진 최소 700억 돈방석
  5. 5 "통장 사진 보내라 해서 보냈는데" 첫출근 전에 잘린 직원…왜?