인공지능이 유전자가위 DNA 편집 효율 예측한다

머니투데이 류준영 기자 2020.07.09 12:00
글자크기
예측 프로그램의 개략도교정을 원하는 염기서열을 넣으면 두 가지 예측모델이 각각 염기교정 효율과 가능한 교정결과들의 빈도를 수치화. 이후 두 모델을 결합하여 염기교정 유전자가위가 만들 수 있는 모든 결과물들에 대한 예측을 수행한다/자료=한국연구재단예측 프로그램의 개략도교정을 원하는 염기서열을 넣으면 두 가지 예측모델이 각각 염기교정 효율과 가능한 교정결과들의 빈도를 수치화. 이후 두 모델을 결합하여 염기교정 유전자가위가 만들 수 있는 모든 결과물들에 대한 예측을 수행한다/자료=한국연구재단


국내 연구진이 염기교정 유전자 가위를 적용했을 때 나타날 효율을 미리 예측할 수 있는 인공지능(AI) 프로그램을 개발했다.

한국연구재단은 9일 연세대 약리학교실 김형범 교수 연구팀이 이 같은 연구성과를 거뒀다고 발표했다.

인간이 앓는 유전 질환의 절반 이상은 점돌연변이가 원인이다. 점돌연변이는 유전자(DNA)엔 아데닌(A), 구아닌(G), 시토신(C), 티민(T) 등 특정 순서로 늘어선 네 종류의 염기 중 하나가 바뀌면서 발생하는 돌연변이를 말한다.



이 때문에 발생한 질환은 염기교정 유전자 가위로 치료 가능하다. 기존 유전자가위와 달리 DNA 이중 나선을 절단하지 않고 특정 염기만 치환할 수 있는 기능을 가졌다. 현재 아데닌을 구아닌으로 치환할 수 있는 ‘아데닌 염기교정 유전자가위’와 사이토신을 티민으로 치환할 수 있는 ‘사이토신 염기교정 유전자가위’가 있다.

하지만 이 가위로 원하는 치료 효과를 얻기가 쉽지 않다. 일정 범위 안에 표적 염기가 여러 개 존재한다면 자칫 원하지 않는 염기를 잘라낼 수 있기 때문이다.
인간 점돌연변이 질환에 대한 염기교정 유전자가위 효율을 예측인간 점돌연변이 질환에 대해 염기교정 유전자가위의 염기교정 효율을 예측하여 효율에 따른 분포도. 특히, 예측 프로그램은 진한 빨간 부분(효율 5% 이상, 염기교정 범위 내 2개 이상 A 혹은 C)에 대한 질환에 대한 사용 가능성을 제시, 옅은 파랑(효율 5% 미만, 염기교정 범위 내 단일 A 혹은 C)에 해당하는 질환에는 사용이 어려울 것으로 예측함으로써 염기교정 유전자가위의 대상 질환에 대한 1차적인 선별이 가능하다/자료=한국연구재단인간 점돌연변이 질환에 대한 염기교정 유전자가위 효율을 예측인간 점돌연변이 질환에 대해 염기교정 유전자가위의 염기교정 효율을 예측하여 효율에 따른 분포도. 특히, 예측 프로그램은 진한 빨간 부분(효율 5% 이상, 염기교정 범위 내 2개 이상 A 혹은 C)에 대한 질환에 대한 사용 가능성을 제시, 옅은 파랑(효율 5% 미만, 염기교정 범위 내 단일 A 혹은 C)에 해당하는 질환에는 사용이 어려울 것으로 예측함으로써 염기교정 유전자가위의 대상 질환에 대한 1차적인 선별이 가능하다/자료=한국연구재단
DNA 편집 효율을 일정 수준 이상 유지하려면 다양한 염기교정 유전자 가위를 만들고 무엇보다 다양한 염기교정 결과물들의 빈도를 예측하는 프로그램이 필요하다.



연구팀은 기존에 개발된 유전자 가위 대량검증법을 사용해 염기교정 유전자 가위의 활성 및 교정결과의 빈도를 측정해 대량의 데이터를 생산한 후 딥러닝 분석을 통해 염기교정 결과예측 프로그램을 개발했다.

연구팀은 이 프로그램을 돌려 2만3479개의 점돌연변이 유전 질환 중 염기교정 범위 내 표적 염기가 1개이면서 효율이 5% 이상 높을 것으로 예상돼 유전자편집을 시도해볼 수 있는 질환으로, 낭포성 섬유증 등 3058개의 점돌연변이 유전 질환을 선별해냈다. 또 점돌연변이 유전 질환 가운데 약 1만9505개가 염기교정이 일어날 수 있는 범위에 아데닌 또는 시토신 등 동일 염기가 2개 이상 자리하고 있다는 것도 확인했다.

이번 연구성과는 국제학술지 ‘네이처바이오 테크놀로지’에 게재됐다.

이 기사의 관련기사

TOP