DNA 정보 집결…'한국형 알파폴드’ 키운다

머니투데이 대전=류준영 기자 2019.12.02 04:00
글자크기

[르포]생명硏 `국가생명연구자원정보센터` 가보니…국내 생물자원 허브로 내년 증설땐 EBI보다 커

DNA 정보 집결…'한국형 알파폴드’ 키운다


바둑계를 평정한 인공지능(AI) ‘알파고’의 다음 공략 대상은 무엇일까. 이를 궁금해하던 과학자들은 지난해 12월 ‘알파 폴드’ 발표를 듣고 “그럴 줄 알았다”는 반응을 보였다. 알파 폴드는 단백질 접힘을 예측하는 알고리즘이다. 세포를 구성하고 생체 내 물질대사를 일으키는 단백질이 제 기능을 하기 위해선 내부 20종의 아미노산이 고차(입체) 구조를 갖춰야 한다. 접힘은 아미노산이 구부러지고 꼬이면서 이런 구조를 만들어가는 과정을 말한다. 단백질 접힘이 정확하게 이뤄지지 않으면 파킨슨병·알츠하이머·치매와 같은 퇴행성 뇌·신경질환을 유발한다. 알파 폴드가 단백질 접힘 예측에 성공한다면 신약 개발에 일대 혁명이 일어날 수 있다.



최근 문재인 대통령이 AI 분야를 국가 차원에서 전략적으로 육성하겠다는 뜻을 밝힌 가운데 국내에서도 ‘한국형 알파 폴드’ 개발을 위한 첫 단추가 채워졌다. 전국 각종 생물 소재와 DNA(유전체) 등 생명연구자원 정보를 한데 모아 분석하는 국내 최대 국가생명연구자원정보센터(KOBIC, 이하 센터)가 지난 29일 한국생명공학연구원(이하 생명연) 내부에 문을 열었다. 이곳에 수집된 한국인 유전체 분석 빅데이터 등 바이오 정보는 정밀의료시장을 타깃으로 한 기술 고도화와 관련 AI 개발을 위해 쓰일 예정이다.

국가생명연구자원정보센터 전경/사진=생명 硏국가생명연구자원정보센터 전경/사진=생명 硏
센터는 약 10만㎡ 부지에 연면적 6205㎡의 3층 건물로 지어졌다. 과학기술정보통신부와 대전시 지원으로 2015년부터 5년간 187억원이 투입됐다. 앞으로 매년 50억원의 운영비가 지원될 예정이다.



정전기 방지 실내화로 갈아신고 센터 1층으로 들어서자 전산 장비를 모니터링하는 99㎡(30평) 정도의 상황실과 함께 최대 3만 코어, 200페타바이트(PB, 1PB=1000조바이트) 규모의 실내 농구장만한 전산 서버실이 펼쳐졌다. 서버·스토리지 장비를 최대 1200대까지 적재할 수 있다. 내년에 장비가 추가 증설되면 영국에 위치한 유럽생물정보학연구소(EBI) 보다 더 큰 의학·유전학 연구 인프라를 갖추게 될 것이란 게 생명연 관계자의 설명이다.

국가생명연구자원정보센터 내부 전산서버실/사진=류준영 기자국가생명연구자원정보센터 내부 전산서버실/사진=류준영 기자
바닥에 설치된 투명창 <br>
<br>
전산서버실의 효과적 냉기순환체계를 위해 바닥이 비어진 상태로 설계됐다/사진=류준영 기자 바닥에 설치된 투명창

전산서버실의 효과적 냉기순환체계를 위해 바닥이 비어진 상태로 설계됐다/사진=류준영 기자
1층 전산서버실을 지나 ㄱ(기역자) 방향으로 나 있는 계단을 내려오자 바닥에 설치된 가로, 세로 각각 50cm 정도인 투명창이 먼저 눈에 들어왔다. 그리고 찬바람이 뒷덜미를 쓱 만지듯 지나갔다. 변익수 생명연 전산팀장은 “안에 보시면 아무것도 없다”며 “이곳 서버·스토리지와 같은 모든 장비들이 바닥에서 60cm 이상 높이에 떠 있다고 보면 된다”고 설명했다. 일반적으로 데이터센터는 케이블 트레이, 네트워크 설비 등을 바닥에 매설하는데 이 센터는 반대로 바닥을 비우고 천정 부근에 설치했다. 변 팀장은 “냉기가 천정과 바닥을 돌며 내부에 오랫동안 남아 순환될 수 있도록 설계한 것”이라며 “상당한 양의 전기를 절감할 수 있다”고 설명했다.

서버·스토리지는 놓인 위치에 따라 빅데이터분석그룹, 백업그룹으로 나눠 관리됐다. 생명연 관계자는 테러 등 외부 침입이나 공격을 받았을 경우를 대비해 생명연 오창 분원에 2차 데이터백업센터를 별도로 운영·관리하고 있다고 귀띔했다.


전국 바이오정보가 총집결된 공간인만큼 최첨단 점검·관리 솔루션이 도입됐다. 이를테면 센터 내 온도·습도·전력에 문제가 일어나면 그 즉시 해당 관리 직원들에게 어떤 문제가 발생했는지를 이메일 및 모바일메신저 카카오톡 등으로 상세히 알린다. 군데군데 거미줄처럼 촘촘히 퍼져 있는 노란색 케이블은 청정소화가스관이다. 내부 화재 발생 시 이 관을 따라 가스를 분사돼 산소 농도를 낮춰 불을 끄는 방식이다. 이와 동시에 재해복구시스템이 자동 가동돼 데이터 처리 작업에 차질이 없도록 했다. 변 팀장은 “센터는 컴퓨팅과 네트워킹, 보안 등 모든 요소가 전산화돼 관리 효율이 매우 높은 편”이라고 말했다.

곳곳마다 설치된 노란색 케이블에서 청정소화가스가 나온다/사진=류준영 기자 곳곳마다 설치된 노란색 케이블에서 청정소화가스가 나온다/사진=류준영 기자
오두병 생명연 센터장(연구전략본부장)은 “바이오 경제시대의 가장 중요한 축은 R&D(연구·개발) 및 기술발전의 원천 재료를 제공하는 생물자원의 확보와 활용”이라며 “센터를 통해 범부처 생명연구자원통합정보체계를 마련해 국가생명연구자원의 선순환 체계를 마련하고, 알파 폴드처럼 AI를 이용해 바이오 빅데이터에서 유용한 정보를 뽑아내는 연구도 추진할 것”이라고 강조했다.

이 기사의 관련기사

TOP