엔비디아, DNA 염기서열 '클라라 파라브릭스'로 7시간만에 중환자 진단

기술

엔비디아, DNA 염기서열 '클라라 파라브릭스'로 7시간만에 중환자 진단

leahloveu 2022. 1. 21. 21:16
728x90
반응형

엔비디아(CEO 젠슨 황)는 스탠퍼드대 의과대학이 주도하는 이니셔티브가 엔비디아 클라라(NVIDIA Clara), 구글 딥베리언트(Google DeepVariant), 옥스퍼드 나노포어 테크놀로지(Oxford Nanopore Technologies) 염기서열 분석(sequencing)을 통해 7시간 반 만에 유전질환을 파악할 수 있게 됐다고 밝혔다.

 


스탠퍼드 대학교의 한 연구팀은 혈액 샘플 채취부터 질병 관련 변종 확인을 위한 전체 게놈 염기서열 분석에 이르는 과정의 모든 단계를 가속화함으로써, 단 몇 시간만에 희귀 발작을 유발하는 유전적 장애가 있는 생후 3개월 된 영아의 병원성 변이를 찾아내고 최종 진단을 내렸다. 이와 동시에 시작한 기존 유전자 패널 분석은 결과를 내놓는 데 2주가 소요됐다.

뉴잉글랜드 의학 저널(New England Journal of Medicine)에 자세히 소개된 이 초고속 염기서열 분석 방법은 신생아의 발작 유형과 항발작 약물에 대한 치료 반응에 관한 인사이트를 제공해 임상의가 뇌전증 케이스를 다루는 데 도움을 줬다.

해당 방법은 가장 빠른 DNA 염기서열 분석 기술로 5시간 2분이라는 기네스 세계 신기록을 세웠다.

스탠퍼드 Uni, 엔비디아, 옥스퍼드 나노포어 테크놀로지, 구글, 베일러 의과Uni., 캘리포니아 Uni. 산타크루즈의 연구원에 의해 개발됐다.

연구진은 구글 클라우드의 비디아 GPU를 이용해 기본 콜링(base calling)과 변이 콜링(variant calling)을 모두 가속화했다. 게놈에서 수백만 개의 변이를 식별하는 과정인 변이 콜링도 엔비디아 클라라 파라브릭스(Parabricks)를 통해 가속화됐다.

 

*클라라 파라브릭스 : 엔비디아의 컴퓨터 유전체학 애플리케이션 

이 논문의 교신 저자이자 스탠퍼드대 의과대학 의학과, 유전학과, 생물의학 데이터과학 교수를 역임하고 있는 유안 애슐리(Euan Ashley) 박사(MB ChB, DPhil)는 오는 22/3/21~24일 온라인 엔비디아 GTC에서 강연 예정

 

특정 질병과 관련된 유전적 변이를 식별하는 것은 모래사장에서 바늘 찾기 같은 문제로, 연구자들은 질병을 유발하는 하나의 변화를 찾기 위해 30억 염기쌍의 게놈을 샅샅이 조사해야 한다.

 



이는 기나긴 과정으로, 일반적인 전체 인간 게놈 염기서열 분석 검사는 6주에서 8주가 걸린다. 심지어 급속 턴어라운드 테스트도 2~3일이 걸린다. 이는 대부분 중환자 치료에 차이를 만들기에는 너무 느리다.

진단 파이프라인을 7-10시간으로 최적화함으로써 임상의는 환자 치료 계획에 활용할 수 있는 유전적 단서를 보다 신속하게 식별할 수 있다. 이번 시범 프로젝트에서는 스탠퍼드 헬스케어(Stanford Health Care)와 루실 패커드 아동 병원 스탠퍼드(Lucile Packard Childrens Hospital Stanford)에서 환자 12명의 게놈 염기서열을 분석했으며, 이 중 대부분은 어린이 환자였다.

 

*게놈(genome) = 유전자(gene)+염색체(chromosome)

1개 세포에 들어 있는 DNA 염기 배열 전체/  인간의 게놈은 30억 염기쌍

연구팀은 5건의 사례에서 의사가 검토하고 심장 이식과 약물 처방을 포함한 임상 결정을 알리는 데 활용되는 진단 변이체를 발견했다.

 

연구진은 샘플 준비 속도를 높이고 옥스퍼드 나노포어의 프로메티온 플로 셀(PromethION Flow Cells)에서 나노포어 염기서열 분석을 통해, 시간당 100기가베이스 이상의 데이터를 생성하는 것을 포함해 파이프라인의 모든 단계를 최적화하는 방법을 발견했다.

 

1. 기본콜링(base calling)

 

염기서열 분석 데이터는 실시간으로 구글 클라우드 컴퓨팅 환경에서 엔비디아 텐서 코어 GPU로 전송되어 기기의 원시 신호를 A, T, C, G 뉴클레오티드 문자열로 바꾸는 프로세스인 기본 콜링(base calling)과 정렬을 한다. 클라우드 GPU 인스턴스에 데이터를 분산하면 지연 시간을 최소화할 수 있다

 

 2. 변이 콜링(variant calling)

다음으로, 과학자들은 유전적 장애를 일으킬 수 있는 DNA 서열 속 작은 변이를 찾아야 했다.

구글과 UC 산타크루즈의 컴퓨터 유전체학 연구소의 협업으로 개발된 파이프라인 페퍼 마진 딥베리언트(PEPPER-Margin-DeepVariant)의 GPU 가속 버전을 사용해 클라라 파라브릭스로 속도를 높였다.

딥베리언트(DeepVariant)는 매우 정확한 변이 콜링(variant calling)을 위해 합성곱 신경망(convolutional neural networks)을 사용한다. 클라라 파라브릭스의 GPU 가속 딥베리언트 생식세포 파이프라인(DeepVariant Germline Pipeline) 소프트웨어는 기본 딥베리언트 인스턴스의 10배 속도로 결과를 제공해 질병을 유발하는 변이체를 식별하는 시간을 단축한다.

----------------------------------------------------------------------------------

결론

 

환자의 게놈 전체 염기서열 분석에 필요 시간 2주에서 5~10시간 으로 초단축

 

*출처: Kbench.com

반응형