Waiting
Login processing...

Trial ends in Request Full Access Tell Your Colleague About Jove
Click here for the English version

Genetics

인간 유전체학 및 모델 유기체 유전학 정보를 통합하는 웹 기반 도구인 MARRVEL 탐색

Published: August 15, 2019 doi: 10.3791/59542

Summary

여기서, 우리는 많은 인간과 모형 유기체 데이터베이스에 효율적으로 액세스하고 분석하기 위한 프로토콜을 제시한다. 이 프로토콜은 차세대 염기서열 분석 노력에서 확인된 후보 질병 유발 변이체를 분석하기 위해 MARRVEL의 사용을 보여줍니다.

Abstract

전체 엑솜/게놈 시퀀싱을 통해 인간 유전학자는 질병 표현형과 분리되는 희귀 한 변종을 식별합니다. 특정 변이체가 병원성인지 평가하기 위해 관심 유전자가 유전 질환에 연결되어 있는지 여부, 특정 변이체가 이전에 보고되었는지 여부 및 모델 유기체에서 사용할 수있는 기능 데이터를 결정하기 위해 많은 데이터베이스를 쿼리해야합니다. 인간에서 유전자의 기능에 대한 단서를 제공 할 수있는 데이터베이스. MARRVEL (희귀 변이체 ExpLoration을위한 모델 유기체 집계 자원)는 마우스, 쥐, 얼룩말, 과일 파리, 선충 벌레, 분열을 포함한 7 가지 모델 유기체에서 인간 유전자 및 변이체 및 정형 고 유전자에 대한 원 스톱 데이터 수집 도구입니다. 효모, 그리고 신진 효모. 이 프로토콜에서, 우리는 MARRVEL이 사용될 수 있는 것에 대한 개요를 제공하고, 알려진 질병 유발 유전자에서 알 수 없는 유의성(VUS)의 변이체 또는 불확실한 유의성(GUS)의 변이체가 어떻게 다른 데이터 세트를 사용하여 평가할 수 있는지 논의합니다. 병원성. 이 프로토콜은 관심 있는 변이체의 유무에 관계없이 인간 유전자로 동시에 시작하는 여러 인간 데이터베이스를 검색하여 사용자를 안내합니다. 또한 OMIM, ExAC/gnomAD, 클린바르, 제노2MP, DGV 및 DECHIPHER의 데이터를 활용하는 방법에 대해서도 논의합니다. 더욱이, 우리는 각 인간 유전자와 관련되었던 모형 유기체에 있는 정형교정 후보 유전자, 발현 패턴 및 GO 용어의 목록을 해석하는 방법을 설명합니다. 더욱이, 우리는 제공된 단백질 구조 도메인 주석값을 논의하고 다중 종 단백질 정렬 기능을 사용하여 관심의 변이체가 진화적으로 보존된 도메인 또는 아미노산에 영향을 미치는지 여부를 평가하는 방법을 설명합니다. 마지막으로, 우리는이 웹 사이트의 세 가지 다른 사용 사례에 대해 설명합니다. MARRVEL은 임상 및 기본 연구자 모두를 위해 설계된 쉽게 접근 할 수있는 오픈 액세스 웹 사이트이며 기능 적 연구를위한 실험을 설계하는 출발점 역할을합니다.

Introduction

차세대 염기서열 분석 기술의 사용은 연구 및 임상 유전 실험실모두에서 확대되고 있습니다 1. 전체 엑솜 (WES) 및 전체 게놈 염기서열 분석 (WGS) 분석은 알려진 질병 일으키는 유전자에 있는 알려지지 않은 중요성 (VUS)의 수많은 희소한 이체및 Mendelian 질병과 연관되지 않은 유전자에 있는 이체를 밝힙니다 (GUS: 불확실한 유전자의 유전자) 중요)를 참조하십시오. 임상 서열 보고서에 있는 유전자 그리고 이체의 명부로 제출된, 의학 유전학자는 관심있는 환자에서 보인 특정 표현형에 책임 있을 지도 모르다 어떤 변이체를 평가하기 위하여 추가 정보를 얻기 위하여 다중 온라인 자원을 수동으로 방문해야 합니다 . 이 과정은 시간이 많이 걸리며 그 효능은 개인의 전문 지식에 크게 의존합니다. 몇 가지 지침 논문이2,3,WES 및 WGS의 해석은 변형 분석을위한 표준화 된 방법론이 아직 없기 때문에 수동 큐레이션이 필요합니다. VUS의 해석을 위해, 일반 인구에 있는 이전에 보고된 유전자형 표현형 관계, 상속의 모형 및 eele 주파수에 대한 지식은 귀중하게 됩니다. 또한, 변이체가 중요한 단백질 도메인에 영향을 미치는지, 또는 진화적으로 보존된 잔류물이 병원성 가능성을 증가 또는 감소시킬 수 있는지에 대한 지식. 이 모든 정보를 수집하려면 정보가 월드 와이드 웹을 통해 분산되어 있기 때문에 일반적으로 10-20개의 인간 및 모델 유기체 데이터베이스를 탐색해야 합니다.

유사하게, 특정 유전자 및 통로에 일하는 모형 유기체 과학자는 수시로 인간적인 질병 기계장치에 그들의 사실 인정을 연결에 흥미있고 인간 적인 유전체학 필드에서 생성되는 지식을 이용하고 싶습니다. 그러나 인간 게놈에 관한 데이터 세트의 급속한 확장과 진화로 인해 유용한 정보를 제공하는 데이터베이스를 식별하는 것이 어려웠습니다. 또한, 대부분의 모델 유기체 데이터베이스는 매일 특정 유기체와 함께 일하는 연구자용으로 설계되었기 때문에, 예를 들어 마우스 연구원이 Drosophila 데이터베이스에서 특정 정보를 검색하는 것은 매우 어렵습니다. 그 반대의 경우도 마찬가지입니다. 의학 유전학자에 의해 수행 되는 변이체 해석 검색 과 유사, 유용한 인간 및 기타 모델 유기체 정보를 식별 하는 것은 시간이 많이 걸리고 모델 유기체 연구원의 배경에 크게 의존. MARRVEL (희귀 변형 ExpLoration에 대한 모델 유기체 집계 자원)4 는 워크플로우를 간소화하기 위해 두 사용자 그룹을 위해 설계된 도구입니다.

MARRVEL (http://marrvel.org)은 임상의와 연구자에게 효율적이고 일관된 방식으로 체계적으로 데이터를 수집하는 중앙 집중식 검색 엔진으로 설계되었습니다. 20 개 이상의 공개적으로 사용할 수있는 데이터베이스의 정보를 통해이 프로그램은 사용자가 신속하게 정보를 수집하고 반복 검색없이 많은 수의 인간 및 모델 유기체 데이터베이스에 액세스 할 수 있습니다. 또한 검색 결과 페이지에는 원본 정보 소스에 대한 하이퍼링크가 포함되어 있어 개인이 원시 데이터에 액세스하고 소스에서 제공하는 추가 정보를 수집할 수 있습니다.

VCF 또는 BAM 파일의 형태로 큰 시퀀싱 데이터 입력을 필요로 하는 변형 우선 순위 지정 도구의 대부분과 는 달리, MARRVEL은 모든 웹 브라우저에서 작동 합니다. 인터넷에 연결되어 있는 한 휴대용 장치(예: 스마트폰, 태블릿)와 호환되는 비용으로 사용할 수 있습니다. 우리는 많은 임상의와 연구원이 일반적으로 한 번에 하나 또는 몇몇 유전자 및 이체를 검색할 필요가 있기 때문에 이 형식을 선택했습니다. 필요한 경우 사용자 지정 쿼리 도구를 통해 사용자가 한 번에 수백 개의 유전자와 변종을 큐레이트할 수 있도록 MARRVEL용 일괄 다운로드 및 API(애플리케이션 프로그래밍 인터페이스) 기능을 개발하고 있습니다.

이 프로토콜에서는 다양한 응용 프로그램으로 인해 MARRVEL이 표시하는 다양한 데이터 집합을 탐색하는 방법에 대한 광범위하게 포괄적인 접근 방식을 설명합니다. 특정 사용자의 요구에 맞게 조정된 보다 타겟팅된 예제는 대표 결과 섹션에 설명되어 있습니다. MARRVEL의 출력은 여전히 귀중한 정보를 추출하기 위해 인간의 유전학 또는 모델 유기체중 하나에 배경 지식의 특정 수준을 필요로한다는 것을 주의하는 것이 중요하다. MARRVEL(표 1)에서 큐레이션한 각 원래 데이터베이스의 기능을 설명하는 기본 논문이나열된 표에 독자를 참조합니다. 다음 프로토콜은 세 부분으로 나뉩니다: (1) 검색을 시작하는 방법, (2) MARRVEL 인간 유전학 출력을 해석하는 방법, (3) MARRVEL에서 모델 유기체 데이터를 사용하는 방법. 대표 결과 섹션에서는 보다 집중적이고 구체적인 접근 방식에 대해 설명합니다. MARRVEL은 적극적으로 업데이트되고 있으므로 데이터 원본에 대한 자세한 내용은 현재 웹 사이트의 FAQ 페이지를 참조하십시오. MARRVEL 홈 페이지 하단에 있는 전자 메일 제출 양식을 통해 업데이트 알림을 받으려면 MARRVEL 사용자에게 등록하는 것이 좋습니다.

Subscription Required. Please recommend JoVE to your librarian.

Protocol

1. 검색을 시작하는 방법

  1. 인간 유전자 및 변형 기반 검색을 위해 1.1.1.-1.1.2 단계로 이동합니다. 인간 유전자 기반 검색(변형 입력 없음)의 경우 1.2단계로 이동합니다. 모델 유기체 유전자 기반 검색의 경우 1.3.1.-1.3.2 단계를 참조하십시오.
    1. http://marrvel.org/ MARRVEL 4의 홈 페이지로 이동하십시오. 먼저 인간의 유전자 기호를 입력합니다. 후보 유전자 이름이 각 문자 항목과 함께 입력 상자 아래에 나열되어 있는지 확인합니다. 검색이 부정적인 돌아오는 경우, 사용 된 유전자 기호는 HUGO 유전자 명명위원회 웹 사이트5 (HGNC; https://www.genenames.org/)를 사용하여 최신 상태인지 확인하십시오.
    2. 인간의 변형을 입력합니다. 검색 바는 두 가지 유형의 변형 명명선과 호환됩니다: ExAC 및 GnomAD 6에 이체가 표시되는 방법과 유사한 게놈 위치와 HGVS 지침에 따라 전사체 기반 명명법의 두 가지 유형과 호환됩니다. 이러한 형식의 예는 검색 상자 내의 회색 텍스트로 표시됩니다. 게놈 위치 명명칙의 경우 hg19/GRCh37에 따라 좌표를 사용합니다.
      참고: 검색에서 오류가 반환되는 경우 가장 일반적인 문제는 유전자 기호가 최신 상태이거나 변형 명명칙이 올바르지 않은 것입니다. 이러한 경우 HGNC(https://www.genenames.org/), 뮤탈리저 7(https://www.mutalyzer.nl/) 및 TransVar 8(https://bioinformatics.mdanderson.org/transvar/) 웹 사이트는 오류를 수정하는 데 유용한 리소스입니다. HGNC는 모든 인간 유전자에 대한 공식 유전자 기호와 별칭을 제공합니다.
    3. 유전자 이름이 최신 상태임을 확인한 후에도 오류 메시지가 계속 발생하는 경우 Mutalyzer 및 TransVar을 사용하여 변형 명명법 확인 및 변환을 사용합니다.
    4. HGNC의 매우 최근 유전자 기호 변경과 같은 일부 상황에서는 유전자에 대한 동의어를 사용하여 시도하고 MARRVEL이 데이터 로 인해 정확한 정보를 제공하지 않을 수 있으므로 소스 데이터를 업데이트하기 위해 "피드백"탭을 사용하여 MARRVEL 운영 팀에 문의하십시오. 날짜.
  2. 인간 유전자 기호를 입력하고 인간 변이체 검색 바를 비워 둡니다. 오류가 발생하면 HGNC (https://www.genenames.org/)로 이동하여 공식 유전자 기호를 확인하거나 이전 유전자 기호를 시도하십시오.
    1. 상단 배너(그림 1)에서 모델 생물 검색 탭을 클릭하거나 http://marrvel.org/model 이동합니다. 선택한 모델 유기체를 선택하고 모델 유기체 유전자 기호를 입력합니다. 이름이 자동으로 완료되면 유전자 기호를 클릭한 다음 검색을클릭합니다. 검색 결과가 음수이면 모델 유기체 데이터베이스에 사용되는 공식 유전자기호를 확인합니다(표 1).
    2. 검색 결과가 여전히 음수인 경우 DIOPT(DRSC 통합 직교 예측 도구, https://www.flyrnai.org/cgi-bin/DRSC_orthologs.pl) 및 HCOP(https://www.genenames.org/tools/hcop/)에 액세스하여 올바른 직교 로그가 없는지 평가합니다. 관심있는 유전자. DIOPT는 DRSC(초파리 RNAi 스크리닝 센터)에 의해 실행되는 직교 예측 검색 엔진이며 HCOP는 HGNC에 의해 개발 된 유사한 제품군입니다.
      참고: BLAST(https://blast.ncbi.nlm.nih.gov/Blast.cgi)를 사용한 추가 검색을 사용하면 DIOPT 및 HCOP에 사용되는 예측 알고리즘에서 놓칠 수 있는 직교 로그를 찾을 수 있습니다.
    3. 선택한 인간의 직교를 예측하려면 하단에 있는 MARRVEL을 클릭합니다. DIOPT 점수9 및 모델 유기 체에 인간 유전자에서 최고의 점수를 확인? 인간 유전자의 선택을 위해. 2단계로 진행합니다.
      참고: DIOPT 점수9(https://www.flyrnai.org/cgi-bin/DRSC_orthologs.pl)는 두 유기체에서 한 쌍의 유전자를 서로 직교로 예측하는 수의 교정 기종 예측 알고리즘의 값입니다. 이러한 값과 이 점수를 계산하는 데 사용되는 특정 알고리즘에 대한자세한 내용은 Hu et al 9를 참조하십시오. 때 인간 유전자에서 모델 유기체에 최고 점수? 예,그것은 인간의 유전자가 관심있는 유전자의 진정한 인간 직교 가능성이 더 높지만 예외가있을 수 있음을 나타냅니다, 특히 여러 인간의 유전자가 직교 인 경우 진화 도중 유전자 중복 사건으로 인해 다중 모형 유기체 유전자. 관심유전자가 여러 종에서 발산진화를 겪은 복잡한 유전자 가족의 일원이라면, 사용자는 관심 있는 유전자 패밀리의 광범위한 계통유전학적 분석을 수행한 간행물을 식별하여 가장 많은 것을 식별해야 합니다. 직교 후보 유전자.

2. 유전자 및 변이체 검색을 위해 MARRVEL 인간 유전학 출력을 해석하는 방법

참고: 결과 페이지에는 7개의 휴먼 데이터베이스가 표시됩니다(표1, 그림1). 각 출력 상자에 대해 오른쪽 상단 모서리에 외부 링크 버튼(대각선 화살표가있는 작은상자)이 있으며 자세한 내용은 원본 데이터베이스에 연결됩니다.

  1. 오마이걸(man, https://www.omim.org/)의 첫 번째데이터베이스를 클릭합니다.
    참고 : OMIM은 인간의 유전 질환과 특성에 대한 정보를 집계하고 요약하는 수동으로 선별 된 데이터베이스입니다.
    1. 유전자 및 유전자 생성물에 대해 알려진 내용에 대한 간략한 요약을 위해 OMIM의 인간 유전자 설명 상자를 사용합니다.
    2. 유전자 표현형 관계 상자를 사용하여 이 유전자가 알려진 질병 유발 유전자인지 여부를 결정합니다. 이 상자는 관심 있는 유전자와 수동으로 선별된 알려진 질병 또는 표현형 협회를 제공합니다.
    3. OMIM 상자에서 보고된 Alleles를 사용하여 OMIM이 큐레이터한 병원성 변이체 목록을 얻습니다.
      참고: 새로운 질병 유전자 발견에 관한 간행물의 수동 큐레이션은 OMIM에 나타나는 유전자 질병 협회를 위해 필요하기 때문에, 약간의 시간 지연 및/또는 놓친 간행물은 오해로 이끌어 낼 수 있습니다. 사용자가 PubMed(https://www.ncbi.nlm.nih.gov/pubmed/) 검색을 수행하여 최근 문헌도 살펴보는 것이 좋습니다(4.1.2 참조). OMIM에서 큐레이터 된 추가 정보는 Amberger10,11을참조하십시오.
  2. 클릭엑스AC (주)(엑소메 집계 컨소시엄, http://exac.broadinstitute.org/)6및 노움AD(게놈 응집 데이터베이스, http://gnomad.broadinstitute.org/), 중증 소아 질환을 제외하도록 선택된 사람들의 WES 및 WGS에 기초한 대규모 인구 유전체학 데이터베이스.
    참고 : ExAC는 ~ 60,000 WES를 함유하고 있는 반면, 그놈AD에는 ~120,000 WES 및 ~15,000 WGS가 포함되어 있습니다. ExAC와 gnomAD 모두 제어 인구 데이터베이스로 사용할 수 있습니다., 특히 심한 소아 질환에 대 한, 하지만 그것의 해석주의의 어느 정도 필요. 일반적으로, 그놈AD는 ExAC에 포함 된 대부분의 코호트가 그놈AD에 포함되어 있기 때문에 ExAC의 업데이트 되고 확장 된 버전으로 간주 될 수 있습니다. 그러나 몇 가지 예외가 있기 때문에 (각각 http://exac.broadinstitute.org/about 및 http://gnomad.broadinstitute.org/about 코호트 정보 참조), MARRVEL은 두 소스의 데이터를 표시합니다.
    1. 대조군 유전자 요약 상자를 사용하여 일반 집단에서 기능 상실(LOF) 대말기의 손실을 찾을 확률과 같은 유전자 수준 통계를 얻습니다. 이것은 ExAC에 있는 pLI (LOF 편협의 확률) 점수에게 불리고 특정 유전자를 위한 LOF 대절의 단 하나 사본이 haplo 부족한 기계장치를 통해 지배적인 질병을 일으키는 원인이 될 수 있다는 것을 얼마나 확률이 추론하기 위하여 이용될 수 있습니다.
      참고: 유전자의 pLI 점수를 보는 것은 가치가 있습니다, 특히 de novo 이체와 관련되었던 가혹한 소아 질병으로 제출하는 지배적인 무질서를 취급할 때. 유전자가 0.00의 pLI 점수를 가지고 있는 경우에, 그것은 지배적인 haploinsufficiency 기계장치를 통해 질병을 일으키는 원인이 되기 위하여 이렇게 유전자가 LOF 이체의 높게 관대하다는 것을 의미합니다. 이것은, 그러나, 반드시 기능 (GOF) 또는 지배적인 부정적인 중재된 기계장치의 그밖 지배적인 이득을 배제하지 않으며 질병을 일으키는 원인이 될 수 있습니다. 또한, 열성 질환을 일으키는 유전자는 경력이 일반 인구에서 발견 될 것으로 예상되기 때문에 낮은 pLI 점수를 가질 수있다. 다른 한편으로는, 유전자가 1.00의 pLI 점수가 있는 경우에, 이 유전자의 1개의 사본의 손실이 인간 건강을 위해 유해하다는 것을 가능합니다. DOMINO (https://wwwfbm.unil.ch/domino/)와 같은 웹 사이트에서추가 검색은 또한 지배적 인 장애를 일으키는 특정 유전자에서 변이체의 가능성을 평가하기 위해 조합하여 사용될 수있다.
    2. 다음 두 개의 상자를 사용하여 ExAC 및 gnomAD에 관심 있는 변이체의 대열유전자 주파수를 각각 획득하여 환자가 지배적이거나 열성 질환을 가지고 있는지 여부에 따라 변이체가 병원성일 수 있는지 여부를 해석하는 데 도움을 줍니다. 이 상자는 사용자가 검색을 시작했을 때 변형 정보를 입력할 때만 표시됩니다.
      참고: 열성 질환 시나리오를 가설하고 관심 유전자의 pLI 점수가 낮으면 여기에 나열된 대중 말레 주파수에 주의를 기울여야 합니다. 몇몇 유전학자는 가혹한 열성 승계한 질병을 일으키는 원인이 될 수 있는 병원성 이체를 위한 최대 대립 유전자 주파수로 0.005 내지0.0001의 컷오프 점을 설치할 수 있습니다 2. 다른 한편으로는, 지배적인 질병 시나리오를 가설하는 경우에, 대조군 인구에 있는 동일하거나 유사한 이체를 찾아낼 확률이 낮습니다. 다시 말하지만, 이것은 늦은 개시 무질서를 가진 개별, 온화한 프리젠테이션을 가진 질병, 정신 장애 또는 ExAC/gnomAD 연구원에 의해 가려지지 않는 질병이 아직도 포함될 수 있고 이체가 아직도 지배적인 병원성일 지도 모르기 때문에 주의를 요구합니다 변형. 또한, 이러한 데이터베이스에서 몇 개인에서 발견 소아 조건에 연결 된 변종의 몇 가지 인스턴스가 있었다12,13,14,잠재적으로 불완전 한 침투 또는 체이마 모자이크13 , 15세 , 16. 또한, ExAC 및 gnomAD는 동형 접합 상태에서 발견되는 변이체를 표시하지만, 화합물 이형 이형 구스 상태에서 발견되는 변이체 중 어느 것이 있는지 여부를 나타내지 않습니다. 마지막으로, 이러한 데이터베이스에서 발견되는 일부 변종은 시퀀싱의 기술적 문제(예: 낮은 시퀀스 커버리지, 반복 시퀀스)로 인해 낮은 신뢰도로 태그가 지정됩니다. 이러한 데이터 집합을 보다 자세히 살펴보려면 외부 링크 단추를 사용하여 원래 ExAC 및 gnomAD 웹 사이트를 방문하여 추가 정보를 얻는 것이 좋습니다.
  3. 제노 클릭 2 MP (멘델리안 표현형 브라우저에 유전형, http://geno2mp.gs.washington.edu/Geno2MP/), 멘델리안 유전학에 대한 워싱턴 센터의 워싱턴 대학에서 WES 기반 데이터의 컬렉션. 그것은 에 대 한 포함 9,600 exomes (1/18/2019) 영향을 받는 개인및 영향을 받지않는 친척의 일부 자형화 설명 (그림 1).
    1. 질병 인구 상자를 사용하여 이 코호트에 대한 관심 있는 변이체의 대말레 주파수를 얻습니다.
    2. 유전자 표현형 관계 상자를 사용하여 HPO(인간 표현형 온톨로지)를 얻기 위해 관심있는 변형을 가진 개인에 대한17 항. 이것은 동일 질병이 있을 수 있는 환자를 찾아기 위하여 1개의 많은 방법의 한개입니다.
      참고: 관심 있는 유전자가 환자의 질병과 연관되어 있고 Geno2MP에서 발견되는 일치가 있는 경우, 추가 중요한 정보가 표시되는 것 이상으로 데이터 소스에 존재할 수 있습니다.
      1. 외부 링크 버튼을 제노2MP의 유전자 특이적 페이지로 클릭하고, 환자의 돌연변이(예: 잘못된 감각, LOF)와 유사한 돌연변이를 필터링하고 변이체 목록을 주의 깊게 검토합니다. 높은 CADD18 점수와 변형을 기록하고 HPO 프로필을 클릭합니다. 예를 들어, 20보다 높은 CADD 점수는 해로운 것으로 예상되는 모든 변종의 상위 1% 이내이며, 10보다 높은 CADD 점수는 상위 10% 내에 있습니다. HPO 용어는 인간 표현형에 대한 표준화된 설명을 제공합니다. 여기에서 는 변형이 영향을받는 개인또는 친척에서 확인되었는지 확인하십시오.
      2. 환자와 동일한 장기 시스템에서 영향을 받는 환자에서 변이체가 발견되는 경우, Geno2MP 웹 사이트에 제공된 기능을 사용하여 이러한 사례를 제출한의사에게 연락하기 위해 전자 메일 양식을 사용하는 것이 좋습니다.
        참고 : 모든 의사가 이러한 쿼리에 응답하지 는 않으므로 환자 매치메이킹의 다른 방법을 탐색해야합니다. 같은 질병에 의해 영향을받는 환자의 코호트를 수집하는 다른 방법은 GeneMatcher19 (https://www.genematcher.org/) 및 매치 메이커 교환19,20의 일부인 다른 데이터베이스와 같은 도구를 사용하는 것입니다 . https://www.matchmakerexchange.org/). 매치메이킹21에대한 자세한 내용은 JoVE 문서를 참조하십시오.
  4. 연구원과 임상의가 병원성 의 결정 유무에 관계없이 변종을 제출하는 국립 보건원 (NIH)이 지원하는 ClinVar (https://www.ncbi.nlm.nih.gov/clinvar/)22 데이터베이스를 사용하여 검사를 하십시오. 단일 뉴클레오티드 변이체 (SNV), 작은 인델 및 더 큰 복사 수 변이 (CNV).
    1. 맨 위 행을 사용하여 ClinVar에 보고된 각 변형 유형의 수요약을 검토합니다(그림 1).
    2. ClinVar에서 보고 된 Alleles에서아래 변형 목록을 확인 합니다.
      참고 : 변이체가 초기 검색에 포함 된 경우, 청록색의 강조 된 변종은 관심있는 변이체의 게놈 위치를 포함하는 모든 변이체입니다 [큰 CNV를 포함하여, 종종로 표시되어 있습니다; 게놈 좌표 ... x1 (삭제) 및 ... x3(중복)].
  5. DGV23 (유전체 변이체, http://dgv.tcag.ca/dgv/app/home 데이터베이스) 및 해독24 (Ensembl 자원을 사용하여 인간에서 genomiC varIation 및 표현형의 DatabasE, https://decipher.sanger.ac.uk/), 둘 다 CnV. DGV의 컬렉션은 54,000 명 이상의 개인에서 구조적 변종의 가장 큰 공공 액세스 컬렉션입니다. 이 데이터베이스는 소문에 따르면 건강 한 개인의 샘플을 포함, 확인의 시간에, 최대에서 72 다른 연구. 마찬가지로 DECIPHER에서 표시되는 데이터에는 제어 채우기의 일반적인 변형이 포함됩니다.
    참고: MARRVEL은 DECIPHIER에서 환자 파생 데이터를 표시할 수 있는 권한이 없으므로 사용자는 해독웹 사이트를 직접 방문하여 잠재적으로 병원성 CNV 정보에 액세스하는 것이 좋습니다.
    1. 제어 모집단(DGV Database) 상자의 복사 번호 변형을 클릭하여 관심 유전자를 포함하는 변이체를 구합니다. 복사 번호 변형의 크기, 하위 유형 및 참조와 같은 정보는 동일한 상자에서 찾을 수 있습니다.
    2. 공통 복사 번호 변형(DECIPHER Database) 상자를 클릭하여 관심 있는 변형의 게놈 위치를 포함하는 변이체를 구합니다. 이 정보는 유전자가 통제 개별에서 복제되거나 삭제되는지 결정하는 것을 도울 수 있습니다.
      참고: 관심 있는 유전자가 대조군 집단에 있는 많은 개별에서 삭제되는 경우에, 이 유전자는 LOF 이체의 높게 관대하기 위하여 확률이 높다는 것을 의미합니다. 낮은 pLI 점수 같이, 이것은 이 유전자의 단 하나 사본 손실이 haploinspapiciency 기계장치를 통해 가혹한 질병을 일으키는 원인이 되기 위하여 확률이 낮다는 것을 건의합니다. 이것은, 그러나, 반드시 특정 오인 및 잘림 대틀에 기인한 기능 또는 지배적인 음성 기계장치 (예를 들면, 반모프, hypermorphic 및 neomorphic eeles)의 그밖 지배적인 이득을 배제하지 않습니다.  이러한 데이터에 대한 가능한 제한사항으로는 수집된 데이터의 출처와 방법의 변동, 병원성 CNV의 불완전한 침투에 관한 정보 부족, 개인이 데이터 수집 이후 특정 질병을 개발했는지 여부 등이 있습니다.

3. MARRVEL에서 모델 유기체 데이터를 사용하는 방법

  1. 유전자 함수 표를 사용하여 인간(인간, 쥐, 마우스, 제브라피쉬, 초파리, C 선충,신진 효모 및 핵분열 효모)을 포함한 8가지 모델 유기체에 대한 다음 정보를 얻을 수 있습니다.
    1. 유전자 이름: 각 유전자 이름은 각 모델 유기체 데이터베이스의 유전자 페이지에 하이퍼 링크되기 때문에 이러한 링크를 클릭하여 각 모델 유기체에 사용할 수있는 현상형 정보 및 리소스에 대해 자세히 알아보십시오. 예를 들어 FlyBase25(http://flybase.org/)에는 생성된 모든 대중항, 각각의 표현형 및 공용 스톡 센터에서 각 대식구의 가용성 목록이 있습니다.
    2. PubMed 링크: PubMed 링크를 클릭하여 각 유기체의 관심 유전자와 관련된 간행물 목록으로 이동합니다. 이러한 링크를 사용하지 않고, PubMed에서 직접 인간 유전자를 검색하면 인간 유전자를 참조하기 위해 오래된 유전자 별칭을 사용한 일부 간행물이 누락될 수 있습니다. 유사하게, 모형 유기체 유전자 이름은 역사적으로 변동할 수 있습니다.
    3. 디옵트 (것)중 9 점수: 유전자가 관심 있는 인간 유전자의 직교일 가능성이 있다고 예측하는 얼마나 많은 직교 예측 알고리즘의 점수에 대해 이 컬럼을 확인합니다. 하나는 단단한 직교 후보를 식별하기 위해 합리적인 컷오프로 3 이상의 DIOPT 점수를 사용할 수 있습니다. 그러나, 정품 직교는 제한된 상동성으로 인해 1의 DIOPT 점수가있는 경우가 있습니다. 유전자 기능 표의 상단에, "만 최고의 DIOPT 점수 유전자 표시" 상자를 선택 취소 하 고 일반적으로 반드시 직교 하지 않는 상동 유전자를 포함 하는 모든 후보를 표시 하려면.
    4. 발현: 관심 있는 유전자 또는 단백질이 인간 또는 모델 유기체 데이터베이스에서 발현되는 것으로 보고된 조직 목록을 이 칼럼에서 확인한다. 인간 유전자 및 단백질 발현 데이터는 각각 GTEx26(https://gtexportal.org/) 및 인간 단백질 아틀라스 27(https://www.proteinatlas.org/)으로부터 이다. 일부는 히트 맵을 사용하여 표현 패턴을 표시하는 인간 및 플라이와 같은 팝업 링크가 있는 단추를 가지고 있는 반면, 다른 버튼은 각 모델 유기체 데이터베이스 페이지에 하이퍼링크됩니다.
    5. 유전자 온톨로지 28 (GO) 용어: 실험 증거 코드에 의해 필터링하고 각각의 인간 또는 모델 유기체 데이터베이스로부터 얻는다. "계산 분석 증거 코드"와 "전자 추가 증거 코드"(예측)에 기반한 GO 용어는 표시되지 않습니다. 필요한 경우 각 모델 유기체 웹 사이트를 방문하여 이 정보를 수집하십시오.
    6. 군주 이니셔티브 29(https://monarchinitiative.org/)IMPC30(http://www.mousephenotype.org/)과 같은 다른 링크: 군주 이니셔티브 하이퍼링크를 사용하여 페노그리드 페이지로 이동 특정 인간 유전자에 대해, 알려진 인간 질병및 표현형 이중되는 모델 유기체 돌연변이체에 대한 관심 유전자와 관련된 표현형 간의 빠른 비교를 제공하는 차트. 마우스 유전자가 국제 마우스 표현형 컨소시엄 (IMPC)에 의해 만들어지거나 계획 된 녹아웃 마우스가있는 경우, "IMPC"는 녹아웃 마우스의 표현형과 공공 재고 센터에서의 가용성을 자세히 설명하는 페이지로 연결됩니다.
  2. 인간 단백질 도메인: 인간 유전자 단백질 도메인 박스를 사용하여 인간 유전자의 예측된 단백질 도메인을 얻었다. 데이터는 Pfam(https://pfam.xfam.org/) 및 CCD(보존도메인 데이터베이스, https://www.ncbi.nlm.nih.gov/Structure/cdd/cdd.shtml)를 사용하는 DIOPT에서파생됩니다. 단일 잔류물은 두 소스에 추가된 도메인의 일부 중복으로 인해 두 번 이상 추가될 수 있습니다.
  3. 다중 단백질 정렬 상자를 사용하여 DIOPT 9에 의해 생성된 아미노산다중 정렬을 획득하여 인간(hs), 쥐(rn), 마우스(mm), 얼룩말(dr), 과일 플라이(dm), 웜(ce), 및 효모(sc 및 sp)를 포함한다. 관심있는 아미노산을 강조하기 위해 상자 의 하단으로 스크롤하여 아래 아미노산 번호를 입력하고 관심있는 아미노산이 청록색으로 강조 표시됩니다. 정렬은 DIOPT에 의해 제공되며 MAFFT 정렬기를 사용합니다(아미노산 또는 뉴클레오티드서열에 대한 다중 정렬 프로그램, https://mafft.cbrc.jp/alignment/software/ 31).
    참고: 숫자에 따라 강조 표시된 아미노산이 예상되는 아미노산이 아닌 경우, 정렬에 사용되는 다른 접합 이소폼 때문일 수 있습니다. DIOPT는 원칙적으로 가장 긴 이소폼을 사용하여 이 상자에 표시합니다. 또한 잘 보존되지 않은 유전자 세그먼트의 경우 기본 매개 변수를 사용하여 다종 서열의 정렬이 최적이 아닐 수 있습니다. Clustal 오메가 및 ClustalW/X (http://www.clustal.org/)32와 같은 다른 웹 사이트 및 소프트웨어를 사용하여 정렬 매개 변수와 행렬을 적절하게 최적화하는 것이 좋습니다.

Subscription Required. Please recommend JoVE to your librarian.

Representative Results

인간 유전학자와 모델 유기체 과학자들은 각각 다른 원하는 결과를 가진 별개의 방법으로 MARRVEL을 사용합니다. 다음은 MARRVEL에 사용할 수 있는 세 가지 비네팅입니다.

지배적 인 질병에 있는 이체의 병원성 평가
MARRVEL을 방문하는 대부분의 사용자는 이 웹 사이트를 사용하여 희귀 한 인간 변이체가 특정 질병을 일으킬 수있는 가능성을 분석합니다. 예를 들어, TBX2의 오종(17:59477596 G>A, p.R20Q) 변종은 이형성 특징과 갈라진 구개, 심장 결함, 골격 및 숫자 이상, 갑상선 관련 을 가진 작은 가족에서 상염색체 지배적인 방식으로 분리되는 것으로 나타났습니다. 표현형 및 면역 결함12. 이 현상으로 영향을 받은 어머니와 2명의 아이들은 아버지가 하지 않는 반면, 이체를 전송했습니다. 9 살짜리 아들은 가장 심한 표현형을 가지고 있었지만 36 세의 어머니와 6 살짜리 딸은이 질병의 온화한 형태를 가지고 있었습니다. 이 이체가 가능성이 병원성인지 평가하기 위하여는, http://MARRVEL.org 시작 페이지에 유전자 그리고 이체를 입력해서 MARRVEL 검색을 시작할 수 있습니다. 변이체 검색 바는 "염색체"를 나타내기 위해 원래 임상 보고서에 나열된 경우 변이체 앞에 Chr을 제거해야합니다. 원래 연구의 시간에, 결과 페이지는이 유전자와 관련 된 OMIM 표현형이 없다는 것을 보여주었다, 이 변이체는 그놈AD에서 한 번만 발견 하지만 ExAC에서, ClinVar, 또는 제노2MP. 하나는 한 개별의 이 확인이 병원성 이체인 p.R20Q에 대하여 기록일지도 모르다 생각할지도 모르지만, 가족의 어머니가 질병의 온화한 양식을 전시했다는 것을 주의하는 것이 중요합니다. 1/~150,000명의 개인에서 발견되는 변이체는 실제로 매우 드문 변이체이며 동일한 변이체를 가진 개인의 식별은 감소된 표현력 또는 침투성으로 설명될 수 있다. 유전자 기능 표에서, 유전자가 환자의 표현형에 관한 (GTEx와 단백질 아틀라스를 통해) 인간에 있는 관련 조직에서 표현되는지 확인하는 것이 수시로 도움이 됩니다. 이 경우, 발현 패턴은 환자가 다중 조직에서 표현형을 가지기 때문에 일치하며 유전자는 또한 심장 및 면역 관련 장기를 포함하여 널리 발현된다.

MARRVEL에 표시된 모델 유기체 정보를 바탕으로, 유전자가 C. 예쁜꼬마선충과 초파리에서 인간과 관심아미노산으로 보존된다는 것을 빠르게 알 수 있으며, p.R20은 또한 진화 전반에 걸쳐 매우 보존되어 있습니다. 그림 2(랫트 Tbx2는 정렬에 사용되는 전사체로 인해 이 영역에서 잘 정렬되지 않음). 마우스와 제브라피시의 Phenotypic 정보는 이 유전자가 심장 혈관 시스템, 두개안면/구개 및 숫자를 포함한 여러 조직의 발달 또는 기능에 영향을 미친다는 것을 나타냅니다. 요약하면, 이 데이터는 이 이체가 가능하게 병원성이고 추가 기능적인 연구 결과가 귀중하다는 것을 건의합니다. 유전자와 변이체가 C. 예쁜꼬마선충과 초파리와같은 유기체에서 보존된다는 점을 고려할 때, 무척추동물에서의 기능적 연구는 척추동물 모델 유기체에서 동일한 실험을 수행하는 것에 비해 더 빠르고 저렴할 것이다. 제브라피시, 마우스, 쥐 등. 우리가 이 경우에 대한 기능적 검정을 어떻게 설계하고 수행했는지에 관한 Harnish 외21의 첨부 기사를 참조하십시오12. 이 가족의 질병에 있는 이 유전자/변이체의 관련은 GeneMatcher를 사용하여 동일 유전자에 있는 de novo 오해의 소지가 있는 이체를 가진 겹치는 표현형을 가진 관련없는 8 세 남성 환자의 확인에 의해 더욱 강화되었습니다. 두 패밀리의 변이체는 모두 드로소필라에서실험을 통해 기능적으로 발견되었으며, TBX2에서희귀 한 변이체의 병원성을 더욱 뒷받침합니다. 이 질병은 최근 오마이에서 '척추 이상 및 가변 내분비 및 T 세포 기능 장애(VETD, OMIM #618223)'로 선별되었습니다. TBX2 17:59477596 G>A의 전체 출력은 그림 3을 참조하십시오.

열성 질환에서 변이체의 병원성 평가
지배적인 열성 질병에 있는 인간적인 이체를 분석하는 사이 중요한 다름이 있습니다. 예를 들면, pLI 점수, 경미한 대문자 주파수 및 통제 인구에 있는 삭제의 존재는 어떤 표현형을 드러내기 위하여 2개의 eeles가 필요하기 때문에 보다 적게 중요하게 됩니다.

열성 질환의 분석의 한 예는 여기에 요약되어 있는 윤외 33 및 왕 외 4에 상세히 설명되어 있다. 15세 소녀는 발달 지연, 소두증, 운동 실조, 운동 장애, 근력 저하, 언어 장애, 뇌 이상 및 코퍼스 callosum33의부전 증세를 나타냈다. 수장대, 그녀의 영향을받지 않은 부모, 그리고 영향을받지 않는 형제는 WES를 받았다. proband에 유일하고 인구에서 희소한 이체를 여과한 후에, 13개의 다른 유전자에 있는 이체는 남아 있었습니다. 여기에 설명된 프로토콜에 따라 13개의 후보를 수동으로 필터링 및 분석한 결과, OGDHL에서 기능적 연구를 위한 좋은 후보로서 하나의 특정 변이체의 우선순위가 지정되었다. OGDHL에서 p.S778L의 우선 순위를 정하는 정보의 주요 조각 (10:50946295 G>A) 다른 변이체에 포함: (1) OMIM에서 이전 질병 협회 없음, (2) 제어 인구에서 찾을 수 없는 변이체, (3) 유전자 온톨로지와 관련 된 유전자 미세소관 및 미토콘드리아, 신경 장애에 많은 링크가 있는 두 개의 시스템34,35, (4) 인간 소뇌에서 고도로 발현되는 조직, 이 환자에서 심각하게 영향을 받는 조직, 및 (5) 관심의 변이체가 고도로 영향을 미치는 보존 된 아미노산 (효모에서 인간으로) 촉매 도메인4내에 위치. 이 유전자를 위한 pLI 점수는 0.00입니다 그러나 이것은 우리가 상속의 열성 모드를 의심하고 이 유전자에 있는 해로운 이체의 운대가 일반 인구에서 제출할 수 있기 때문에 이 케이스를 위한 이 이체/유전자의 우선순위에 영향을 미치지 않습니다. OGDHL 10:50946295 G>A의 MARRVEL 출력은 그림 4를 참조하십시오.

병행하여 수행된 모델 유기체 연구는 Ogdh(Nc73EF라고도 함)의 손실, OGDHL의 초초성 직교, 신경계에서 신경 퇴행성 표현형과 일치하는 신경 퇴행성 표현형을 나타낸다는 것을 보여주었습니다. 프로밴드의 신경장애33. Drosophila에 있는 기능적인 연구 결과는 관심의 변이체 (p.S778L)가 단백질 기능에 영향을 미친다는 것을 보여주었습니다, 이 질병을 위한 강한 후보 유전자만들기. 그 이후, 새로운 신경 장애에 연결된 OGDHL의 잠재적인 병원성 변이체에 대한 이 정보는 최근 오미엠(https://www.omim.org/entry/617513)에 통합되었지만 아직 질병 표현형이 할당되지 않았습니다. 2019년 1월 현재 단 한 건의 사례만 보고되었기 때문입니다.

유전 질환과 관련된 관심있는 모델 유기체 유전자의 인간 직교입니까?
많은 모형 유기체 연구원은 관심있는 그들의 유전자의 인간 직교가 유전 질병에 링크를 가질 수 있는지 보기 위하여 흥미있을 지도 모릅니다. 이 예에서, 우리는 플라이 노치(N) 유전자의 인간 직교가 유전질환과 어떤 관련이 있는지 를 검색한다. 이를 위해 '모델 유기체 검색(1.3.1.-1.3.2.)'을 수행하고 종명칭으로'초파리멜라노가스터'를 선택하고,'N'을 모델 유기체 유전자명으로 선정합니다. 이 비행 유전자에 대한 4개의 예측된 인간 직교는 NOTCH1, NOTCH2, NOTCH3 NOTCH4로 결과 창에 표시됩니다. 4개의 유전자는 플라이 N과 각 인간 유전자 사이 상동성의 정도 때문에 다른 DIOPT 점수 (NOTCH1를 위한 10/12, NOTCH2와 NOTCH3를 위한 8/12, NOTCH4를 위한 5/12)가 있습니다. "인간 유전자에서 비행까지의 최고 점수"를 고려하면 4개의 유전자 모두에 대해 "예"로 나열되며, 각 인간 유전자로부터의 역검색은 가장 가능성이 높은 직교 후보로 서플라이 N 유전자를 선택합니다. 실제로, 4개의 인간 노치 유전자는 무척추 동물 혈통(36)으로부터 분할된 후 척추동물 혈통에서 일어난 전체 게놈 복제 사건의 두라운드 동안 단일 노치 유전자로부터 발생한 것으로 생각된다. 각 인간 유전자에 대한 "MARRVEL it" 버튼을 클릭하면 NOTCH1-4에대한 인간 유전자 기반 출력을 얻을 수 있습니다.  각 유전자의 결과 페이지에서, OMIM에 대한 상단 상자는 NOTCH1, 2 및 3이 유전 질환과 연관되어 있지만, NOTCH4는 현재 어떤 인간 질병과도 연관되어 있지 않다는 것을 나타낸다. 노치4의 변이체가 게놈 전체 협회 연구 (GWAS)37,38에근거를 둔 정신 분열증과 연관되어 있는지 여부에 대한 논쟁이 있었다는 점에 유의하십시오. OMIM은 일반적으로 일부 예외(예: APOE, PTPN22)를제외하고 GWAS 데이터를 선별하지 않으므로 이 정보는 OMIM 창에서 사용할 수 없습니다. 유사하게, OMIM은 일반적으로 암 관련 체세포 돌연변이 정보를 큐레이터하지 않기 때문에, 이 유전자에 있는 체세포 돌연변이가 특정 암 모형과 연관되는지에 대한 정보는 몇몇 예외로 열거되지 않을 것입니다 (예를 들면 TP53, RB1, BRCA1). PubMed 또는 Monarch 상자를 클릭하면 OMIM에서 선별되지 않은 질병 관련 논문을 식별할 수 있습니다. 비행 유전자 N 및 인간 유전자 NOTCH4에 대한 전체 MARRVEL 출력에 대한 5를 참조하십시오.

Figure 1
그림 1 . MARRVEL 검색의 대표 출력입니다. 이 특정 예는 "TBX2/17:59477596 G>A"(http://marrvel.org/search/pair/TBX2/17:59477596%20G%3EA)에 대한 유전자/변이체 검색을 보여주는 것입니다. 왼쪽의 사이드바는 데이터 출력을 통한 탐색을 지원합니다. 여기에 "외부 링크" 표지판은 UCSC 게놈 브라우저(https://genome.ucsc.edu/)의 적절한 페이지에 대한 링크를 제공합니다. 상단의 탭을 사용하면 모델 유기체 유전자 기반 검색을 수행하고 MARRVEL에 대한 추가 정보를 얻고 사용자 피드백을 제공할 수 있습니다. '검색 결과' 패널은 이미지에 표시된 소스의 유전자 및 변형 정보를 표시합니다. 이 그림의 더 큰 버전을 보려면 여기를 클릭하십시오.

Figure 2
그림 2 . TBX2에대한 모델 유기체 직교 테이블 및 다종 정렬의 요약. A) MARRVEL은 DIOPT 도구를 기반으로 각 종에 대한 상위 직교 후보를 선택합니다. 예를 들어, DROSOPHILa 바이 유전자에 대해 도시된 10/12의 DIOPT 점수는 DIOPT에 의해 사용되는 12개의 정형외과 예측 프로그램 중 10개를 의미하며, BI는 인간 TBX2의가장 가능성이 높은 비행 직교임을 예측하였다. 유전자의 25%가 인간에 비해 제브라피시에서 복제되기 때문에, MARRVEL은 2개의 마비 유전자(이 경우 tbx2atbx2b)를표시합니다. B) 다종 정렬 창의 스냅샷입니다. 특정 유기체 [이 경우 인간 (hs)]을 선택하고 관심있는 아미노산을 입력함으로써, 청록색의 특정 아미노산을 강조 할 수 있습니다. 이 예에서, 인간 TBX2의 p.R20은 마우스(mm1), 제브라피시 직교(dr1 및 dr2), 초파리(dm1) 및 C. 예쁜꼬마선충(ce1)에서 보존되는 것으로 보인다. 랫트 Tbx2는 다른 종에 비해 잘 정렬되지 않는 것으로 보이며, 대부분 다종 정렬을 수행하기 위해 DIOPT에 의해 사용되는 이소폼으로 인한 것이다. 이 그림의 더 큰 버전을 보려면 여기를 클릭하십시오.

Figure 3
그림 3 : TBX2 17:59477596 G>A의 전체 출력. 이 파일을 다운로드하려면 여기를 클릭하십시오.

Figure 4
그림 4 : OGDHL 10:50946295 G>A용 MARRVEL 출력. 이 파일을 다운로드하려면 여기를 클릭하십시오.

Figure 5
그림 5 : 플라이 유전자 N 및 인간 유전자 NOTCH4에 대한 MARRVEL 출력. 이 파일을 다운로드하려면 여기를 클릭하십시오.

데이터베이스 유형 데이터베이스 이름 URL/데이터베이스 링크 MARRVEL에 포함하기 위한 근거 참조(PMID)
인간 유전학 클린바르 ()의 https://www.ncbi.nlm.nih.gov/clinvar/ ClinVar는 인간의 변이와 표현형 사이의 관계에 대한 보고서의 공개 아카이브입니다, 증거와 함께. 연구원과 임상의에 의해 보고된 해석을 가진 이체는 이체가 병원성일 확률이 얼마나 분석하기 를 위해 귀중합니다. PMID: 29165669
인간 유전학 해독 https://decipher.sanger.ac.uk/ MARRVEL에 표시되는 해독 데이터에는 제어 집단의 일반적인 변형이 포함됩니다. 표시된 데이터에는 입력 변이체의 게놈 위치를 커버하는 구조적 변이체가 포함됩니다. DECIPHER는 또한 영향을받는 개인에 대한 변형 및 자형기능 정보를 포함하지만 자신의 웹 사이트를 통해 직접 액세스 할 수 있습니다. PMID: 19344873
인간 유전학 DGV http://dgv.tcag.ca/dgv/app/home 우리의 지식에, DGV는 54,000 개 이상의 개인에서 구조적 변종의 가장 큰 공공 액세스 컬렉션입니다. 데이터베이스에는 최대 72개의 다른 연구에서 확인 시 건강한 개인의 샘플이 포함되어 있습니다. 이 데이터에 대한 가능한 제한은 병원성 CNV의 불완전한 침투에 관한 정보의 부족을 획득 한 데이터의 소스 및 방법의 변화와 개인이 데이터 수집 후 관련 질병을 개발할 지 여부를 포함합니다. PMID: 24174537
정형외과 예측 디옵트 (것)중 https://www.flyrnai.org/cgi-bin/DRSC_orthologs.pl DIOPT는 관심 있는 인간 유전자의 단백질 서열에 대하여 6개의 모델 유기체에서 가장 잘 예측된 직교의 다중 단백질 서열 정렬을 제공하였다. 정렬은 기능성 단백질 도메인뿐만 아니라 특정 아미노산의 보존에 대한 정보를 제공합니다. PMID: 21880147
인간 유전자/성적 증명서 명명 엔셈블 (동안) https://useast.ensembl.org/ Ensembl 유전자 아이디는 다른 데이터베이스를 연결하는 데 사용됩니다. PMID: 29155950
인간 유전학 엑스AC (주) http://exac.broadinstitute.org/ ExAC는 60,000 개 이상의 엑소메스를 포함하고 있으며, 그놈AD (http://gnomad.broadinstitute.org/) 이외의, 심한 초기 발병 멘델리안 표현형을 가진 개인에 대해 선택된 엑소액의 가장 큰 공공 컬렉션입니다. MARRVEL의 목적을 위해 ExAC 및 gnomAD는 사소한 대중 음절 빈도를 계산하는 최상의 제어 모집단 데이터 세트역할을 합니다. 우리는 ExAC에서 출력의 두 세트를 제공합니다. 첫 번째 출력은 예상 된 대 관찰 된 수의 오감각 및 기능 손실 (LOF) 대말레의 유전자 중심 개요입니다. pLI(LOF 편협 확률)라고 하는 메트릭은 0.00에서 1.00 사이의 범위로 생식 연령 이전의 특정 변이체에 대한 선택적 압력을 반영합니다. pLI 점수 1.00은 이 유전자가 어떤 LOF 이체든지의 아주 관대하다는 것을 의미하고 이 유전자의 haploinsapaiiiiiiis는 인간에 있는 질병을 일으키는 원인이 될 수 있습니다. 두 번째 출력은 특정 변형과 관련된 ExAC의 데이터입니다. ExAC에서 동일한 변형이 표시되면 MARRVEL은 사소한 대열 주파수를 표시합니다. PMID: 27535533
기본 모델 유기체 데이터베이스 플라이베이스 (초파리) http://flybase.org MARRVEL은 여러 모델 유기체 데이터베이스에서 데이터를 수집하고 표시합니다. 우리는 GO 용어를 사용하여 유전자의 분자, 세포 및 생물학적 기능에 대한 요약을 제공합니다. 가장 가능성이 높은 직교는 DIOPT에 의해 파생됩니다. PMID:26467478
모델 유기체 데이터베이스 통합 도구 제네2기능 http://www.gene2function.org/search/ MARRVEL은 DIOPT 및 Gene2Function과 협력하여 "모델 유기체 검색" 기능을 제공합니다. 하이퍼링크는 사용자가 여러 MO 데이터베이스를 통합하고 MARREL이 수행하는 방식과 다른 스타일로 표시하는 웹 사이트에 액세스할 수 있도록 제공됩니다. PMID: 28663344
인간 유전학 제노2MP http://geno2mp.gs.washington.edu/Geno2MP/ Geno2MP는 멘델리안 유전학을 위한 워싱턴 센터의 대학에서 견본의 집합입니다. 그것은 영향을받는 개인과 영향을받지 않은 친척의 ~ 9,650 엑소메스를 포함합니다. 이 데이터베이스는 특정 대미골에 상속 정보의 모드뿐만 아니라 자형증을 연결합니다. 표현형의 경우, 관심 있는 환자의 영향을 받는 장기 시스템을 Geno2MP의 영향을 받는 개인과 비교함으로써, 잠재적인 일치를 찾을 수 있습니다. 대문자, 상속 모드 및 표현형의 일치는 변이체가 병원성일 가능성이 있는 증가된 확률을 제공한다. 그러나, 작은 견본 크기 때문에 부정적인 협회는 반드시 이체의 병원성 우선순위를 감소시키지 않습니다. 관심 있는 환자의 1차 의사에게 연락하는 메커니즘이 원래 소스에 제공된다. 해당/A
인간 유전학 그놈AD http://gnomad.broadinstitute.org/ gnomAd는 각종 질병 특정 및 인구 유전 연구 결과의 한 부분으로 서열된 관련없는 개별에게서 총 123,136엑솜 서열 및 15,496의 전체 게놈 순서를 포함합니다. ExAC 데이터의 상당 부분은 그놈AD로 통합됩니다. MARRVEL에서 우리는 현재 특정 변형과 관련된 인구 주파수를 표시합니다. PMID: 27535533
유전자 온톨로지 고 센트럴 http://www.geneontology.org/ MARRVEL은 각 유전자에 대한 실험 적 증거에서 파생 된 유전자 온톨로지 (GO) 용어 (분자 기능, 세포 구성 요소 및 생물학적 과정)만 표시합니다. "실험 증거 코드" 및 "계산 분석 증거 코드" 및 "전자 추가 증거 코드"(예측)를 기반으로 하는 GO 용어로 필터링됩니다. PMID: 10802651, 25428369
인간 유전자/단백질 발현 GTEx https://gtexportal.org/home/ MARRVEL은 각 유전자의 인간 조직에서 mRNA 및 단백질 발현 패턴을 모두 표시합니다. 발현 패턴은 환자 및/또는 모델 유기체에서 관찰된 표현형에 대한 통찰력을 추가할 수 있습니다. PMID: 29019975, 23715323
인간 유전자 명명칙 HGNC https://www.genenames.org/ HGNC 공식 유전자 기호는 MARRVEL 검색에 사용됩니다. PMID: 27799471
기본 모델 유기체 데이터베이스 IMPC (마우스) http://www.mousephenotype.org/ MARRVEL은 IMPC 웹 사이트에서 마우스 유전자 페이지를 공동 응답하는 하이퍼링크를 제공합니다. IMPC에 의해 만들어진 녹아웃 마우스가 있는 경우에, 연구 결과및 그 결과의 철저한 목록은 공개적으로 유효하게 되고 유전자가 분실될 때 표현형에 통찰력을 제공할 수 있습니다. 일부 정보는 MGI에서 큐레이터하지만 어쩌면 시간 지연이있다. PMID: 27626380
기본 모델 유기체 데이터베이스 MGI (마우스) http://www.informatics.jax.org/ MARRVEL은 여러 모델 유기체 데이터베이스에서 데이터를 수집하고 표시합니다. 우리는 GO 용어를 사용하여 유전자의 분자, 세포 및 생물학적 기능에 대한 요약을 제공합니다. 가장 가능성이 높은 직교는 DIOPT에 의해 파생됩니다. PMID:25348401
모델 유기체 데이터베이스 통합 도구 군주 이니셔티브 https://monarchinitiative.org/ MARRVEL은 군주 이니셔티브에 인간 유전자의 Phenogrid에 대한 링크를 제공합니다. 이 그리드는 모델 유기체의 표현형과 알려진 인간 질병 간의 비교를 제공합니다. PMID: 27899636
인간 변형 명명칙 뮤탈리저 https://mutalyzer.nl/ MARRVEL은 Mutalyzer의 API를 사용하여 다른 변형 명명거를 게놈 위치로 변환합니다. PMID: 18000842
인간 유전학 오미엠 (주) https://omim.org/ 우리가 OMIM에서 그리는 정보의 3개의 중요한 조각은: 유전자 기능, 관련표현형 및 보고된 대틀기입니다. 유전자가 알려진 멘델리안 표현형(# 항목)과 연관되어 있는지 아는 것이 도움이 됩니다. 이 지식이 없는 유전자는 새로운 유전자 발견을 위한 후보입니다. 이 범주인 유전자의 경우, 환자의 표현형이 보고된 질병 및 표현형뿐만 아니라 문헌에 있는 환자의 표현형과 일치하지 않는 경우, 이것은 관심 있는 유전자에 대한 표현형 확장을 제공할 기회를 증가시킨다. PMID: 28654725
기본 모델 유기체 데이터베이스 폼베이스 (핵분열 효모) https://www.pombase.org/ MARRVEL은 여러 모델 유기체 데이터베이스에서 데이터를 수집하고 표시합니다. 우리는 GO 용어를 사용하여 유전자의 분자, 세포 및 생물학적 기능에 대한 요약을 제공합니다. 가장 가능성이 높은 직교는 DIOPT에 의해 파생됩니다. PMID:22039153
문학 Pubmed https://www.ncbi.nlm.nih.gov/pubmed/ MARRVEL은 "유전자"기반 PubMed 검색에 대한 하이퍼 링크를 제공합니다. 이 링크를 클릭하면 이전 유전자 이름과 기호에 따라 관심있는 유전자를 참조하는 생체 의학 논문을 검색 할 수 있습니다. 해당/A
기본 모델 유기체 데이터베이스 RGD (쥐) https://rgd.mcw.edu/ MARRVEL은 여러 모델 유기체 데이터베이스에서 데이터를 수집하고 표시합니다. 우리는 GO 용어를 사용하여 유전자의 분자, 세포 및 생물학적 기능에 대한 요약을 제공합니다. 가장 가능성이 높은 직교는 DIOPT에 의해 파생됩니다. PMID:25355511
기본 모델 유기체 데이터베이스 SGD (신진 효모) https://www.yeastgenome.org/ MARRVEL은 여러 모델 유기체 데이터베이스에서 데이터를 수집하고 표시합니다. 우리는 GO 용어를 사용하여 유전자의 분자, 세포 및 생물학적 기능에 대한 요약을 제공합니다. 가장 가능성이 높은 직교는 DIOPT에 의해 파생됩니다. PMID: 22110037
인간 유전자/단백질 발현 인간 단백질 아틀라스 https://www.proteinatlas.org/ MARRVEL은 각 유전자의 인간 조직에서 mRNA 및 단백질 발현 패턴을 모두 표시합니다. 발현 패턴은 환자 및/또는 모델 유기체에서 관찰된 표현형에 대한 통찰력을 추가할 수 있습니다. PMID: 21752111
기본 모델 유기체 데이터베이스 웜베이스 (C. 예쁜꼬마선충) http://wormbase.org MARRVEL은 여러 모델 유기체 데이터베이스에서 데이터를 수집하고 표시합니다. 우리는 GO 용어를 사용하여 유전자의 분자, 세포 및 생물학적 기능에 대한 요약을 제공합니다. 가장 가능성이 높은 직교는 DIOPT에 의해 파생됩니다. PMID:26578572
기본 모델 유기체 데이터베이스 ZFIN (제브라피시) https://zfin.org/ MARRVEL은 여러 모델 유기체 데이터베이스에서 데이터를 수집하고 표시합니다. 우리는 GO 용어를 사용하여 유전자의 분자, 세포 및 생물학적 기능에 대한 요약을 제공합니다. 가장 가능성이 높은 직교는 DIOPT에 의해 파생됩니다. PMID:26097180

표 1. MARRVEL의 데이터 원본 목록입니다. MARRVEL에서 데이터를 가져오는 모든 데이터베이스가 이 테이블에 나열됩니다. 각 데이터베이스에 대해 데이터베이스 유형, URL/링크, MARRVEL 에 포함할 근거 및 기본 참조가 나열됩니다.

Subscription Required. Please recommend JoVE to your librarian.

Discussion

이 프로토콜의 중요한 단계에는 초기 입력(1.1-1.3 단계)과 출력의 후속 해석이 포함됩니다. 검색 결과가 부정적인 가장 일반적인 이유는 유전자 및/또는 변이체를 설명할 수 있는 여러 가지 방법 때문입니다. MARRVEL은 예약된 방식으로 업데이트되지만 이러한 업데이트로 인해 MARRVEL이 연결하는 여러 데이터베이스 간의 연결이 끊어질 수 있습니다. 따라서, 문제 해결의 첫 번째 단계는 유전자 또는 변이체의 대체 이름이 성공적인 검색 결과로 이어질 지 여부를 항상 확인하는 것입니다. 그래도 해결할 수 없는 경우 http://marrvel.org/message 피드백 양식을 사용하여 개발 팀에 메시지를 보내주십시오.

MARRVEL에 대한 한 가지 제한은 유전자 및 변이체 분석에 필요한 모든 유용한 데이터베이스를 아직 포함하지 않는다는 것입니다. 예를 들어 CADD18과 같은 병원성 예측 알고리즘은 현재 제공되지 않습니다. 유사하게, 단백질 구조 정보 및 단백질-단백질 상호작용 정보는 또한 유전자에서 알려진 질병 유발 이체에 대한 구조적 및 기능적 링크를 제공할 수 있는 것은 현재 MARRVEL에 표시되지 않는다. 우리의 다음 주요 업데이트에서, 우리는 모델 유기체 웹 사이트, IMPC, 군주 이니셔티브 및 게놈 자원의 연합 (AGR, https://www.alliancegenome.org/)에서 더 많은 현상형 정보를 통합하는 것 외에도, MARRVEL에이 정보를 통합 할 계획이다. MARRVEL은 희귀 질환 연구를 용이하게하기 위해 설계되었기 때문에, 프로그램은 현재 생식선 변이체에 초점을 맞추고 체세포 변이체 정보에 대한 액세스를 제공하지 않습니다. 이 프로토콜의 출판을 통해 암 유전학 관련 데이터베이스가 통합되지 않았습니다. MARRVEL이 적극적으로 개발 및 업그레이드되고 있기 때문에 피드백을 높이 평가하며 기존 사용자가 향후 통합되는 추가 데이터베이스에 대해 http://marrvel.org/message 뉴스레터에 가입할 것을 강력히 권장합니다.

MARRVEL의 데이터는 병원성일 수 있는 변이체의 우선 순위를 정하는 데 사용될 수 있지만. 그러나 병원성을 입증하기 위해서는 유사한 유전자형 및 표현형을 가진 다른 환자를 식별하거나 기능적 연구를 수행하여 관심있는 변형이 관련있는 기능적 결과를 가지고 있다는 확실한 증거를 제공해야합니다. 질병 상태. 변형이 모델 유기체에서 실험적으로 조사 할 가치가 있는지 판단하는 데 유용 할 수있는 MARRVEL 외부의 추가 정보에 대한 자세한 내용은 함께 제공되는 기사 Harnish et al21을 참조하십시오. 모형 유기체를 사용하여 인간 변이체를 연구하는 다음 단계를 취하기 위하여는, 인간 유전학자 및 모형 유기체 연구원은 연결하고 협력할 수 있어야 합니다. 매치메이커 교환 컨소시엄의 일부인 GeneMatcher 및 기타 게놈 컨소시엄은 다음 단계를 용이하게 하는 리소스입니다. 사용자가 캐나다에 거주하는 경우 희귀 질환 모델 및 메커니즘 네트워크 (RDMM, http://www.rare-diseases-catalyst-network.ca/)에 등록하여 임상의 및 / 또는 39 명의 공동 작업을 기꺼이 하는 모델 유기체 연구원을 식별 할 수 있습니다. . 일본(J-RDMM, https://irudbeyond.nig.ac.jp/en/index.html), 유럽(RDMM-유럽, http://solve-rd.eu/rdmm-europe/), 호주(호주 기능 유전체학 네트워크: https://www.functionalgenomics.org.au/)는 최근 캐나다 RDMM 모델은 해당 국가/지역 내에서 유사한 협업을 용이하게 합니다. 또한 BioLitMine (https://www.flyrnai.org/tools/biolitmine/web/)과 같은 도구를 사용하여 이전에 관심유전자에 종사한 주요 조사자 중 잠재적 인 협력자를 검색 할 수 있습니다.

마지막으로, MARRVEL 외에도 Gene2Function40 (http://www.gene2function.org/), 군주 이니셔티브29 (https://monarchinitiative.org/) 및 얼라이언스를 포함한 여러 가지 종 간 데이터 마이닝 도구가 있습니다. 게놈 자원 (AGR, https://www.alliancegenome.org/). Gene2Function은 종 간 데이터에 대한 액세스를 제공하고 군주 이니셔티브는 자형학적 비교를 제공하지만, MARRVEL은 인간의 변이체에 더 중점을 두고 인간의 게놈 데이터를 모델 유기체와 연결합니다. AGR은 각 데이터베이스에 의해 축적 된 데이터의 접근성을 높이기 위해 균일 한 방법으로 다른 데이터베이스의 데이터를 통합 하는 6 개의 모델 유기 체 데이터베이스와 유전자 온톨로지 컨소시엄을 포함 하는 이니셔티브. 이러한 리소스는 상호 보완적이며 사용자는 각 데이터베이스의 강점을 이해하여 커뮤니티의 연구자들이 축적한 방대한 양의 지식을 탐색해야 합니다. MARRVEL 개발이 계속됨에 따라 모델 유기체에서 인간의 변이체를 연구하는 것과 관련된 더 많은 데이터베이스를 포함할 계획입니다. MARRVEL의 가장 중요한 목표는 임상의와 연구자 모두 우리가 할 수있는 한 간단한 인터페이스를 유지하면서 유용한 정보를 통합하여 추가 연구를위한 인간의 유전자와 변이체를 분석 할 수있는 쉽게 접근 할 수있는 방법을 제공하는 것입니다.

Subscription Required. Please recommend JoVE to your librarian.

Disclosures

저자는 공개 할 것이 없다.

Acknowledgments

라미 알 오란 박사, 김선영, 연희(클레어) 후, 잉우이 완, 나빈 마노하란, 사시다르 파수푸레티, 아람 콤진, 동수마오, 마이클 왕글러, 샤오투안 차오, 스테파니 모어, 노르베르트 페리몬 의 지원에 감사드립니다. 마벨의 유지 보수. 사만다 엘 딜과 제이 마이클 하니쉬가 이 원고에 입력해 주신 것에 감사드립니다.

MARRVEL의 초기 개발은 NIH 커먼 펀드 (U54NS093793)를 통해 진단되지 않은 질병 네트워크 모델 생물 선별 센터와 NIH 연구 인프라 프로그램 (ORIP)(R24OD022005)을 통해 부분적으로 지원되었습니다. JW는 NIH 유니스 케네디 슈리버 국립 아동 건강 및 인간 개발 연구소 (F30HD094503)와 BCM의 로버트 와 제니스 맥나이어 재단 맥나이어 MD / 박사 학생 장학생 프로그램에 의해 지원됩니다. HJB는 더 일반 의학의 NIH 국립 연구소에 의해 지원 (R01GM067858) 하워드 휴즈 의학 연구소의 조사자입니다. ZL은 일반 의학의 NIH 국립 연구소에 의해 지원 (R01GM120033), 노화의 국립 연구소 (R01AG057339), 허핑턴 재단. SY는 NIH 국립 청각 장애 및 기타 통신 장애 연구소 (R01DC014932), 사이먼스 재단 (SFARI 상 : 368479), 알츠하이머 협회 (새로운 조사자 연구 보조금 : 15-364099), 나만 가족으로부터 추가 지원을 받았습니다. 분자 의학 연구를위한 기초 연구 및 캐롤라인 비스 법률 기금기금.

Materials

Name Company Catalog Number Comments
Human Genetics ClinVar PMID: 29165669 https://www.ncbi.nlm.nih.gov/clinvar/
Human Genetics DECIPHER PMID: 19344873  https://decipher.sanger.ac.uk/
Human Genetics DGV PMID: 24174537 http://dgv.tcag.ca/dgv/app/home
Orthology Prediction DIOPT PMID: 21880147  https://www.flyrnai.org/cgi-bin/DRSC_orthologs.pl
Human Gene/Transcript Nomenclature Ensembl PMID: 29155950  https://useast.ensembl.org/
Human Genetics ExAC  PMID: 27535533 http://exac.broadinstitute.org/
Primary Model Organism Databases FlyBase (Drosophila) PMID:26467478 http://flybase.org
Model Organism Database Integration Tools Gene2Function PMID: 28663344 http://www.gene2function.org/search/
Human Genetics Geno2MP N/A http://geno2mp.gs.washington.edu/Geno2MP/
Human Genetics gnomAD PMID: 27535533 http://gnomad.broadinstitute.org/
Gene Ontology GO Central PMID: 10802651, 25428369  http://www.geneontology.org/
Human Gene/Protein Expression GTEx PMID: 29019975, 23715323  https://gtexportal.org/home/
Human Gene Nomenclature HGNC PMID: 27799471  https://www.genenames.org/
Primary Model Organism Databases IMPC (mouse) PMID: 27626380 http://www.mousephenotype.org/
Primary Model Organism Databases MGI (mouse) PMID:25348401 http://www.informatics.jax.org/
Model Organism Database Integration Tools Monarch Initiative PMID: 27899636 https://monarchinitiative.org/
Human Variant Nomenclature Mutalyzer PMID: 18000842  https://mutalyzer.nl/
Human Genetics OMIM PMID: 28654725 https://omim.org/
Primary Model Organism Databases PomBase (fission yeast) PMID:22039153 https://www.pombase.org/
Literature PubMed N/A https://www.ncbi.nlm.nih.gov/pubmed/
Primary Model Organism Databases RGD (rat) PMID:25355511 https://rgd.mcw.edu/
Primary Model Organism Databases SGD (budding yeast) PMID: 22110037 https://www.yeastgenome.org/
Human Gene/Protein Expression The Human Protein Atlas PMID: 21752111 https://www.proteinatlas.org/
Primary Model Organism Databases WormBase (C. elegans) PMID:26578572 http://wormbase.org
Primary Model Organism Databases ZFIN (zebrafish) PMID:26097180 https://zfin.org/

DOWNLOAD MATERIALS LIST

References

  1. Yang, Y., et al. Clinical whole-exome sequencing for the diagnosis of mendelian disorders. New England Journal of Medicine. 369 (16), 1502-1511 (2013).
  2. Richards, S., et al. Standards and guidelines for the interpretation of sequence variants: a joint consensus recommendation of the American College of Medical Genetics and Genomics and the Association for Molecular Pathology. Genetics in Medicine. 17 (5), 405-424 (2015).
  3. MacArthur, D. G., et al. Guidelines for investigating causality of sequence variants in human disease. Nature. 508 (7497), 469-476 (2014).
  4. Wang, J., et al. MARRVEL: Integration of Human and Model Organism Genetic Resources to Facilitate Functional Annotation of the Human Genome. American Journal of Human Genetics. 100 (6), 843-853 (2017).
  5. Povey, S., et al. The HUGO Gene Nomenclature Committee (HGNC). Human Genetics. 109 (6), 678-680 (2001).
  6. Lek, M., et al. Analysis of protein-coding genetic variation in 60,706 humans. Nature. 536 (7616), 285-291 (2016).
  7. Wildeman, M., van Ophuizen, E., den Dunnen, J. T., Taschner, P. E. Improving sequence variant descriptions in mutation databases and literature using the Mutalyzer sequence variation nomenclature checker. Human Mutation. 29 (1), 6-13 (2008).
  8. Zhou, W., et al. TransVar: a multilevel variant annotator for precision genomics. Nature Methods. 12 (11), 1002-1003 (2015).
  9. Hu, Y., et al. An integrative approach to ortholog prediction for disease-focused and other functional studies. BMC Bioinformatics. 12, 357 (2011).
  10. Amberger, J. S., Hamosh, A. Searching Online Mendelian Inheritance in Man (OMIM): A Knowledgebase of Human Genes and Genetic Phenotypes. Current Protocols in Bioinformatics. 58, 1 (2017).
  11. Amberger, J. S., Bocchini, C. A., Scott, A. F., Hamosh, A. OMIM.org: leveraging knowledge across phenotype-gene relationships. Nucleic Acids Research. 47, 1038-1043 (2019).
  12. Liu, N., et al. Functional variants in TBX2 are associated with a syndromic cardiovascular and skeletal developmental disorder. Human Molecular Genetics. 27 (14), 2454-2465 (2018).
  13. Ropers, H. H., Wienker, T. Penetrance of pathogenic mutations in haploinsufficient genes for intellectual disability and related disorders. European Journal of Medical Genetics. 58 (12), 715-718 (2015).
  14. Shashi, V., et al. De Novo Truncating Variants in ASXL2 Are Associated with a Unique and Recognizable Clinical Phenotype. American Journal of Human Genetics. 100 (1), 179 (2017).
  15. Chen, R., et al. Analysis of 589,306 genomes identifies individuals resilient to severe Mendelian childhood diseases. Nature Biotechnology. 34 (5), 531-538 (2016).
  16. Halvorsen, M., et al. Mosaic mutations in early-onset genetic diseases. Genetics in Medicine. 18 (7), 746-749 (2016).
  17. Kohler, S., et al. The Human Phenotype Ontology in 2017. Nucleic Acids Research. 45 (1), 865-876 (2017).
  18. Rentzsch, P., Witten, D., Cooper, G. M., Shendure, J., Kircher, M. CADD: predicting the deleteriousness of variants throughout the human genome. Nucleic Acids Research. 47 (1), 886-894 (2019).
  19. Sobreira, N., Schiettecatte, F., Valle, D., Hamosh, A. GeneMatcher: a matching tool for connecting investigators with an interest in the same gene. Human Mutation. 36 (10), 928-930 (2015).
  20. Sobreira, N. L. M., et al. Matchmaker Exchange. Current Protocols in Human Genetics. 95 (9), 31-39 (2017).
  21. Harnish, M., Deal, S., Wangler, M., Yamamoto, S. In vivo functional study of disease-associated rare human variants using Drosophila. Journal of Visualized Experiments. , (2019).
  22. Harrison, S. M., et al. Using ClinVar as a Resource to Support Variant Interpretation. Current Protocols in Human Genetics. 89, 11-18 (2016).
  23. MacDonald, J. R., Ziman, R., Yuen, R. K., Feuk, L., Scherer, S. W. The Database of Genomic Variants: a curated collection of structural variation in the human genome. Nucleic Acids Research. 42, Database issue 986-992 (2014).
  24. Firth, H. V., et al. DECIPHER: Database of Chromosomal Imbalance and Phenotype in Humans Using Ensembl Resources. American Journal of Human Genetics. 84 (4), 524-533 (2009).
  25. Thurmond, J., et al. FlyBase 2.0: the next generation. Nucleic Acids Research. 47, 759-765 (2019).
  26. Consortium, G. T. Human genomics. The Genotype-Tissue Expression (GTEx) pilot analysis: multitissue gene regulation in humans. Science. 348 (6235), 648-660 (2015).
  27. Ponten, F., Jirstrom, K., Uhlen, M. The Human Protein Atlas--a tool for pathology. Journal of Pathology. 216 (4), 387-393 (2008).
  28. The Gene Ontology, C. The Gene Ontology Resource: 20 years and still GOing strong. Nucleic Acids Research. , (2018).
  29. Mungall, C. J., et al. The Monarch Initiative: an integrative data and analytic platform connecting phenotypes to genotypes across species. Nucleic Acids Research. 45 (1), 712-722 (2017).
  30. Meehan, T. F., et al. Disease model discovery from 3,328 gene knockouts by The International Mouse Phenotyping Consortium. Nature Genetics. 49 (8), 1231-1238 (2017).
  31. Katoh, K., Rozewicki, J., Yamada, K. D. MAFFT online service: multiple sequence alignment, interactive sequence choice and visualization. Brief Bioinform. , (2017).
  32. Sievers, F., Higgins, D. G. Clustal Omega for making accurate alignments of many protein sequences. Protein Science. 27 (1), 135-145 (2018).
  33. Yoon, W. H., et al. Loss of Nardilysin, a Mitochondrial Co-chaperone for alpha-Ketoglutarate Dehydrogenase, Promotes mTORC1 Activation and Neurodegeneration. Neuron. 93 (1), 115-131 (2017).
  34. Deal, S., Yamamoto, S. Unraveling novel mechanisms of neurodegeneration through a large-scale forward genetic screen in Drosophila. Frontiers in Genetics. 9, (2019).
  35. Matamoros, A. J., Baas, P. W. Microtubules in health and degenerative disease of the nervous system. Brain Research Bulletin. 126, Pt 3 217-225 (2016).
  36. Theodosiou, A., Arhondakis, S., Baumann, M., Kossida, S. Evolutionary scenarios of Notch proteins. Molecular Biology and Evolution. 26 (7), 1631-1640 (2009).
  37. Shayevitz, C., Cohen, O. S., Faraone, S. V., Glatt, S. J. A re-review of the association between the NOTCH4 locus and schizophrenia. American Journal of Medical Genetics. Part B: Neuropsychiatric Genetics. 159 (5), 477-483 (2012).
  38. Wang, Z., et al. A review and re-evaluation of an association between the NOTCH4 locus and schizophrenia. American Journal of Medical Genetics. Part B: Neuropsychiatric Genetics. 141 (8), 902-906 (2006).
  39. Oriel, C., Lasko, P. Recent Developments in Using Drosophila as a Model for Human Genetic Disease. International Journal of Molecular Sciences. 19 (7), (2018).
  40. Hu, Y., Comjean, A., Mohr, S. E., FlyBase, C., Perrimon, N. Gene2Function: An Integrated Online Resource for Gene Function Discovery. G3. 7 (8), Bethesda. 2855-2858 (2017).

Tags

유전학 문제 150 인간 게놈 변이체 우선 순위 모델 유기체 유전학 희귀 및 진단되지 않은 질병 기능 적 유전체학 데이터베이스 통합 번역 연구 의학적 진단 알 수없는 유의의 변이체 유전자 불확실한 의미 웹 기반 도구
인간 유전체학 및 모델 유기체 유전학 정보를 통합하는 웹 기반 도구인 MARRVEL 탐색
Play Video
PDF DOI DOWNLOAD MATERIALS LIST

Cite this Article

Wang, J., Liu, Z., Bellen, H. J.,More

Wang, J., Liu, Z., Bellen, H. J., Yamamoto, S. Navigating MARRVEL, a Web-Based Tool that Integrates Human Genomics and Model Organism Genetics Information. J. Vis. Exp. (150), e59542, doi:10.3791/59542 (2019).

Less
Copy Citation Download Citation Reprints and Permissions
View Video

Get cutting-edge science videos from JoVE sent straight to your inbox every month.

Waiting X
Simple Hit Counter