Summary

İnsan Genomik ve Model Organizma Genetiği Bilgilerini Entegre Eden Web Tabanlı Bir Araç olan MARRVEL'de Gezinme

Published: August 15, 2019
doi:

Summary

Burada, birçok insan ve model organizma veritabanlarına verimli bir şekilde erişmek ve analiz etmek için bir protokol salıyoruz. Bu protokol, yeni nesil sıralama çalışmalarından tanımlanan hastalığa neden olan aday varyantları analiz etmek için MARRVEL kullanımını göstermektedir.

Abstract

İnsan genetikçiler, bütün eksom/genom dizilimi sayesinde hastalık fenomenilerle ayrıştıran nadir varyantları tanımlarlar. Belirli bir varyantın patojenik olup olmadığını değerlendirmek için, ilgi geninin genetik bir hastalıkla bağlantılı olup olmadığını, belirli varyantın daha önce bildirilip bildirilmediğini ve model organizmada hangi işlevsel verilerin mevcut olduğunu belirlemek için birçok veritabanını sorgulamak gerekir. genin insandaki işlevi hakkında ipuçları verebilecek veritabanları. MARRVEL (Nadir Varyant Patlaması için Model organizma Toplu Kaynaklar) fare, fare, zebra balığı, meyve sineği, nematod solucanı, fizyon dahil olmak üzere yedi model organizmada insan genleri ve varyantları ve bunların ortolog genleri için tek noktadan oluşan bir veri toplama aracıdır. maya ve tomurcuklanan maya. Bu Protokol’de, MARRVEL’in ne için kullanılabileceğine genel bir bakış sunmaktayız ve bilinen bir hastalığa neden olan gende (VUS) bilinmeyen öneme (VUS) veya belirsiz öneme sahip bir genin (GUS) varyantının nasıl kullanılabileceğini değerlendirmek için farklı veri kümelerinin nasıl kullanılabileceğini tartışıyoruz. Patojenik. Bu protokol, bir kullanıcı geni ile başlayan ve ilgi nin bir varyantı olmayan birden fazla insan veritabanını aynı anda arayarak bir kullanıcıya rehberlik edecektir. Ayrıca OMIM, ExAC/gnomAD, ClinVar, Geno2MP, DGV ve DECHIPHER’den gelen verilerin nasıl kullanılacağını tartışıyoruz. Ayrıca, her insan geni ile ilişkili model organizmalarda ortolog aday genlerinin, ifade kalıplarının ve GO terimlerinin bir listesini nasıl yorumlanacağımızı gösteriyoruz. Ayrıca, sağlanan değer protein yapısal etki alanı ek açıklamaları tartışmak ve ilgi bir varyant evrimsel olarak korunmuş etki alanı veya amino asit etkiler olup olmadığını değerlendirmek için birden fazla tür protein hizalama özelliği nasıl kullanılacağını açıklar. Son olarak, bu web sitesinin üç farklı kullanım durumlarını tartışacağız. MARRVEL, hem klinik hem de temel araştırmacılar için tasarlanmış kolay erişilebilir bir açık erişim web sitesidir ve fonksiyonel çalışmalar için deneyler tasarlamak için bir başlangıç noktası olarak hizmet vermektedir.

Introduction

Yeni nesil sıralama teknolojisinin kullanımı hem araştırma hem de klinikgenetik laboratuvarlarda genişlemektedir 1. Bütün eksozum (WES) ve tüm genom dizilemesi (WGS) analizleri, bilinen hastalığa neden olan genlerde bilinmeyen önemi (VUS) ve mendeli bir hastalıkla henüz ilişkili olan genlerdeki varyantları (GUS: belirsiz genler) ortaya koymaktadır. önemi). Klinik dizi raporunda gen lerin ve varyantların bir listesini sunan tıbbi genetikçiler, hangi varyantın hastada görülen belirli bir fenotipten sorumlu olabileceğini değerlendirmek için daha fazla bilgi edinmek için birden fazla çevrimiçi kaynağı el ile ziyaret etmelidir. . Bu süreç zaman alıcıdır ve etkinliği son derece bireyin uzmanlığına bağlıdır. Çeşitli kılavuz kağıtları yayınlanmış olmasına rağmen2,3, WES ve WGS yorumu henüz varyant analizi için standart bir metodoloji olduğu için manuel kürleme gerektirir. VUS’un yorumlanması için, daha önce bildirilen genotip-fenotip ilişkisi, kalıtım şekli ve genel popülasyondaki alel frekansları hakkındaki bilgiler değerli hale gelir. Buna ek olarak, varyantın kritik bir protein etki alanını mı etkilediği veya evrimsel olarak korunmuş bir kalıntının patojenizlik olasılığını artırıp azaltabileceği bilgisi de artabilir veya azaltabilir. Tüm bu bilgileri toplamak için, bilgi World Wide Web’e dağılmış olduğundan, genellikle 10-20 insan ve model organizma veritabanlarında gezinmek gerekir.

Benzer şekilde, belirli genler ve yollar üzerinde çalışan model organizma bilim adamları genellikle bulgularını insan hastalığı mekanizmalarına bağlamakla ilgilenirler ve insan genomik alanında üretilen bilgiden yararlanmak isterler. Ancak, insan genomu ile ilgili veri setlerinin hızla genişlemesi ve evrimi nedeniyle, yararlı bilgiler sağlayan veritabanlarını belirlemek zor olmuştur. Buna ek olarak, çoğu model organizma veritabanları günlük olarak belirli bir organizma ile çalışan araştırmacılar için tasarlanmış olduğundan, çok zordur, örneğin, bir fare araştırmacı için bir Drosophila veritabanında belirli bilgileri aramak için ve tam tersi. Tıbbi genetikçiler tarafından yapılan varyant yorumlama araştırmalarına benzer şekilde, yararlı insan ve diğer model organizma bilgilerinin tanımlanması zaman alıcıdır ve model organizma araştırmacısının arka planına büyük ölçüde bağlıdır. MARRVEL (Nadir Varyant Patlaması için Model organizma Toplu Kaynaklar) 4, her iki kullanıcı grubu için de iş akışlarını kolaylaştırmak için tasarlanmış bir araçtır.

MARRVEL (http://marrvel.org) klinisyenler ve araştırmacılar için verimli ve tutarlı bir şekilde sistematik veri toplayan merkezi bir arama motoru olarak tasarlanmıştır. 20 veya daha fazla kamuya açık veritabanlarından gelen bilgilerle, bu program kullanıcıların hızlı bir şekilde bilgi toplamasına ve yinelemeli aramalar yapmadan çok sayıda insan ve model organizma veritabanlarına erişmesine olanak tanır. Arama sonuç sayfaları, bireylerin ham verilere erişmesine ve kaynaklar tarafından sağlanan ek bilgileri toplamasına olanak tanıyan orijinal bilgi kaynaklarına köprüler de içerir.

VCF veya BAM dosyaları ve genellikle tescilli/ticari yazılım yüklemeleri şeklinde büyük sıralama veri girişi gerektiren varyant önceliklendirme araçlarının çoğu aksine, MARRVEL herhangi bir web tarayıcısında çalışır. İnternete bağlı olduğu sürece ücretsiz olarak kullanılabilir ve taşınabilir cihazlarla (örn. akıllı telefonlar, tabletler) uyumludur. Birçok klinisyen ve araştırmacı genellikle bir seferde bir veya birkaç gen ve varyantları aramak gerekir bu yana biz bu biçimi seçti. MarrveL için toplu indirme ve API (uygulama programlama arabirimi) özellikleri geliştirdiğimizi ve kullanıcıların gerekirse özelleştirilmiş sorgu araçları aracılığıyla bir seferde yüzlerce gen ve varyantı bir seferde küratörlük edebilmelerini sağlayacağımızı unutmayın.

Geniş uygulama yelpazesi nedeniyle, bu protokolde, MARRVEL’in görüntülediğimiz farklı veri kümelerinde nasıl gezineceğiniz konusunda geniş kapsamlı bir yaklaşım açıklayacağız. Belirli kullanıcıların ihtiyaçlarına göre uyarlanmış daha fazla hedeflenen örnek Temsilci Sonuçları bölümünde açıklanacaktır. MarrveL çıktısı hala değerli bilgileri ayıklamak için insan genetiği veya model organizmalar da arka plan bilgisi belirli bir düzeyde gerektirir dikkat etmek önemlidir. Okuyucuları, MARRVEL küratörlüğünde bulunan orijinal veritabanlarının her birinin işlevini açıklayan birincil kağıtları listeleyen tabloya yönlendiririz (Tablo 1). Aşağıdaki protokol üç bölüme ayrılmıştır: (1) Bir aramaya nasıl başlanır, (2) MARRVEL insan genetiği çıktılarının nasıl yorumlanacağı ve (3) MARRVEL’deki model organizma verilerinin nasıl kullanılacağı. Temsilci Sonuçları bölümünde daha odaklı ve özel yaklaşımlar açıklanmıştır. MARRVEL aktif olarak güncellenmektedir, bu nedenle veri kaynakları hakkında ayrıntılı bilgi için lütfen geçerli web sitesinin SSS sayfasına bakın. MARRVEL ana sayfasının alt kısmındaki e-posta gönderimi formu aracılığıyla güncelleme bildirimleri almak için MARRVEL kullanıcılarının kaydolmasını önemle tavsiye ederiz.

Protocol

1. Arama nasıl başlatılalır? İnsan geni ve varyant tabanlı arama için 1.1.1.-1.1.2 adımlarına gidin. İnsan gen tabanlı arama (varyant girişi yok) için adım 1.2’ye gidin. Model organizma gen tabanlı arama için 1.3.1.-1.3.2 adımlarına bakın. http://marrvel.org/ MARRVEL4 ana sayfasına gidin. İnsan gen sembolü girerek başlayın. Aday gen adlarının her karakter girişiyle birlikte giriş kutusunun altında listelendirilmesini sağlayın. Arama negatif çıkars…

Representative Results

İnsan genetikçiler ve model organizma bilim adamları her farklı şekillerde MARRVEL kullanın, her farklı istenilen sonuçlara sahip. Aşağıda MARRVEL için olası kullanımları üç vinyetler vardır. Baskın bir hastalıkta varyantın patojenitesinin değerlendirilmesiMARRVEL ziyaret kullanıcıların çoğu nadir bir insan varyantı belirli bir hastalığa neden olabilir olasılığını analiz etmek için bu web sitesini kullanın. Örneğin, TBX2’de b…

Discussion

Bu protokoldeki kritik adımlar, ilk girişi (adım 1.1-1.3) ve çıktının sonraki yorumunu içerir. Arama sonuçlarının negatif olmasının en yaygın nedeni, bir genin ve/veya varyantın tanımlanabileceği birçok yololmasıdır. MARRVEL zamanlanan bazda güncelleştirilirken, bu güncelleştirmeler MARRVEL’in bağlantı verdiği farklı veritabanları arasındaki kopukluklara neden olabilir. Bu nedenle, sorun gidermedeki ilk adım, genin veya varyantın alternatif adlarının başarılı bir arama sonucuna yol pa…

Disclosures

The authors have nothing to disclose.

Acknowledgements

Dr. Rami Al-Ouran, Seon-Young Kim, Yanhui (Claire) Hu, Ying-Wooi Wan, Naveen Manoharan, Sasidhar Pasupuleti, Aram Comjean, Dongxue Mao, Michael Wangler, Hsiao-Tuan Chao, Stephanie Mohr ve Norbert Perrimon’a gelişim deki desteklerinden dolayı teşekkür ederiz. MARRVEL bakımı. Samantha L. Deal ve J. Michael Harnish’e bu el yazmasına yaptıkları katkıları için minnettarız.

MARRVEL’in ilk gelişimi kısmen NIH Commonfund (U54NS093793) ve NIH Araştırma Altyapı Programları Ofisi (ORIP) (R24OD022005) aracılığıyla Teşhis Edilmemiş Hastalıklar Ağ Modeli Organizmalar Tarama Merkezi tarafından desteklenmiştir. JW NIH Eunice Kennedy Shriver Ulusal Çocuk Sağlığı ve İnsangelişimi Enstitüsü (F30HD094503) ve Robert ve Janice McNair Vakfı McNair MD / Doktora Öğrenci Akademik Programı BCM tarafından desteklenmektedir. HJB, NIH Ulusal Genel Tıp Bilimleri Enstitüsü (R01GM067858) tarafından daha da desteklenir ve Howard Hughes Tıp Enstitüsü’nde araştırmacıdır. ZL, NIH Ulusal Genel Tıp Bilimleri Enstitüsü (R01GM120033), Ulusal Yaşlanma Enstitüsü (R01AG057339) ve Huffington Vakfı tarafından desteklenir. SY, NIH Ulusal Sağırlık ve Diğer İletişim Bozuklukları Enstitüsü (R01DC014932), Simons Vakfı (SFARI Ödülü: 368479), Alzheimer Derneği (Yeni Araştırmacı Araştırma Bursu: 15-364099), Naman Ailesi’nden ek destek aldı. Temel Araştırma Fonu ve Caroline Wiess Hukuk Fonu Moleküler Tıp Araştırma için.

Materials

Human Genetics ClinVar PMID: 29165669 https://www.ncbi.nlm.nih.gov/clinvar/
Human Genetics DECIPHER PMID: 19344873  https://decipher.sanger.ac.uk/
Human Genetics DGV PMID: 24174537 http://dgv.tcag.ca/dgv/app/home
Orthology Prediction DIOPT PMID: 21880147  https://www.flyrnai.org/cgi-bin/DRSC_orthologs.pl
Human Gene/Transcript Nomenclature Ensembl PMID: 29155950  https://useast.ensembl.org/
Human Genetics ExAC  PMID: 27535533 http://exac.broadinstitute.org/
Primary Model Organism Databases FlyBase (Drosophila) PMID:26467478 http://flybase.org
Model Organism Database Integration Tools Gene2Function PMID: 28663344 http://www.gene2function.org/search/
Human Genetics Geno2MP N/A http://geno2mp.gs.washington.edu/Geno2MP/
Human Genetics gnomAD PMID: 27535533 http://gnomad.broadinstitute.org/
Gene Ontology GO Central PMID: 10802651, 25428369  http://www.geneontology.org/
Human Gene/Protein Expression GTEx PMID: 29019975, 23715323  https://gtexportal.org/home/
Human Gene Nomenclature HGNC PMID: 27799471  https://www.genenames.org/
Primary Model Organism Databases IMPC (mouse) PMID: 27626380 http://www.mousephenotype.org/
Primary Model Organism Databases MGI (mouse) PMID:25348401 http://www.informatics.jax.org/
Model Organism Database Integration Tools Monarch Initiative PMID: 27899636 https://monarchinitiative.org/
Human Variant Nomenclature Mutalyzer PMID: 18000842  https://mutalyzer.nl/
Human Genetics OMIM PMID: 28654725 https://omim.org/
Primary Model Organism Databases PomBase (fission yeast) PMID:22039153 https://www.pombase.org/
Literature PubMed N/A https://www.ncbi.nlm.nih.gov/pubmed/
Primary Model Organism Databases RGD (rat) PMID:25355511 https://rgd.mcw.edu/
Primary Model Organism Databases SGD (budding yeast) PMID: 22110037 https://www.yeastgenome.org/
Human Gene/Protein Expression The Human Protein Atlas PMID: 21752111 https://www.proteinatlas.org/
Primary Model Organism Databases WormBase (C. elegans) PMID:26578572 http://wormbase.org
Primary Model Organism Databases ZFIN (zebrafish) PMID:26097180 https://zfin.org/

References

  1. Yang, Y., et al. Clinical whole-exome sequencing for the diagnosis of mendelian disorders. New England Journal of Medicine. 369 (16), 1502-1511 (2013).
  2. Richards, S., et al. Standards and guidelines for the interpretation of sequence variants: a joint consensus recommendation of the American College of Medical Genetics and Genomics and the Association for Molecular Pathology. Genetics in Medicine. 17 (5), 405-424 (2015).
  3. MacArthur, D. G., et al. Guidelines for investigating causality of sequence variants in human disease. Nature. 508 (7497), 469-476 (2014).
  4. Wang, J., et al. MARRVEL: Integration of Human and Model Organism Genetic Resources to Facilitate Functional Annotation of the Human Genome. American Journal of Human Genetics. 100 (6), 843-853 (2017).
  5. Povey, S., et al. The HUGO Gene Nomenclature Committee (HGNC). Human Genetics. 109 (6), 678-680 (2001).
  6. Lek, M., et al. Analysis of protein-coding genetic variation in 60,706 humans. Nature. 536 (7616), 285-291 (2016).
  7. Wildeman, M., van Ophuizen, E., den Dunnen, J. T., Taschner, P. E. Improving sequence variant descriptions in mutation databases and literature using the Mutalyzer sequence variation nomenclature checker. Human Mutation. 29 (1), 6-13 (2008).
  8. Zhou, W., et al. TransVar: a multilevel variant annotator for precision genomics. Nature Methods. 12 (11), 1002-1003 (2015).
  9. Hu, Y., et al. An integrative approach to ortholog prediction for disease-focused and other functional studies. BMC Bioinformatics. 12, 357 (2011).
  10. Amberger, J. S., Hamosh, A. Searching Online Mendelian Inheritance in Man (OMIM): A Knowledgebase of Human Genes and Genetic Phenotypes. Current Protocols in Bioinformatics. 58, 1 (2017).
  11. Amberger, J. S., Bocchini, C. A., Scott, A. F., Hamosh, A. OMIM.org: leveraging knowledge across phenotype-gene relationships. Nucleic Acids Research. 47, 1038-1043 (2019).
  12. Liu, N., et al. Functional variants in TBX2 are associated with a syndromic cardiovascular and skeletal developmental disorder. Human Molecular Genetics. 27 (14), 2454-2465 (2018).
  13. Ropers, H. H., Wienker, T. Penetrance of pathogenic mutations in haploinsufficient genes for intellectual disability and related disorders. European Journal of Medical Genetics. 58 (12), 715-718 (2015).
  14. Shashi, V., et al. De Novo Truncating Variants in ASXL2 Are Associated with a Unique and Recognizable Clinical Phenotype. American Journal of Human Genetics. 100 (1), 179 (2017).
  15. Chen, R., et al. Analysis of 589,306 genomes identifies individuals resilient to severe Mendelian childhood diseases. Nature Biotechnology. 34 (5), 531-538 (2016).
  16. Halvorsen, M., et al. Mosaic mutations in early-onset genetic diseases. Genetics in Medicine. 18 (7), 746-749 (2016).
  17. Kohler, S., et al. The Human Phenotype Ontology in 2017. Nucleic Acids Research. 45 (1), 865-876 (2017).
  18. Rentzsch, P., Witten, D., Cooper, G. M., Shendure, J., Kircher, M. CADD: predicting the deleteriousness of variants throughout the human genome. Nucleic Acids Research. 47 (1), 886-894 (2019).
  19. Sobreira, N., Schiettecatte, F., Valle, D., Hamosh, A. GeneMatcher: a matching tool for connecting investigators with an interest in the same gene. Human Mutation. 36 (10), 928-930 (2015).
  20. Sobreira, N. L. M., et al. Matchmaker Exchange. Current Protocols in Human Genetics. 95 (9), 31-39 (2017).
  21. Harnish, M., Deal, S., Wangler, M., Yamamoto, S. In vivo functional study of disease-associated rare human variants using Drosophila. Journal of Visualized Experiments. , (2019).
  22. Harrison, S. M., et al. Using ClinVar as a Resource to Support Variant Interpretation. Current Protocols in Human Genetics. 89, 11-18 (2016).
  23. MacDonald, J. R., Ziman, R., Yuen, R. K., Feuk, L., Scherer, S. W. The Database of Genomic Variants: a curated collection of structural variation in the human genome. Nucleic Acids Research. 42, 986-992 (2014).
  24. Firth, H. V., et al. DECIPHER: Database of Chromosomal Imbalance and Phenotype in Humans Using Ensembl Resources. American Journal of Human Genetics. 84 (4), 524-533 (2009).
  25. Thurmond, J., et al. FlyBase 2.0: the next generation. Nucleic Acids Research. 47, 759-765 (2019).
  26. Consortium, G. T. Human genomics. The Genotype-Tissue Expression (GTEx) pilot analysis: multitissue gene regulation in humans. Science. 348 (6235), 648-660 (2015).
  27. Ponten, F., Jirstrom, K., Uhlen, M. The Human Protein Atlas–a tool for pathology. Journal of Pathology. 216 (4), 387-393 (2008).
  28. The Gene Ontology, C. The Gene Ontology Resource: 20 years and still GOing strong. Nucleic Acids Research. , (2018).
  29. Mungall, C. J., et al. The Monarch Initiative: an integrative data and analytic platform connecting phenotypes to genotypes across species. Nucleic Acids Research. 45 (1), 712-722 (2017).
  30. Meehan, T. F., et al. Disease model discovery from 3,328 gene knockouts by The International Mouse Phenotyping Consortium. Nature Genetics. 49 (8), 1231-1238 (2017).
  31. Katoh, K., Rozewicki, J., Yamada, K. D. MAFFT online service: multiple sequence alignment, interactive sequence choice and visualization. Brief Bioinform. , (2017).
  32. Sievers, F., Higgins, D. G. Clustal Omega for making accurate alignments of many protein sequences. Protein Science. 27 (1), 135-145 (2018).
  33. Yoon, W. H., et al. Loss of Nardilysin, a Mitochondrial Co-chaperone for alpha-Ketoglutarate Dehydrogenase, Promotes mTORC1 Activation and Neurodegeneration. Neuron. 93 (1), 115-131 (2017).
  34. Deal, S., Yamamoto, S. Unraveling novel mechanisms of neurodegeneration through a large-scale forward genetic screen in Drosophila. Frontiers in Genetics. 9, (2019).
  35. Matamoros, A. J., Baas, P. W. Microtubules in health and degenerative disease of the nervous system. Brain Research Bulletin. 126, 217-225 (2016).
  36. Theodosiou, A., Arhondakis, S., Baumann, M., Kossida, S. Evolutionary scenarios of Notch proteins. Molecular Biology and Evolution. 26 (7), 1631-1640 (2009).
  37. Shayevitz, C., Cohen, O. S., Faraone, S. V., Glatt, S. J. A re-review of the association between the NOTCH4 locus and schizophrenia. American Journal of Medical Genetics. Part B: Neuropsychiatric Genetics. 159 (5), 477-483 (2012).
  38. Wang, Z., et al. A review and re-evaluation of an association between the NOTCH4 locus and schizophrenia. American Journal of Medical Genetics. Part B: Neuropsychiatric Genetics. 141 (8), 902-906 (2006).
  39. Oriel, C., Lasko, P. Recent Developments in Using Drosophila as a Model for Human Genetic Disease. International Journal of Molecular Sciences. 19 (7), (2018).
  40. Hu, Y., Comjean, A., Mohr, S. E., FlyBase, C., Perrimon, N. Gene2Function: An Integrated Online Resource for Gene Function Discovery. G3. 7 (8), 2855-2858 (2017).

Play Video

Cite This Article
Wang, J., Liu, Z., Bellen, H. J., Yamamoto, S. Navigating MARRVEL, a Web-Based Tool that Integrates Human Genomics and Model Organism Genetics Information. J. Vis. Exp. (150), e59542, doi:10.3791/59542 (2019).

View Video