Waiting
Login processing...

Trial ends in Request Full Access Tell Your Colleague About Jove
Click here for the English version

Genetics

Navigieren in MARRVEL, einem webbasierten Tool, das Informationen zur Humangenomik und Modellgenetik integriert

Published: August 15, 2019 doi: 10.3791/59542

Summary

Hier stellen wir ein Protokoll vor, um effizient auf viele Datenbanken für menschliche und Modellorganismen zuzugreifen und diese zu analysieren. Dieses Protokoll veranschaulicht die Verwendung von MARRVEL zur Analyse von Krankheitsverursachenden Varianten, die bei Sequenzierungsbemühungen der nächsten Generation identifiziert wurden.

Abstract

Durch die Sequenzierung von Ganzexom/Genom identifizieren Humangenetiker seltene Varianten, die sich mit Krankheitsphänotypen trennen. Um zu beurteilen, ob eine bestimmte Variante pathogen ist, muss man viele Datenbanken abfragen, um festzustellen, ob das Gen von Interesse mit einer genetischen Krankheit in Verbindung steht, ob die spezifische Variante bereits berichtet wurde und welche funktionellen Daten im Modellorganismus verfügbar sind. Datenbanken, die Hinweise auf die Funktion des Gens beim Menschen liefern können. MARRVEL (Model organism Aggregated Resources for Rare Variant ExpLoration) ist ein Tool zur Datenerfassung aus einer Zwischenstation für menschliche Gene und Varianten und deren orthologous Gene in sieben Modellorganismen, darunter in Dermaus, Ratte, Zebrafisch, Fruchtfliege, Nematodenwurm, Spalt Hefe und aufkeimende Hefe. In diesem Protokoll geben wir einen Überblick darüber, wofür MARRVEL verwendet werden kann, und diskutieren, wie verschiedene Datensätze verwendet werden können, um zu beurteilen, ob eine Variante unbekannter Bedeutung (VUS) in einem bekannten krankheitserregenden Gen oder eine Variante in einem Gen von ungewisser Bedeutung (GUS) Pathogenen. Dieses Protokoll führt einen Benutzer durch die Suche mehrerer menschlicher Datenbanken gleichzeitig beginnend mit einem menschlichen Gen mit oder ohne eine Variante von Interesse. Wir besprechen auch, wie Daten von OMIM, ExAC/gnomAD, ClinVar, Geno2MP, DGV und DECHIPHER genutzt werden können. Darüber hinaus veranschaulichen wir, wie eine Liste von Ortholog-Kandidatengenen, Expressionsmustern und GO-Begriffen in Modellorganismen interpretiert wird, die mit jedem menschlichen Gen assoziiert sind. Darüber hinaus besprechen wir die bereitgestellten Wertproteinstrukturbereichsanmerkungen und erklären, wie die Proteinausrichtungsfunktion mehrerer Arten verwendet werden kann, um zu beurteilen, ob eine Variante von Interesse eine evolutionär konservierte Domäne oder Aminosäure beeinflusst. Abschließend werden wir drei verschiedene Anwendungsfälle dieser Website besprechen. MARRVEL ist eine leicht zugängliche Open-Access-Website, die sowohl für klinische als auch für Grundlegende Forscher entwickelt wurde und als Ausgangspunkt für die Entwicklung von Experimenten für funktionelle Studien dient.

Introduction

Der Einsatz der Sequenzierungstechnologie der nächsten Generation wird sowohl in der Forschung als auch in den klinischen genetischen Laboratorien erweitert1. Whole-Exom (WES) und Whole-Genome-Sequenzierung (WGS) Analysen zeigen zahlreiche seltene Varianten von unbekannter Bedeutung (VUS) in bekannten krankheitserregenden Genen sowie Varianten in Genen, die noch mit einer Mendelian-Krankheit in Verbindung gebracht werden müssen (GUS: Gene von ungewisser Bedeutung). Mit einer Liste von Genen und Varianten in einem klinischen Sequenzbericht vorgestellt, müssen medizinische Genetiker manuell mehrere Online-Ressourcen besuchen, um mehr Informationen zu erhalten, um zu beurteilen, welche Variante für einen bestimmten Phänotyp verantwortlich sein kann, der beim Patienten von Interesse gesehen wird. . Dieser Prozess ist zeitaufwändig und seine Wirksamkeit hängt stark von der Expertise des Einzelnen ab. Obwohl mehrere Leitpapiere veröffentlicht wurden2,3, erfordert die Interpretation von WES und WGS eine manuelle Kuration, da es noch keine standardisierte Methodik für die Variantenanalyse gibt. Für die Interpretation von VUS wird das Wissen über die zuvor berichtete Schrift-Phänotyp-Beziehung, die Vererbungsart und die Allelfrequenzen in der allgemeinen Bevölkerung wertvoll. Darüber hinaus kann das Wissen darüber, ob die Variante eine kritische Proteindomäne oder einen evolutionär konservierten Rückstand betrifft, die Wahrscheinlichkeit einer Pathogenität erhöhen oder verringern. Um all diese Informationen zu sammeln, muss man in der Regel durch 10-20 Datenbanken für menschliche und Modellorganismen navigieren, da die Informationen über das World Wide Web verstreut sind.

In ähnlicher Weise sind Modellorganismenwissenschaftler, die an bestimmten Genen und Pfaden arbeiten, oft daran interessiert, ihre Erkenntnisse mit menschlichen Krankheitsmechanismen zu verbinden, und möchten das Wissen nutzen, das im Bereich der menschlichen Genomik generiert wird. Aufgrund der raschen Erweiterung und Weiterentwicklung von Datensätzen in Bezug auf das menschliche Genom war es jedoch schwierig, Datenbanken zu identifizieren, die nützliche Informationen liefern. Da die meisten Modellorganismus-Datenbanken für Forscher konzipiert sind, die täglich mit dem spezifischen Organismus arbeiten, ist es beispielsweise für einen Mausforscher sehr schwierig, nach spezifischen Informationen in einer Drosophila-Datenbank zu suchen und umgekehrt . Ähnlich wie bei der Varianteninterpretation spioniert die Suche von medizinischen Genetikern, ist die Identifizierung nützlicher Informationen über menschliche und andere Modellorganismen zeitaufwändig und stark vom Hintergrund des Modellorganismusforschers abhängig. MARRVEL (Model organism Aggregated Resources for Rare Variant ExpLoration)4 ist ein Tool, das für beide Benutzergruppen entwickelt wurde, um ihren Workflow zu optimieren.

MARRVEL (http://marrvel.org) wurde als zentrale Suchmaschine entwickelt, die Daten systematisch und konsistent für Kliniker und Forscher sammelt. Mit Informationen aus 20 oder mehr öffentlich zugänglichen Datenbanken ermöglicht dieses Programm Benutzern, schnell Informationen zu sammeln und auf eine große Anzahl von Datenbanken für menschliche und Modellorganismen zuzugreifen, ohne dass eine wiederholungsative Suche durchgeführt wird. Die Suchergebnisseiten enthalten auch Hyperlinks zu den ursprünglichen Informationsquellen, die es Einzelpersonen ermöglichen, auf die Rohdaten zuzugreifen und zusätzliche Informationen zu sammeln, die von den Quellen bereitgestellt werden.

Im Gegensatz zu vielen der Variantenpriorisierungstools, die eine große Sequenzierung von Daten in Form von VCF- oder BAM-Dateien und Installationen von oft proprietärer/kommerzieller Software erfordern, arbeitet MARRVEL an jedem Webbrowser. Es kann kostenlos verwendet werden und ist mit tragbaren Geräten (z.B. Smartphones, Tablets) kompatibel, solange man mit dem Internet verbunden ist. Wir haben uns für dieses Format entschieden, da viele Kliniker und Forscher in der Regel ein oder mehrere Gene und Varianten gleichzeitig suchen müssen. Beachten Sie, dass wir Batch-Download- und API-Funktionen (Application Programming Interface) für MARRVEL entwickeln, um es Benutzern schließlich zu ermöglichen, Hunderte von Genen und Varianten gleichzeitig durch benutzerdefinierte Abfragetools zu kuratieren.

Aufgrund der breiten Palette von Anwendungen werden wir in diesem Protokoll einen weit gefassten Ansatz beschreiben, wie man durch verschiedene Datasets navigiert, die MARRVEL anzeigt. Gezieltere Beispiele, die auf die spezifischen Bedürfnisse der Nutzer zugeschnitten sind, werden im Abschnitt Repräsentative Ergebnisse beschrieben. Es ist wichtig zu beachten, dass die Ausgabe von MARRVEL immer noch ein gewisses Maß an Hintergrundwissen in der Humangenetik oder Modellorganismen erfordert, um wertvolle Informationen zu extrahieren. Wir verweisen die Leser auf die Tabelle, die Primärpapiere auflistet, die die Funktion der einzelnen ursprünglichen Datenbanken beschreiben, die von MARRVEL kuratiert werden (Tabelle 1). Das folgende Protokoll gliedert sich in drei Abschnitte: (1) Wie man eine Suche beginnt, (2) wie man die Ergebnisse der MARRVEL-Humangenetik interpretiert und (3) wie man Modellorganismusdaten in MARRVEL nutzt. Im Abschnitt Repräsentative Ergebnisse werden gezieltere und spezifischere Ansätze beschrieben. MARRVEL wird aktiv aktualisiert, daher lesen Sie bitte die FAQ-Seite der aktuellen Website für Details zu Datenquellen. Wir empfehlen den Nutzern von MARRVEL dringend, sich anzumelden, um Aktualisierungsbenachrichtigungen über das E-Mail-Einreichungsformular am Ende der MARRVEL-Homepage zu erhalten.

Subscription Required. Please recommend JoVE to your librarian.

Protocol

1. Wie man eine Suche beginnt

  1. Für die menschliche Gen- und Variantensuche gehen Sie zu den Schritten 1.1.1.-1.1.2. Für die menschliche genbasierte Suche (keine Varianteneingabe) fahren Sie mit Schritt 1.2 fort. Die genbasierte Suche nach Modellorganismen finden Sie in den Schritten 1.3.1.-1.3.2.
    1. Gehen Sie auf die Homepage von MARRVEL4 auf http://marrvel.org/. Beginnen Sie mit der Eingabe eines menschlichen Gensymbols. Stellen Sie sicher, dass die Kandidatengennamen unter dem Eingabefeld mit jedem Zeicheneintrag aufgeführt sind. Wenn die Suche negativ zurückkommt, stellen Sie sicher, dass das verwendete Gensymbol auf der Website des HUGO Gene Nomenclature Committee5 (HGNC; https://www.genenames.org/) auf dem neuesten Stand ist.
    2. Geben Sie eine menschliche Variante ein. Die Suchleiste ist mit zwei Variantennomenklaturarten kompatibel: Genomposition ähnlich wie Varianten auf ExAC und GnomAD6 und Transkriptebasierte Nomenklatur nach HGVS-Richtlinien. Beispiele für solche Formate werden in grauem Text im Suchfeld angezeigt. Für die Nomenklatur der genomischen Lage verwenden Sie die Koordinaten nach hg19/GRCh37. Fahren Sie mit Schritt 2 fort.
      HINWEIS: Wenn eine Suche einen Fehler zurückgibt, sind die häufigsten Probleme entweder das Gensymbol ist nicht auf dem neuesten Stand oder die Variantennomenklatur ist falsch. In diesen Fällen sind die Websites HGNC (https://www.genenames.org/), Mutalyzer7 (https://www.mutalyzer.nl/) und TransVar8 (https://bioinformatics.mdanderson.org/transvar/) großartige Ressourcen, um den Fehler zu beheben. HGNC liefert offizielle Gensymbole und deren Aliasnamen für alle menschlichen Gene.
    3. Wenn nach der Bestätigung des Gennamens immer noch Fehlermeldungen angezeigt werden, verwenden Sie Mutalyzer und TransVar, um die Variantennomenklatur zu überprüfen und zu konvertieren.
    4. Versuchen Sie in einigen Situationen, wie z. B. einer kürzlichen Änderung des Gensymbols in HGNC, die Verwendung eines Synonyms für das Gen und wenden Sie sich bitte über die Registerkarte "Feedback" an das MARRVEL-Betriebsteam, um die Quelldaten zu aktualisieren, da MARRVEL aufgrund einer Verzögerung der Daten möglicherweise nicht die richtigen Informationen liefert. datum.
  2. Geben Sie ein menschliches Gensymbol ein und lassen Sie die Suchleiste der menschlichen Variante leer. Wenn ein Fehler auftritt, gehen Sie zu HGNC (https://www.genenames.org/), um nach dem offiziellen Gensymbol zu suchen, oder versuchen Sie es mit einem älteren Gensymbol.
    1. Klicken Sie auf die Registerkarte Modellorganismensuche auf dem oberen Banner (Abbildung 1) oder gehen Sie zu http://marrvel.org/model. Wählen Sie den Modellorganismus der Wahl aus und geben Sie ein Modellorganismus-Gensymbol ein. Klicken Sie auf das Gensymbol, da der Name automatisch vervollständigt wird, und klicken Sie dann auf Suchen. Wenn das Suchergebnis negativ ist, überprüfen Sie das offizielle Gensymbol, das in Datenbanken für Modellorganismen verwendet wird (Tabelle 1).
    2. Wenn das Suchergebnis immer noch negativ ist, greifen Sie auf DIOPT (DRSC Integrative Ortholog Prediction Tool, https://www.flyrnai.org/cgi-bin/DRSC_orthologs.pl) und HCOP (https://www.genenames.org/tools/hcop/) zu, um zu beurteilen, ob es keine guten vorhergesagten Orthologs für das Gen von Interesse. DIOPT ist eine Ortholog-Vorhersage-Suchmaschine, die vom DRSC (Drosophila RNAi Screening Center) betrieben wird und HCOP ist eine ähnliche Suite, die von HGNC entwickelt wurde.
      HINWEIS: Zusätzliche Suchvorgänge mit BLAST (https://blast.ncbi.nlm.nih.gov/Blast.cgi) können es Benutzern ermöglichen, Orthologs zu finden, die von Vorhersagealgorithmen, die in DIOPT und HCOP verwendet werden, übersehen werden können.
    3. Klicken Sie auf den MARRVEL es unten für die vorhergesagte menschliche Ortholog der Wahl. Überprüfen Sie die DIOPT-Punktzahl9 und die beste Punktzahl vom menschlichen Gen zum Modellorganismus? für die Auswahl des menschlichen Gens. Fahren Sie mit Schritt 2 fort.
      HINWEIS: DIOPT-Score9 (https://www.flyrnai.org/cgi-bin/DRSC_orthologs.pl) ist ein Wert dafür, wie viele Ortholog-Vorhersagealgorithmen ein Paar Gene in zwei Organismen vorhersagen, um sich gegenseitig ortholog zu sein. Weitere Informationen zu diesen Werten und den spezifischen Algorithmen, die zur Berechnung dieser Punktzahl verwendet werden, finden Sie unter Hu et al9. Wenn die beste Punktzahl vom menschlichen Gen zum Modellorganismus? Jaist, zeigt es an, dass das menschliche Gen eher ein echter menschlicher Ortholog des Gens von Interesse ist, aber es könnte Ausnahmen geben, besonders wenn mehrere menschliche Gene orthologus sind, um mehrere Modellorganismusgene aufgrund von Genduplizierungsereignissen während der Evolution. Wenn das Gen von Interesse ein Mitglied einer komplexen Genfamilie ist, die bei mehreren Arten eine divergierende Evolution durchlaufen hat, sollten Benutzer eine Publikation identifizieren, die eine umfassende phylogenetische Analyse der Genfamilie von Interesse durchgeführt hat, um die wahrscheinliches Ortholog-Kandidatengen.

2. Wie interpretiert man DIE OUTPUTs der MARRVEL-Humangenetik für eine Gen- und Variantensuche

HINWEIS: Auf der Ergebnisseite werden sieben menschliche Datenbanken angezeigt (Tabelle1, Abbildung 1). Für jedes Ausgabefeld gibt es eine Schaltfläche "Externe Verknüpfung" (kleinesFeld mit einem diagonalen Pfeil) in der oberen rechten Ecke, die mit der ursprünglichen Datenbank verknüpft wird, um weitere Details zu erhalten.

  1. Klicken Sie auf OMIM (Online Mendelian Inheritance in Man, https://www.omim.org/)10, die erste Datenbank, die angezeigt wird.
    HINWEIS: OMIM ist eine manuell kuratierte Datenbank, die Informationen über genetische Krankheiten und Merkmale im Menschen aggregiert und zusammenfasst.
    1. Verwenden Sie die Box Human Gene Description von OMIM für eine kurze Zusammenfassung dessen, was über das Gen- und Genprodukt bekannt ist.
    2. Verwenden Sie die Box Gene-Phenotype Relationships, um festzustellen, ob es sich bei diesem Gen um ein bekanntes krankheitserregendes Gen handelt oder nicht. Diese Box bietet manuell kuratierte bekannte Krankheit sanieren oder Phänotyp Assoziationen mit dem Gen von Interesse.
    3. Verwenden Sie die Liste der gemeldeten Alleles aus der OMIM-Box, um eine Liste der pathogenen Varianten zu erhalten, die von OMIM kuratiert wurden.
      HINWEIS: Da die manuelle Kuration einer Veröffentlichung über eine neue Krankheitsgenentdeckung notwendig ist, damit eine Gen-Krankheit-Assoziation in OMIM auftritt, können eine gewisse Zeitverzögerung und/oder verpasste Veröffentlichungen zu Missverständnissen führen. Es wird empfohlen, dass Benutzer PubMed (https://www.ncbi.nlm.nih.gov/pubmed/)-Suchen durchführen, um auch aktuelle Literatur zu untersuchen (siehe 4.1.2.). Weitere Informationen in OMIM finden Sie unter Amberger10,11.
  2. klickenExAC(Exome Aggregation Consortium, http://exac.broadinstitute.org/)6und gnomAD(Genome Aggregation Database, http://gnomad.broadinstitute.org/), große Populationsgenomik-Datenbanken auf der Grundlage von WES und WGS von Menschen, die ausgewählt werden, um schwere pädiatrische Erkrankungen auszuschließen.
    HINWEIS: ExAC enthält 60.000 WES, während gnomAD 120.000 WES und 15.000 US-Dollar WGS enthält. Sowohl ExAC als auch gnomAD können als Kontrollpopulationsdatenbank verwendet werden, insbesondere bei schweren pädiatrischen Erkrankungen, aber ihre Interpretation erfordert ein gewisses Maß an Vorsicht. Im Allgemeinen kann gnomAD als eine aktualisierte und erweiterte Version von ExAC betrachtet werden, da die meisten Kohorten, die in ExAC enthalten sind, auch in gnomAD enthalten sind. Da es jedoch einige Ausnahmen gibt (siehe Kohorteninformationen in http://exac.broadinstitute.org/about bzw. http://gnomad.broadinstitute.org/about), zeigt MARRVEL Daten aus beiden Quellen an.
    1. Verwenden Sie das Feld "Kontrolle Population Gene Summary", um Statistiken auf Genebene zu erhalten, z. B. die Wahrscheinlichkeit, den Funktionsverlust (LOF)-Allele in der allgemeinen Population zu finden. Dies wird in ExAC als pLI-Score (Wahrscheinlichkeit der LOF-Intoleranz) bezeichnet und kann verwendet werden, um abzuleiten, wie wahrscheinlich eine einzelne Kopie eines LOF-Alleels für ein bestimmtes Gen eine dominante Erkrankung durch haplounzureichende Mechanismen verursachen kann.
      HINWEIS: Der Blick auf den pLI-Score eines Gens hat einen Wert, insbesondere wenn es um dominante Erkrankungen geht, die als schwere pädiatrische Erkrankungen im Zusammenhang mit de novo-Varianten vorkommen. Wenn ein Gen einen pLI-Wert von 0,00 hat, bedeutet dies, dass es sehr tolerant gegenüber LOF-Varianten ist, so dass das Gen unwahrscheinlich ist, dass es eine Krankheit über einen dominanten Haploinsuffizienzmechanismus verursacht. Dies schließt jedoch nicht notwendigerweise aus, dass andere dominante Funktionsgewinne (GOF) oder dominante negative vermittelte Mechanismen Krankheiten verursachen können. Darüber hinaus können Gene, die die rezessiven Krankheiten verursachen, niedrige pLI-Werte haben, da Karrieren in der allgemeinen Bevölkerung erwartet werden. Andererseits ist es möglich, dass der Verlust einer Kopie dieses Gens für die menschliche Gesundheit schädlich ist, wenn ein Gen einen pLI-Wert von 1,00 hat. Zusätzliche Suchanfragen in Websites wie DOMINO (https://wwwfbm.unil.ch/domino/) können auch in Kombination verwendet werden, um die Wahrscheinlichkeit einer Variante in einem bestimmten Gen zu beurteilen, die eine dominante Störung verursacht.
    2. Verwenden Sie die nächsten beiden Boxen, um die Allelfrequenzen der Variante von Interesse an ExAC bzw. gnomAD zu erhalten, bzw. um zu interpretieren, ob die Variante pathogen sein kann, je nachdem, ob der Patient die dominante oder rezessive Erkrankung hat. Dieses Feld wird nur angezeigt, wenn der Benutzer beim Einieren der Suche Varianteninformationen eingibt.
      HINWEIS: Wenn man ein rezessives Krankheitsszenario vermutet und der pLI-Score des Gens von Interesse niedrig ist, sollte man auf die hier aufgeführte Allelhäufigkeit achten. Einige Genetiker können einen Cut-off-Punkt von 0,005 bis 0,0001 als maximale Allelhäufigkeit für pathogene Varianten festlegen, die eine schwere rezessiv vererbte Krankheit verursachen können2. Auf der anderen Seite, wenn man ein dominantes Krankheitsszenario vermutet, ist es weniger wahrscheinlich, die identische oder ähnliche Variante in einer Kontrollpopulation zu finden. Auch dies erfordert Vorsicht, da Personen mit spät auftretenden Störungen, Krankheiten mit leichter Darstellung, psychiatrischestörungen oder Krankheiten, die nicht von den ExAC/gnomAD-Forschern untersucht werden, immer noch einbezogen werden können und die Variante immer noch eine dominante pathogene variante. Auch gab es einige Fälle von Varianten im Zusammenhang mit pädiatrischen Bedingungen in einigen Personen in diesen Datenbanken gefunden12,13,14, möglicherweise aufgrund unvollständiger Penetranz oder somatischer Mosaikismus13 , 15 , 16. Darüber hinaus werden ExAC und gnomAD zwar Varianten anzeigen, die in einem homozygoten Zustand gefunden werden, aber es wird nicht angegeben, ob eine der Varianten in einem zusammengesetzten heterozygoten Zustand gefunden wird. Schließlich werden einige Varianten, die in diesen Datenbanken gefunden werden, aufgrund technischer Herausforderungen bei der Sequenzierung als wenig vertraulich markiert (z. B. geringe Sequenzabdeckung, sich wiederholende Sequenz). Um diese Datensätze genauer zu untersuchen, wird Benutzern empfohlen, die schaltfläche externer Links zu verwenden, um die ursprünglichen ExAC- und gnomAD-Websites zu besuchen, um zusätzliche Informationen zu erhalten.
  3. Klicken Sie auf Geno2MP (Genotype to Mendelian Phenotype Browser, http://geno2mp.gs.washington.edu/Geno2MP/), eine Sammlung von WES-basierten Daten vom University of Washington Center for Mendelian Genetics. Es enthält etwa 9.600 Exome (Stand: 18.11.2019) betroffener Personen und nicht betroffener Verwandter mit einigen phänotypischen Beschreibungen (Abbildung 1).
    1. Verwenden Sie das Feld Krankheitspopulation, um die Allelhäufigkeit der Variante des Interesses an dieser Kohorte zu erhalten.
    2. Verwenden Sie die Feld Gene-Phenotype-Beziehungen, um HPO (Human Phänotyp Ontologie)17 Begriffe für die Personen mit der Variante von Interesse zu erhalten. Dies ist eine von vielen Möglichkeiten für einen, nach Patienten zu suchen, die die gleiche Krankheit haben können.
      HINWEIS: Wenn ein Gen von Interesse im Verdacht steht, mit der Krankheit eines Patienten in Verbindung gebracht zu werden, und es Übereinstimmungen in Geno2MP gibt, können zusätzliche wichtige Informationen in der Datenquelle vorhanden sein, die über das angezeigte hinausgeht.
      1. Klicken Sie auf die schaltfläche externer Link zur genspezifischen Seite auf Geno2MP, filtern Sie nach Mutationen, die denen des Patienten ähneln (z. B. Missense, LOF), und überprüfen Sie sorgfältig die Variantenlisten. Notieren Sie sich die Varianten mit hohen CADD 18-Scores und klicken Sie in die HPO-Profile. Beispielsweise liegen CADD-Werte, die höher als 20 sind, innerhalb der obersten 1 % aller Varianten, die als schädlich vorhergesagt werden, CADD-Werte, die höher als 10 sind, innerhalb der oberen 10 %. HPO-Begriffe bieten eine standardisierte Beschreibung menschlicher Phänotypen. Stellen Sie hier sicher, ob die Variante bei einer betroffenen Person oder in einem Verwandten identifiziert wurde.
      2. Wenn Varianten bei Patienten gefunden werden, die im selben Organsystem wie der Patient betroffen sind, sollten Sie das E-Mail-Formular verwenden, um den Arzt zu kontaktieren, der diese Fälle mit der auf der Geno2MP-Website bereitgestellten Funktion an Geno2MP übermittelt hat.
        HINWEIS: Nicht alle Ärzte reagieren auf solche Fragen, daher sollte man andere Wege der Patienten-Matchmaking erkunden. Eine andere Möglichkeit, eine Kohorte von Patienten zu sammeln, die von denselben Krankheiten betroffen sind, ist die Verwendung von Tools wie GeneMatcher19 (https://www.genematcher.org/) und anderen Datenbanken, die Teil der Matchmaker Exchange19,20 ( https://www.matchmakerexchange.org/). Weitere Informationen zum Matchmaking finden Sie im begleitenden JoVE-Artikel21.
  4. Verwenden Sie die Von den National Institutes of Health (NIH) unterstützte Datenbank ClinVar (https://www.ncbi.nlm.nih.gov/clinvar/)22, in der Forscher und Kliniker Varianten mit oder ohne Bestimmung der Pathogenität einreichen, Single Nukleotidvarianten (SNV), kleine Indels und größere Kopiernummernvariationen (CNV).
    1. Verwenden Sie die oberste Zeile, um eine Zusammenfassung der Anzahl der einzelnen in ClinVar gemeldeten Variantentypen zu überprüfen (Abbildung 1).
    2. Überprüfen Sie die Liste der Varianten unten im Feld Gemeldete Alleles von ClinVar.
      HINWEIS: Wenn eine Variante in die erste Suche einbezogen wurde, sind die hervorgehobenen Varianten in Petrol alle Varianten, die die genomische Position der Variante von Interesse [einschließlich großer CNVs, die oft als; genomische Koordinate... x1 (Löschen) und ... x3 (Duplizierung)].
  5. Verwenden Sie DGV23 (Datenbank genomischer Varianten, http://dgv.tcag.ca/dgv/app/home) und DECIPHER24 (DatabasE der GenomiC-VarIation und des Phänotyps beim Menschen mit Ensembl-Ressourcen, https://decipher.sanger.ac.uk/), beide DGV ist die größte öffentlich zugängliche Sammlung von Strukturvarianten von mehr als 54.000 Personen. Diese Datenbank enthält Proben von angeblich gesunden Personen, zum Zeitpunkt der Feststellung, aus bis zu 72 verschiedenen Studien. Ebenso enthalten die von DECIPHER angezeigten Daten allgemeine Varianten aus der Steuerelementpopulation.
    HINWEIS: Da MARRVEL nicht über die Berechtigung verfügt, von DECIPHIER abgeleitete Patientendaten anzuzeigen, wird den Benutzern empfohlen, direkt die DECIPHER-Website zu besuchen, um auf potenziell pathogene CNV-Informationen zuzugreifen.
    1. Klicken Sie auf das Feld Kopiernummernvariation in der Kontrollpopulation (DGV-Datenbank), um Varianten zu erhalten, die das betreffende Gen enthalten. Informationen wie Größe, Untertyp und Verweis auf die Änderung der Kopiernummer finden Sie im selben Feld.
    2. Klicken Sie auf das Feld Allgemeine Kopiernummernvarianten (DECIPHER-Datenbank), um Varianten zu erhalten, die den genomischen Standort der Interessenvariante enthalten. Diese Informationen können helfen festzustellen, ob das Gen in den Kontrollpersonen dupliziert oder gelöscht wird.
      HINWEIS: Wenn das Gen von Interesse bei vielen Individuen in der Kontrollpopulation gelöscht wird, bedeutet dies, dass dieses Gen wahrscheinlich sehr tolerant gegenüber LOF-Varianten ist. Wie niedrige pLI-Werte deutet dies darauf hin, dass ein einzelner Kopierverlust dieses Gens weniger wahrscheinlich eine schwere Krankheit über einen Haploinsuffizienzmechanismus verursacht. Dies schließt jedoch nicht notwendigerweise andere dominante Funktionsgewinne oder dominante negative Mechanismen (z. B. antimorphe, hypermorphe und neomorphe Allele) aus, die durch spezifische Fehlsinnen und Schnittallele verursacht werden.  Mögliche Einschränkungen dieser Daten sind die Variation der Quelle und der Methode der erfassten Daten, der Mangel an Informationen über unvollständige Penetranz pathogener CNVs und die Frage, ob Einzelpersonen nach der Datenerhebung bestimmte Krankheiten entwickelt haben.

3. Verwendung von Modellorganismusdaten in MARRVEL

  1. Verwenden Sie die Gene Function Table, um die folgenden Informationen für acht Modellorganismen zu erhalten, einschließlich Mensch, Ratte, Maus, Zebrafisch, Drosophila, C elegans,angehende Hefe und Spalthefe):
    1. Genname: Da jeder Genname mit Genseiten in den jeweiligen Modellorganismus-Datenbanken verknüpft ist, klicken Sie auf diese Links, um mehr über die phänotypischen Informationen und Ressourcen zu erfahren, die für jeden Modellorganismus verfügbar sind. Auf FlyBase25 (http://flybase.org/) wird es beispielsweise eine Liste aller alleLe geben, die generiert wurden, ihre jeweiligen Phänotypen und die Verfügbarkeit jedes Alleels aus öffentlichen Lagerzentren.
    2. PubMed Link: Klicken Sie auf den PubMed-Link, um zu einer Liste von Publikationen zu gehen, die sich auf das Gen von Interesse in jedem Organismus beziehen. Ohne diese Links zu verwenden, kann die Suche nach dem menschlichen Gen direkt in PubMed dazu führen, dass einige Publikationen fehlen, die einen alten Genalias verwendet haben, um auf das menschliche Gen zu verweisen. In ähnlicher Weise können Modellorganismus-Gennamen historisch schwankt haben.
    3. DIOPT 9 Punktzahl: Überprüfen Sie diese Spalte auf eine Bewertung, wie viele Ortholog-Vorhersagealgorithmen vorhersagen, dass das Gen wahrscheinlich ein Ortholog des menschlichen Gens von Interesse ist. Man kann eine DIOPT-Punktzahl von 3 oder höher als angemessene Cut-off verwenden, um solide Ortholog-Kandidaten zu identifizieren. Es gibt jedoch Fälle, in denen echte Orthologs aufgrund der begrenzten Homologie nur einen DIOPT-Score von 1 haben. An der Spitze der Genfunktionstabelle, deaktivieren Sie die "Nur bestes DIOPT-Score-Gen anzeigen" und zeigen Sie alle Kandidaten an, die typischerweise homologe Gene enthalten, die nicht unbedingt Orthologs sind.
    4. Expression: Überprüfen Sie in dieser Spalte die Liste der Gewebe, bei denen das Gen oder Protein von Interesse in Datenbanken für menschliche oder Modellorganismen exprimiert wurde. Die Daten der menschlichen Gen- und Proteinexpression stammen aus GTEx26 (https://gtexportal.org/) bzw. Human Protein Atlas27 (https://www.proteinatlas.org/). Einige haben eine Schaltfläche mit Pop-up-Links, z. B. für Mensch und Für fliegen, die das Ausdrucksmuster mit einer Heatmap anzeigen, während andere zu den entsprechenden Seiten der Modellorganismus-Datenbanken verlinkt sind.
    5. Gene Ontologie 28 (GO)-Begriffe: Filtern Sie nach experimentellen Beweiscodes und beziehen Sie diese aus den jeweiligen Datenbanken für menschliche oder Modellorganismen. GO-Begriffe, die auf "Datenanalyse-Beweiscodes" und "elektronischen Anmerkungsbeweiscodes" (Vorhersagen) basieren, werden nicht angezeigt. Bitte besuchen Sie jede Website des Modellorganismus, um diese Informationen bei Bedarf zu sammeln.
    6. Weitere Links wie Monarch Initiative29 (https://monarchinitiative.org/) und IMPC30 (http://www.mousephenotype.org/): Verwenden Sie den Hyperlink monarch Initiative, um zur Phenogrid-Seite zu navigieren für das spezifische menschliche Gen ein Diagramm, das einen schnellen Vergleich zwischen den Phänotypen bietet, die mit dem Gen von Interesse zu bekannten menschlichen Krankheiten verbunden sind, und Modellorganismus-Mutanten, die phänotypische Überlappungen aufweisen. Wenn ein Maus-Gen eine Knockout-Maus hat, die vom International Mouse Phenotyping Consortium (IMPC) hergestellt oder geplant wurde, verweist das "IMPC" auf die Seite, die den Phänotyp der Knockout-Maus und ihre Verfügbarkeit von öffentlichen Lagerzentren beschreibt.
  2. Human Protein-Domains: Verwenden Sie die Box für menschliche Genproteindomänen, um vorhergesagte Proteindomänen des menschlichen Gens zu erhalten. Die Daten werden von DIOPTabgeleitet, das Pfam (https://pfam.xfam.org/) und CCD (Conserved Domains Database, https://www.ncbi.nlm.nih.gov/Structure/cdd/cdd.shtml) verwendet. Ein einzelner Rückstand wurde möglicherweise mehr als einmal durch einige Überschneidungen in Domänen, die in den beiden Quellen mit Anmerkungen anmerkungiert wurden, mit Anmerkungen.
  3. Verwenden Sie die Feld Multiple Protein Alignment, um die von DIOPT9 erzeugte Aminosäure-Mehrfachausrichtung zu erhalten, die menschliche (hs), Ratte (rn), Maus (mm), Zebrafische (dr), Fruchtfliegen (dm), Wurm (ce) und Hefen (sc und sp) umfasst. Um die Aminosäure von Interesse hervorzuheben, scrollen Sie nach unten in der Box und geben Sie die Aminosäurenummern unten ein und die Aminosäuren von Interesse werden in Petrol hervorgehoben. Die Ausrichtung wird von DIOPT bereitgestellt und verwendet MAFFT Aligner (Multiple Alignment Program for amino acid or nukleotide sequences, https://mafft.cbrc.jp/alignment/software/31).
    HINWEIS: Wenn die Aminosäure, die basierend auf der Zahl hervorgehoben wird, nicht diejenige ist, die erwartet wird, kann dies auf verschiedene Spleißisoformen zurückzuführen sein, die für die Ausrichtung verwendet werden. Im Prinzip verwendet DIOPT die längste Isoform, um in diesem Feld angezeigt zu werden. Auch für Segmente von Genen, die nicht gut konserviert sind, ist die Ausrichtung von Sequenzen mit mehreren Arten unter Verwendung von Standardparametern möglicherweise nicht optimal. Wir empfehlen die Verwendung anderer Websites und Software wie Clustal Omega und ClustalW/X (http://www.clustal.org/)32, um die Ausrichtungsparameter und Matrizen entsprechend zu optimieren.

Subscription Required. Please recommend JoVE to your librarian.

Representative Results

Humangenetiker und Modellorganismus-Wissenschaftler verwenden JEWEILS MARRVEL auf unterschiedliche Weise, jeder mit unterschiedlichen gewünschten Ergebnissen. Im Folgenden sind drei Vignetten der möglichen Verwendungsmöglichkeiten für MARRVEL.

Bewertung der Pathogenität einer Variante bei einer dominanten Krankheit
Die meisten Benutzer, die MARRVEL besuchen, nutzen diese Website, um die Wahrscheinlichkeit zu analysieren, dass eine seltene menschliche Variante eine bestimmte Krankheit verursachen kann. Beispielsweise wurde festgestellt, dass sich eine Missense-Variante (17:59477596 G>A, p.R20Q) in TBX2 in einer autosomal dominanten Weise in einer kleinen Familie mit dysmorphen Merkmalen und Gaumenspalten, Herzfehlern, Skelett- und Zifferanomalien, Schilddrüsen-bezogenen Phänotypen und Immundefekte12. Die Mutter und zwei Kinder, die von diesen Symptomen betroffen waren, trugen die Variante, während der Vater dies nicht tat. Der 9-jährige Sohn hatte den schwersten Phänotyp, während die 36-jährige Mutter und die 6-jährige Tochter mildere Formen dieser Krankheit hatten. Um zu beurteilen, ob diese Variante wahrscheinlich pathogen ist, kann man eine MARRVEL-Suche starten, indem man das Gen und die Varianten auf der Startseite auf http://MARRVEL.org eingibt. Beachten Sie, dass die Variantensuchleiste die Entfernung von Chr vor der Variante erfordert, wenn diese im ursprünglichen klinischen Bericht aufgeführt ist, um "Chromosom" anzuzeigen. Zum Zeitpunkt der ursprünglichen Studie zeigte die Ergebnisseite, dass kein OMIM-Phänotyp mit diesem Gen assoziiert ist, und diese Variante ist nur einmal in gnomAD gefunden, aber nicht in ExAC, ClinVar oder Geno2MP. Man könnte denken, dass diese Identifizierung einer Person ein Beweis dafür sein kann, dass p.R20Q eine pathogene Variante ist, aber es ist wichtig zu beachten, dass die Mutter der Familie eine milde Form der Krankheit zeigte. Eine Variante, die in 1/150.000 Einzelzufällen gefunden wird, ist in der Tat eine sehr seltene Variante, und die Identifizierung eines Individuums mit der identischen Variante kann durch reduzierte Expressivität oder Penetranz erklärt werden. In der Tabelle Gene Function ist es oft hilfreich zu überprüfen, ob das Gen in relevanten Geweben beim Menschen (über GTEx und Protein Atlas) in Bezug auf die Phänotypen des Patienten exprimiert wird. In diesem Fall stimmt das Expressionsmuster überein, da der Patient Phänotypen in mehreren Geweben hat und das Gen ebenfalls weit verbreitet ist, einschließlich Herz- und immunverwandte Organe.

Basierend auf den in MARRVEL dargestellten Modellorganismusinformationen kann man schnell erkennen, dass das Gen von C. elegans und Drosophila bis zum Menschen konserviert wird und die Aminosäure von Interesse, p.R20 ist auch während der gesamten Evolution hochkonserviert, wie in Abbildung 2 (Beachten Sie, dass Ratte Tbx2 in diesem Bereich nicht gut ausgerichtet ist, wahrscheinlich aufgrund des Transkripts, das für die Ausrichtung verwendet wird). Phänotypische Informationen in Maus und Zebrafisch zeigen, dass dieses Gen die Entwicklung oder Funktion einer Reihe von Geweben beeinflusst, einschließlich des Herz-Kreislauf-Systems, craniofacial/palate, und Ziffern. Zusammenfassend deuten diese Daten darauf hin, dass diese Variante möglicherweise pathogen ist und weitere funktionelle Studien wertvoll sind. Wenn man bedenkt, dass das Gen und die Variante in Organismen wie C. elegans und Drosophilakonserviert werden, werden funktionelle Studien an wirbellosen Tieren schneller und billiger sein als bei der Durchführung desselben Experiments an Wirbeltiermodellorganismen. wie Zebrafisch, Maus und Ratte. Bitte lesen Sie den begleitenden Artikel von Harnish et al.21 darüber, wie wir funktionale Assays für diesen Fall12entworfen und durchgeführt haben. Die Beteiligung dieser Gen/Variante an der Krankheit dieser Familie wurde durch die Identifizierung eines nicht verwandten 8-jährigen männlichen Patienten mit überlappenden Phänotypen mit einer de novo missense-Variante im selben Gen mit GeneMatcher weiter verstärkt. Die Varianten in den beiden Familien wurden beide mit Experimenten in Drosophilafunktionsfähig, was die Pathogenität der seltenen Varianten in TBX2weiter unterstützt. Die Krankheit wurde vor kurzem kuratiert als "Vertebral Anomalien und variable endokrine und T-Zell-Dysfunktion (VETD, OMIM #618223)" in OMIM. Siehe Abbildung 3 für die gesamte Ausgabe für TBX2 17:59477596 G>A.

Bewertung der Pathogenität einer Variante bei einer rezessiven Erkrankung
Es gibt signifikante Unterschiede zwischen der Analyse menschlicher Varianten bei dominanten und rezessiven Krankheiten. Beispielsweise werden pLI-Score, geringfügige Allelhäufigkeit und das Vorhandensein von Deletionen in der Kontrollpopulation weniger wichtig, da zwei Allele notwendig sind, um jeden Phänotyp zu offenbaren.

Ein Beispiel für die Analyse einer rezessiven Krankheit ist in Yoon et al33 und Wang et al4 aufgeführt, das hier zusammengefasst ist. Ein 15-jähriges Mädchen zeigte Entwicklungsverzögerung, Mikrozephalie, Ataxie, motorische Beeinträchtigung, Hypotonie, Sprachstörungen, Hirnanomalien und Hypoplasie des Corpus callosum33. Die Band, ihre nicht betroffenen Eltern und ein nicht betroffenes Geschwisterchen erhielten WES. Nach der Filterung nach Varianten, die sowohl für den Probanden einzigartig als auch in der Population selten waren, blieben Varianten in 13 verschiedenen Genen übrig. Die manuelle Filterung und Analyse der 13 Kandidaten nach dem hier beschriebenen Protokoll führte zur Priorisierung einer spezifischen Variante in OGDHL als guter Kandidat für Funktionsstudien. Die wichtigsten Informationen, die zur Priorisierung von p.S778L in OGDHL (10:50946295 G>A) gegenüber anderen Varianten geführt haben, sind: (1) keine vorherige Krankheitsassoziation in OMIM, (2) Variante, die nicht in Kontrollpopulationen gefunden wurde, (3) Genontologie, die mit Mikrotubuli und Mitochondrien, zwei Systeme, die viele Verbindungen zu neurologischen Erkrankungen haben34,35, (4) stark in menschlichem Kleinhirn exprimiert, ein Gewebe, das bei diesem Patienten schwer betroffen ist, und (5) die Variante von Interesse, die eine konservierte Aminosäure (von Hefe zum Menschen) und befindet sich innerhalb der katalytischen Domäne4. pLI-Score für dieses Gen ist 0.00, aber dies hat keinen Einfluss auf die Priorisierung dieser Variante/ Gen für diesen Fall, da wir eine rezessive Art der Vererbung vermuten und dass Träger von schädlichen Varianten in diesem Gen in der allgemeinen Bevölkerung vorhanden sein können. Siehe Abbildung 4 für DIE MARRVEL-Ausgabe für OGDHL 10:50946295 G>A.

Parallel durchgeführte Modellorganismusstudien zeigten, dass der Verlust von Ogdh(auch nc73EF genannt),dem Drosophila-Ortholog von OGDHL, im Nervensystem einen neurodegenerativen Phänotyp aufweist, der mit dem Neurologische Störung33. Funktionelle Studien in Drosophila zeigten, dass die Variante von Interesse (p.S778L) die Proteinfunktion beeinflusst, was dies zu einem starken Kandidatengen für diese Krankheit macht. Seitdem wurden diese Informationen über eine mögliche pathogene Variante in OGDHL im Zusammenhang mit einer neuartigen neurologischen Erkrankung erst vor kurzem in OMIM (https://www.omim.org/entry/617513) aufgenommen, aber noch keinen Krankheits-Phänotyp zugewiesen. Zahl, da seit Januar 2019 nur ein Fall gemeldet wurde.

Ist der menschliche Ortholog eines Modellorganismus-Gens von Interesse mit genetischen Krankheiten verbunden?
Viele Modellorganismusforscher könnten daran interessiert sein zu sehen, ob der menschliche Ortholog ihres Gens von Interesse Verbindungen zu genetischen Krankheiten haben kann. In diesem Beispiel werden wir untersuchen, ob die menschlichen Orthologe des Fliegennotch (N) Gens irgendeine Relevanz für genetische Krankheiten haben. Dazu beginnen wir mit einer "Model Organisms Search (1.3.1.-1.3.2.)" und wählen"Drosophila melanogaster" als Artennamen und"N" als Modellorganismus-Gennamen. Die vier vorhergesagten menschlichen Orthologs für dieses Fliegengen werden im Ergebnisfenster als NOTCH1, NOTCH2, NOTCH3 und NOTCH4 angezeigt. Die vier Gene haben unterschiedliche DIOPT-Scores (10/12 für NOTCH1, 8/12 für NOTCH2 und NOTCH3, 5/12 für NOTCH4) aufgrund des Homologiegrades zwischen Fliege N und jedem menschlichen Gen. Unter Berücksichtigung der "Best score from Human gene to Fly" wird für alle vier Gene "Ja" aufgeführt, nimmt die umgekehrte Suche von jedem menschlichen Gen das Fliegen-N-Gen als wahrscheinlichster Ortholog-Kandidat auf. Tatsächlich wird angenommen, dass die vier menschlichen NOTCH-Gene während der beiden Runden der gesamten Genomduplizierungsereignisse, die in der Wirbeltierlinie nach der Trennung von der wirbellosen Linie36passierten, aus einem einzigen Kerbgen entstanden sind. Durch Anklicken der "MARRVEL it"-Tasten für jedes menschliche Gen kann man die menschlichen genbasierten Ausgänge für NOTCH1-4erhalten.  Auf der Ergebnisseite jedes Gens zeigen die Top-Boxen für OMIM an, dass NOTCH1, 2 und 3 zwar mit genetischen Krankheiten in Verbindung gebracht werden, NOTCH4 aber derzeit nicht mit menschlichen Krankheiten in Verbindung gebracht wird. Beachten Sie, dass es Debatten darüber gab, ob Varianten in NOTCH4 mit Schizophrenie auf der Grundlage genomweiter Assoziationsstudien (GWAS)37,38in Verbindung gebracht werden. Da OMIM GWAS-Daten in der Regel mit einigen Ausnahmen (z. B. APOE, PTPN22) nicht kuratiert, sind diese Informationen im OMIM-Fenster nicht verfügbar. Da OMIM im Allgemeinen keine krebsassoziierten somatischen Mutationsinformationen kuratiert, werden Informationen darüber, ob somatische Mutationen in diesen Genen mit bestimmten Krebsarten in Verbindung gebracht werden, nicht mit wenigen Ausnahmen aufgeführt (z. B. TP53, RB1, BRCA1). Wenn Sie auf das Feld PubMed oder Monarch klicken, können Sie einige krankheitsbezogene Papiere identifizieren, die in OMIM nicht kuratiert sind. Siehe Abbildung 5 für den gesamten MARRVEL-Output für das Fliegengen N und das humane Gen NOTCH4.

Figure 1
Abbildung 1 . Eine repräsentative Ausgabe einer MARRVEL-Suche. Dieses spezifische Beispiel zeigt eine Gen/Variantensuche nach "TBX2/17:59477596 G>A" (http://marrvel.org/search/pair/TBX2/17:59477596%20G%3EA). Sidebar auf der linken Seite unterstützt Navigationen durch die Datenausgabe. Beachten Sie, dass die "externen Link"-Schilder hier Links zu den entsprechenden Seiten des UCSC Genom-Browsers (https://genome.ucsc.edu/) enthalten. Die Registerkarten oben ermöglichen es, genbasierte Modellforschungen durchzuführen, zusätzliche Informationen über MARRVEL zu erhalten und Benutzerfeedbacks zu geben. Die Bedienfelder "Suchergebnisse" zeigen Gen- und Varianteninformationen aus den im Bild angegebenen Quellen an. Bitte klicken Sie hier, um eine größere Version dieser Abbildung anzuzeigen.

Figure 2
Abbildung 2 . Zusammenfassung der Orthologtabelle des Modellorganismus und der Ausrichtung mehrerer Arten für TBX2. A) MARRVEL wählt auf Der Grundlage des DIOPT-Tools den Besten für die Ortholog-Kandidaten für jede Art aus. Ein DIOPT-Score von 10/12 für das Drosophila bi-Gen bedeutet beispielsweise 10 von 12 von DIOPT verwendeten Orthologie-Vorhersageprogrammen, dass Bi der wahrscheinlichste Fliegenortholog des menschlichen TBX2ist. Da 25 % der Gene in Zebrafischen im Vergleich zum Menschen dupliziert werden, zeigt MARRVEL zwei paralogusfarbene Gene (in diesem Fall tbx2a und tbx2b),wenn dies anwendbar ist. B) Momentaufnahme des Ausrichtungsfensters mit mehreren Arten. Durch die Auswahl eines bestimmten Organismus [in diesem Fall des Menschen (hs)] und das Eindringen in die Aminosäure von Interesse kann man die spezifische Aminosäure in Petrol hervorheben. In diesem Beispiel scheint p.R20 des menschlichen TBX2 in Maus (mm1), sowohl Zebrafisch-Orthologs (dr1 und dr2), Drosophila (dm1) und C. elegans (ce1), konserviert zu sein. Ratte Tbx2 scheint im Vergleich zu anderen Arten nicht gut auszurichten, was höchstwahrscheinlich auf die Isoform zurückzuführen ist, die von der DIOPT zur Durchführung der Multi-Arten-Ausrichtung verwendet wird. Bitte klicken Sie hier, um eine größere Version dieser Abbildung anzuzeigen.

Figure 3
Abbildung 3 : Gesamte Ausgabe für TBX2 17:59477596 G>A. Bitte klicken Sie hier, um diese Datei herunterzuladen.

Figure 4
Abbildung 4 : MARRVEL-Ausgang für OGDHL 10:50946295 G>A. Bitte klicken Sie hier, um diese Datei herunterzuladen.

Figure 5
Abbildung 5 : MARRVEL-Ausgang für das Fliegengen N und das humane Gen NOTCH4. Bitte klicken Sie hier, um diese Datei herunterzuladen.

Art der Datenbank Name der Datenbank URL/Link zur Datenbank Begründung für die Aufnahme in MARRVEL Referenz (PMID)
Humangenetik ClinVar https://www.ncbi.nlm.nih.gov/clinvar/ ClinVar ist ein öffentliches Archiv von Berichten über die Beziehungen zwischen menschlichen Variationen und Phänotypen, mit Belegen. Varianten mit Interpretationen, die von Forschern und Klinikern berichtet werden, sind wertvoll für die Analyse, wie wahrscheinlich eine Variante pathogen ist. PMID: 29165669
Humangenetik entziffern https://decipher.sanger.ac.uk/ Die auf MARRVEL angezeigten DECIPHER-Daten enthalten gängige Varianten aus der Steuerungspopulation. Die angezeigten Daten umfassen strukturelle Varianten, die die genomische Position der Eingangsvariante abdecken. DECIPHER enthält auch Varianten- und phänotypische Informationen für Betroffene, kann aber nur direkt über deren Website abgerufen werden. PMID: 19344873
Humangenetik DGV http://dgv.tcag.ca/dgv/app/home Unserer Kenntnis nach ist der DGV die größte öffentlich zugängliche Sammlung von Strukturvarianten von mehr als 54.000 Personen. Die Datenbank enthält Proben von angeblich gesunden Personen, zum Zeitpunkt der Feststellung, aus bis zu 72 verschiedenen Studien. Mögliche Einschränkungen dieser Daten sind die Variation der Quelle und der Methode der Daten, die den Mangel an Informationen über unvollständige Penetranz pathogener CNVs und die Frage, ob Einzelpersonen nach der Datenerhebung assoziierte Krankheiten entwickeln werden, erfasst haben. PMID: 24174537
Orthologie-Vorhersage DIOPT https://www.flyrnai.org/cgi-bin/DRSC_orthologs.pl DIOPT lieferte mehrere Proteinsequenzausrichtung der am besten vorhergesagten Orthologs in sechs Modellorganismen gegen die Proteinsequenz des menschlichen Gens von Interesse. Die Ausrichtung wird Informationen über die Konservierung bestimmter Aminosäuren sowie funktioneller Proteindomänen liefern. PMID: 21880147
HumanGene/Transkript-Nomenklatur Ensembl https://useast.ensembl.org/ Ensembl-Gen-IDs werden verwendet, um die verschiedenen Datenbanken zu verknüpfen. PMID: 29155950
Humangenetik ExAC http://exac.broadinstitute.org/ ExAC enthält mehr als 60.000 Exome und ist, mit Weniger als gnomAD (http://gnomad.broadinstitute.org/), die größte öffentliche Sammlung von Exomen, die gegen Personen mit schweren mendelianen Phänotypen im Frühbeginn ausgewählt wurden. Für MARRVEL-Zwecke dienen ExAC und gnomAD als bestes Steuerelement-Bevölkerungsdatensatz, um kleinere Allel-Frequenzen zu berechnen. Wir bieten zwei Sätze von Ausgängen von ExAC. Die erste Ausgabe ist die genzentrierte Übersicht über die erwartete im Vergleich zu beobachteten Anzahl von Fehlsinn und Funktionsverlust (LOF) Allele. Eine Metrik namens pLI (Wahrscheinlichkeit der LOF-Intoleranz) reicht zwischen 0,00 und 1,00 und spiegelt den selektiven Druck auf bestimmte Varianten vor dem reproduktiven Alter wider. pLI-Score von 1,00 bedeutet, dass dieses Gen sehr intolerant gegenüber lOF-Varianten ist und Haploinsuffizienz dieses Gens Krankheiten beim Menschen verursachen kann. Die zweite Ausgabe sind Daten von ExAC, die sich auf die jeweilige Variante beziehen. Wenn die identische Variante in ExAC zu sehen ist, zeigt MARRVEL die kleinere Allelfrequenz an. PMID: 27535533
Primäre Modellorganismus-Datenbanken FlyBase (Drosophila) http://flybase.org MARRVEL sammelt und zeigt Daten aus Datenbanken mehrerer Modellorganismen an. Wir liefern eine Zusammenfassung der molekularen, zellulären und biologischen Funktion des Gens unter Verwendung von GO-Begriffen. Der wahrscheinlichste Ortholog wird von DIOPT abgeleitet. PMID:26467478
Modellorganismus-Datenbank-Integrationstools Gene2Funktion http://www.gene2function.org/search/ MARRVEL arbeitet mit DIOPT und Gene2Function zusammen, um die Funktion "Model Organism Search" bereitzustellen. Ein Hyperlink wird Benutzern bereitgestellt, um auf ihre Website zuzugreifen, die eine Reihe von MO-Datenbanken integriert und sie in einem anderen Stil als MARREL anzeigt. PMID: 28663344
Humangenetik Geno2MP http://geno2mp.gs.washington.edu/Geno2MP/ Geno2MP ist eine Sammlung von Proben des University of Washington Center for Mendelian Genetics. Es enthält 9.650 Exome von betroffenen Personen und nicht betroffenen Verwandten. Diese Datenbank verknüpft die phänotypische und Art der Vererbungsinformationen mit bestimmten Allelen. Für Phänotyp, durch den Vergleich des betroffenen Organsystems des Patienten von Interesse zu den betroffenen Personen in Geno2MP, kann man potenzielle Übereinstimmungen finden. Eine Übereinstimmung in Allel, Vererbungsart und Phänotyp bietet eine erhöhte Wahrscheinlichkeit, dass die Variante wahrscheinlich pathogen ist. Aufgrund der geringen Stichprobengröße verringert jedoch eine negative Assoziation nicht notwendigerweise die pathogene Priorität einer Variante. Ein Mechanismus, um den Hausarzt eines Patienten von Interesse zu kontaktieren, ist in der ursprünglichen Quelle vorgesehen. N/A
Humangenetik gnomAD http://gnomad.broadinstitute.org/ gnomAd enthält insgesamt 123.136 Exomsequenzen und 15.496 Ganzgenomsequenzen von nicht verwandten Individuen, die im Rahmen verschiedener krankheitsspezifischer und populationsgenetischer Studien sequenziert wurden. Ein erheblicher Teil der ExAC-Daten wird in gnomAD integriert. In MARRVEL zeigen wir derzeit die Populationsfrequenzen an, die sich auf eine bestimmte Variante beziehen. PMID: 27535533
Gene Ontologie GO Central http://www.geneontology.org/ MARRVEL zeigt nur Gene Ontology (GO)-Begriffe (Molecular Function, Cellular Component, and Biological Process) an, die aus experimentellen Beweisen für jedes Gen abgeleitet wurden. Sie werden nach "experimentellen Beweiscodes" gefiltert und GO-Begriffe, die auf "Datenanalyse-Beweiscodes" und "elektronischen Anmerkungsbeweiscodes" (Vorhersagen) basieren, werden vermieden. PMID: 10802651, 25428369
Humane Gen-/Proteinexpression GTEx https://gtexportal.org/home/ MARRVEL zeigt sowohl mRNA- als auch Proteinexpressionsmuster in menschlichen Geweben jedes Gens an. Das Expressionsmuster kann Einen Einblick in die bei Patienten und/oder Modellorganismen beobachteten Phänotypen geben. PMID: 29019975, 23715323
Human Gene Nomenklatur HGNC https://www.genenames.org/ Für DIE MARRVEL-Suche werden offizielle HGNC-Gensymbole verwendet. PMID: 27799471
Primäre Modellorganismus-Datenbanken IMPC (Maus) http://www.mousephenotype.org/ MARRVEL stellt einen Hyperlink zu den antwortenden Maus-Genseiten auf der IMPC-Website bereit. Wenn es eine Knock-out-Maus durch den IMPC gemacht hat, wird eine erschöpfende Liste von Assays und deren Ergebnisse öffentlich zugänglich gemacht und kann Einblick in den Phänotyp geben, wenn ein Gen verloren geht. Einige Informationen werden in MGI kuratiert, aber es gibt vielleicht eine Zeitverzögerung. PMID: 27626380
Primäre Modellorganismus-Datenbanken MGI (Maus) http://www.informatics.jax.org/ MARRVEL sammelt und zeigt Daten aus Datenbanken mehrerer Modellorganismen an. Wir liefern eine Zusammenfassung der molekularen, zellulären und biologischen Funktion des Gens unter Verwendung von GO-Begriffen. Der wahrscheinlichste Ortholog wird von DIOPT abgeleitet. PMID:25348401
Modellorganismus-Datenbank-Integrationstools Monarch-Initiative https://monarchinitiative.org/ MARRVEL stellt eine Verbindung zum Phenogrid eines menschlichen Gens auf Monarch Initiative bereit. Dieses Raster liefert Vergleiche zwischen dem Phänotyp von Modellorganismen und bekannten menschlichen Krankheiten. PMID: 27899636
Human Variant Nomenklatur Mutalyzer https://mutalyzer.nl/ MARRVEL verwendet Mutalyzers API, um verschiedene Variantennomenklaturen an den genomischen Standort umzuwandeln. PMID: 18000842
Humangenetik OMIM https://omim.org/ Die drei wichtigsten Informationen, die wir aus OMIM beziehen, sind: Genfunktion, assoziierte Phänotypen und gemeldete Allele. Es ist hilfreich zu wissen, ob ein Gen mit einem bekannten mendelianischen Phänotyp (- Einträge) verbunden ist, dessen molekulare Grundlage bekannt ist. Gene ohne dieses Wissen sind Kandidaten für die Entdeckung neuartiger Gene. Für Gene, die diese Kategorie sind, wenn der Phänotyp des Patienten nicht mit der gemeldeten Krankheit und dem Phänotyp sowie denen der Patienten in der Literatur übereinstimmt, erhöht dies die Möglichkeit, eine phänotypische Expansion für das Gen von Interesse bereitzustellen. PMID: 28654725
Primäre Modellorganismus-Datenbanken PomBase (Spalthefe) https://www.pombase.org/ MARRVEL sammelt und zeigt Daten aus Datenbanken mehrerer Modellorganismen an. Wir liefern eine Zusammenfassung der molekularen, zellulären und biologischen Funktion des Gens unter Verwendung von GO-Begriffen. Der wahrscheinlichste Ortholog wird von DIOPT abgeleitet. PMID:22039153
literatur Pubmed https://www.ncbi.nlm.nih.gov/pubmed/ MARRVEL stellt einen Hyperlink zur "Gene"-basierten PubMed-Suche bereit. Wenn Sie auf diesen Link klicken, können Sie biomedizinische Papiere durchsuchen, die sich auf das Gen von Interesse beziehen, basierend auf früheren Gennamen und Symbolen. N/A
Primäre Modellorganismus-Datenbanken RGD (Ratte) https://rgd.mcw.edu/ MARRVEL sammelt und zeigt Daten aus Datenbanken mehrerer Modellorganismen an. Wir liefern eine Zusammenfassung der molekularen, zellulären und biologischen Funktion des Gens unter Verwendung von GO-Begriffen. Der wahrscheinlichste Ortholog wird von DIOPT abgeleitet. PMID:25355511
Primäre Modellorganismus-Datenbanken SGD (angehende Hefe) https://www.yeastgenome.org/ MARRVEL sammelt und zeigt Daten aus Datenbanken mehrerer Modellorganismen an. Wir liefern eine Zusammenfassung der molekularen, zellulären und biologischen Funktion des Gens unter Verwendung von GO-Begriffen. Der wahrscheinlichste Ortholog wird von DIOPT abgeleitet. PMID: 22110037
Humane Gen-/Proteinexpression Der menschliche Proteinatlas https://www.proteinatlas.org/ MARRVEL zeigt sowohl mRNA- als auch Proteinexpressionsmuster in menschlichen Geweben jedes Gens an. Das Expressionsmuster kann Einen Einblick in die bei Patienten und/oder Modellorganismen beobachteten Phänotypen geben. PMID: 21752111
Primäre Modellorganismus-Datenbanken WormBase (C. elegans) http://wormbase.org MARRVEL sammelt und zeigt Daten aus Datenbanken mehrerer Modellorganismen an. Wir liefern eine Zusammenfassung der molekularen, zellulären und biologischen Funktion des Gens unter Verwendung von GO-Begriffen. Der wahrscheinlichste Ortholog wird von DIOPT abgeleitet. PMID:26578572
Primäre Modellorganismus-Datenbanken ZFIN (Zebrafisch) https://zfin.org/ MARRVEL sammelt und zeigt Daten aus Datenbanken mehrerer Modellorganismen an. Wir liefern eine Zusammenfassung der molekularen, zellulären und biologischen Funktion des Gens unter Verwendung von GO-Begriffen. Der wahrscheinlichste Ortholog wird von DIOPT abgeleitet. PMID:26097180

Tabelle 1. Liste der Datenquellen für MARRVEL. Alle Datenbanken, aus denen MARRVEL Daten bezieht, sind in dieser Tabelle aufgeführt. Für jede Datenbank listen wir den Datenbanktyp, URL/Link, die Begründung für die Aufnahme in MARRVEL und primäre Referenzen auf.

Subscription Required. Please recommend JoVE to your librarian.

Discussion

Zu den kritischen Schritten in diesem Protokoll gehören die anfängliche Eingabe (Schritte 1.1-1.3) und die anschließende Interpretation der Ausgabe. Der häufigste Grund, warum Suchergebnisse negativ sind, ist aufgrund der vielen Möglichkeiten, wie ein Gen und/oder eine Variante beschrieben werden kann. Während MARRVEL planmäßig aktualisiert wird, können diese Aktualisierungen zu Trennungen zwischen den verschiedenen Datenbanken führen, zu denen MARRVEL verknüpft ist. Der erste Schritt bei der Fehlerbehebung besteht daher ausnahmslos darin, zu prüfen, ob alternative Namen des Gens oder der Variante zu einem erfolgreichen Suchergebnis führen. Wenn es immer noch nicht gelöst werden kann, senden Sie bitte eine Nachricht an das Entwicklungsteam über das Feedback-Formular in http://marrvel.org/message.

Eine Einschränkung für MARRVEL ist, dass es noch nicht alle nützlichen Datenbanken enthält, die für die Gen- und Variantenanalyse notwendig sind. Beispielsweise werden pathogenizitätsvorhersagealgorithmen wie CADD18 derzeit nicht bereitgestellt. Ebenso werden Proteinstrukturinformationen und Protein-Protein-Interaktionsinformationen, die auch strukturelle und funktionelle Verbindungen zu bekannten krankheitserregenden Varianten in Genen liefern können, derzeit in MARRVEL nicht angezeigt. In unserem nächsten großen Update planen wir, diese Informationen in MARRVEL zu integrieren, zusätzlich zu mehr phänotypischen Informationen von Modellorganismus-Websites, IMPC, Monarch Initiative und Alliance of Genome Resources (AGR, https://www.alliancegenome.org/). Da MARRVEL entwickelt wurde, um die Erforschung seltener Krankheiten zu erleichtern, konzentriert sich das Programm derzeit auf Keimbahnvarianten und bietet keinen Zugang zu somatischen Varianteninformationen. Nach der Veröffentlichung dieses Protokolls sind keine datenbanken im Zusammenhang mit Krebsgenetik integriert. Da MARRVEL aktiv weiterentwickelt und aktualisiert wird, freuen wir uns sehr über Feedback und ermutigen die bestehenden Nutzer dringend, sich für Newsletter auf http://marrvel.org/message für zukünftige zusätzliche Datenbanken anzumelden, die integriert werden.

Obwohl Daten von MARRVEL verwendet werden können, um Varianten zu priorisieren, die pathogen sein können. Um jedoch pathogenizität nachzuweisen, muss man andere Patienten mit ähnlichen Genotypen und Phänotypen identifizieren oder funktionelle Studien durchführen, um solide Beweise dafür zu liefern, dass die Variante von Interesse funktionelle Folgen hat, die für Krankheitszustand. Weitere Informationen zu zusätzlichen Informationen außerhalb von MARRVEL, die nützlich sein können, um zu beurteilen, ob eine Variante eine experimentelle Untersuchung im Modellorganismus wert ist, finden Sie im begleitartikel Harnish et al21. Um die nächsten Schritte bei der Verwendung von Modellorganismen zur Untersuchung menschlicher Varianten zu unternehmen, müssen Humangenetiker und Modellorganismusforscher in der Lage sein, sich zu vernetzen und zusammenzuarbeiten. GeneMatcher und andere genomische Konsortien, die Teil des Matchmaker Exchange-Konsortiums sind, sind Ressourcen, die diesen nächsten Schritt erleichtern. Wenn die Benutzer in Kanada ansässig sind, kann man sich auch im Rare Disease Models and Mechanisms Network (RDMM, http://www.rare-diseases-catalyst-network.ca/) registrieren, um Kliniker und/oder Modellorganismusforscher zu identifizieren, die bereit sind, zusammenzuarbeiten39 . Japan (J-RDMM, https://irudbeyond.nig.ac.jp/en/index.html), Europa (RDMM-Europe, http://solve-rd.eu/rdmm-europe/) und Australien (Australian Functional Genomics Network: https://www.functionalgenomics.org.au/) haben vor kurzem die Kanadisches RDMM-Modell zur Erleichterung ähnlicher Kooperationen innerhalb ihrer Länder/Regionen. Darüber hinaus kann man mit Hilfe von Tools wie BioLitMine (https://www.flyrnai.org/tools/biolitmine/web/) unter den Hauptermittlern, die zuvor an dem Gen von Interesse gearbeitet haben, nach potenziellen Mitarbeitern suchen.

Schließlich gibt es neben MARRVEL eine Reihe weiterer artenübergreifender Data Mining-Tools, darunter Gene2Function40 (http://www.gene2function.org/), Monarch Initiative29 (https://monarchinitiative.org/) und Alliance of Genomressourcen (AGR, https://www.alliancegenome.org/). Während Gene2Function Zugang zu artenübergreifenden Daten bietet und die Monarch Initiative phänotypische Vergleiche bietet, legt MARRVEL einen größeren Schwerpunkt auf menschliche Varianten und die Verknüpfung menschlicher genomischer Daten mit Modellorganismen. AGR ist eine Initiative, die sechs Modellorganismus-Datenbanken und das Gene Ontology Consortium umfasst, das Daten aus verschiedenen Datenbanken einheitlich integriert, um den Zugriff auf die von jeder Datenbank angesammelten Daten zu erhöhen. Diese Ressourcen ergänzen sich, und die Benutzer sollten die Stärken jeder Datenbank verstehen, um durch die enorme Menge an Wissen zu navigieren, die von Forschern in den Gemeinschaften angesammelt wurde. Im weiteren Entwicklungsstadium von MARRVEL planen wir, weitere Datenbanken aufzunehmen, die für die Untersuchung menschlicher Varianten in Modellorganismen relevant sind. Das übergeordnete Ziel von MARRVEL ist es, Ärzten und Forschern gleichermaßen eine leicht zugängliche Möglichkeit zu bieten, menschliche Gene und Varianten für weitere Studien zu analysieren, indem nützliche Informationen integriert werden, während die Schnittstelle so einfach wie möglich gehalten wird.

Subscription Required. Please recommend JoVE to your librarian.

Disclosures

Die Autoren haben nichts zu verraten.

Acknowledgments

Wir danken Drs. Rami Al-Ouran, Seon-Young Kim, Yanhui (Claire) Hu, Ying-Wooi Wan, Naveen Manoharan, Sasidhar Pasupuleti, Aram Comjean, Dongxue Mao, Michael Wangler, Hsiao-Tuan Chao, Stephanie Mohr und Norbert Perrimon für ihre Unterstützung bei der Entwicklung und Wartung von MARRVEL. Wir danken Samantha L. Deal und J. Michael Harnish für ihren Beitrag zu diesem Manuskript.

Die erste Entwicklung von MARRVEL wurde teilweise durch das Undiagnosed Diseases Network Model Organisms Screening Center durch den NIH Commonfund (U54NS093793) und durch das NIH Office of Research Infrastructure Programs (ORIP) (R24OD022005) unterstützt. JW wird vom NIH Eunice Kennedy Shriver National Institute of Child Health & Human Development (F30HD094503) und der Robert and Janice McNair Foundation McNair MD/PhD Student Student Program am BCM unterstützt. Die HJB wird weiterhin vom NIH National Institute of General Medical Sciences (R01GM067858) unterstützt und ist EinForscher des Howard Hughes Medical Institute. ZL wird vom NIH National Institute of General Medical Science (R01GM120033), dem National Institute of Aging (R01AG057339) und der Huffington Foundation unterstützt. SY erhielt zusätzliche Unterstützung vom NIH National Institute on Deafness and other Communication Disorders (R01DC014932), der Simons Foundation (SFARI Award: 368479), der Alzheimer es Association (New Investigator Research Grant: 15-364099), Naman Family Fund for Basic Research und Caroline Wiess Law Fund for Research in Molecular Medicine.

Materials

Name Company Catalog Number Comments
Human Genetics ClinVar PMID: 29165669 https://www.ncbi.nlm.nih.gov/clinvar/
Human Genetics DECIPHER PMID: 19344873  https://decipher.sanger.ac.uk/
Human Genetics DGV PMID: 24174537 http://dgv.tcag.ca/dgv/app/home
Orthology Prediction DIOPT PMID: 21880147  https://www.flyrnai.org/cgi-bin/DRSC_orthologs.pl
Human Gene/Transcript Nomenclature Ensembl PMID: 29155950  https://useast.ensembl.org/
Human Genetics ExAC  PMID: 27535533 http://exac.broadinstitute.org/
Primary Model Organism Databases FlyBase (Drosophila) PMID:26467478 http://flybase.org
Model Organism Database Integration Tools Gene2Function PMID: 28663344 http://www.gene2function.org/search/
Human Genetics Geno2MP N/A http://geno2mp.gs.washington.edu/Geno2MP/
Human Genetics gnomAD PMID: 27535533 http://gnomad.broadinstitute.org/
Gene Ontology GO Central PMID: 10802651, 25428369  http://www.geneontology.org/
Human Gene/Protein Expression GTEx PMID: 29019975, 23715323  https://gtexportal.org/home/
Human Gene Nomenclature HGNC PMID: 27799471  https://www.genenames.org/
Primary Model Organism Databases IMPC (mouse) PMID: 27626380 http://www.mousephenotype.org/
Primary Model Organism Databases MGI (mouse) PMID:25348401 http://www.informatics.jax.org/
Model Organism Database Integration Tools Monarch Initiative PMID: 27899636 https://monarchinitiative.org/
Human Variant Nomenclature Mutalyzer PMID: 18000842  https://mutalyzer.nl/
Human Genetics OMIM PMID: 28654725 https://omim.org/
Primary Model Organism Databases PomBase (fission yeast) PMID:22039153 https://www.pombase.org/
Literature PubMed N/A https://www.ncbi.nlm.nih.gov/pubmed/
Primary Model Organism Databases RGD (rat) PMID:25355511 https://rgd.mcw.edu/
Primary Model Organism Databases SGD (budding yeast) PMID: 22110037 https://www.yeastgenome.org/
Human Gene/Protein Expression The Human Protein Atlas PMID: 21752111 https://www.proteinatlas.org/
Primary Model Organism Databases WormBase (C. elegans) PMID:26578572 http://wormbase.org
Primary Model Organism Databases ZFIN (zebrafish) PMID:26097180 https://zfin.org/

DOWNLOAD MATERIALS LIST

References

  1. Yang, Y., et al. Clinical whole-exome sequencing for the diagnosis of mendelian disorders. New England Journal of Medicine. 369 (16), 1502-1511 (2013).
  2. Richards, S., et al. Standards and guidelines for the interpretation of sequence variants: a joint consensus recommendation of the American College of Medical Genetics and Genomics and the Association for Molecular Pathology. Genetics in Medicine. 17 (5), 405-424 (2015).
  3. MacArthur, D. G., et al. Guidelines for investigating causality of sequence variants in human disease. Nature. 508 (7497), 469-476 (2014).
  4. Wang, J., et al. MARRVEL: Integration of Human and Model Organism Genetic Resources to Facilitate Functional Annotation of the Human Genome. American Journal of Human Genetics. 100 (6), 843-853 (2017).
  5. Povey, S., et al. The HUGO Gene Nomenclature Committee (HGNC). Human Genetics. 109 (6), 678-680 (2001).
  6. Lek, M., et al. Analysis of protein-coding genetic variation in 60,706 humans. Nature. 536 (7616), 285-291 (2016).
  7. Wildeman, M., van Ophuizen, E., den Dunnen, J. T., Taschner, P. E. Improving sequence variant descriptions in mutation databases and literature using the Mutalyzer sequence variation nomenclature checker. Human Mutation. 29 (1), 6-13 (2008).
  8. Zhou, W., et al. TransVar: a multilevel variant annotator for precision genomics. Nature Methods. 12 (11), 1002-1003 (2015).
  9. Hu, Y., et al. An integrative approach to ortholog prediction for disease-focused and other functional studies. BMC Bioinformatics. 12, 357 (2011).
  10. Amberger, J. S., Hamosh, A. Searching Online Mendelian Inheritance in Man (OMIM): A Knowledgebase of Human Genes and Genetic Phenotypes. Current Protocols in Bioinformatics. 58, 1 (2017).
  11. Amberger, J. S., Bocchini, C. A., Scott, A. F., Hamosh, A. OMIM.org: leveraging knowledge across phenotype-gene relationships. Nucleic Acids Research. 47, 1038-1043 (2019).
  12. Liu, N., et al. Functional variants in TBX2 are associated with a syndromic cardiovascular and skeletal developmental disorder. Human Molecular Genetics. 27 (14), 2454-2465 (2018).
  13. Ropers, H. H., Wienker, T. Penetrance of pathogenic mutations in haploinsufficient genes for intellectual disability and related disorders. European Journal of Medical Genetics. 58 (12), 715-718 (2015).
  14. Shashi, V., et al. De Novo Truncating Variants in ASXL2 Are Associated with a Unique and Recognizable Clinical Phenotype. American Journal of Human Genetics. 100 (1), 179 (2017).
  15. Chen, R., et al. Analysis of 589,306 genomes identifies individuals resilient to severe Mendelian childhood diseases. Nature Biotechnology. 34 (5), 531-538 (2016).
  16. Halvorsen, M., et al. Mosaic mutations in early-onset genetic diseases. Genetics in Medicine. 18 (7), 746-749 (2016).
  17. Kohler, S., et al. The Human Phenotype Ontology in 2017. Nucleic Acids Research. 45 (1), 865-876 (2017).
  18. Rentzsch, P., Witten, D., Cooper, G. M., Shendure, J., Kircher, M. CADD: predicting the deleteriousness of variants throughout the human genome. Nucleic Acids Research. 47 (1), 886-894 (2019).
  19. Sobreira, N., Schiettecatte, F., Valle, D., Hamosh, A. GeneMatcher: a matching tool for connecting investigators with an interest in the same gene. Human Mutation. 36 (10), 928-930 (2015).
  20. Sobreira, N. L. M., et al. Matchmaker Exchange. Current Protocols in Human Genetics. 95 (9), 31-39 (2017).
  21. Harnish, M., Deal, S., Wangler, M., Yamamoto, S. In vivo functional study of disease-associated rare human variants using Drosophila. Journal of Visualized Experiments. , (2019).
  22. Harrison, S. M., et al. Using ClinVar as a Resource to Support Variant Interpretation. Current Protocols in Human Genetics. 89, 11-18 (2016).
  23. MacDonald, J. R., Ziman, R., Yuen, R. K., Feuk, L., Scherer, S. W. The Database of Genomic Variants: a curated collection of structural variation in the human genome. Nucleic Acids Research. 42, Database issue 986-992 (2014).
  24. Firth, H. V., et al. DECIPHER: Database of Chromosomal Imbalance and Phenotype in Humans Using Ensembl Resources. American Journal of Human Genetics. 84 (4), 524-533 (2009).
  25. Thurmond, J., et al. FlyBase 2.0: the next generation. Nucleic Acids Research. 47, 759-765 (2019).
  26. Consortium, G. T. Human genomics. The Genotype-Tissue Expression (GTEx) pilot analysis: multitissue gene regulation in humans. Science. 348 (6235), 648-660 (2015).
  27. Ponten, F., Jirstrom, K., Uhlen, M. The Human Protein Atlas--a tool for pathology. Journal of Pathology. 216 (4), 387-393 (2008).
  28. The Gene Ontology, C. The Gene Ontology Resource: 20 years and still GOing strong. Nucleic Acids Research. , (2018).
  29. Mungall, C. J., et al. The Monarch Initiative: an integrative data and analytic platform connecting phenotypes to genotypes across species. Nucleic Acids Research. 45 (1), 712-722 (2017).
  30. Meehan, T. F., et al. Disease model discovery from 3,328 gene knockouts by The International Mouse Phenotyping Consortium. Nature Genetics. 49 (8), 1231-1238 (2017).
  31. Katoh, K., Rozewicki, J., Yamada, K. D. MAFFT online service: multiple sequence alignment, interactive sequence choice and visualization. Brief Bioinform. , (2017).
  32. Sievers, F., Higgins, D. G. Clustal Omega for making accurate alignments of many protein sequences. Protein Science. 27 (1), 135-145 (2018).
  33. Yoon, W. H., et al. Loss of Nardilysin, a Mitochondrial Co-chaperone for alpha-Ketoglutarate Dehydrogenase, Promotes mTORC1 Activation and Neurodegeneration. Neuron. 93 (1), 115-131 (2017).
  34. Deal, S., Yamamoto, S. Unraveling novel mechanisms of neurodegeneration through a large-scale forward genetic screen in Drosophila. Frontiers in Genetics. 9, (2019).
  35. Matamoros, A. J., Baas, P. W. Microtubules in health and degenerative disease of the nervous system. Brain Research Bulletin. 126, Pt 3 217-225 (2016).
  36. Theodosiou, A., Arhondakis, S., Baumann, M., Kossida, S. Evolutionary scenarios of Notch proteins. Molecular Biology and Evolution. 26 (7), 1631-1640 (2009).
  37. Shayevitz, C., Cohen, O. S., Faraone, S. V., Glatt, S. J. A re-review of the association between the NOTCH4 locus and schizophrenia. American Journal of Medical Genetics. Part B: Neuropsychiatric Genetics. 159 (5), 477-483 (2012).
  38. Wang, Z., et al. A review and re-evaluation of an association between the NOTCH4 locus and schizophrenia. American Journal of Medical Genetics. Part B: Neuropsychiatric Genetics. 141 (8), 902-906 (2006).
  39. Oriel, C., Lasko, P. Recent Developments in Using Drosophila as a Model for Human Genetic Disease. International Journal of Molecular Sciences. 19 (7), (2018).
  40. Hu, Y., Comjean, A., Mohr, S. E., FlyBase, C., Perrimon, N. Gene2Function: An Integrated Online Resource for Gene Function Discovery. G3. 7 (8), Bethesda. 2855-2858 (2017).

Tags

Genetik Ausgabe 150 Humangenomik Variantenpriorisierung Modellorganismen Genetik seltene und nicht diagnostizierte Krankheiten funktionelle Genomik Datenbankintegration translationale Forschung medizinische Diagnostik Variante unbekannter Bedeutung Gen ungewisse Bedeutung webbasiertes Werkzeug
Navigieren in MARRVEL, einem webbasierten Tool, das Informationen zur Humangenomik und Modellgenetik integriert
Play Video
PDF DOI DOWNLOAD MATERIALS LIST

Cite this Article

Wang, J., Liu, Z., Bellen, H. J.,More

Wang, J., Liu, Z., Bellen, H. J., Yamamoto, S. Navigating MARRVEL, a Web-Based Tool that Integrates Human Genomics and Model Organism Genetics Information. J. Vis. Exp. (150), e59542, doi:10.3791/59542 (2019).

Less
Copy Citation Download Citation Reprints and Permissions
View Video

Get cutting-edge science videos from JoVE sent straight to your inbox every month.

Waiting X
Simple Hit Counter