Waiting
Login processing...

Trial ends in Request Full Access Tell Your Colleague About Jove
Click here for the English version

Genetics

Bestimmen die Wahrscheinlichkeit einer Variante Pathogenität mit Aminosäure-Niveau Signal-Rausch-Analyse genetischer Variation

Published: January 16, 2019 doi: 10.3791/58907

Summary

Aminosäure-Niveau Signal-Rausch-Analyse bestimmt die Prävalenz der genetischen Variation an einer bestimmten Aminosäure-Position auf Hintergrund genetische Variation einer bestimmten Population normalisiert. Dies ermöglicht eine Identifizierung der Variante "Hotspots" in eine Proteinsequenz (Signal), die über die Häufigkeit der seltenen Varianten gefunden in einer Population (Lärm) steigt.

Abstract

Fortschritten bei der Kosten und Geschwindigkeit der genetische Sequenzierung der nächsten Generation haben eine Explosion von klinischen ganze Exome und gesamten Genoms Tests generiert. Während dies zu erhöhten Identifikation von wahrscheinlich pathogenen Mutationen im Zusammenhang mit genetischen Syndromen geführt hat, hat sie auch drastisch erhöht, die Zahl der übrigens fand genetische Varianten von unbekannter Bedeutung (VUS). Feststellung der klinischen Bedeutung dieser Varianten ist eine große Herausforderung für Wissenschaftler und Kliniker. Es ist ein Ansatz zur Unterstützung bei der Bestimmung der Wahrscheinlichkeit der Pathogenität Signal-Rausch-Analyse auf Proteinebene Sequenz. Dieses Protokoll beschreibt eine Methode für die Aminosäure-Niveau Signal-Rausch-Analyse, die Variante Frequenz bei jeder Aminosäure des Proteins mit bekannten Protein Topologie, um Bereiche der primären Sequenz mit erhöhter Wahrscheinlichkeit zu ermitteln, nutzt pathologische Variation (bezogen auf Bevölkerungsanstieg "Hintergrund"). Diese Methode erkennt Aminosäure Rückstände Lage "Hotspots" der hohe pathologische Signal, welche verwendet werden können, um die diagnostische Gewicht des VUSs wie diejenigen, die von der nächsten Generation Gentests zu verfeinern.

Introduction

Die schnelle Verbesserung der genetische Sequenzierung Plattformen hat die Zugänglichkeit und die Rolle der Genetik in der Medizin revolutioniert. Sobald auf ein einzelnes Gen oder eine Handvoll Genen beschränkt, ist die Reduzierung der Kosten und Erhöhung der Geschwindigkeit der nächsten Generation genetische Sequenzierung dazu, dass routinemäßige Sequenzierung des gesamten Genoms geführt hat Sequenz (ganze Exome Sequenzierung, WES) Codierung und das gesamte Genom ( kompletten Genoms, WGS) in der klinischen Einstellung. WES und WGS wurden häufig verwendet in der Umgebung von kritisch kranken Neugeborenen und Kindern mit Besorgnis für genetisches Syndrom wo ist es eine bewährte Diagnosetool, das Klinikmanagement1,2ändern kann. Während dies zu erhöhten Identifikation von wahrscheinlich pathogenen Mutationen im Zusammenhang mit genetischen Syndromen geführt hat, stieg es auch drastisch die Anzahl der im übrigen gefundenen genetischen Varianten oder unerwartete positive Ergebnisse von unbekannten Diagnose- Bedeutung (VUS). Während einige dieser Varianten sind außer acht gelassen und nicht gemeldet, Varianten zu lokalisieren sind Gene verbunden mit potenziell tödlichen oder sehr morbide Erkrankungen häufig berichtet. Aktuelle Leitlinien empfehlen Berichterstattung über anfallende Varianten gefunden in bestimmte Gene, die möglicherweise von medizinischen Nutzen für den Patienten, einschließlich der Gene, die im Zusammenhang mit der Entwicklung von plötzlichen kardialen Tod prädisponierende Erkrankungen wie Kardiomyopathien und Channelopathien3. Obwohl diese Empfehlung entwickelt wurde, um Personen in Gefahr einer SCD prädisponierende Erkrankung erfassen, übertrifft die Nachweisempfindlichkeit Variante Spezifität. Dies spiegelt sich in einer wachsenden Zahl von VUSs und übrigens unklar Diagnoseprogramm, die weit über die Häufigkeit der jeweiligen Krankheiten in einer gegebenen Population4Varianten zugeordnet. Eine solche Krankheit, lange QT-Syndrom (LQTS), ist eine kanonische kardiale Channelopathie verursacht durch Mutationen, die Lokalisierung von Genen die kardiale Ionenkanäle codieren oder Kanal-Proteine, wodurch Interaktion verzögert kardiale Repolarisation5. Diese verzögerte Repolarisation, gesehen von einem verlängertem QT-Intervall im Ruhe-EKG, führt zu einem elektrischen Prädisposition für potenziell tödliche ventrikuläre Arrhythmien wie Torsades de Pointes. Während eine Reihe von Genen für die Entwicklung dieser Krankheit, Mutationen im KCNQ1verknüpft wurden-kodiert ichKs Kalium Kanal (KCNQ1, Kv7.1) ist die Ursache des LQTS Typ 1 und ist als ein Beispiel unter6genutzt. Zur Veranschaulichung der Komplexität in der Variante Interpretation, wurde die Anwesenheit von seltenen Varianten in LQTS-assoziierten Genen, so genannte "Hintergrund genetische Variation" beschriebenen7,8.

Neben großen Kompendium-Stil Datenbanken der bekannten pathogenen Varianten existieren mehrere Strategien für die Vorhersage, dass die Wirkung verschiedener Varianten produzieren. Einige basieren auf Algorithmen, wie z. B. SIFT und Polyphen 2, die große Anzahl von Roman nicht gleichbedeutend Varianten vorherzusagen Verderblichkeit9,10filtern können. Trotz breiten Einsatz dieser Werkzeuge begrenzt geringe Spezifität ihrer Anwendbarkeit, wenn es darum geht, "calling" klinische VUSs11. "Signal-Rausch-" Analyse ist ein Werkzeug, das die Wahrscheinlichkeit einer Variante mit Krankheit bezogen auf die Frequenz des bekannten pathologische Variation bei den fraglichen Loci normalisiert gegen seltene genetische Variation aus einer Population identifiziert. Lokalisierung von genetischen Loci Varianten wo gibt es eine hohe Prävalenz von krankheitsassoziierten Mutationen im Vergleich zur Bevölkerung basierende Variante, einen hohen Signal-Rausch-, sind eher krankheitsassoziierten selbst zu sein. Weitere, seltene Varianten fand übrigens auf ein Gen mit einer hohen Frequenz von seltenen Bevölkerung Varianten Lokalisierung im Vergleich zu krankheitsassoziierten Frequenz, eine geringe Signal-Rausch-, möglicherweise seltener Krankheiten. Der diagnostische Nutzen des Signal-Rausch-Analyse hat in den neuesten Leitlinien für Gentests für Kardiomyopathien und Channelopathien illustriert; Es ist jedoch nur auf ganze gen oder domänenspezifische Level12beschäftigt. Vor kurzem gegeben erhöhte Verfügbarkeit der pathologische Varianten (Krankheit Datenbanken, Kohortenstudien in der Literatur) und bevölkerungsbezogenen Kontrolle Varianten (Exome Aggregation Konsortium, ExAC und Genom-Aggregation-Datenbank, GnomAD13), die einzelne Aminosäure-Positionen innerhalb der primären Sequenz eines Proteins zugewiesen wurden. Aminosäure-Niveau Signal-Rausch-Analyse hat bei der Kategorisierung übrigens identifizierter Varianten in Genen verbunden mit LQTS als wahrscheinlich "Hintergrund" genetische Variation, anstatt krankheitsassoziierten bewährt. Unter den drei wichtigen Genen verbunden mit LQTS, einschließlich KCNQ1fehlte diese übrigens identifizierten Varianten eine erhebliche Signal-Rausch-Verhältnis, darauf hindeutet, dass die Häufigkeit dieser Varianten an einzelne Aminosäure-Positionen selten reflektieren Bevölkerungsanstieg anstatt krankheitsassoziierten Mutationen. Darüber hinaus wurde als Protein-spezifische Domänentopologie gegen Gebiete der hohen Signal-Rausch, pathologischer Mutation "Hotspots" auf wichtige Funktionsbereiche der Proteine14lokalisiert überlagert. Diese Methode verspricht bei der Bestimmung, dass (1) die Wahrscheinlichkeit, dass eine Variante krankheitsassoziierten oder Bevölkerung ist und (2) Ermittlung der Roman kritische Funktionsbereiche eines Proteins mit der menschlichen Krankheit verbunden.

Subscription Required. Please recommend JoVE to your librarian.

Protocol

1. identifizieren Sie die Gene und bestimmte Splice Isoform von Interesse

Hinweis: Hier zeigen wir den Einsatz von Ensembl15 Konsensussequenz für das gen des Interesses zu identifizieren, die im Zusammenhang mit der Pathogenese der Krankheit von Interesse (d.h. KCNQ1 Mutationen LQTS zugeordnet sind). Alternativen zu Ensembl gehören RefSeq über das National Center for Biotechnology Information (NCBI)16 und der University of California, Santa Cruz (UCSC) menschliche Genom Browser17 (siehe Tabelle der Materialien).

  1. Wählen Sie in der Ensembl-Homepage die Art (z.B. Mensch) im Dropdown-Menü, und geben Sie das gen des Interesses Akronym im Feld (d.h. KCNQ1). Klicken Sie auf "Go"
  2. Wählen Sie den Link, das gen des Interesses entsprechen (d.h. "KCNQ1 (menschliche Gene)"
  3. Wählen Sie den Link entsprechend der Niederschrift des Interesse ID von Interesse aus der "Protokoll-Tabelle" (d. h. TranscriptID ENST00000155840.10, NM_000218 [RNA-Abschrift], NP_000209 [Proteinprodukt von RNA-Transkript]).
    Hinweis: Die Überprüfung der einschlägigen Literatur wird benötigt, um sicherzustellen, dass die korrekte Abschrift Konsensussequenz ausgewählt ist.
  4. Beachten Sie die Protokoll-spezifischen NM und NP Kenn-Nummern zum Nachschlagen in der Spalte "RefSeq" des Tisches"Transkript" gefunden.
  5. Wählen Sie den Link mit dem NP-ID-Nummer, eine neue Webseite von NCBI Protein-Datenbank zu öffnen.
  6. Scrollen Sie zum Abschnitt "Ursprung" die Proteinsequenz (primäre) für diese gen-Transkription von Interesse zu erhalten.
  7. Scrollen Sie im Abschnitt "Features" erhalten Sie eine Liste der Protein-Funktionen (Funktionsbereiche, bindende Domänen, Post-translationale Modifikation Stätten).
    Hinweis: Diese Informationen auch über die NCBI Protein-Datenbank oder aus Primärquellen in der Literatur erhalten. Dies wird in Schritt 5 weiter diskutiert werden.

2. erstellen Sie experimentelle Variante Gendatenbank (das "Signal")

Hinweis: Hier zeigen wir wie erstelle ich eine Datenbank von krankheitsassoziierten Varianten im gen des Interesses mit der Frequenz der krankheitsassoziierten Varianten unter den Menschen mit der Krankheit von Interesse. Diese Datenbank kann viele Formen annehmen und stellt das "Signal" (Phänotyp-Positive genetische Variation), das gegen die Variante Steuerdatenbank normalisiert werden. Dazu gehören 1) krankheitsassoziierten Varianten für den Vergleich mit VUSs, Roman Funktionsbereiche der Proteine und/oder 2) VUSs, einschließlich übrigens identifiziert VUSs zu vergleichen gegen krankheitsassoziierten Varianten zu bestimmen, eine Verwechslungsgefahr zu identifizieren Pathogenität. Zur Veranschaulichung werden krankheitsassoziierten Varianten in KCNQ1 präsentiert; Allerdings ist die Methode für die Analyse der übrigens identifiziert VUSs oder beliebigen anderen Satz von experimentellen Varianten gleich.

  1. Standardkohorten von unabhängigen Index Fälle/Probanden zu identifizieren, mit der Krankheit von Interesse für das interessierende Gen umfassend für alle Probanden genotypisiert wurde (d. h. eine Studie identifiziert 24 unabhängige Probanden Hosting-Varianten in KCNQ1 von 200 Personen mit LQTS KCNQ1 genetische Verhör unterzogen wurden).
    Hinweis: Diese Kohorten können aus der Literatur, aus experimentellen Genanalyse, oder eine Kombination aus beidem identifiziert werden.
    1. Studien, die nicht Kohorte-basierte ausschließen (d. h. ein Fallbericht beschreibt eine einzelne Mutation-positiven) bieten nicht die Gesamtzahl der Individuen genotypisiert für das gen des Interesses, oder analysieren das Gen (nicht umfassend genetisch d.h. eine "gezielte" genetisches Screening nur KCNQ1 Exons 2-4) diese Berechnung der Frequenz einer Variante entgegen.
    2. Sind Personen, die nicht verwandten Probanden und verwandte Personen ausschließen, da dies Variante Frequenzen überschätzen kann (d. h. eine Studie identifiziert 4 unabhängige Personen mit KCNQ1 Mutationen in einer Kohorte von 20 Patienten mit LQTS. Eines dieser Probanden ist Teil einer Familie mit 5 anderen Mutation-positiven Verwandtschaft. Schließen Sie alle Familienmitglieder und beinhalten Sie nur die 4 unabhängigen Probanden).
  2. Kompilieren Sie alle experimentellen Genvarianten gefunden in identifizierten Standardkohorten
    1. Weisen Sie die Nomenklatur, die die Wildtyp Aminosäure, Aminosäure-Position und variant Aminosäure (d.h. Alanin Aminosäure Hausnummer 212 geändert, Valin, Ala212Val oder A212V) enthält. Eine solche Art der Nomenklatur ist in Abbildung 1gezeigt.
    2. Bestätigen Sie, dass variant Nomenklatur aller experimentellen genetischen Varianten auf der gleichen Referenz gen Transkript wie in Schritt 1.4 basiert. Wenn experimentelle genetische Varianten auf die gleiche Referenz gen Abschrift nicht beschriftet sind, dann reannotate Variante dazu ein Referenz-Transkript mit Transkript Alignment (siehe Schritt 1.2)
  3. Schließen Sie aus, Varianten, die je nach Fragestellung erforscht nicht gelten.
    1. Exclude Varianten Lokalisierung nicht-kodierenden Regionen des Genoms oder Varianten, die das Protein nicht verändern-Sequenz wie Synonyme, intronischen Varianten, 5' oder 3'-untranslatierten Region [UTR] und intergenetischer Region Varianten (d.h. eine gemeldete pathologische Variante in KCNQ1 die lokalisiert, die 5' UTR der kodierenden Region ausgeschlossen wäre da es voraussichtlich nicht die Proteinsequenz ändern).
    2. Schließen Sie aus, Varianten, die Einschlusskriterien für die Studie nicht erfüllen. Dazu gehört für krankheitsassoziierten Varianten Varianten, die nicht mehr pathologische gelten.
      1. Bestätigen Sie, dass jede Variante derzeit wahrscheinlich Pathogen, als Pathogene oder zumindest nicht gutartig, durch Querverweise Varianten mit der ClinVar-Datenbank (siehe Tabelle der Materialien).
      2. Geben Sie den gen und Variante von Interesse in ClinVar Suchfeld ein (z.B. KCNQ1-Y111C), wählen Sie "Suchen"
      3. Die Variante des Interesses unter der Spalte "Variation/Ort" zu identifizieren.
      4. Beachten Sie die Konsens-Interpretation der Pathogenität unter "Klinische Bedeutung" Spalte (d.h. KCNQ1-Y111C wird interpretiert als "Pathogen").
      5. Enthalten Varianten sind "wahrscheinlich pathogenen" oder "Pathogene."
      6. Varianten mit Bezeichnungen "widersprüchliche Interpretationen der Pathogenität," gehören "unsichere Bedeutung," oder wenn kein Datensatz verfügbar ist ("nicht vorhanden") wenn gerechtfertigt durch die Studie.
      7. Varianten als ausschließen "wahrscheinlich gutartig" (d.h. KCNQ1-A62T).
  4. Die kleine Allel-Frequenz (MAF) jeder experimentelle Variante Position zu berechnen.
    1. Berechnen Sie, wie alle Allele waren positiv für jede jeweilige Variante (d.h. wenn eine heterozygote Mutation, bei 2 nicht miteinander verwandten Personen, die Anzahl der Allele Variante-positiven gefunden wird KCNQ1-Y111C 2).
    2. Berechnen Sie die Anzahl der Allele sequenziert innerhalb der Kohorte
      1. Beachten Sie die Gesamtzahl der Personen in jeder Kohortenstudie (Schritt 2.1) sequenziert
      2. Multiplizieren Sie die Gesamtzahl der Personen, mit 2, um die Gesamtzahl der Allele zu ermitteln.
        Hinweis: Dies setzt voraus diploiden Genom wobei jedes einzelnen Hosts 2 Jedes Allel.
    3. Berechnen Sie die Gesamtzahl der Variante-Positive Personen für jede Aminosäure-Position (Allele in Schritt 2.4.1/alleles im Schritt 2.4.2). Beispielsweise wenn 2 unabhängige Individuen jeder host heterozygote KCNQ1-Y111C-Mutationen in Kohorten von 100 und 200 LQTS betroffenen Individuen, beziehungsweise, dann die Häufigkeit der experimentellen Varianten an Aminosäure Position 111 2 Varianten/((100+200 individuals () * 2 Allele/Person) (d. h. MAF 0.0033 kombiniert).
    4. Berechnen Sie diesen Wert für jede Variante als die jeweiligen MAF jeder experimentelle Variante. Für weitere Details siehe Punkt 4.2.

3. erstellen Sie die genetische Variante-Verwaltungsdatenbank (das "Rauschen")

Hinweis: Hier zeigen wir wie erstelle ich eine Datenbank von Kontrolle-Varianten im gen des Interesses mit zugehörigen Häufigkeit in einer Kontrollgruppe. Diese Datenbank stellt das "Rauschen" (Phänotyp-negativ, Population-based genetische Variation) Hintergrund ist gegen, den experimentelle Variante Datenbank normalisiert werden. Dies wird als "Kontrolle" Variation bezeichnet.

  1. Identifizieren Sie ein Standardkohorten von gesunden, nicht verwandten Probanden zu oder nutzen Sie große bevölkerungsbezogene Studien um seltene Varianten in einer gegebenen Bevölkerung zu identifizieren.
    Hinweis: Quellen für diese Datenbank sind vielfältig und umfassen: 1) gesunde Einzelpersonen und/oder sonst Phänotyp-negativen Personen ausgesetzt Sanger-Sequenzierung oder öffentlich gehaltenen Datenbanken derjenigen bevölkerungsweit für die betreffende Krankheit ist selten in Frequenz z. B. 2) 1000-Genom-Projekt (N = 1.094 Themen)18, 3) National Heart, Lung und Blut-Institut gehen Exome Sequenzierung Projekt (ESP, N = 5.379 Themen)19, 4) Exome-Aggregation-Konsortium (ExAC, N = 60.706 Themen)13 , bzw. 5) Genom-Aggregation-Datenbank (GnomAD, N = 138.632 Personen)13 (siehe Tabelle der Materialien). Die GnomAD-Datenbank wird als ein anschauliches Beispiel genutzt werden.
    1. Geben Sie das gen des Interesses in das Suchfeld auf der GnomAD-Homepage (d.h. KCNQ1).
    2. Bestätigen Sie, dass der Browser das richtige gen und Transkript von Interesse (Schritt 1.4) ausgewählt.
    3. Bestätigen Sie, dass ausreichende Deckung für die Sequenzierung der Locus anhand der "mittlere Abdeckung" und "Abdeckung Handlung."
    4. Wählen Sie für die Codierung Sequenz genetische Variation durch die Auswahl "Missense + LoF."
    5. Wählen Sie "Export-Tabelle in CSV," dem eine TextEdit-Datei generiert wird benannt "Unbekannt."
    6. Die Datei neu und verfügen über eine neue Erweiterung "*.csv" (d.h. "KCNQ1 Kontrolle Variation.csv").
    7. Öffnen Sie die Datei mit einem entsprechenden Softwareprogramm für die Analyse von *.CSV-Dateien (siehe Tabelle der Materialien).
  2. Identifizieren des Proteins ändern genetischen Variation in der Spalte "Protein Konsequenz."
  3. Gelten Sie gleichen Ausschlusskriterien für diese Kontrolle genetische Varianten wie die experimentelle genetische Varianten (Schritt 2.3.1).
  4. Identifizieren Sie die MAF jeder Kontrolle-Variante.
    1. Suchen Sie die "Allel Count"-Spalte, die die Anzahl der Allele festgestellt, dass die Variante Hafen gibt.
    2. Suchen Sie die "Allel-Nummer"-Spalte, die die Gesamtzahl der Allele sequenziert in diesem amino Acid Stellung bezeichnet.
      Hinweis: Die Gesamtzahl der Allele sequenziert variieren je nach Berichterstattung an dieser Stelle. Bereiche der hohen Abdeckung herankommen 2 * Gesamtzahl der Individuen innerhalb GnomAD (d. h. für 138.632 Personen, komplette Abdeckung umfasst 277.264 total Allele genotypisiert).  Im Gegensatz dazu müssen Bereiche der unteren Abdeckung eine reduzierte total Allel-Reihe
    3. Suchen Sie die Variante MAF errechnet sich bereits in der Spalte "Häufigkeit Allel" und steht für "Allel Count" geteilt durch "Allel Anzahl."
      Hinweis: Human Genome haben zwei jedes Allel (d.h. 1 Thema findet eine heterozygote Variante bei 10 Menschen haben ein MAF 1/20)
    4. Beachten Sie die MAF für jede Variante als die jeweiligen MAF jeder Kontrolle-Variante.
      Hinweis: Bestimmte MAF Variante für jede Rasse/ethnische Gruppe bestehend aus GnomAD ersichtlich in den Spalten rechts neben der "Allel Frequenz."
  5. Wenden Sie eine MAF-Schwelle für seltene Varianten über die Kontrolle Varianten ausgeschlossen sind, als "häufig."
    1. Auf den maximalen Wert an dem alle wirklich krankheitsassoziierten Varianten (siehe Schritt 2) auch beobachtet in der Datenbank, unterhalb der Schwelle enthalten sind der MAF-Schwellenwert festlegen (d. h.unter allen krankheitsassoziierten KCNQ1 Varianten auch in GnomAD gefunden die höchsten verbreitete Variante MAF ist 0,009, dann alle GnomAD-Varianten über einen Grenzwert von 0,01 ausgeschlossen werden sollten).
  6. Sicherzustellen, dass die experimentelle Variante Nomenklatur identisch zu kontrollieren ist (siehe Punkt 2.2).
  7. Speichern Sie die Datei. In einigen Fällen kann dies erfordern, die Dateierweiterung ändern.

(4) Aminosäure Pegelrechnung Signal-Rausch- und Mapping

  1. Berechnen einer MAF für jede Aminosäure-Position mit einer Kontrollvariante (siehe Abbildung 1 mit Beispiel KCNQ1 GnomAD Varianten).
    1. Erstellen Sie in einer Grafik-fähigen Tabellenkalkulation eine Spalte der Positionen aller experimentellen Varianten.
    2. Entfernen Sie Variante Text nur die Variante Position verlassen.
      Hinweis: Verschiedene Funktionen/Formeln kann verwendet werden, um diese Textelemente innerhalb von Zellen (Abbildung 1, Spalte C; siehe Tabelle of Materials) automatisch zu löschen.
    3. Sortieren Sie die Varianten in aufsteigender Wert zur Identifizierung die Positionen mehr als 1 Variante zugeordnet (Abbildung 1, Spalte E haben; d. h. Aminosäure Stellung 10 notiert zweimal in Spalte E die 2 einzigartige Varianten an der Position bezeichnet).
    4. Kombinieren Sie die MAF für jede Variante einer bestimmten Position zugeordnet, indem man die Summe aller MAFs für eine bestimmte Position (Abbildung 1, Spalte G und H).
  2. Ein MAF für jede Aminosäure-Position mit einer experimentellen Variante zu berechnen (siehe Abbildung 2 mit mock KCNQ1 pathologische Varianten).
    1. Erstellen Sie in ähnlicher Weise zu 4.1.1 eine Spalte der Aminosäure-Positionen, die experimentelle Varianten (Abbildung 2, Spalte B) haben.
    2. Berechnen Sie für jede Variante Position die MAF aller Varianten dieser Position aus Schritt 2.4 (Abbildung 2, Spalte C-G) zugeordnet.
  3. Erstellen einer rollenden Durchschnitt der MAF für beide experimentelle und Kontrolle-Varianten.
    1. Erweitern Sie die Spalten erstellt in 4.1 und 4.2 Zellen für die Aminosäure-Positionen enthalten, die keine als ein MAF Variante = 0. (Abbildung 3).
      1. Erstellen Sie eine Spalte mit allen Aminosäurepositionen im gen des Interesses (d. h. 1, 676 für KCNQ1, Abbildung 3, Spalte C und ich).
      2. Fügen Sie ein MAF 0 für alle Positionen, die keine Varianten für Kontrolle und experimentelle Datensätze haben.
        Hinweis: Dies kann automatisch erfolgen durch die Verwendung der Funktion "SVERWEIS" in einem häufig verwendeten Softwareprogramm (sieheAbbildung 3, Spalte D und J, Table of Materials).
    2. Erstellen einer rollenden Durchschnitt für jede experimentelle und Prävalenz Steuersäule.
      Hinweis: Dies ermöglicht die Ableitung von benachbarten Position Pathogenität und kann geändert, oder sogar ausgeschlossen, um die Bedürfnisse der Studie passen.
      1. Erstellen Sie eine Spalte für einen Durchschnitt von der MAF sowohl für die Kontrolle und experimentelle Datensätze (Abbildung 3, Spalte E und K).
      2. Legen Sie in der rollenden Durchschnitt Spalte den Durchschnitt der jeweiligen MAF für 5 variant Positionen, die N-terminale und 5 Variante C-Terminal an der angegebenen Position positioniert.
        Hinweis: Dies erstellt einen rollenden Durchschnitt der + /-5. Für Positionen mit weniger als 5 Aminosäurereste vor oder nach einer sanften durchschnittliche Lage (d.h. die N - oder C-Terminus), der gleitenden Durchschnitt wird nur berücksichtigen diese Rückstände, die vorhanden sind (d. h. die rollende durchschnittlich Aminosäure-Position, 3 durchschnittlich die MAF an Aminosäure-Positionen 1 bis 8, wird berechnet als Summe dieser MAFs geteilt durch 8).
  4. Berechnen Sie die minimale Steuerfrequenz indem die niedrigste rollenden MAF durch 2 dividiert.
    1. Ändern Sie eine beliebige Zelle mit einem Steuerelement MAF 0 auf die minimale Frequenz Division durch 0 bei der Berechnung ein Signal-Rausch-Verhältnisses zu vermeiden.
  5. Berechnen Sie die Aminosäure-Niveau Signal-Rausch-Verhältnis (Abbildung 4).
    1. Teilen Sie jede Aminosäure Position experimentelle Durchschnitt durch das jeweilige Steuerelement Durchschnitt.
    2. Grafisch darstellen dieser Verhältnis (Y-Achse) vs. Aminosäure-Position (X-Achse).

5. Protein Domain Topologie Overlay

  1. Identifizieren Sie die Konsens Aminosäure Standorte der funktionellen Domänen/Funktionen oder Bereiche der Post-translationale Modifikation des Proteins des Interesses (Schritt 1,7).
    Hinweis: Eine Reihe von Ressourcen kann genutzt werden, um diese Bereiche zu identifizieren. Diese Ressourcen sowie Mittel zur Identifizierung von vermeintlicher Domänen in neuartige Proteine wurden auch in der Literatur20überprüft. Dieses Protokoll beschreibt die Proteindatenbank durch NCBI, die allgemein verwendet ist und robust (siehe Tabelle der Materialien) zur Verfügung.
  2. Identifizieren Sie Aminosäurepositionen Protein Domänen/Features zugeordnet.
    1. Öffnen Sie die NCBI-Webseite.
    2. Der NP des Proteins des Interesses in das Suchfeld eingeben.
    3. Bekannten Protein Domänen zu identifizieren und die Funktionen sind Kataloge unter "Funktionen".
    4. Ermitteln Sie und notieren Sie die Domäne Name/Typ und Aminosäure-Positionen.
    5. Wählen Sie den Link entsprechend der Funktion die Region auf das Protein des Interesses primäre Sequenz zu visualisieren.
  3. Erstellen Sie eine Spalte, die die Grenzen der Bereiche/Funktionen enthalten.
    1. Erstellen Sie eine Spalte neben der Spalte Signalrauschen: damit die Aminosäure-Spalte "Position" werden kann (Abb. 5A, Spalte C) verwiesen.
    2. Identifizieren Sie die Zellen bei der N-terminalen oder C-terminale Aspekt für jede Domäne/Funktion und setzen Sie eine 1 in jeder Zelle (d. h. wenn die N-terminale Domäne der S1 transmembrane Domäne von KCNQ1 Aminosäure Position 122 ist, und die C-terminale Domäne Position ist 142, dann ein 1 befindet sich in der Zeile für Aminosäure Position 122 und 142).
    3. Überlappende Bereiche/Funktionen, zeigen Sie mehrere Domänen durch Ändern der 1 auf andere Werte (d.h. 1,5, 2, 2.5); Dies kann helfen bei der Unterscheidung von Domänen.
  4. Erstellen Sie ein Diagramm mit diesen Grenzen als Y-Achse und Aminosäure-Position auf der X-Achse (Abb. 5B).
  5. Überlagern Sie dieses Diagramm mit dem Signal-Rausch-Diagramm erstellt in Schritt 4.4.
  6. Identifizieren Sie Korrelationen zwischen bekannten Protein Domänen/Funktionen und das Signal-Rausch-Analyse.

6. Variante Position Overlay

  1. Stadtplan Variante Einzelpositionen für Überlagerung von Graphen in den Schritten 4.4 und 5.4 produziert.
    1. Erstellen Sie eine Spalte neben der Domäne/Feature-Spalte, so dass Aminosäurepositionen (Abbildung 5A, Spalte D) Zeilen in der Spalte entspricht.
    2. Setzen Sie eine 1 in jeder Zelle in die hinzugefügte Zeile entspricht einer Position mit einer entsprechenden Variante.
    3. Erstellen Sie ein Diagramm mit dieser Spalte als Y-Achse und Aminosäure-Position auf der X-Achse (Abbildung 5C).
  2. Überlagern Sie dieses Diagramm mit den Signal-Rausch-Diagramm erstellt in Schritt 4.4 und Domäne Graph erstellt in Schritt 5.4.

Subscription Required. Please recommend JoVE to your librarian.

Representative Results

Ein repräsentatives Ergebnis für Aminosäure-Niveau Signal-Lärm-Analyse für KCNQ1 ist in Abbildung 6dargestellt. In diesem Beispiel, seltene Varianten identifiziert in der GnomAD Kohorte (Kontrolle Kohorte), gilt als im übrigen identifiziert WES (experimentelle Kohorte #1), und LQTS Fall-assoziierten Varianten wahrscheinlich krankheitsassoziierten (experimentelle Kohorte #2) dargestellt werden. Darüber hinaus normalisiert die Signal-Rausch-Analyse Vergleich WES und LQTS Kohorte Variante gegen GnomAD Variante Frequenz dargestellt wird. LQTS-assoziierten Varianten nachgewiesen hohen Signal-Rausch-Verhältnis in Domänen mit der Kanal-Pore, Selektivität Filter und KCNE1-bindende Domäne entspricht. Im Vergleich dazu übrigens identifizierte Varianten in der WES-Kohorte nicht deutlich bestimmte Regionen des Signal-Rausch-Höhenlage, was darauf hindeutet, dass diese Varianten genetische Variation Hintergrund widerspiegeln. In diesem Beispiel wussten Variante MAFs wie oben erwähnt nicht nutzen; Es zeigt aber alle den gleichen Prinzipien wie beschrieben.

Figure 1
Abbildung 1 : Beispiel für variant-Datenbank mit MAF Berechnung. Spalte A, direkt importiert GnomAD Kontrolle seltene Varianten. Spalte B, Löschen von linksseitiger, nicht-positionsbezogene Text von der Variante mit einer Beispielformel für die Charakter-Entfernung-Nomenklatur (d.h.: für B2 "= rechts (A2, LEN (A2)-5", siehe Tabelle der Materialien). Spalte C, Löschen von rechtsseitige, nicht-positionsbezogene Text von der Variante mit einer entsprechenden Formel-Nomenklatur (d.h.: für C2 "= LEFT(B2,LEN(B2)-3"). Spalte D, unsortiert resultierende Aminosäurepositionen. Spalte E, Aminosäure-Positionen in einer aufsteigenden Mode erkennen doppelte Positionen sortiert. Spalte F, verbunden MAF für jede Variante, wie von GnomAD importiert. Spalte G und H, kombiniert MAF für eine bestimmte Aminosäure-Position (Summe der einzelnen Varianten MAF an einer bestimmten Position). Bitte klicken Sie hier für eine größere Version dieser Figur.

Figure 2
Abbildung 2 : Beispiel für experimentelle Variante Datenbank mit MAF Berechnung. Spalte A, eine Liste von mock LQTS-assoziierten Mutationen im KCNQ1 repräsentieren eine experimentelle krankheitsassoziierten Mutationen-Datenbank. Spalte B, Mutation Position, jede Variante entspricht. Spalte C, eine Zählung der Mutation-positiven Personen im Rahmen der mock Studie 1. Sind vermutlich heterozygoten Mutationsträger. Die Gesamtzahl der Personen in der Studie genotypisiert befindet sich an der Unterseite des Blattes. Spalte D, Anzahl einzelner Mutation-positiven mock Studie 2. Spalte E, Anzahl der Mutation-positiven Menschen in mock Studie 3. Spalte F, totale Mutation-positiven Personen hosting der beobachteten Mutation in allen Studien. Beachten Sie, dass verschiedene Mutationen im Zusammenhang mit der gleichen Aminosäure Position kombiniert werden sollte. Spalte G, MAF jeder Mutation und Aminosäure-Position mit einer Beispielformel (d.h.: G2 "=2/(176*2)", finden Sie unter Table of Materials). Beachten Sie, dass da alle Individuen sind vermutlich heterozygot sein und jeder einzelne davon ausgegangen, 2 Allele von KCNQ1 Locus tragen, die total Individuen von 2 für das Allel-Frequenz multipliziert werden soll. Bitte klicken Sie hier für eine größere Version dieser Figur.

Figure 3
Abbildung 3 : Beispiel mit sanften Durchschnittsberechnung für Kontrolle und experimentelle Varianten. Spalte A und B, GnomAD-Variante Positionen und jeweiligen MAFs. Spalte C, position alle Aminosäurepositionen von KCNQ1 aus Aminosäure zum Finale. Spalte D, GnomAD Variante MAF für alle Positionen mit einem MAF 0 anstelle von Positionen ohne Variante. Dies kann automatisch berechnet werden mit Hilfe einer SVERWEIS-Funktion (d.h. für D2, "= IFERROR(VLOOKUP(C2,A:B,2,),0), siehe Tabelle der Materialien). Spalte E, rollenden Durchschnitt der position MAF mit einer Beispielformel (d. h. für E2 "= SUM(D2:D7)/6" und E7 "= SUM(D2:D12)/11"). Spalte G und H, Positionen LQTS experimentelle Variante mit entsprechenden MAFs. Spalte ich alle Aminosäurepositionen von KCNQ1. Spalte J, LQTS Variante MAF für alle Positionen. Spalte K, rollende LQTS MAF. Graue Füllung Zellen sind Beispiele dafür, wo MAF Werte aus Spalten B und H in Spalte D und J, bzw. erweitert werden, welche korrelieren mit der jeweiligen Positionen in Spalte C/I. Hinweis, das es wichtig ist, dass alle Zellen, als "Zahlen" für die richtige Formel formatiert sind funktionieren. Bitte klicken Sie hier für eine größere Version dieser Figur.

Figure 4
Abbildung 4 : Beispiel der Signal-Rausch-Analyse und grafische Darstellung. Links, Datenbank und Berechnungen. Spalte A, alle Aminosäurepositionen von KCNQ1. Spalte B, LQTS experimentelle MAF gleitenden Durchschnitt für jede Position. Spalte C, GnomAD Steuern MAF gleitenden Durchschnitt für jede Position. D: Signal-Rausch-Verhältnis (d.h. für D2 "= B2/C2"). Beispiel rechts, der Graph der Signal-Rausch-Verhältnis (Y-Achse) versus Aminosäure-Position (X-Achse). Bitte klicken Sie hier für eine größere Version dieser Figur.

Figure 5
Abbildung 5 : Beispiel für Protein und variant Position Mapping. A, Beispieldatenbank und Berechnungen. Spalte A, alle Aminosäurepositionen von KCNQ1. Spalte B, KCNQ1 positioniert die eine seltene Kontrollvariante in GnomAD identifiziert haben. Spalte C, identifiziert die Domain Mapping Spalte wo die N oder C-terminale Aspekt der Zellen mit Werten entsprechen KCNQ1 Protein Domänen oder Funktionen. Wie die meisten N-terminale Domäne die S1-Domain hat die N-terminale Grenze zu Aminosäure 122 ist, sind hier keine Werte angegeben. Spalte D, wo Zellen mit einem 1 KCNQ1 entsprechen, Variante Mapping-Spalte positioniert die seltenen Varianten zu lokalisieren. Graue Füllung Zellen sind zwei Beispiele, wo Variante Positionen in Spalte B in Spalte D erweitert werden die korrelieren mit der jeweiligen Positionen in Spalte a Klicken Sie bitte hier, um eine größere Version dieser Figur.

Figure 6
Abbildung 6 : Beispiel für eine Aminosäure-Niveau Signal-Rausch-Analyse von KCNQ1-KCNQ1 kodiert (Kv7.1). Top, variant Positionen werden mit vertikalen Linien, darunter seltene GnomAD Kohorte Varianten (schwarz), im übrigen identifiziert demonstriert in WES Verweise (blau), und Varianten in LQTS cases(green) identifiziert. Funktionsbereiche sind vermerkt. Relative Häufigkeit des LQTS Fall Varianten normiert auf GnomAD Varianten (grüne Linie) ist im Vergleich zu WES (blaue Linie) dargestellt. S1-S6, transmembranen Domänen; SF, Selektivität Ionenfilter; KCNE1 und AKAP9, jeweiligen Protein Bindung Domänen. Modifizierte und nachgedruckt mit Erlaubnis vom vorherigen Arbeit14. Bitte klicken Sie hier für eine größere Version dieser Figur.

Subscription Required. Please recommend JoVE to your librarian.

Discussion

Hochdurchsatz-Gentests hat drastisch in seiner Anwendung und Verfügbarkeit im letzten Jahrzehnt weiterentwickelt. Jedoch ist bei vielen Erkrankungen mit etablierten genetische Grundlagen, wie z. B. Kardiomyopathien, erweiterte Tests fehlgeschlagen diagnostische Ausbeute21zu verbessern. Darüber hinaus gibt es erhebliche Unsicherheit in Bezug auf das Diagnoseprogramm von vielen identifizierte Varianten. Dies ist teilweise auf eine wachsende Zahl von übrigens identifizierten seltenen Varianten entdeckt auf WES und WGS, was zu Fehldiagnosen22führen kann. Aminosäure-Signal-Rausch-Analyse basiert auf etablierten Strategien für die Vorhersage Variante Pathogenität und bietet den Vorteil der Hebelwirkung groß angelegte bevölkerungsbezogene Genom Studien um Variante Auslegung zu verfeinern.

Daraus folgt, dass einer der entscheidendsten Schritte dieses Protokolls die Auswahl der Steuerung und experimentellen Kohorten ist. Viele der öffentlich zugänglichen großen Genom Studien sind zugänglich durch aggregierte Datenbanken, wie z. B. GnomAD, die für repräsentative Kontrolle Kohorten in diesem Protokoll zum gegenwärtigen Zeitpunkt so groß wie 138.632 Menschen sein können. Obwohl nicht alle Themen in dieser aggregierten Kohorten angeblich gesund sind, der großen Stichprobenumfang in der Umgebung von seltenen Krankheiten macht diese Ressource von unschätzbarem Wert und ermöglicht eine stringente MAF Ausgrenzung Schwelle. Ausschluss der gängige Varianten ist notwendig, da sind sie unwahrscheinlich, dass eine Ursache für hohe Penetranz Mendelian Krankheit sein. Basierend auf früheren Arbeiten, eine MAF-Schwelle von 0,01 für Channelopathie-Assoziierte Gene und 0,0001 für Kardiomyopathie Gene möglicherweise geeignet und durch unabhängige Gruppen23,24validiert wurde. Wichtig ist, sollte angesichts der Bedeutung der MAF-Schwelle, dies festgelegt und unabhängig für jede Studie validiert. Eine MAF-Schwelle muss nicht auf eine experimentelle Kohorte, da die etablierte Anwesenheit von Gründer Mutationen in Channelopathien und Kardiomyopathien angewendet werden. Die Größe der experimentellen Kohorte muss ausreichen, um Bereiche zu identifizieren, wo Varianten cluster können; Allerdings gibt es keine strengen Größe. Darüber hinaus sollte die experimentellen Kohorte nicht enthalten Varianten bekanntermaßen gutartige innerhalb der Literatur, wie dies die Wahrhaftigkeit des pathogenen Signals verringern würde.

Auch die Auswahl richtig Ausschlusskriterien ist entscheidend für die Auslegung und Anwendung des Ergebnisses. Obwohl dieses Protokoll empfiehlt, ausgenommen bestimmte Mutation-Klassen, z. B. Synonyme Varianten, könnte diese durchaus realistisch für Krankheitsprozesse enthalten sein in denen schädliche gleichbedeutend Varianten identifizierten25,26gewesen sein. Darüber hinaus bei verschiedenen Ausschlusskriterien für beide experimentelle gelten und Gruppen zu steuern, können sie sich für Schichtung des Signal-Rausch-Mapping von Mutation Unterklasse (d. h. vergleichen Missense zum Abschneiden Varianten) zulassen.

Einstellung ein gleitender Durchschnitt für MAFs zu ermöglichen, für die Ableitung der Beteiligung an benachbarten Aminosäuren. Zum Beispiel wenn Aminosäure 35 position enthält eine pathologische Variante und befindet sich in einem kritischen Protein-Domäne dann Position 36 Grad der Pathogenität wenn mutiert haben können. Ebenso sollte eine Strecke von primären Sequenz eine große Menge an seltenen Kontrolle Varianten haben, dann Aminosäuren innerhalb dieser Region, die nicht seltenen Varianten host noch eine höhere Wahrscheinlichkeit mit seltenen Varianten in einer Population gefunden haben können. Zwar der gleitenden Durchschnitt in diesem Protokoll + /-5, dieser Bereich kann variieren basierend auf der Benutzer die gewünschte Auflösung des Signal-Rausch-Verhältnis und die spezifischen Proteins untersucht. Im Beispiel des LQTS, verhört KCNQ1-codierten KCNQ1 Kanal hat mehrere transmembrane Domänen überspannt ~ 10 Aminosäuren, woraufhin die Autoren ihre gewünschte Auflösung wesentliche Erkenntnisse auf dieser Skala14entsprechend anpassen. Für Proteine mit einer mehr primäre Sequenz und Protein Länge kann die Spanne von den gleitenden Durchschnitt müssen durch größere Spannweiten der Proteinsequenz ohne Kontrolle Variation gesteigert werden.

Es gibt mehrere Einschränkungen für diese Methode. Wie bereits erwähnt muss eine ausreichende Phänotyp-positiven Bevölkerung hosting vermeintliche pathologische Varianten identifiziert werden, um eine klare pathologische Signal zu fahren. Darüber hinaus diese pathologischen Varianten möglicherweise Variable Penetranz, so wahrhaft pathologische Mutationen können keinen Krankheit Phänotyp manifestieren oder sonst nicht voll Eindringmittel und Krankheit verursacht. Während viele Datenbanken, wie z. B. GnomAD, werden oft als "gesunde Kohorten" öffentlich gehalten, die Verbreitung von Erbkrankheiten ist wahrscheinlich ähnlich wie in dieser Datenbank als Bevölkerungsstudien. Als detaillierte konzentriert sich dieses Protokoll speziell auf Aminosäure Pegeländerungen infolge exonic Genvarianten diesen Code für Aminosäuren, die die Rolle ausschließt, die Pathogene intronischen Spleißen Varianten bei monogenen Krankheiten spielen können. Angesichts ihrer vor kurzem demonstriert Rolle bei Kardiomyopathien, Ausbau der Entschließung dieser Ansatz kann gerechtfertigt sein, um intergenetischer "Hotspots" sowie zu identifizieren. Darüber hinaus kann die Anwendung einer MAF-Schwelle bestimmten "Risiko-Allele" verpassen, dass, obwohl die vorhandenen in der Bevölkerung mit einer höher als der von Krankheit Prävalenz, kann dazu beitragen, Krankheit Pathogenese27,28MAF. Trotz dieser Einschränkungen dieser Analyse ist anpassungsfähig und kann eine Schlüsselrolle bei der Bereitstellung von Ärzten, die eine relative Wahrscheinlichkeit der Krankheit Pathogenität bei Bedarf angewendet.

Schließlich erhalten die Vorliebe dieser Analyse, kritische Regionen innerhalb eines Proteins zu identifizieren, Aminosäure-Niveau Signal-Rausch-Berechnungen unter Verwendung pathologische Mutationen bietet die Möglichkeit, neuartige Funktionsbereiche der Proteine zu identifizieren sein studierte. Aufgrund die Beobachtung von hoher Pathogenität Signal-Rausch-an wichtigen Standorten der Ionenkanäle, wie z. B. die Pore, Selektivität Filter, S2 transmembrane Domäne, und der KCNE1-Bindung Domäne von KCNQ1, Identifizierung eines "Peaks der Pathogenität" innerhalb eines Bereichs des Proteins ohne bekannte Funktion kann eine neue kritische Domain vorschlagen. Zum Beispiel hat eine deutliche Spitze der Pathogenität des LQTS-assoziierten Mutationen identifiziert worden, Lokalisierung, Aminosäure Rückstände 912-930 KCNH2-KCNH2 kodiert (Kv11.1). Diese Region des Proteins hat keine identifizierbaren funktionale Domäne noch zeigt eine deutliche Neigung zum LQTS-assoziierten Mutationen14. Wie das Wissen der Protein-Topologie erweitert, anspruchsvollere Proteomics könnte durchaus realistisch verbessern die Auflösung dieser Methode in Zukunft aus der Analyse des Signal-Rausch-Abstand entlang der Primärstruktur eines Proteins enthalten die sekundären, tertiären, oder quaternäre Struktur. Zusätzlich erweiterte computational Sciences zu dieser Analyse, wie maschinelles lernen und künstliche Intelligenz, bietet die Gelegenheit, neue Muster zu identifizieren pathologische versus bevölkerungsbezogene genetische Variation, wenn robuste Datenbanken dieser Varianten können generierte29,30sein. Im Gegenzug diese Methode könnte helfen, bessere Charakterisierung und Vorhersage der Genotyp-Phänotyp-Beziehung von bestimmten Krankheiten und in Verbindung mit einer Person vor dem Test Wahrscheinlichkeit der Krankheit verwendet werden, um die diagnostische Ausbeute von Gentests zu verbessern. Darüber hinaus kann dieser Analyse entdecken neuartiges Protein Biologie und identifizieren neuartiger Loci innerhalb des menschlichen Genoms, die mit der Krankheit wenn geändert zu manifestieren.

Subscription Required. Please recommend JoVE to your librarian.

Disclosures

Die Autoren haben nichts preisgeben.

Acknowledgments

APL ist von den nationalen Instituten der Gesundheit K08-HL136839 unterstützt.

Materials

Name Company Catalog Number Comments
1000 Genome Project N/A www.internationalgenome.org
ClinVar N/A www.ncbi.nlm.nih.gov/clinvar
Ensembl Genome Browser N/A uswest.ensembl.org/index.html
Excel Microsoft office.microsoft.com/excel/ Used for all example formulas and functions
Exome Aggregation Consortium  N/A www.exac.broadinstitute.org
Genome Aggregation Database  N/A www.gnomad.broadinstitute.org
National Center for Biotechnology Information Domain and Structure Database N/A www.ncbi.nlm.nih.gov/guide/domains-structures/
National Center for Biotechnology Information Gene Database N/A www.ncbi.nlm.nih.gov/gene/
National Center for Biotechnology Information Protein Database N/A www.ncbi.nlm.nih.gov/protein/
National Heart, Lung, and Blood Institute GO Exome Sequencing Project N/A www.evs.gs.washington.edu/EVS/
SnapGene GSL Biotech LCC www.snapgene.com
University of California, Santa Cruz Human Genome Browser N/A www.genome.ucsc.edu

DOWNLOAD MATERIALS LIST

References

  1. Yang, Y., et al. Clinical whole-exome sequencing for the diagnosis of mendelian disorders. New England Journal of Medicine. 369 (16), 1502-1511 (2013).
  2. Meng, L., et al. Use of Exome Sequencing for Infants in Intensive Care Units: Ascertainment of Severe Single-Gene Disorders and Effect on Medical Management. Journal of the American Medical Association Pediatrics. 171 (12), 173438 (2017).
  3. Kalia, S. S., et al. Recommendations for reporting of secondary findings in clinical exome and genome sequencing, 2016 update (ACMG SF v2.0): a policy statement of the American College of Medical Genetics and Genomics. Genetics in Medicine. 19 (2), 249-255 (2017).
  4. Landstrom, A. P., Ackerman, M. J. The Achilles' heel of cardiovascular genetic testing: distinguishing pathogenic mutations from background genetic noise. Clinical Pharmacology and Therapeutics. 90 (4), 496-499 (2011).
  5. Landstrom, A. P., Tester, D. J., Ackerman, M. J. Role of genetic testing for sudden death predisposing heart conditions in athletes. Sports Cardiology Essentials. Lawless, C. , Springer. New York, NY. (2011).
  6. Wang, Q., et al. Positional cloning of a novel potassium channel gene: KVLQT1 mutations cause cardiac arrhythmias. Nature Genetics. 12 (1), 17-23 (1996).
  7. Kapa, S., et al. Genetic testing for long-QT syndrome: distinguishing pathogenic mutations from benign variants. Circulation. 120 (18), 1752-1760 (2009).
  8. Ackerman, M. J., et al. Ethnic differences in cardiac potassium channel variants: implications for genetic susceptibility to sudden cardiac death and genetic testing for congenital long QT syndrome. Mayo Clinic Proceedings. 78 (12), 1479-1487 (2003).
  9. Kumar, P., Henikoff, S., Ng, P. C. Predicting the effects of coding non-synonymous variants on protein function using the SIFT algorithm. Nature Protocols. 4 (7), 1073-1081 (2009).
  10. Adzhubei, I., Jordan, D. M., Sunyaev, S. R. Predicting functional effect of human missense mutations using PolyPhen-2. Current Protocols in Human Genetics. , Chapter 7 (Unit 7.20) (2013).
  11. Flanagan, S. E., Patch, A. M., Ellard, S. Using SIFT and PolyPhen to predict loss-of-function and gain-of-function mutations. Genetic Testing and Molecular Biomarkers. 14 (4), 533-537 (2010).
  12. Ackerman, M. J., et al. HRS/EHRA expert consensus statement on the state of genetic testing for the channelopathies and cardiomyopathies this document was developed as a partnership between the Heart Rhythm Society (HRS) and the European Heart Rhythm Association (EHRA). Heart Rhythm. 8 (8), 1308-1339 (2011).
  13. Lek, M., et al. Analysis of protein-coding genetic variation in 60,706 humans. Nature. 536 (7616), 285-291 (2016).
  14. Landstrom, A. P., et al. Amino acid-level signal-to-noise analysis of incidentally identified variants in genes associated with long QT syndrome during pediatric whole exome sequencing reflects background genetic noise. Heart Rhythm. 15 (7), 1042-1050 (2018).
  15. Hubbard, T., et al. Ensembl 2005. Nucleic Acids Research. 33, Database issue 447-453 (2005).
  16. O'Leary, N. A., et al. Reference sequence (RefSeq) database at NCBI: current status, taxonomic expansion, and functional annotation. Nucleic Acids Research. 44, 733-745 (2016).
  17. Kent, W. J., et al. The human genome browser at UCSC. Genome Research. 12 (6), 996-1006 (2002).
  18. The 100 Genome Projects Consortium. An integrated map of genetic variation from 1,092 human genomes. Nature. 491 (7422), 56-65 (2012).
  19. Fu, W., et al. Analysis of 6,515 exomes reveals the recent origin of most human protein-coding variants. Nature. 493 (7331), 216-220 (2013).
  20. Mulder, N. J., Apweiler, R. Tools and resources for identifying protein families, domains and motifs. Genome Biology. 3 (1), (2002).
  21. Cirino, A. L., et al. A Comparison of Whole Genome Sequencing to Multigene Panel Testing in Hypertrophic Cardiomyopathy Patients. Circulation Cardiovascular Genetics. 10 (5), (2017).
  22. Landstrom, A. P., et al. Interpreting Incidentally Identified Variants in Genes Associated With Catecholaminergic Polymorphic Ventricular Tachycardia in a Large Cohort of Clinical Whole-Exome Genetic Test Referrals. Circulation Arrhythmia and Electrophysiology. 10 (4), (2017).
  23. Whiffin, N., et al. Using high-resolution variant frequencies to empower clinical genome interpretation. Genetics in Medicine. 19 (10), 1151-1158 (2017).
  24. Walsh, R., et al. Reassessment of Mendelian gene pathogenicity using 7,855 cardiomyopathy cases and 60,706 reference samples. Genetics in Medicine. 19 (2), 192-203 (2017).
  25. Buske, O. J., Manickaraj, A., Mital, S., Ray, P. N., Brudno, M. Identification of deleterious synonymous variants in human genomes. Bioinformatics. 31 (5), 799 (2015).
  26. Wen, P., Xiao, P., Xia, J. dbDSM: a manually curated database for deleterious synonymous mutations. Bioinformatics. 32 (12), 1914-1916 (2016).
  27. Bagnall, R. D., et al. Whole Genome Sequencing Improves Outcomes of Genetic Testing in Patients With Hypertrophic Cardiomyopathy. Journal of the American College of Cardiology. 72 (4), 419-429 (2018).
  28. Giudicessi, J. R., Roden, D. M., Wilde, A. A. M., Ackerman, M. J. Classification and Reporting of Potentially Proarrhythmic Common Genetic Variation in Long QT Syndrome Genetic Testing. Circulation. 137 (6), 619-630 (2018).
  29. Sundaram, L., et al. Predicting the clinical impact of human mutation with deep neural networks. Nature Genetics. 50, 1161-1170 (2018).
  30. Krittanawong, C., Zhang, H., Wang, Z., Aydar, M., Kitai, T. Artificial Intelligence in Precision Cardiovascular Medicine. Journal of the American College of Cardiology. 69 (21), 2657-2664 (2017).

Tags

Genetik Ausgabe 143 genetische Analysen Gentests Mutation Topologie Variante der unsicheren Bedeutung ganze Exome Sequenzierung
Bestimmen die Wahrscheinlichkeit einer Variante Pathogenität mit Aminosäure-Niveau Signal-Rausch-Analyse genetischer Variation
Play Video
PDF DOI DOWNLOAD MATERIALS LIST

Cite this Article

Jones, E. G., Landstrom, A. P.More

Jones, E. G., Landstrom, A. P. Determining the Likelihood of Variant Pathogenicity Using Amino Acid-level Signal-to-Noise Analysis of Genetic Variation. J. Vis. Exp. (143), e58907, doi:10.3791/58907 (2019).

Less
Copy Citation Download Citation Reprints and Permissions
View Video

Get cutting-edge science videos from JoVE sent straight to your inbox every month.

Waiting X
Simple Hit Counter