Waiting
Login processing...

Trial ends in Request Full Access Tell Your Colleague About Jove
Click here for the English version

Genetics

Bepaling van de waarschijnlijkheid van Variant pathogeniteit met behulp van aminozuur-niveau Signal-to-Noise analyse van genetische variatie

Published: January 16, 2019 doi: 10.3791/58907

Summary

Aminozuur-niveau signal-to-noise analyse bepaalt de prevalentie van genetische variatie op de positie van een bepaald aminozuur genormaliseerd naar de genetische variatie van de achtergrond van een bepaalde populatie. Dit zorgt voor de identificatie van de variant "hotspots" binnen een eiwit-reeks (signaal) die stijgt tot boven de frequentie van de zeldzame varianten gevonden in een populatie (lawaai).

Abstract

Vooruitgang in de kosten en de snelheid van de volgende generatie genetische sequentie hebben gegenereerd een explosie van klinische hele exome en het hele genoom testen. Terwijl dit heeft geleid tot meer identificatie van waarschijnlijk pathogene mutaties genetische syndromen is gekoppeld, is het ook sterk toegenomen het aantal overigens gevonden genetische varianten van onbekende betekenis (VUS). Het bepalen van de klinische betekenis van deze varianten is een grote uitdaging voor zowel wetenschappers en clinici. Signal-to-noise analyses op het niveau van de reeks eiwit is een aanpak om te helpen bij het bepalen van de waarschijnlijkheid van pathogeniteit. Dit protocol beschrijft een methode voor de analyse van aminozuur-niveau signal-to-noise die variant frequentie op de positie van elk aminozuur van het eiwit met bekende eiwit topologie hefboomwerkingen te identificeren van de gebieden van de primaire reeks met verhoogde kans op pathologische variatie (ten opzichte van de bevolking "achtergrond" variatie). Deze methode kan het identificeren van aminozuur residu locatie "hotspots" van hoge pathologische signaal, dat kan worden gebruikt voor het verfijnen van de diagnostische gewicht van VUSs zoals die welke door de volgende generatie genetische tests.

Introduction

De snelle verbetering van de genetische sequentie platformen heeft hervormd de toegankelijkheid en de rol van genetica in de geneeskunde. Zodra beperkt tot een enkel gen of een handvol genen, de afname van de kosten en verhoging van de snelheid van de volgende generatie genetische sequentie heeft geleid routine sequentiebepaling van het geheel van het genoom sequentie (hele exome sequencing, WES) de codering en de gehele genoom ( hele genoom sequencing, WGS) in de klinische setting. WES en WGS zijn gebruikt vaak in de omgeving van ernstig zieke pasgeborenen en kinderen met bezorgdheid voor genetische syndroom waar het is een bewezen diagnostisch instrument dat van klinische behandeling1,2 veranderen kan. Terwijl dit heeft geleid tot meer identificatie van waarschijnlijk pathogene mutaties genetische syndromen is gekoppeld, is het ook sterk toegenomen het aantal overigens gevonden genetische varianten, of onverwachte positieve resultaten, van onbekende diagnose betekenis (VUS). Terwijl sommige van deze varianten zijn buiten beschouwing gelaten en niet gemeld, varianten lokaliseren naar worden genen geassocieerd met potentieel dodelijk of zeer morbide aandoeningen vaak gerapporteerd. Huidige richtsnoeren aanbevelen rapportage van incidentele varianten gevonden in specifieke genen die van medisch nut aan de patiënt, met inbegrip van genen in verband met de ontwikkeling van plotselinge dood-predisponerende hartziekten zoals hartziekten kunnen zijn en channelopathies3. Hoewel deze aanbeveling was ontworpen om personen in gevaar van een ziekte SCD-predisponerende vangen, de gevoeligheid van variant detectie veel groter is dan specificiteit. Dit komt tot uiting in een groeiend aantal VUSs en overigens geïdentificeerd varianten met onduidelijk diagnostisch hulpprogramma die veel verder gaan dan de frequentie van de respectieve ziekten in een bepaalde bevolking4. Een dergelijke ziekte, lang QT syndroom (LQTS), is een canonieke cardiale channelopathy veroorzaakt door mutaties lokaliseren aan genen die cardiale ionenkanalen coderen, of kanaal interactie van eiwitten, resulterend in vertraagd cardiale repolarisatie5. Deze vertraagde repolarisatie, gezien door een verlengde QT-interval op rusten elektrocardiogram, resulteert in een elektrische aanleg voor potentieel dodelijke Ventriculaire ritmestoornissen zoals torsades de pointes kunnen teweegbrengen. Terwijl een aantal genen zijn gekoppeld aan de ontwikkeling van deze ziekte, mutaties in KCNQ1-ikKs kalium gecodeerd kanaal (KCNQ1, Kv7.1) is de oorzaak van LQTS type 1 en wordt gebruikt als een voorbeeld minder dan6. Ter illustratie van de complexiteit van variant interpretatie, is de aanwezigheid van zeldzame varianten in LQTS-geassocieerde genen, zogenaamde "achtergrond genetische variatie" eerder beschreven7,8.

Naast grote compendium-stijl databases van bekende pathogene varianten bestaan verschillende strategieën voor het voorspellen van dat de verschillende varianten van effect zal produceren. Sommige zijn gebaseerd op algoritmen, zoals SIFT en Polyphen 2, waarin grote aantallen roman niet-synoniem varianten om te voorspellen deleteriousness9,10kunt filteren. Ondanks breed gebruik van deze hulpprogramma's beperkt lage specificiteit hun toepasbaarheid als het gaat om "calling" klinische VUSs11. 'Signal-to-noise'-analyse is een hulpprogramma waarmee u de waarschijnlijkheid van een variant die wordt geassocieerd met de ziekte op basis van de frequentie van de bekende pathologische variatie op de betrokken loci genormaliseerd tegen zeldzame genetische variatie uit een populatie. Varianten aan genetische loci lokaliseren waar sprake is van een hoge prevalentie van de ziekte-geassocieerde mutaties ten opzichte van bevolking gebaseerde variatie, een hoge signaal-ruis, hebben meer kans op ziekte-geassocieerde zichzelf zijn. Verdere, zeldzame varianten vond overigens lokaliseren naar een gen met een hoge frequentie van de zeldzame bevolking varianten vergeleken met ziekte-geassocieerde frequentie, een lage signal-to-noise, wellicht minder waarschijnlijk worden ziekte-geassocieerde. Het diagnostische hulpprogramma van signal-to-noise analyse heeft geïllustreerd in de meest recente richtsnoeren voor genetische tests voor hartziekten en channelopathies; echter, het is alleen werkzaam zijn op het niveau van de hele gen of domeinspecifieke niveau12. Onlangs, gegeven toegenomen beschikbaarheid van zowel de pathologische varianten (ziekte databases, cohortstudies in de literatuur) en de bevolking gebaseerde controle varianten (Exome aggregatie Consortium, ExAC en de aggregatie genoomdatabase, GnomAD13), Dit is vereffend met de standpunten van de individuele aminozuur binnen de primaire volgorde van een eiwit. Analyse van de signal-to-noise aminozuur-niveau is nuttig bij het categoriseren van overigens geïdentificeerde varianten in genen LQTS als waarschijnlijk "achtergrond" genetische variatie zijn gekoppeld in plaats van het ziekte-geassocieerde gebleken. Onder de drie belangrijke genen geassocieerd met LQTS, met inbegrip van KCNQ1, ontbrak deze overigens geïdentificeerde varianten een significante signal-to-noise ratio's, wat suggereert dat de frequentie van deze varianten op individuele aminozuur posities zeldzame weerspiegelen variatie van de bevolking in plaats van ziekte-geassocieerde mutaties. Bovendien, wanneer eiwit-specifieke domeintopologie was bedekt tegen gebieden van hoge signal-to-noise, pathologische mutatie "hotspots" gelokaliseerd op belangrijke functionele domeinen van de proteïnen14. Deze methode houdt belofte in bepalen dat 1) de kans op een variant is ziekte - of bevolking-geassocieerde en 2) het identificeren van nieuwe kritieke functionele domeinen van een eiwit ziekten bij de mens is gekoppeld.

Subscription Required. Please recommend JoVE to your librarian.

Protocol

1. Identificeer de Gene en specifieke Splice isovorm van belang

Opmerking: Hier, wij tonen het gebruik van Ensembl15 te identificeren van de volgorde van de consensus voor het gen van belang die gekoppeld aan de pathogenese van de ziekte van belang is (d.w.z. KCNQ1 mutaties zijn geassocieerd met LQTS). Alternatieven voor Ensembl omvatten RefSeq via het nationaal centrum voor biotechnologische informatie (NCBI)16 en de University of California, Santa Cruz (UCSC) menselijke genoom Browser17 (Zie Tabel van materialen).

  1. Selecteer de soorten (dat wil zeggen menselijke) in het dropdownmenu in de Ensembl homepage, en het gen van belang acroniem invoert in het veld (d.w.z. KCNQ1). Klik op "Go"
  2. Selecteer de koppeling die overeenkomt met het gen van belang (d.w.z. "KCNQ1 (menselijk gen)"
  3. Selecteer de koppeling die overeenkomt met het transcript van belang ID van belang van de "Transcript tabel" (dat wil zeggen TranscriptID ENST00000155840.10, NM_000218 [RNA transcript], NP_000209 [eiwit product van RNA transcriptie]).
    Opmerking: Overzicht van de relevante literatuur is nodig om ervoor te zorgen dat de juiste transcript consensus volgorde is geselecteerd.
  4. Opmerking het transcript-specifieke NM en NP identificatienummers voor toekomstige verwijzing gevonden in de kolom "RefSeq" van de "Transcript tafel".
  5. Selecteer de koppeling die de NP-ID-nummer een webpagina te openen nieuwe uit de NCBI eiwit-database is gekoppeld.
  6. Scroll naar beneden naar de sectie "Oorsprong" te verkrijgen van de (primaire) volgorde van de eiwitten voor het transcript van de gen van belang.
  7. Scroll tot de "Functies" sectie om te verkrijgen van een lijst van de functies van het eiwit (functionele domeinen, bindende domeinen, posttranslationele wijziging sites).
    Opmerking: Deze informatie kan ook worden verkregen via de NCBI eiwit-database of uit primaire bronnen in de literatuur. Dit zal verder worden besproken in stap 5.

2. Maak de experimentele genetische Variant Database (de "signaal")

Opmerking: Hier, we laten zien hoe het maken van een database van ziekte-geassocieerde varianten in het gen van belang met de frequentie van de ziekte-geassocieerde varianten onder personen met de ziekte van belang. Deze database kan vele vormen aannemen en vertegenwoordigt het "signaal" (fenotype-positieve genetische variatie) die tegen de controle variant database zal worden genormaliseerd. Dit kan omvatten 1) ziekte-geassocieerde varianten voor vergelijking tegen VUSs te identificeren van nieuwe functionele domeinen van de eiwitten en/of 2) VUSs, met inbegrip overigens geïdentificeerd VUSs, om te vergelijken tegen ziekte-geassocieerde varianten om de kans op pathogeniteit. Ziekte-geassocieerde varianten in KCNQ1 zullen worden gepresenteerd ter illustratie; de methode is echter het zelfde voor analyse van overigens geïdentificeerd VUSs of een andere set van experimentele varianten.

  1. Cohort(s) van niet-verwante index gevallen/probands identificeren met de ziekte van belang waarvoor het gen van belang uitgebreid gegenotypeerde voor alle probands was (dat wil zeggen een studie identificeert 24 onafhankelijke probands hosting varianten in KCNQ1 uit 200 personen met LQTS die werden onderworpen aan genetische ondervraging van KCNQ1).
    Opmerking: Deze cohorten kunnen worden geïdentificeerd van de literatuur, van experimentele genetische analyse, of een combinatie van beide.
    1. Studies die niet cohort gebaseerde uitsluiten (dat wil zeggen een gevallenrapport beschrijven een enkele mutatie-positieve persoon), bieden niet het totale aantal personen gegenotypeerde voor het gen van belang of de gene (uitgebreid genetisch niet doen analyseren dat wil zeggen een "gerichte" genetische screening van alleen KCNQ1 exons 2-4) dit beletsel voor berekening van de frequentie van een variant.
    2. Opnemen van individuen die niet-verwante probands en verwante personen uit te sluiten als dit variant frequenties overschatten kan (dat wil zeggen een studie identificeert 4 onafhankelijke individuen met KCNQ1 mutaties in een cohort van 20 patiënten met LQTS. Een van deze probands is onderdeel van een gezin met 5 andere mutatie-positieve verwanten. Uitsluiten van alle gezinsleden en bevatten alleen de 4 onafhankelijke probands).
  2. Compileren van alle experimentele genetische varianten gevonden in geïdentificeerde cohort(s)
    1. Toewijzen nomenclatuur waarin de wild-type amino acid, aminozuur positie en variant aminozuur (d.w.z. alanine op aminozuur nummer 212 veranderd naar valine, Ala212Val of A212V). Een dergelijk type van nomenclatuur wordt geïllustreerd in Figuur 1.
    2. Bevestigen dat variant nomenclatuur van alle experimentele genetische varianten is gebaseerd op de dezelfde referentie gene afschrift als aangegeven in stap 1.4. Als experimentele genetische varianten zijn niet op de dezelfde referentie gene transcript geannoteerd, vervolgens reannotate variant kunnen een afschrift van de verwijzing transcript alignering gebruiken (zie stap 1.2)
  3. Uitsluiten varianten die zijn niet van toepassing zijn afhankelijk van de vraag onderzocht.
    1. Uitsluiten varianten lokaliseren naar niet-codeert gebieden van het genoom- of varianten die niets aan het eiwit veranderen sequentie zoals synoniem, intronic varianten, 5' of 3' niet-vertaalde regio [UTR] en intergenic regio varianten (dat wil zeggen een gerapporteerde pathologische variant in KCNQ1 die op de 5 lokaliseert ' UTR codering regio zou worden uitgesloten als er niet wordt voorspeld te wijzigen van de volgorde van eiwitten).
    2. Uitsluiten varianten die niet voldoen aan de opgenomen criteria voor de studie. Voor ziekte-geassocieerde varianten omvat dit varianten die niet langer worden geacht pathologische.
      1. Bevestigen dat elke variant wordt momenteel beschouwd als pathogene, waarschijnlijk pathogene, of op zijn minst niet goedaardig, door kruisverwijzingen varianten met de ClinVar database (Zie Tabel van materialen).
      2. De gen en de variant van belang invoeren in het zoekveld (d.w.z. KCNQ1-Y111C) ClinVar, selecteer "Zoeken"
      3. Identificatie van de variant van belang onder de kolom ' Variatie/locatie'.
      4. Opmerking de interpretatie van de consensus van pathogeniteit onder "Klinische betekenis" kolom (d.w.z. KCNQ1-Y111C wordt geïnterpreteerd als "pathogene").
      5. Varianten die omvatten "waarschijnlijk pathogene" of "pathogene".
      6. Varianten met oorsprongsbenamingen "conflicting interpretations of pathogeniteit," opnemen "onzekere betekenis," of wanneer geen record beschikbaar is ('niet geleverd') als gerechtvaardigd door de studie.
      7. Uitsluiten van varianten uitgeroepen tot "waarschijnlijk benigne" (d.w.z. KCNQ1-A62T).
  4. Bereken de frequentie van de kleine allel (MAF) van elke experimentele variant positie.
    1. Berekenen hoe een allelen waren positief voor elke respectieve variant (dat wil zeggen als een KCNQ1-Y111C heterozygote mutatie voor bij 2 onafhankelijke personen, het aantal variant-positieve allelen komt 2).
    2. Berekenen van het totale aantal allelen sequenced binnen de cohort
      1. Let op het totale aantal individuen sequenced in elk cohortstudie (stap 2.1)
      2. Het totale aantal personen vermenigvuldigt met 2 om te bepalen van het totale aantal allelen.
        Opmerking: Veronderstelt dit diploïde genomen waarbij elke afzonderlijke hosts 2 van elk allel.
    3. Bereken het totale aantal variant-positieve individuen voor elke aminozuur positie (allelen in stap 2.4.1/alleles in stap 2.4.2). Bijvoorbeeld, als 2 onafhankelijke personen elke host heterozygoot KCNQ1-Y111C-mutaties in cohorten van 100 en 200 LQTS getroffen individuen, respectievelijk, is de frequentie van de experimentele varianten op aminozuur positie 111 2 varianten/((100+200 individuals ) * 2 allelen/individu) (d.w.z. gecombineerd MAF 0.0033).
    4. Deze waarde berekend voor elke variant als de respectieve MAF van elke experimentele variant. Zie voor meer informatie stap 4.2.

3. Maak de genetische Variant Database controle (het "lawaai")

Opmerking: Hier, we laten zien hoe een database te maken voor controle varianten in het gen van belangstelling voor de bevolking van een besturingselement met een bijbehorende frequentie. Deze database vertegenwoordigt het "lawaai" (fenotype-negatief, bevolking gebaseerde genetische variatie) dat is de achtergrond waartegen de experimentele variant database zal worden genormaliseerd. Dit wordt aangeduid als "control" variatie.

  1. Identificeren van een cohort(s) van gezonde, niet-verwante probands of gebruiken van grote bevolking gebaseerde studies ter identificatie van zeldzame varianten onder een bepaalde bevolking.
    Opmerking: Bronnen voor deze database zijn divers en omvatten: 1) gezonde individuen en/of anders fenotype-negatieve personen onderworpen aan Sanger sequencing of beursgenoteerde databases van bevolking gebaseerde personen waarvoor de betrokken ziekte is zeldzaam in frequentie zoals 2) 1000 Genome Project (N = 1,094 onderwerpen)18, 3) nationale hart-, Long- en bloed Instituut gaan Exome Sequencing Project (ESP, N = 5,379 onderwerpen)19, 4) Exome aggregatie Consortium (ExAC, N = 60,706 onderwerpen)13 , en/of 5) genoomdatabase aggregatie (GnomAD, N = 138,632 personen)13 (Zie Tabel van materialen). De GnomAD database zal worden gebruikt als een illustratief voorbeeld.
    1. Voer het gen van belang in het zoekvak op de startpagina van de GnomAD (d.w.z. KCNQ1).
    2. Zorg ervoor dat de browser de juiste gen en afschrift van belang (stap 1.4) geselecteerd.
    3. Controleer of er passende dekking van sequencing van de locus door herziening van de "gemiddelde dekking" en "dekking plot."
    4. Selecteer voor codering van genetische variatie van de reeks door het selecteren van "Missense + LoF."
    5. Selecteer "tabel exporteren naar CSV," die een teksteditor-bestand genereren zal met de naam 'Unknown'.
    6. Het bestand hernoemen en omvatten een nieuwe extensie "*.csv" (d.w.z. "KCNQ1 controle Variation.csv").
    7. Open het bestand met behulp van een geschikte softwareprogramma voor analyse van *.csv bestanden (Zie Tabel van materialen).
  2. Identificeren van het eiwit veranderen van de genetische variatie in de kolom met de naam "Eiwit gevolg."
  3. Gelden dezelfde uitsluitingscriteria de genetische varianten van deze controle als de experimentele genetische varianten (stap 2.3.1).
  4. Identificeren van het MAF van elke controle-variant.
    1. Zoek de kolom "-allel Count", die duidt op het aantal allelen gevonden aan de haven van de variant.
    2. Zoek de kolom "-allel nummer", waarmee het totale aantal allelen sequenced op dit amino zuur positie krijgen.
      Opmerking: Het totale aantal allelen sequenced zal variëren afhankelijk van de dekking op die locatie. Gebieden van hoge dekking zal aanpak 2 * totaal aantal individuen binnen GnomAD (dat wil zeggen voor 138,632 personen, volledige dekking omvat 277,264 totale allelen gegenotypeerde).  Omgekeerd, gebieden van de lagere dekking zal hebben enkele verminderde totale allel
    3. Zoek de variant MAF die vooraf wordt berekend in de kolom "-allel frequentie" en vertegenwoordigt "-allel Count" gedeeld door "Allel nummer."
      Opmerking: Menselijk genoom hebben twee van elk allel (d.w.z. 1 onderwerp gevonden te hebben van een heterozygoot variant in 10 mensen heeft een MAF van 1/20)
    4. Opmerking het MAF voor elke variant als de respectieve MAF van elke controle-variant.
      Opmerking: De specifieke MAF Variant voor elke raciaal/etnisch-groep bestaande uit GnomAD kan worden gezien in de kolommen rechts van "Allel frequentie."
  5. Toepassing van de drempel van een MAF voor zeldzame varianten waarboven controle varianten zijn uitgesloten als "gemeenschappelijk."
    1. De MAF-drempel ingesteld op de maximale waarde waartegen alle echt ziekte-geassocieerde varianten (zie stap 2) ook waargenomen in de controle-database onder de drempel zijn opgenomen (dat wil zeggen, onder alle ziekte-geassocieerde KCNQ1 varianten ook gevonden in GnomAD de hoogste gemeenschappelijke variant MAF is 0.009, dan alle varianten van de GnomAD boven een drempel van 0,01 dienen te worden uitgesloten).
  6. Zorgen dat de experimentele variant nomenclatuur identiek aan controle is (zie stap 2.2).
  7. Sla het bestand. In sommige gevallen hiervoor kunnen wijzigen van de type/bestandsextensie.

4. aminozuur niveau Signal-to-noise berekening en toewijzing

  1. Een MAF voor elke positie aminozuur met een variant van het besturingselement te berekenen (Zie Figuur 1 met voorbeeld KCNQ1 GnomAD varianten).
    1. In een werkblad graphing-staat een kolom van de standpunten van alle experimentele varianten te maken.
    2. Variant tekst te laten alleen de variant positie verwijderen.
      Opmerking: Verschillende functies/formules kunnen worden gebruikt om automatisch verwijderen van deze tekstelementen binnen cellen (Figuur 1, kolom C; Zie Tabel van materialen).
    3. Sorteren van de varianten in oplopende waarde te identificeren die posities meer dan 1 variant gekoppeld (Figuur 1, kolom E hebben; dat wil zeggen aminozuur positie 10 is tweemaal vermeld in kolom E waarmee de 2 unieke varianten op de positie).
    4. Combineer het MAF voor elke variant die is gekoppeld aan een bepaalde positie door middel van de som van alle MAFs voor een bepaalde positie (Figuur 1, kolom G en H).
  2. Berekenen van een MAF voor elke positie aminozuur met een experimentele variant (Zie Figuur 2 met mock KCNQ1 pathologische varianten).
    1. Op een gelijkaardige manier aan 4.1.1, een kolom voor aminozuur posities hebben experimentele varianten (Figuur 2, kolom B) te maken.
    2. Voor elke variant positie, berekenen het MAF voor alle varianten die zijn gekoppeld aan dit standpunt uit stap 2.4 (Figuur 2, kolom C-G).
  3. Maak een rolling gemiddelde van MAF voor beide experimentele- en controle varianten.
    1. Vouw de kolommen gemaakt in 4.1 en 4.2 cellen voor aminozuur posities hebben geen variant als een MAF = 0. (Figuur 3).
      1. Maak een kolom met alle aminozuur posities in het gen van belang (d.w.z. 1 naar 676 voor KCNQ1, Figuur 3, kolom C en ik).
      2. Een MAF voor 0 voor alle posities die geen varianten voor zowel controle en experimentele gegevenssets toevoegen.
        Opmerking: Dit kan worden gedaan automatisch met behulp van de functie "Vert.zoeken" in een algemeen gebruikte softwareprogramma (Figuur 3, kolom D en J, Zie Tabel van materialen).
    2. Maak een rolling gemiddelde voor elk experimenteel en controle prevalentie kolom.
      Opmerking: Dit zorgt voor afleiding van aangrenzende positie pathogeniteit en kan worden gewijzigd of zelfs uitgesloten, om te voldoen aan de eisen van de studie.
      1. Maak een kolom vertegenwoordigt een voortschrijdend gemiddelde van het MAF voor zowel de voor zowel het besturingselement als experimentele data sets (Figuur 3, kolom E en K).
      2. In het voortschrijdend gemiddelde kolom, plaatst u het gemiddelde van de respectieve MAF voor de 5 variant posities N-terminal en 5 variant posities C-terminal naar de opgegeven positie.
        Opmerking: Dit maakt rolling gemiddelde van +/-5. Voor posities met minder dan 5 aminozuurresidu's van voorgaande of volgende, een voortschrijdend gemiddelde locatie (dat wil zeggen de N - of C-terminus), het voortschrijdend gemiddelde zal alleen rekening houden met de residuen die aanwezig zijn (dat wil zeggen het rollen gemiddelde op aminozuur positie 3 zal zijn een gemiddelde van het MAF op aminozuur posities 1 maar 8, berekend als de som van deze MAFs gedeeld door 8).
  4. De minimale controle-frequentie berekenen door de laagste rollende MAF delen door 2.
    1. Een cel met een besturingselement MAF van 0 naar de minimale frequentie om te voorkomen dat delen door 0 bij het berekenen van een signal-to-noise verhouding wijzigen
  5. Bereken het aminozuur niveau signal-to-noise verhouding (Figuur 4).
    1. Verdeel elke experimentele rollen gemiddelde door de respectieve controle rollen gemiddelde aminozuur-positie.
    2. Grafiek van deze verhouding (y-as) vs. aminozuur positie (x-as).

5. eiwitten domein topologie Overlay

  1. Het identificeren van de consensus aminozuur locaties van functionele domeinen/kenmerken, of gebieden van posttranslationele modificatie, van de proteïne van belang (stap 1.7).
    Opmerking: Een aantal van de middelen kan worden gebruikt om het identificeren van deze domeinen. Deze middelen, alsmede de middelen voor de identificatie van de vermeende domeinen in nieuwe eiwitten, zijn goed onderzocht in de literatuur20. Dit protocol beschrijft de eiwit-database beschikbaar via NCBI, die algemeen wordt gebruikt en robuust (Zie Tabel van materialen).
  2. Identificeren aminozuur standpunten met betrekking tot eiwit domeinen/functies.
    1. Open de NCBI-webpagina.
    2. Voer de NP van de proteïne van belang in het zoekveld.
    3. Identificeren van bekende eiwit domeinen en functies zijn catalogi onder 'Functies'.
    4. Identificeren en Let op de posities van het domein naam/type en aminozuur.
    5. Selecteer de koppeling die overeenkomt met de functie voor het visualiseren van de regio op de proteïne van belang primaire volgorde.
  3. Maak een kolom met de grenzen van de domeinen/functies.
    1. Een kolom naast de kolom signaal: lawaai maken, zodat de kolom aminozuur positie kan worden verwezen (Figuur 5A, kolom C).
    2. Identificeren van de cellen die overeenkomt op het N-terminaal of C-terminal aspect van elke domein/functie en plaats een 1 in elke cel (dat wil zeggen als het domein van de N-terminal van de S1 transmembraan domein van KCNQ1-aminozuur 122 staat, en het domein C-terminal staat 142, dan een 1 is geplaatst in de rij voor aminozuur positie 122 en 142).
    3. Voor de overlappende domeinen/functies, meerdere domeinen weergeven door het veranderen van de 1 op andere waarden (d.w.z. 1,5, 2, 2.5); Dit kan helpen bij het onderscheiden van domeinen.
  4. Een grafiek maken met deze grenzen als een y-as en aminozuur positie op de x-as (Figuur 5B).
  5. Bedekken deze grafiek met de grafiek van de signal-to-noise gemaakt in stap 4.4.
  6. Identificeren van correlaties tussen bekende eiwit domeinen/functies en de signal-to-noise-analyse.

6. variant Position Overlay

  1. Kaart van individuele variant posities voor overlay van grafieken geproduceerd in stap 4.4 en 5.4.
    1. Maak een kolom naast de kolom domein/functie zodanig dat rijen in de kolom met de aminozuur-posities (Figuur 5A, kolom D overeen komt).
    2. Plaats een 1 in elke cel van de toegevoegde rij die correspondeert met een positie met een respectieve variant.
    3. Een grafiek maken met deze kolom als een y-as en aminozuur positie op de x-as (Figuur 5C).
  2. Deze grafiek overlay met de signal-to-noise grafiek gemaakt in stap 4.4 en domein grafiek gemaakt in stap 5.4.

Subscription Required. Please recommend JoVE to your librarian.

Representative Results

Een representatief resultaat voor aminozuur-niveau signaal ruisanalyse voor KCNQ1 is afgebeeld in Figuur 6. In dit voorbeeld, zeldzame varianten geïdentificeerd in de GnomAD cohort (controle cohort), overigens geïdentificeerd WES varianten (experimentele cohort #1), en LQTS geval-geassocieerde varianten geacht waarschijnlijk ziekte-geassocieerde (experimentele cohort #2) worden afgebeeld. Verder, de analyse van de signal-to-noise vergelijken de WES en LQTS cohort variant frequentie genormaliseerd tegen GnomAD variant frequentie wordt afgebeeld. LQTS-geassocieerde varianten aangetoond hoog signal-to-noise verhouding in domeinen die overeenkomt met de porie kanaal, selectiviteit filter en de KCNE1-bindend domein. In vergelijking, overigens geïdentificeerde varianten in de WES cohort deed niet tonen duidelijk aan specifieke regio's hoge signaal-ruis-hoogte, suggereren dat deze varianten achtergrond genetische variatie weerspiegelen. In het volgende voorbeeld deed niet gebruiken variant MAFs zoals hierboven; het toont echter allemaal van dezelfde principes zoals beschreven.

Figure 1
Figuur 1 : Voorbeeld van de variant database controle met de berekening van het MAF. Kolom A, direct geïmporteerd GnomAD controle zeldzame varianten. Kolom B, schrapping van de linkerpagina, niet-positie-gerelateerde tekst uit de variant nomenclatuur met behulp van de formule van een voorbeeld voor het verwijderen van teken (dat wil zeggen: voor B2 "= rechts (A2, LEN (A2) -5", Zie Tabel van materialen). Kolom C, schrapping van de rechterpagina, niet-positie-gerelateerde tekst uit de variant nomenclatuur met behulp van een verwante formule (dat wil zeggen: voor C2 "= LEFT(B2,LEN(B2)-3"). Kolom D, resulterende ongesorteerde aminozuur posities. Kolom E, aminozuur posities in een oplopende mode toe voor de identificatie van dubbele posities gesorteerd. Kolom F, bijbehorende MAF voor elke variant zoals geïmporteerd uit GnomAD. MAF kolom G en H, gecombineerd voor een bepaald aminozuur positie (som van elke variant MAF op een specifieke positie). Klik hier voor een grotere versie van dit cijfer.

Figure 2
Figuur 2 : Voorbeeld van experimentele variant database met MAF berekening. Kolom A, een lijst van mock LQTS-geassocieerde mutaties in KCNQ1 voor een ziekte-geassocieerde mutatie experimentele database. Kolom B, mutatie positie overeenkomt met elke variant. Kolom C, een telling van mutatie-positieve individuen binnen mock studie 1. Elk zijn geacht heterozygote mutatie dragers. Het totale aantal personen in de studie gegenotypeerde is gelegen aan de onderkant van het blad. Kolom D, graaf van mutatie-positieve persoon in mock studie 2. Kolom E, graaf van mutatie-positieve persoon in mock studie 3. Kolom F, totale mutatie-positieve individuen hosting van de waargenomen mutatie over alle onderzoeken. Merk op dat verschillende mutaties die zijn gekoppeld aan dezelfde aminozuur positie moeten worden gecombineerd. Kolom G, MAF van elke mutatie en aminozuur positie met behulp van een voorbeeld-formule (dat wil zeggen: voor G2 "=2/(176*2)", Zie Tabel van materialen). Merk op dat aangezien alle individuen worden geacht te worden heterozygoot en elk individu geacht te voeren 2 allelen van de locus KCNQ1, de totale personen moeten worden vermenigvuldigd met 2 voor de allel frequentie. Klik hier voor een grotere versie van dit cijfer.

Figure 3
Figuur 3 : Voorbeeld van een gemiddelde berekening voor controle en experimentele varianten rolling. Kolom A en B, GnomAD controle variant posities en respectieve MAFs. Kolom C, alle aminozuur posities van KCNQ1 van aminozuur positie naar de finale. Kolom D, GnomAD variant MAF voor alle posities met een MAF van 0 in plaats van posities zonder een variant. Dit kan worden automatisch berekend met behulp van een functie VERT.zoeken (dat wil zeggen voor D2, "= IFERROR(VLOOKUP(C2,A:B,2,),0), Zie Tabel van materialen). De positie van de kolom E, voortschrijdend gemiddelde van MAF met behulp van een voorbeeld-formule (dat wil zeggen voor E2, "= SUM(D2:D7)/6" en E7, "= SUM(D2:D12)/11"). Kolom G en H, LQTS experimentele variant posities met respectieve MAFs. Kolom I, alle aminozuur posities van KCNQ1. Kolom J, LQTS variant MAF voor alle posities. Kolom K, rolling LQTS MAF. Grijze opvulling cellen zijn voorbeelden van waar MAF waarden uit kolommen B en H worden uitgevouwen in kolom D en J, respectievelijk, welke correlaat met respectieve standpunten in kolom C/I. Merk op dat het is van cruciaal belang dat alle cellen zijn opgemaakt als "Numbers" voor de juiste formule werking. Klik hier voor een grotere versie van dit cijfer.

Figure 4
Figuur 4 : Voorbeeld van signal-to-noise analyse en graphing. Links, voorbeeld database en berekeningen. Kolom A, alle aminozuur posities van KCNQ1. Kolom B, LQTS experimentele MAF voortschrijdend gemiddelde van elke positie. Kolom C, GnomAD controle MAF voortschrijdend gemiddelde van elke positie. D: signal-to-noise verhouding (dat wil zeggen voor D2, "= B2/C2"). Juiste, voorbeeld van de grafiek van signal-to-noise verhouding (y-as) versus aminozuur positie (x-as). Klik hier voor een grotere versie van dit cijfer.

Figure 5
Figuur 5 : Voorbeeld van eiwit en variant positie mapping. A, voorbeeld database en berekeningen. Kolom A, alle aminozuur posities van KCNQ1. Kolom B, KCNQ1 posities hebben een variant van de zeldzame controle geïdentificeerd in GnomAD. Kolom C, de kolom voor het toewijzen van domein waar cellen met waarden komen met de N- of C-terminal aspect van overeen KCNQ1 eiwit domeinen of eigenschappen geïdentificeerd. Zoals de meeste N-terminale domein dat het S1-domein heeft de grens van het N-terminaal aminozuur 122 is, wordt geen waarden worden hier vermeld. Kolom D, de kolom van de variant toewijzing waar de cellen met een 1 correspondeert met KCNQ1 posities die zeldzame varianten lokaliseren. Grijze opvulling cellen zijn twee voorbeelden van waar variant posities in kolom B in kolom D worden uitgebreid die met de respectieve standpunten in kolom A. correleren Klik hier voor een grotere versie van dit cijfer.

Figure 6
Figuur 6 : Voorbeeld van aminozuur-niveau signal-to-noise analyse van KCNQ1-gecodeerd KCNQ1 (Kv7.1). Top, variant posities worden gedemonstreerd met verticale lijnen, waaronder zeldzame GnomAD cohort varianten (zwart), overigens geïdentificeerd varianten in WES verwijzingen (blauw) en varianten in LQTS cases(green) geïdentificeerd. Functionele domeinen worden vermeld. Relatieve frequentie van case varianten LQTS genormaliseerd (groene lijn) van de varianten van het GnomAD wordt afgebeeld in vergelijking met WES (blauwe lijn). S1-S6, transmembraan domeinen; SF, ion selectiviteit filter; KCNE1 en AKAP9, respectieve eiwit bindende domeinen. Gewijzigde en herdrukt met toestemming van eerdere werk-14. Klik hier voor een grotere versie van dit cijfer.

Subscription Required. Please recommend JoVE to your librarian.

Discussion

High-throughput genetische tests beschikt over geavanceerde dramatisch in de toepassing en de beschikbaarheid in het afgelopen decennium. Echter in veel ziekten met gevestigde genetische onderbouwing, zoals hartziekten, uitgebreide testen in geslaagd om diagnostische opbrengst21. Verder is er grote onzekerheid over het diagnostische hulpprogramma van vele geïdentificeerde varianten. Dit is gedeeltelijk te wijten aan een groeiend aantal overigens geïdentificeerde zeldzame varianten op WES en WGS, die tot gepaard22 leiden kanontdekt. Aminozuur signal-to-noise analyse is gebaseerd op gevestigde strategieën voor het voorspellen van variant pathogeniteit en biedt het voordeel van de hefboomwerking van grootschalige bevolking gebaseerde genoom studies om te verfijnen variant interpretatie.

Hieruit volgt dat een van de meest cruciale stappen bij dit protocol de selectie van het besturingselement en experimentele cohorten is. Veel van de openbaar-beschikbare grote genoom studies zijn toegankelijk via statistische databanken, zoals GnomAD, die voor een vertegenwoordiger cohorten van de controle in dit protocol zorgen kunnen te zijn zo groot als 138,632 individuen op huidige datum. Hoewel niet alle onderwerpen in deze statistische cohorten ogenschijnlijk gezond zijn, de grote steekproefgrootte in de setting van zeldzame ziekte maakt deze bron onschatbare waarde en zorgt voor een strenge MAF uitsluiting drempel. Uitsluiting van voorkomende varianten is noodzakelijk omdat ze zijn waarschijnlijk niet een oorzaak van de zeer penetrant Mendelian ziekte. Gebaseerd op eerdere werk, een MAF drempel van 0,01 voor channelopathy-geassocieerde genen en 0,0001 voor cardiomyopathie genen kan dienstig zijn en door onafhankelijke groepen23,24is gevalideerd. Nog belangrijker is, moet gezien het belang van het MAF-drempel, dit worden ingesteld en gevalideerd voor elk onderzoek onafhankelijk. Een MAF drempel moet niet worden toegepast op een experimentele cohort, gezien het gevestigde aanwezigheid van oprichter mutaties in channelopathies en hartziekten. De grootte van de experimentele cohort moet toereikend zijn om te wijzen op mogelijke aspecten waar de varianten kunnen cluster; Er is echter geen strikte grootte. Bovendien moet de experimentele cohort varianten bekend als goedaardige binnen de literatuur, zoals dit afbreuk aan de juistheid van de pathogene signaal doen zou niet bevatten.

Goed selecteren uitsluitingscriteria is ook cruciaal voor de interpretatie en toepassing van het resultaat. Hoewel dit protocol met uitzondering van bepaalde klassen van de mutatie zoals synoniem varianten beveelt, zou dit redelijkerwijs opgenomen voor ziekteprocessen waarin schadelijke synoniem varianten geïdentificeerde25,26zijn geweest. Daarnaast kunt diverse uitsluitingscriteria worden toegepast op zowel experimentele en controlegroepen, het laten voor de stratificatie van signal-to-noise toewijzing door mutatie subklasse (d.w.z. vergelijken missense aan afknotten varianten).

Instelling van een voortschrijdend gemiddelde van MAFs toestaan voor gevolgtrekking van betrokkenheid naar naburige aminozuren. Bijvoorbeeld, als aminozuur 35 standpunt bevat een pathologische variant en woont in een kritische eiwitten domein en vervolgens de positie 36 wellicht een zekere mate van pathogeniteit wanneer gemuteerd. Ook moet een stuk van primaire sequentie hebben een grote hoeveelheid zeldzame controle varianten, dan aminozuren binnen deze regio die zeldzame varianten treden niet als host kan nog hebben een hogere kans op zeldzame varianten gevonden in een populatie bevatten. Terwijl het voortschrijdend gemiddelde in dit protocol is ± 5, dit bereik kan worden is afhankelijk van de gebruiker de gewenste niveau van resolutie van signal-to-noise verhouding en de specifieke proteïne bestudeerd. In het voorbeeld van LQTS, de interrogated KCNQ1-gecodeerde KCNQ1 kanaal heeft meerdere transmembraan domeinen verspreid over ~ 10-aminozuren, te vragen de auteurs om hun gewenste resolutie aan belangrijke bevindingen op die schaal14. Voor eiwitten met een meer primaire volgorde en eiwit lengte, kan de overspanning van het voortschrijdend gemiddelde moet worden verhoogd als gevolg van grotere overspanningen van eiwit sequentie zonder controle variatie.

Er zijn verschillende beperkingen aan deze methode. Zoals eerder vermeld, moet een voldoende fenotype-positieve bevolking hosting vermeende pathologische varianten worden geïdentificeerd om te rijden een duidelijk pathologische signaal. Bovendien, deze pathologische varianten wellicht variabele doordringendheid, dus echt pathologische mutaties moge niet het fenotype van een ziekte of anders niet volledig penetrerend middel en ziekte veroorzaken. Terwijl veel gehouden openbare databases, zoals GnomAD, worden vaak beschouwd als "gezond cohorten", de prevalentie van erfelijke ziekten is waarschijnlijk vergelijkbaar in deze database als bevolkingsvraagstukken. Als gedetailleerde, dit protocol zich specifiek richt op aminozuur niveau veranderingen ten gevolge van exonic gen-varianten van de techniek van die code voor aminozuren, die de rol die pathogene intronic splicing varianten bij monogeen ziekte spelen kunnen uitsluit. Gezien hun onlangs aangetoond dat rol in hartziekten, uitbreiding van de resolutie dit aanpak gerechtvaardigd kan zijn om te identificeren intergenic "hotspots" ook. Bovendien mag de toepassing van de drempel van een MAF missen bepaalde allelen"risico" dat, hoewel bestaande in de bevolking met een MAF hoger dan dat van ziekte prevalentie, kan bijdragen tot27,28van de pathogenese van de ziekte. Ondanks deze beperkingen, deze analyse is aan te passen en kan een belangrijke rol bij het verstrekken van clinici een relatieve kans op ziekte pathogeniteit indien nodig toegepast.

Tot slot, gezien de voorliefde van deze analyse te identificeren kritische gebieden binnen een eiwit, aminozuur-niveau signal-to-noise berekeningen met behulp van pathologische mutaties biedt de mogelijkheid voor het identificeren van nieuwe functionele domeinen van de proteïnen wordt studeerde. Gegeven de waarneming van hoge pathogeniteit signal-to-noise op belangrijke locaties van ionenkanalen, zoals het domein van de porie, selectiviteit filter, S2 transmembraan domein en de KCNE1-bindend domein van KCNQ1, identificatie van een "piek van pathogeniteit" binnen een bepaald gebied van het eiwit zonder een bekende functie kan suggereren een nieuwe kritische domein. Bijvoorbeeld, een duidelijke piek van pathogeniteit van LQTS-geassocieerde mutaties is geconstateerd lokaliseren naar aminozuur residuen 912-930 van KCNH2-gecodeerd KCNH2 (Kv11.1). Deze regio van het eiwit is geen identificeerbare functionele domein nog toont een duidelijke neiging voor LQTS-geassocieerde mutaties14. Aangezien de kennis van eiwit topologie groeit, meer verfijnde proteomics de resolutie van deze methode in de toekomst van het analyseren van signal-to-noise verhouding langs de primaire structuur van een eiwit op te nemen van haar secundaire, tertiaire, redelijkerwijs zou kunnen verbeteren of quaternaire structuur. Toevoeging van geavanceerde rekenkundige wetenschappen aan deze analyse, zoals machine learning en kunstmatige intelligentie, biedt de gelegenheid om nieuwe patronen onder pathologische versus bevolking gebaseerde genetische variatie, als robuuste databases van deze varianten kunnen gegenereerde29,30. Op zijn beurt, deze methode zou helpen bij het beter karakterisering en het voorspellen van het genotype-fenotype relatie van specifieke ziekten en worden gebruikt in combinatie met iemands pre-test kans op ziekte ter verbetering van de diagnostische opbrengst van genetische tests. Verder kan deze analyse ontdekken nieuwe eiwit biologie en identificeren van roman loci binnen het menselijk genoom die met ziekte manifesteren wanneer gewijzigd.

Subscription Required. Please recommend JoVE to your librarian.

Disclosures

De auteurs hebben niets te onthullen.

Acknowledgments

APL wordt ondersteund door de nationale instituten van gezondheid K08-HL136839.

Materials

Name Company Catalog Number Comments
1000 Genome Project N/A www.internationalgenome.org
ClinVar N/A www.ncbi.nlm.nih.gov/clinvar
Ensembl Genome Browser N/A uswest.ensembl.org/index.html
Excel Microsoft office.microsoft.com/excel/ Used for all example formulas and functions
Exome Aggregation Consortium  N/A www.exac.broadinstitute.org
Genome Aggregation Database  N/A www.gnomad.broadinstitute.org
National Center for Biotechnology Information Domain and Structure Database N/A www.ncbi.nlm.nih.gov/guide/domains-structures/
National Center for Biotechnology Information Gene Database N/A www.ncbi.nlm.nih.gov/gene/
National Center for Biotechnology Information Protein Database N/A www.ncbi.nlm.nih.gov/protein/
National Heart, Lung, and Blood Institute GO Exome Sequencing Project N/A www.evs.gs.washington.edu/EVS/
SnapGene GSL Biotech LCC www.snapgene.com
University of California, Santa Cruz Human Genome Browser N/A www.genome.ucsc.edu

DOWNLOAD MATERIALS LIST

References

  1. Yang, Y., et al. Clinical whole-exome sequencing for the diagnosis of mendelian disorders. New England Journal of Medicine. 369 (16), 1502-1511 (2013).
  2. Meng, L., et al. Use of Exome Sequencing for Infants in Intensive Care Units: Ascertainment of Severe Single-Gene Disorders and Effect on Medical Management. Journal of the American Medical Association Pediatrics. 171 (12), 173438 (2017).
  3. Kalia, S. S., et al. Recommendations for reporting of secondary findings in clinical exome and genome sequencing, 2016 update (ACMG SF v2.0): a policy statement of the American College of Medical Genetics and Genomics. Genetics in Medicine. 19 (2), 249-255 (2017).
  4. Landstrom, A. P., Ackerman, M. J. The Achilles' heel of cardiovascular genetic testing: distinguishing pathogenic mutations from background genetic noise. Clinical Pharmacology and Therapeutics. 90 (4), 496-499 (2011).
  5. Landstrom, A. P., Tester, D. J., Ackerman, M. J. Role of genetic testing for sudden death predisposing heart conditions in athletes. Sports Cardiology Essentials. Lawless, C. , Springer. New York, NY. (2011).
  6. Wang, Q., et al. Positional cloning of a novel potassium channel gene: KVLQT1 mutations cause cardiac arrhythmias. Nature Genetics. 12 (1), 17-23 (1996).
  7. Kapa, S., et al. Genetic testing for long-QT syndrome: distinguishing pathogenic mutations from benign variants. Circulation. 120 (18), 1752-1760 (2009).
  8. Ackerman, M. J., et al. Ethnic differences in cardiac potassium channel variants: implications for genetic susceptibility to sudden cardiac death and genetic testing for congenital long QT syndrome. Mayo Clinic Proceedings. 78 (12), 1479-1487 (2003).
  9. Kumar, P., Henikoff, S., Ng, P. C. Predicting the effects of coding non-synonymous variants on protein function using the SIFT algorithm. Nature Protocols. 4 (7), 1073-1081 (2009).
  10. Adzhubei, I., Jordan, D. M., Sunyaev, S. R. Predicting functional effect of human missense mutations using PolyPhen-2. Current Protocols in Human Genetics. , Chapter 7 (Unit 7.20) (2013).
  11. Flanagan, S. E., Patch, A. M., Ellard, S. Using SIFT and PolyPhen to predict loss-of-function and gain-of-function mutations. Genetic Testing and Molecular Biomarkers. 14 (4), 533-537 (2010).
  12. Ackerman, M. J., et al. HRS/EHRA expert consensus statement on the state of genetic testing for the channelopathies and cardiomyopathies this document was developed as a partnership between the Heart Rhythm Society (HRS) and the European Heart Rhythm Association (EHRA). Heart Rhythm. 8 (8), 1308-1339 (2011).
  13. Lek, M., et al. Analysis of protein-coding genetic variation in 60,706 humans. Nature. 536 (7616), 285-291 (2016).
  14. Landstrom, A. P., et al. Amino acid-level signal-to-noise analysis of incidentally identified variants in genes associated with long QT syndrome during pediatric whole exome sequencing reflects background genetic noise. Heart Rhythm. 15 (7), 1042-1050 (2018).
  15. Hubbard, T., et al. Ensembl 2005. Nucleic Acids Research. 33, Database issue 447-453 (2005).
  16. O'Leary, N. A., et al. Reference sequence (RefSeq) database at NCBI: current status, taxonomic expansion, and functional annotation. Nucleic Acids Research. 44, 733-745 (2016).
  17. Kent, W. J., et al. The human genome browser at UCSC. Genome Research. 12 (6), 996-1006 (2002).
  18. The 100 Genome Projects Consortium. An integrated map of genetic variation from 1,092 human genomes. Nature. 491 (7422), 56-65 (2012).
  19. Fu, W., et al. Analysis of 6,515 exomes reveals the recent origin of most human protein-coding variants. Nature. 493 (7331), 216-220 (2013).
  20. Mulder, N. J., Apweiler, R. Tools and resources for identifying protein families, domains and motifs. Genome Biology. 3 (1), (2002).
  21. Cirino, A. L., et al. A Comparison of Whole Genome Sequencing to Multigene Panel Testing in Hypertrophic Cardiomyopathy Patients. Circulation Cardiovascular Genetics. 10 (5), (2017).
  22. Landstrom, A. P., et al. Interpreting Incidentally Identified Variants in Genes Associated With Catecholaminergic Polymorphic Ventricular Tachycardia in a Large Cohort of Clinical Whole-Exome Genetic Test Referrals. Circulation Arrhythmia and Electrophysiology. 10 (4), (2017).
  23. Whiffin, N., et al. Using high-resolution variant frequencies to empower clinical genome interpretation. Genetics in Medicine. 19 (10), 1151-1158 (2017).
  24. Walsh, R., et al. Reassessment of Mendelian gene pathogenicity using 7,855 cardiomyopathy cases and 60,706 reference samples. Genetics in Medicine. 19 (2), 192-203 (2017).
  25. Buske, O. J., Manickaraj, A., Mital, S., Ray, P. N., Brudno, M. Identification of deleterious synonymous variants in human genomes. Bioinformatics. 31 (5), 799 (2015).
  26. Wen, P., Xiao, P., Xia, J. dbDSM: a manually curated database for deleterious synonymous mutations. Bioinformatics. 32 (12), 1914-1916 (2016).
  27. Bagnall, R. D., et al. Whole Genome Sequencing Improves Outcomes of Genetic Testing in Patients With Hypertrophic Cardiomyopathy. Journal of the American College of Cardiology. 72 (4), 419-429 (2018).
  28. Giudicessi, J. R., Roden, D. M., Wilde, A. A. M., Ackerman, M. J. Classification and Reporting of Potentially Proarrhythmic Common Genetic Variation in Long QT Syndrome Genetic Testing. Circulation. 137 (6), 619-630 (2018).
  29. Sundaram, L., et al. Predicting the clinical impact of human mutation with deep neural networks. Nature Genetics. 50, 1161-1170 (2018).
  30. Krittanawong, C., Zhang, H., Wang, Z., Aydar, M., Kitai, T. Artificial Intelligence in Precision Cardiovascular Medicine. Journal of the American College of Cardiology. 69 (21), 2657-2664 (2017).

Tags

Genetica kwestie 143 genetische analyse genetische tests mutatie topologie variant van onzekere betekenis hele exome sequencing
Bepaling van de waarschijnlijkheid van Variant pathogeniteit met behulp van aminozuur-niveau Signal-to-Noise analyse van genetische variatie
Play Video
PDF DOI DOWNLOAD MATERIALS LIST

Cite this Article

Jones, E. G., Landstrom, A. P.More

Jones, E. G., Landstrom, A. P. Determining the Likelihood of Variant Pathogenicity Using Amino Acid-level Signal-to-Noise Analysis of Genetic Variation. J. Vis. Exp. (143), e58907, doi:10.3791/58907 (2019).

Less
Copy Citation Download Citation Reprints and Permissions
View Video

Get cutting-edge science videos from JoVE sent straight to your inbox every month.

Waiting X
Simple Hit Counter