Aminosyre-niveau signal-støj analyse bestemmer forekomsten af genetisk variation på en bestemt aminosyre position normaliseret til baggrunden genetiske variation af en given befolkning. Dette giver mulighed for identifikation af variant “hotspots” inden for et protein sekvens (signal), der stiger over hyppigheden af sjældne varianter findes i en population (støj).
Fremskridt i omkostninger og hastighed af næste generation genetisk sekventering har genereret en eksplosion af klinisk hele exome og hele genom test. Mens dette har ført til øget identifikation af sandsynlige patogene mutationer i forbindelse med genetiske syndromer, er det også dramatisk øget antallet af i øvrigt fundet genetiske varianter af ukendt betydning (køretøjsenheder). Fastlæggelse af den kliniske betydning af disse varianter er en stor udfordring for både forskere og klinikere. En tilgang til at hjælpe med at afgøre sandsynligheden for sygdomsfremkaldende evne er signal-støj analyser på protein sekvens. Denne protokol beskriver en metode til aminosyre-niveau signal-støj analyse, der udnytter variant frekvens på hver aminosyre position af protein med kendte protein topologi til at identificere områder af den primære sekvens med forhøjet risiko for patologiske variation (i forhold til befolkningen “baggrund” variation). Denne metode kan identificere aminosyre rester placering “hotspots” høj patologiske signal, som kan bruges til at forfine diagnostiske vægten af VUSs som dem, der identificeres af næste generation genetisk testning.
Den hurtige forbedring af genetiske sekventering platforme har revolutioneret tilgængelighed og rolle genetik i medicin. Når begrænset til et enkelt gen eller en håndfuld af gener, at reduktionen i omkostningerne og stigning i hastighed af næste generation genetisk sekventering har ført rutinemæssig sekventering af helhed af genomet kodende sekvens (hele exome sekventering, WES) og hele genom ( hele genome sequencing, WGS) i de kliniske omgivelser. WES og WGS har været anvendt ofte i fastsættelsen af kritisk syge nyfødte og børn med bekymring for genetiske syndrom er det en gennemprøvet diagnostisk redskab, der kan ændres behandlingsprogram1,2. Mens dette har ført til øget identifikation af sandsynlige patogene mutationer i forbindelse med genetiske syndromer, har det også dramatisk øget antallet af i øvrigt fundet genetiske varianter eller uventede positive resultater, af ukendt diagnostiske betydning (køretøjsenheder). Mens nogle af disse varianter er ignoreret og ikke rapporteret varianter lokalisering til er gener forbundet med potentielt dødelig eller meget morbide sygdomme ofte rapporteret. Nuværende retningslinjer anbefaler rapportering af utilsigtede varianter findes i specifikke gener, som kan være af medicinsk nytteværdi for patienten, herunder gener forbundet med udviklingen af pludselige cardiac death-disponerende sygdomme som cardiomyopatier og channelopathies3. Selv om denne henstilling blev designet til at fange individer med risiko for en SCD-disponerende sygdom, overstiger variant påvisningsfølsomhed langt specificitet. Dette afspejles i et stigende antal VUSs og i øvrigt identificeret varianter med uklare diagnosehjælpeprogram, der langt overstiger hyppigheden af de respektive sygdomme i en given befolkning4. En sådan sygdom, langt QT-syndrom (LQTS), er en kanonisk hjerte channelopathy forårsaget af mutationer lokalisering til gener, der indkode hjerte Ionkanaler, eller kanal interagere proteiner, hvilket resulterer i forsinket hjerte repolarisering5. Denne forsinkede repolarisering, set af en forlænget QT-interval på hvilende elektrokardiogram, resulterer i en elektrisk disposition til potentielt fatale ventrikulære arytmier som torsades de pointes. Mens en række gener har været knyttet til udviklingen af denne sygdom, mutationer i KCNQ1-kodet jegKs kalium kanal (KCNQ1, Kv7.1) er årsag til LQTS type 1 og udnyttes som et eksempel under6. Illustrere kompleksiteten i variant fortolkning, har tilstedeværelsen af sjældne varianter i LQTS-associerede gener, så kaldt “baggrund genetiske variation” været tidligere beskrevet7,8.
Ud over store kompendium-stil databaser af kendte patogene varianter findes flere strategier til at forudsige effekt forskellige varianter vil producere. Nogle er baseret på algoritmer, som SIFT og Polyphen 2, der kan filtrere store mængder af roman ikke-synonym varianter at forudsige deleteriousness9,10. Trods bred anvendelse af disse værktøjer begrænser lav specificitet deres anvendelighed, når det kommer til at “kalde” klinisk VUSs11. “Signal til støj” analyse er et værktøj, der identificerer sandsynligheden for en variant, der er forbundet med sygdom baseret på hyppigheden af kendte patologiske variation på de pågældende loci normaliseret mod sjældne genetiske variation fra en population. Varianter lokalisering til genetiske loci hvor der er en høj forekomst af sygdommen-associerede mutationer i forhold til befolkningen-baserede variation, en høj signal-støj, er mere tilbøjelige til at være sygdom-associerede sig selv. Yderligere, sjældne varianter findes i øvrigt lokalisering af et gen med en høj frekvens af sjældne befolkning varianter i forhold til sygdommen-associerede frekvens, et lavt signal til støj, kan være mindre tilbøjelige til at være sygdom-associeret. Den diagnostiske nytte af signal-støj analyse er blevet illustreret af de nyeste retningslinjer for gentest for cardiomyopatier og channelopathies; imidlertid har det kun været ansat på hele genet niveau eller domæne-specifikke level12. For nylig har givet øget tilgængelighed af både patologiske varianter (sygdom databaser, kohorte studier i litteraturen) og befolkningsbaseret kontrol varianter (Exome Aggregation konsortium, ExAC og genom sammenlægning Database, GnomAD13), Dette har været anvendt til de enkelte aminosyre holdninger inden for den primære sekvens af et protein. Aminosyre-niveau signal-støj analyse har vist sig nyttige til at kategorisere i øvrigt identificeret varianter i gener forbundet med LQTS som sandsynligvis “baggrund” genetisk variation i stedet sygdom-forbundet. Blandt de tre store gener forbundet med LQTS, herunder KCNQ1, manglede disse i øvrigt identificeret varianter en betydelig signal-støj forhold, tyder på, at hyppigheden af disse varianter på individuelle aminosyre holdninger afspejler sjældne befolkningen variation snarere end sygdom-associerede mutationer. Desuden, hvornår protein-specifikke domænetopologi blev overlejret mod områder af høj signal-støj, patologiske mutation “hotspots” lokaliseret til centrale funktionelle domæner af proteiner14. Denne metode har løftet i bestemmelse 1) sandsynligheden for en variant er sygdom eller befolkningen forbundet og 2) at identificere roman kritiske funktionelle domæner af et protein, der er forbundet med sygdom hos mennesker.
Høj overførselshastighed gentest har avancerede dramatisk i dens anvendelse og tilgængelighed i det seneste årti. Dog i mange sygdomme med veletablerede genetiske fundament, såsom cardiomyopatier, har udvidede test kunnet forbedre diagnostisk udbytte21. Yderligere, er der betydelig usikkerhed om den diagnostiske nytte af mange identificerede varianter. Dette er delvis på grund af et stigende antal i øvrigt identificeret sjældne varianter opdaget på WES og WGS, hvilket kan føre til fejldi…
The authors have nothing to disclose.
APL understøttes af de nationale institutter for sundhed K08-HL136839.
1000 Genome Project | N/A | www.internationalgenome.org | |
ClinVar | N/A | www.ncbi.nlm.nih.gov/clinvar | |
Ensembl Genome Browser | N/A | uswest.ensembl.org/index.html | |
Excel | Microsoft | office.microsoft.com/excel/ | Used for all example formulas and functions |
Exome Aggregation Consortium | N/A | www.exac.broadinstitute.org | |
Genome Aggregation Database | N/A | www.gnomad.broadinstitute.org | |
National Center for Biotechnology Information Domain and Structure Database | N/A | www.ncbi.nlm.nih.gov/guide/domains-structures/ | |
National Center for Biotechnology Information Gene Database | N/A | www.ncbi.nlm.nih.gov/gene/ | |
National Center for Biotechnology Information Protein Database | N/A | www.ncbi.nlm.nih.gov/protein/ | |
National Heart, Lung, and Blood Institute GO Exome Sequencing Project | N/A | www.evs.gs.washington.edu/EVS/ | |
SnapGene | GSL Biotech LCC | www.snapgene.com | |
University of California, Santa Cruz Human Genome Browser | N/A | www.genome.ucsc.edu |