Waiting
Login processing...

Trial ends in Request Full Access Tell Your Colleague About Jove
Click here for the English version

Genetics

Navigera i MARRVEL, ett webbaserat verktyg som integrerar Human Genomics och Modellorganismens gen etik information

Published: August 15, 2019 doi: 10.3791/59542

Summary

Här presenterar vi ett protokoll för att effektivt komma åt och analysera många human-och modellorganismens databaser. Detta protokoll visar användningen av MARRVEL för att analysera kandidat sjukdomsframkallande varianter som identifierats från nästa generations sekvenserings arbete.

Abstract

Genom hel-exome/Genomsekvensering, mänskliga genetiker identifiera sällsynta varianter som segregera med sjukdomar fenotyper. För att bedöma om en specifik variant är patogena, måste man fråga många databaser för att avgöra om genen av intresse är kopplad till en genetisk sjukdom, om den specifika varianten har rapporterats tidigare, och vilka funktionella data finns tillgängliga i modellorganism databaser som kan ge ledtrådar om genens funktion i människa. MARRVEL (modellorganism aggregerad resurser för sällsynt variant prospektering) är en One-Stop datainsamlingsverktyg för mänskliga gener och varianter och deras ortologösa gener i sju modellorganismer inklusive i mus, råtta, zebrafisk, fruktfluga, Nematoden mask, fission jäst, och spirande jäst. I detta protokoll ger vi en överblick över vad MARRVEL kan användas till och diskutera hur olika dataset kan användas för att bedöma om en variant av okänd signifikans (VUS) i en känd sjukdomsframkallande gen eller en variant i en gen av osäker betydelse (GUS) kan Patogena. Detta protokoll kommer att vägleda en användare genom att söka flera mänskliga databaser samtidigt börjar med en mänsklig gen med eller utan en variant av intresse. Vi diskuterar också hur man använder data från OMIM, ExAC/gnomAD, ClinVar, geno2MP, DGV och DECHIPHER. Dessutom illustrerar vi hur man tolkar en lista över ortoolog kandidatgener, uttrycksmönster, och gå termer i modellorganismer som är associerade med varje mänsklig gen. Dessutom diskuterar vi värdet protein strukturella domän anteckningar som tillhandahålls och förklara hur man använder flera arter protein anpassning funktion för att bedöma om en variant av intresse påverkar en evolutionärt bevarad domän eller aminosyra. Slutligen kommer vi att diskutera tre olika användningsfall av denna webbplats. MARRVEL är en lättillgänglig Open Access-webbplats utformad för både kliniska och grundläggande forskare och fungerar som utgångspunkt för att designa experiment för funktionella studier.

Introduction

Användningen av nästa generations sekvenserings teknik expanderar i både forskning och kliniska genetiska laboratorier1. Hela-exome (WES) och helgenomsekvensering (WGS) analyser avslöjar många sällsynta varianter av okänd signifikans (VUS) i kända sjukdomsframkallande gener samt varianter av gener som ännu inte är förknippade med en Mendelian sjukdom (GUS: gener av osäkra betydelse). Presenteras med en lista över gener och varianter i en klinisk sekvens rapport, medicinska genetiker måste manuellt besöka flera online-resurser för att få mer information för att bedöma vilken variant kan vara ansvarig för en viss fenotyp ses hos patienten av intresse . Denna process är tidskrävande, och dess effektivitet är mycket beroende av den expertis som individen. Även om flera riktlinjer papper har publicerats2,3, tolkning av Wes och WGS kräver manuell Curation eftersom det finns ännu inte en standardiserad metod för variant analys. För tolkningen av VUS blir kunskapen om det tidigare rapporterade sambandet mellan genotyp och fenotyp, arvs läge och allelefrekvenser i den allmänna populationen värdefull. Dessutom kan kunskapen om huruvida varianten påverkar en kritisk protein domän eller ett evolutionärt bevarat restsubstanser öka eller minska sannolikheten för patogenicitet. För att samla in all denna information behöver man vanligtvis navigera genom 10-20 human-och modellorganismens databaser eftersom informationen sprids via World Wide Web.

På samma sätt är modellorganismforskare som arbetar med specifika gener och vägar ofta intresserade av att ansluta sina fynd till mekanismer för mänskliga sjukdomar och vill dra nytta av den kunskap som genereras inom human Genomics-området. Men på grund av den snabba expansionen och utvecklingen av datauppsättningar om det mänskliga genomet har det varit en utmaning att identifiera databaser som ger användbar information. Dessutom, eftersom de flesta modellorganism databaser är utformade för forskare som arbetar med den specifika organismen på en daglig basis, är det mycket svårt, till exempel, för en mus forskare att söka efter specifik information i en Drosophila databas och tvärtom. I likhet med den variant tolkning sökningar utförs av medicinska genetiker, identifiera användbara mänskliga och andra modellorganism information är tidskrävande och starkt beroende av bakgrunden av modellorganism forskaren. MARRVEL (modellorganism aggregerad resurser för sällsynta variant prospektering)4 är ett verktyg som utformats för båda grupperna av användare att effektivisera sitt arbetsflöde.

MARRVEL (http://marrvel.org) utformades som en centraliserad sökmotor som samlar in data systematiskt på ett effektivt och konsekvent sätt för kliniker och forskare. Med information från 20 eller fler allmänt tillgängliga databaser, tillåter detta program användare att snabbt samla in information och få tillgång till ett stort antal mänskliga och modell organism databaser utan upprepade sökningar. Sökresultatsidorna innehåller också hyperlänkar till de ursprungliga informationskällorna, vilket gör det möjligt för personer att komma åt rådata och samla in ytterligare information från källorna.

I motsats till många av de variant prioritering verktyg som kräver stor sekvensering data input i form av VCF eller BAM filer och installationer av ofta proprietär/kommersiell programvara, fungerar MARRVEL på alla webbläsare. Den kan användas utan kostnad och är kompatibel med bärbara enheter (t. ex. smartphones, surfplattor) så länge en är ansluten till Internet. Vi valde detta format eftersom många kliniker och forskare vanligtvis behöver söka en eller några gener och varianter i taget. Märka så pass vi er utvecklande baken-data överför och API (applicering programmerande gräns flat) dragen för marrvel till så småningom tillåta förbrukaren till komminister hundra av gener och varianten med ett tid igenom customized fråga redskapen om nödvändig.

På grund av det stora utbudet av applikationer, i detta protokoll, kommer vi att beskriva en brett övergripande strategi för hur man navigerar genom olika dataset som MARRVEL visar. Mer riktade exempel som är skräddarsydda mot specifika användares behov kommer att beskrivas i representativa resultat avsnitt. Det är viktigt att notera att produktionen av MARRVEL fortfarande kräver en viss nivå av bakgrundskunskap i antingen humangenetik eller modellorganismer för att extrahera värdefull information. Vi hänvisar läsarna till tabellen som listar primärpapper som beskriver funktionen för var och en av de ursprungliga databaserna som curated av MARRVEL (tabell 1). Följande protokoll är indelat i tre avsnitt: (1) hur man påbörjar en sökning, (2) hur man tolkar MARRVEL humangenetik utgångar, och (3) hur man använder modellorganismens data i MARRVEL. I avsnittet representativa resultat beskrivs mer fokuserade och specifika tillvägagångssätt. MARRVEL uppdateras aktivt så se den aktuella webbplatsens FAQ-sida för mer information om datakällor. Vi rekommenderar starkt att användare av MARRVEL registrerar sig för att få uppdateringsmeddelanden via formuläret för e-postinlämning längst ned på hemsidan för MARRVEL.

Subscription Required. Please recommend JoVE to your librarian.

Protocol

1. hur man påbörjar en sökning

  1. För den mänskliga genen och variant-based search, gå till steg 1.1.1.-1.1.2. För mänsklig genbaserad sökning (ingen variant input), gå till steg 1,2. För modellorganism gen-baserad sökning, se steg 1.3.1.-1.3.2.
    1. Gå till startsidan för MARRVEL4 på http://marrvel.org/. Börja med att skriva in en human gen symbol. Se till att kandidat gen namnen listas under inmatningsrutan med varje teckeninmatning. Om sökningen kommer tillbaka negativt, se till att den gen symbol som används är uppdaterad med hjälp av HUGO Gene nomenklatur Committee webbplats5 (hgnc; https://www.genenames.org/).
    2. Ange en mänsklig variant. Sökfältet är kompatibelt med två typer av variant nomenklatur: genomläge liknar hur varianter visas på ExAC och GnomAD6 och transkription-baserade nomenklaturen enligt HGVS riktlinjer. Exempel på sådana format visas i grå text i sökrutan. För genomisk platsnomenklatur, Använd koordinaterna enligt hg19/GRCh37. gå vidare till steg 2.
      Anmärkning: om en sökning returnerar ett fel, de vanligaste problemen är antingen gen symbolen är inte aktuell eller variant nomenklatur är felaktig. I dessa fall är HGNC (https://www.genenames.org/), Mutalyzer7 (https://www.mutalyzer.nl/) och transvar8 (https://Bioinformatics.mdanderson.org/transvar/) webbplatser bra resurser för att korrigera felet. HGNC tillhandahåller officiella gen symboler och deras alias för alla mänskliga gener.
    3. Om det fortfarande uppstår felmeddelanden efter att du bekräftat att gen namnet är uppdaterat, använder du Mutalyzer och TransVar för att kontrollera och konvertera variantnomenklatur.
    4. I vissa situationer, såsom en mycket ny gen symbol förändring i HGNC, försök att använda en synonym för genen och kontakta MARRVEL operativa team med hjälp av "feedback"-fliken så att uppdatera källdata, som MARRVEL kanske inte ger rätt information på grund av en fördröjning i data upp Datum.
  2. Ange en human gen symbol och lämna den mänskliga varianten sökfältet tomt. Om ett fel påträffas, gå till HGNC (https://www.genenames.org/) för att söka efter den officiella gen symbolen eller prova en äldre gen symbol.
    1. Klicka på sökfliken för modellorganismer på den översta banderollen (bild 1) eller gå till http://marrvel.org/Model. Välj den modellorganism som du väljer och ange en gen symbol för modellorganism. Klicka på gen symbolen som namnet är kompletterat och klicka sedan på Sök. Om sökresultatet är negativt, kontrollera den officiella gen symbolen som används i modellorganismens databaser (tabell 1).
    2. Om sökresultatet är fortfarande negativ, tillgång DIOPT (DRSC integrativ Ortholog förutsägelse verktyg, https://www.flyrnai.org/cgi-bin/DRSC_orthologs.pl) och HCOP (https://www.genenames.org/tools/hcop/) för att bedöma om det inte finns några bra förutspådde ortologgar för gen av intresse. DIOPT är en ortoolog förutsägelse sökmotor som drivs av DRSC (Drosophila RNAi screening Center) och hcop är en liknande Svit utvecklad av HGNC.
      Obs: ytterligare sökningar med BLAST (https://blast.ncbi.nlm.nih.gov/Blast.cgi) kan tillåta användare att hitta ortologgar som kan missas av förutsägelse algoritmer som används i DIOPT och HCOP.
    3. Klicka på Marrvel det längst ner för den förväntade mänskliga ortoolog val. Kontrollera Diopt Poäng9 och bästa Poäng från Human Gene till modell organism? för valet av den mänskliga genen. Gå vidare till steg 2.
      Obs: Diopt Poäng9 (https://www.flyrnai.org/cgi-bin/DRSC_orthologs.pl) är ett värde av hur många ortoolog förutsägelse algoritmer förutsäga ett par gener i två organismer att vara ortologous till varandra. Mer information om dessa värden och de specifika algoritmer som används för att beräkna poängen finns i hu et al9. När bästa Poäng från Human Gene till modell organism? är Ja, det tyder på att den mänskliga genen är mer sannolikt en sann mänsklig ortolog av genen av intresse, men det kan finnas undantag, särskilt när flera mänskliga gener är ortologous att flera modellorganism gener på grund av genduplicering händelser under evolutionen. Om genen av intresse är medlem i en komplex gen familj som har genomgått olika evolution hos flera arter, bör användare identifiera en publikation som har utfört en omfattande fylogenetisk analys av genen familj av intresse för att identifiera de mest sannolikt ortoolog kandidat gen.

2. hur man tolkar MARRVEL humangenetik utgångar för en gen och variant Sök

På resultatsidan finns det sju mänskliga databaser som visas (tabell 1, figur 1). För varje utmatnings ruta finns en extern länk knapp (liten ruta med en diagonal pil) i det övre högra hörnet som kommer att länka till den ursprungliga databasen för mer information.

  1. Klicka på OMIM (online Mendelian arv i Man, https://www.OMIM.org/)10, den första databasen som visas.
    Obs: OMIM är en manuellt curated databas som sammanställer och sammanfattar information om genetiska sjukdomar och egenskaper hos människan.
    1. Använd den mänskliga gen beskrivnings rutan från OMIM för en kort sammanfattning av vad som är känt om genen och genprodukten.
    2. Använd rutan gen-fenotyp relationer för att avgöra om genen är en känd sjukdomsframkallande gen eller inte. Denna ruta ger manuellt kurerad känd sjukdom eller fenotyp associationer med genen av intresse.
    3. Använd den rapporterade alleles från OMIM rutan för att få en lista över patogena varianter curated av OMIM.
      Obs: eftersom manuell Curation av en publikation om en ny sjukdom gen upptäckt är nödvändig för någon gen-sjukan förening ska visas i OMIM, vissa tidsfördröjning och/eller missade publikationer kan leda till missuppfattning. Det rekommenderas att användare utför PubMed (https://www.ncbi.nlm.nih.gov/pubmed/) sökningar för att titta in i den senaste litteraturen också (se 4.1.2.). För ytterligare information curated i OMIM, se Amberger10,11.
  2. KlickaExAC(Exome aggregation Consortium, http://exac.broadinstitute.org/)6och gnomAD(Genomaggregations databas, http://gnomad.broadinstitute.org/), stora populations genomik databaser baserade på WES och WGS av människor som är utvalda för att utesluta allvarliga pediatriska sjukdomar.
    Obs: ExAC innehåller ~ 60 000 WES medan gnomAD innehåller ~ 120 000 WES och ~ 15 000 WGS. Både ExAC och gnomAD kan användas som en kontrollpopulation databas, särskilt för allvarliga pediatriska sjukdomar, men dess tolkning kräver en viss grad av försiktighet. I allmänhet kan gnomAD betraktas som en uppdaterad och utökad version av ExAC eftersom de flesta kohorter som ingår i ExAC ingår också i gnomAD. Men eftersom det finns vissa undantag (se kohort information i http://exac.broadinstitute.org/about respektive http://gnomad.broadinstitute.org/about), visar MARRVEL data från båda källorna.
    1. Använd rutan kontroll population gen för att få statistik på gen nivå, till exempel sannolikheten för att finna förlust av funktion (LOF) alleler i den allmänna populationen. Detta kallas PLI (sannolikhet för LOF intolerans) poäng i exac och kan användas för att dra slutsatsen hur sannolikt en enda kopia av en LOF allel för en specifik gen kan orsaka en dominerande sjukdom genom haplo-otillräckliga mekanismer.
      Obs: om man tittar på pLI poängen av en gen har värde, särskilt när det handlar om dominerande sjukdomar som förekommer som allvarliga pediatriska sjukdomar i samband med de Novo varianter. Om en gen har en pLI poäng på 0,00, betyder det att det är mycket tolerant av LOF varianter således genen osannolikt orsaka sjukdom via en dominerande haploinsufficiens mekanism. Detta utesluter dock inte nödvändigtvis andra dominerande vinst av funktion (GOF) eller dominerande negativa medierade mekanismer kan orsaka sjukdom. Dessutom, gener som orsakar recessiva sjukdomar kan ha låga pLI Poäng eftersom karriärer förväntas finnas i den allmänna befolkningen. Å andra sidan, om en gen har en pLI-poäng på 1,00, är det möjligt att förlusten av en kopia av denna gen är skadligt för människors hälsa. Ytterligare sökningar på webbplatser som DOMINO (https://wwwfbm.unil.ch/domino/) kan också användas i kombination för att bedöma sannolikheten för en variant i en specifik gen som orsakar en dominerande sjukdom.
    2. Använd de två följande rutorna för att få allelefrekvenser av den variant av intresse i ExAC och gnomAD, respektive att hjälpa till att tolka huruvida varianten kan vara patogena beroende på om patienten har den dominerande eller recessiv sjukdom. Den här rutan visas bara när användaren indata variant information när du initierar sökningen.
      Anmärkning: om en hypotes en recessiv sjukdom scenario och PLI poäng av genen av intresse är låg, bör man vara uppmärksam på allel frekvens som anges här. Vissa genetiker kan etablera en brytpunkt på 0,005 till 0,0001 som den maximala allelefrekvensen för patogena varianter som kan orsaka en allvarlig recessiv ärftlig sjukdom2. Å andra sidan, om man hypoteserar ett dominerande sjukdomsscenario, är det mindre sannolikt att hitta den identiska eller liknande variant i en kontrollpopulation. Återigen, detta kräver försiktighet eftersom personer med sena debut sjukdomar, sjukdomar med mild presentation, psykiska störningar eller sjukdomar som inte screenas av ExAC/gnomAD forskarna kan fortfarande inkluderas och varianten kan fortfarande vara en dominerande patogena Variant. Också, det har förekommit vissa fall av varianter kopplade till pediatriska villkor som finns i ett fåtal individer i dessa databaser12,13,14, potentiellt på grund av ofullständig penetrans eller somatiska mosaicism13 , 15 , 16. Dessutom, även om exac och gnomAD kommer att Visa varianter som finns i en homozygot tillstånd, det kommer inte att indikera om någon av de varianter som finns i en förening heterozygot tillstånd. Slutligen är vissa varianter som finns i dessa databaser Taggade som lågt förtroende på grund av tekniska utmaningar i sekvensering (t. ex. låg sekvens täckning, repetitiv sekvens). För att titta mer noggrant in dessa datamängder, användare rekommenderas att använda den externa länken knappen för att besöka den ursprungliga exac och gnomAD webbplatser för att få ytterligare information.
  3. Klicka geno2MP (genotyp till Mendelian fenotyp Browser, http://geno2mp.gs.Washington.edu/Geno2MP/), en samling av Wes-baserade data från University of Washington Center for Mendelian Genetics. Det innehåller omkring 9 600 exomes (som av 1/18/2019) av påverkade individer och opåverkade släktingar med några fenotypic beskrivningar (figur 1).
    1. Använd rutan sjukdoms population för att få allelefrekvensen för den variant av intresse i denna kohort.
    2. Använd den gen-fenotyp relationer rutan för att få HPO (Human fenotyp ontologi)17 termer för de individer med varianten av intresse. Detta är ett av många sätt för en att leta efter patienter som kan ha samma sjukdom.
      Anmärkning: om en gen av intresse misstänks vara förknippad med en patients sjukdom och det finns matchningar i geno2MP, kan ytterligare viktig information förekomma i datakällan utöver vad som visas.
      1. Klicka på knappen extern länk till den genspecifika sidan på geno2MP, filtrera efter mutationer som liknar patientens (t. ex. missense, LOF) och granska noggrant listorna över varianter. Anteckna varianter med hög CADD18 Poäng och klicka på HPO profiler. Till exempel CADD poäng högre än 20 är inom de översta 1% av alla varianter som förutses vara skadliga, CADD Poäng som är högre än 10 är inom de översta 10%. HPO-termer ger en standardiserad Beskrivning av humana fenotyper. Här, se till att kontrollera om varianten identifierades i en berörd individ eller i en släkting.
      2. Om varianter finns hos patienter som påverkas i samma organsystem som patienten, Överväg att använda e-postformuläret för att kontakta den läkare som skickade dessa fall till geno2MP med hjälp av funktionen som finns på geno2MP webbplats.
        Obs: inte alla läkare svara på sådana frågor, så man bör utforska andra vägar för patientens matchmaking. Andra sätt att samla en kohort av patienter som drabbats av samma sjukdomar är att använda verktyg som genematcher19 (https://www.genematcher.org/) och andra databaser som är en del av matchmaker Exchange19,20 ( https://www.matchmakerexchange.org/). Se medföljande JoVE artikel för mer information om matchmaking21.
  4. Använd databasen Clinvar (https://www.ncbi.NLM.NIH.gov/clinvar/)22 , som stöds av National Institutes of Health (NIH), där forskare och kliniker lämnar in varianter med eller utan bestämning av patogenicitet för att kontrollera singelnucleotide variants (SNV), lilla indels och större kopierar numrerar variationer (CNV).
    1. Använd den översta raden för att granska en sammanfattning av antalet av varje typ av varianter som rapporteras i ClinVar (figur 1).
    2. Kontrollera listan över varianter nedan i rutan rapporterade alleles från ClinVar.
      Anmärkning: om en variant ingick i den första sökningen, de markerade varianterna i Teal är alla varianter som inkluderar genomisk plats för den variant av intresse [inklusive stora CNVs, som ofta är märkta som; genomisk samordna... x1 (radering) och... x3 (duplicering)].
  5. Använd DGV23 (databas över genomiska varianter, http://DGV.tcag.ca/DGV/app/Home) och dechiffrera24 (databas över genomisk VarIation och fenotyp hos människor som använder Ensembl Resources, https://decipher.Sanger.AC.uk/), båda samlingar av CNVs. DGV är den största Public-Access samling av strukturella varianter från mer än 54 000 individer. Denna databas innehåller prover av enligt uppgift friska individer, vid tidpunkten för fastställelse, från upp till 72 olika studier. På samma sätt innehåller de data som visas från DECHIFFRERA vanliga varianter från kontroll populationen.
    Eftersom MARRVEL inte har behörighet att Visa patient härledda data från DECIPHIER, uppmuntras användarna att direkt besöka DECHIFFRERA webbplatsen för att få tillgång till potentiellt patogena CNV-information.
    1. Klicka på den Kopiera nummer variation i kontroll population (DGV-databas) rutan för att hämta varianter som innehåller genen av intresse. Information som storlek, undertyp och referens för Kopiera nummer variation finns i samma ruta.
    2. Klicka på den vanliga kopiera nummer varianter (DECHIFFRERA databasen) rutan för att hämta varianter som innehåller den genomiska platsen för den variant av intresse. Denna information kan hjälpa till att avgöra om genen dupliceras eller raderas i kontrollpersonerna.
      Anmärkning: om genen av intresse tas bort i många individer i kontroll populationen, det innebär att denna gen sannolikt är mycket tolerant av LOF varianter. Liksom låga pLI poäng, detta tyder på att en enda kopia förlust av denna gen är mindre benägna att orsaka en allvarlig sjukdom via en haploinsufficiens mekanism. Detta utesluter dock inte nödvändigtvis andra dominerande vinstmedel eller dominerande negativa mekanismer (t. ex. antimorfiska, hypermorfiska och neomorfiska alleler) som orsakas av specifika genom och trunkering av alleler.  Eventuella begränsningar av dessa uppgifter omfattar variationer i källa och metod för de data som erhållits, brist på information om ofullständiga penetrans av patogena CNVs, och om individer utvecklat vissa sjukdomar efter uppgiftsinsamling.

3. hur du använder modellorganismens data i MARRVEL

  1. Använd gen funktionstabellen för att få följande information om åtta modellorganismer, inklusive Human (humant, råtta, mus, zebrafisk, Drosophila, C elegans, spirande jäst och fission jäst):
    1. Gen namn: eftersom varje gen namn är hyperlänkade till gen sidor på respektive modell organism databaser, klicka på dessa länkar för att ta reda på mer om fenotypisk information och tillgängliga resurser för varje modellorganism. Till exempel på Flybase25 (http://flybase.org/), kommer det att finnas en lista över alla alleler som har genererats, deras respektive fenotyper och tillgängligheten av varje allel från offentliga lager centra.
    2. PubMed länk: Klicka på PubMed länken för att gå till en lista över publikationer som relaterar till genen av intresse i varje organism. Utan att använda dessa länkar, söka efter den mänskliga genen direkt i PubMed kan leda till saknade några publikationer som använde en gammal genalias att hänvisa till den mänskliga genen. På samma sätt kan modellorganismens gen namn ha fluktuerat historiskt.
    3. Diopt 9 Poäng: kontrollera denna kolumn för en poäng av hur många ortoolog förutsägelse algoritmer förutsäga genen är sannolikt en ortoolog av den mänskliga genen av intresse. Man kan använda en DIOPT poäng av 3 eller högre som en rimlig cut-off för att identifiera solid ortoolog kandidater. Det finns dock fall där äkta ortologgar bara har en DIOPT poäng på 1 på grund av begränsad homologi. Längst upp i gen funktionstabellen, kryssa i rutan "Visa endast bästa DIOPT score Gene" för att visa alla kandidater som vanligtvis innehåller homolog gener som inte nödvändigtvis är ortologgar.
    4. Uttryck: kontrollera denna kolumn för listan över de vävnader där genen eller proteinet av intresse har rapporterats uttryckas i human-eller modellorganismens databaser. Data från Human Gene och protein Expression är från Gtex26 (https://gtexportal.org/) och human protein Atlas27 (https://www.proteinatlas.org/) respektive. Vissa har en knapp med popup-länkar, till exempel för mänskliga och för fluga som visar uttrycksmönstret med hjälp av en värmekarta, medan andra är hyperlänkade till respektive modell organism databaser sidor.
    5. Genontologi 28 (go) villkor: Filtrera efter experimentella bevis koder och inhämta från respektive human-eller modellorganismens databaser. GO-villkor som baseras på "beräknings bevis koder" och "elektroniska antecknings bevis koder" (förutsägelser) visas inte. Vänligen besök varje modell organism webbplats för att samla in denna information om det behövs.
    6. Andra länkar som Monarch Initiative29 (https://monarchinitiative.org/) och impc30 (http://www.mousephenotype.org/): Använd den Monarch Initiative hyperlänk för att navigera till phenogrid Sidan för den specifika mänskliga genen, ett diagram som ger en snabb jämförelse mellan de fenotyper som är förknippade med genen av intresse för kända mänskliga sjukdomar och modellorganism mutanter som har fenotypiska överlappningar. Om en mus gen har en knockout mus som gjorts eller planeras av International Mouse Fenotyping Consortium (IMPC), den "IMPC" länkar till sidan som specificerar fenotyp av knockout Mouse och dess tillgänglighet från offentliga lager centra.
  2. Mänsklig Protein domäner: Använd rutan Human gen protein domäner för att få fram predikterade protein domäner för den mänskliga genen. Uppgifterna härleds från Diopt, som använder pfam (https://PFAM.xfam.org/) och CCD (bevarade domäner databas, https://www.ncbi.NLM.NIH.gov/Structure/CDD/CDD.shtml). En enda rester kanske kommenterade mer än en gång på grund av viss överlappning i domäner kommenterade i de två källorna.
  3. Använd kombinationsrutan flera proteiner för att erhålla aminosyran multipel justering som genereras av diopt9 som inkluderar Human (HS), råtta (RN), mus (mm), zebrafiskar (Dr), Fruit fly (DM), Worm (CE), och jäst (SC och SP). För att belysa aminosyran av intresse, scrolla ner till botten av rutan och ange aminosyran numren nedan och aminosyror av intresse kommer att lyftas fram i Teal. Anpassningen ges av DIOPT och använder MAFFT Aligner (flera justeringsprogram för aminosyra eller nukleotid sekvenser, https://mafft.cbrc.jp/alignment/software/31).
    Anmärkning: om aminosyran som är markerad baserat på antalet inte är den förväntade, kan det bero på olika splitsning isoformer som används för anpassningen. I princip använder DIOPT den längsta isoformen för att visa i denna ruta. Även för segment av gener som inte är väl bevarade, anpassning av flera arter sekvenser med standardparametrar kanske inte optimalt. Vi rekommenderar att du använder andra webbplatser och program som Clustal Omega och ClustalW/X (http://www.clustal.org/)32 för att optimera justerings parametrarna och matriserna därefter.

Subscription Required. Please recommend JoVE to your librarian.

Representative Results

Mänskliga genetiker och modellorganismforskare varje använder MARRVEL på olika sätt, var och en med olika önskade resultat. Nedan finns tre vinjetter av möjliga användningsområden för MARRVEL.

Utvärdering av patogenicitet hos en variant i en dominerande sjukdom
De flesta av de användare som besöker MARRVEL använda denna webbplats för att analysera sannolikheten att en sällsynt mänsklig variant kan orsaka en viss sjukdom. Till exempel, en genom (17:59477596 G > a, p. R20Q) variant i TBX2 befanns segregera i en autosomalt dominant sätt i en liten familj med dysmorphic funktioner och gomspalt, hjärtfel, skelett-och Digit avvikelser, sköldkörtel-relaterade fenotyper och immundefekter12. Mamman och två barn som drabbats av dessa symptom bar varianten, medan fadern inte gjorde det. Den 9-årige sonen hade den allvarligaste fenotypen, medan den 36-åriga mamman och den 6-årige dottern hade mildare former av denna sjukdom. För att bedöma om denna variant är sannolikt patogena, kan man starta en MARRVEL sökning genom att ange genen och varianter på startsidan på http://MARRVEL.org. Observera att den variant sökfältet kräver avlägsnande av Chr framför varianten om detta anges i den ursprungliga kliniska rapporten för att indikera "kromosom". Vid tidpunkten för den ursprungliga studien, resultatsidan visade att det inte finns någon OMIM fenotyp i samband med denna gen, och denna variant finns endast en gång i gnomAD men inte i ExAC, ClinVar, eller geno2MP. Man kan tycka att denna identifikation av en individ kan vara bevis mot p. R20Q är en patogena variant, men det är viktigt att notera att familjens mor uppvisade en mild form av sjukdomen. En variant som finns i 1/~ 150000 individen är verkligen en mycket sällsynt variant och identifieringen av en individ med identisk variant kan förklaras av minskad uttrycksbenägenhet eller penetrans. I gen funktionstabellen är det ofta bra att kontrollera om genen uttrycks i relevanta vävnader hos människor (via GTEx och protein Atlas) med hänvisning till patientens fenotyper. I detta fall uttrycksmönstret matchar eftersom patienten har fenotyper i flera vävnader och genen är också allmänt uttryckt, inklusive hjärt-, och immunrelaterade organ.

Baserat på modellorganismens information som visas i MARRVEL, kan man snabbt se att genen är bevarad från C. elegans och Drosophila till mänsklig och aminosyran av intresse, p. R20 är också mycket bevarad under hela evolutionen som visas i Figur 2 (Observera att råtta Tbx2 inte överensstämmer väl i denna region, sannolikt på grund av avskriften som används för justering). Fenotypisk information i mus och zebrafisk indikerar att denna gen påverkar utveckling eller funktion av ett antal vävnader inklusive hjärt-kärlsystemet, kraniofacial/gom, och siffror. Sammanfattningsvis tyder dessa data på att denna variant är möjligen patogena och ytterligare funktionell studie är värdefull. Med tanke på att genen och varianten är bevarade i organismer som C. elegans och Drosophila, kommer funktionella studier av ryggradslösa djur att vara snabbare och billigare jämfört med att utföra samma experiment på ryggradsdjur modellorganismer som Zebrafish, mus och råtta. Vänligen se medföljande artikel av Harnish et al.21 om hur vi utformat och utfört funktionella analyser för detta fall12. Medverkan av denna gen/variant i denna familjs sjukdom förstärktes ytterligare genom identifiering av en icke-närstående 8-årig manlig patient med överlappande fenotyper med en de Novo genom variant i samma gen med genematcher. Varianterna i de två familjerna konstaterades båda vara funktionella med hjälp av experiment i Drosophila, ytterligare stödja patogeniteten hos de sällsynta varianter i TBX2. Sjukdomen har nyligen kurerats som "vertebrala anomalier och varierande endokrina och T-cells dysfunktion (VETD, OMIM #618223)" i OMIM. Se figur 3 för hela produktionen för TBX2 17:59477596 G > A.

Utvärdering av patogenicitet hos en variant i en recessiv sjukdom
Det finns betydande skillnader mellan att analysera mänskliga varianter i dominerande och recessiva sjukdomar. Till exempel, pLI poäng, mindre Allelefrekvens, och förekomst av borttagningar i kontroll populationen blir mindre viktigt eftersom två alleler är nödvändiga för att avslöja någon fenotyp.

Ett exempel på analys av en recessiv sjukdom beskrivs i Yoon et al33 och Wang et al4 som sammanfattas här. En 15-årig flicka uppvisade utvecklingsförsening, mikrocefali, ataxi, motorisk funktionsnedsättning, hypotoni, språksvårigheter, missbildningar i hjärnan, och hypoplasi av corpus callosum33. Den proband, hennes opåverkade föräldrar, och en opåverkade syskon fick WES. Efter filtrering för varianter som var både unika för proband och sällsynt i befolkningen, var varianter i 13 olika gener kvar. Manuell filtrering och analys av de 13 kandidaterna genom att följa det protokoll som beskrivs här resulterade i prioriteringen av en specifik variant i Ogdhl som en bra kandidat för funktionella studier. De viktigaste bitarna av information som ledde till att prioritera p. S778L i Ogdhl (10:50946295 G > A) över andra varianter inkluderar: (1) ingen tidigare sjukdoms Association i OMIM, (2) variant som inte finns i kontrollpopulationer, (3) genontologi i samband med mikrotubule och mitokona, två system som har många länkar till neurologiska sjukdomar34,35, (4) högt uttryckt i human cerebellum, en vävnad som drabbats hårt hos denna patient, och (5) den variant av intresse som påverkar en mycket bevaras aminosyran (från jäst till människa) och ligger inom den katalytiska domänen4. pLI Poäng för denna gen är 0,00 men detta påverkar inte prioriteringen av denna variant/gen för detta fall eftersom vi misstänker en recessiv läge av arv och att bärare av skadliga varianter i denna gen kan förekomma i den allmänna befolkningen. Se figur 4 för MARRVEL utgång för Ogdhl 10:50946295 G > A.

Modellorganismstudier utförda parallellt visade att förlust av Ogdh (även kallad Nc73EF), Drosophila ortholog av ogdhl, i nervsystemet uppvisar en neurodegenerativ fenotyp som överensstämmer med probands neurologiska störning33. Funktionella studier i Drosophila visade att den variant av intresse (p. S778L) påverkar proteinfunktion, vilket gör detta till en stark kandidat gen för denna sjukdom. Sedan dess har denna information om en potentiell patogena variant i Ogdhl kopplad till en ny neurologisk sjukdom har införlivats i OMIM (https://www.OMIM.org/Entry/617513) helt nyligen men har ännu inte tilldelats en sjukdom-fenotyp antal eftersom endast ett fall har rapporterats från och med januari 2019.

Är den mänskliga ortoolog av en modell organism gen av intresse i samband med genetiska sjukdomar?
Många modellorganism forskare kan vara intresserade av att se om den mänskliga ortoolog av deras gen av intresse kan ha länkar till genetiska sjukdomar. I detta exempel kommer vi att söka om den mänskliga ortoolog (er) av flugan notch (N) genen har någon relevans för genetiska sjukdomar. För att göra detta börjar vi med att utföra en "Modellorganismsökning (1.3.1.-1.3.2.)" och välj "Drosophila melanogaster" som Artens namn och "N" som modellorganismens gen namn. De fyra förväntade humana ortologgarna för denna fluggen kommer att visas i resultatfönstret som NOTCH1, NOTCH2, NOTCH3 och NOTCH4. De fyra generna har olika DIOPT betyg (10/12 för NOTCH1, 8/12 för NOTCH2 och NOTCH3, 5/12 för NOTCH4) på grund av graden av homologi mellan fly N och varje mänsklig gen. Med tanke på den "bästa poängen från Human Gene to fly" är listad som "Ja" för alla fyra gener, den omvända sökningen från varje mänsklig gen plockar upp fly N genen som den mest sannolika ortoolog kandidat. Faktum är att de fyra mänskliga notch gener tros ha uppstått från en enda notch gen under de två omgångar av hela genomduplicering händelser som hände i ryggradsdjur härstamning efter uppdelning från ryggradslösa härstamning36. Genom att klicka på "MARRVEL IT" knapparna för varje mänsklig gen, kan man få den mänskliga genbaserade utgångar för NOTCH1-4.  På resultatsidan för varje gen, de översta rutorna för OMIM indikerar att medan NOTCH1, 2, och 3 är förknippade med genetiska sjukdomar, NOTCH4 för närvarande inte förknippas med några mänskliga sjukdomar. Observera att det har förekommit debatter om huruvida varianter i NOTCH4 är förknippade med schizofreni baserat på genomomfattande Associations studier (GWAS)37,38. Eftersom OMIM i allmänhet inte komminister GWAS data med några undantag (t. ex. APOE, PTPN22), denna information är inte tillgänglig från OMIM fönstret. Likaså, eftersom OMIM inte i allmänhet komminister cancerrelaterad somatisk mutation information, information om huruvida somatiska mutationer i dessa gener är associerade med vissa cancertyper kommer inte att listas med några få undantag (t. ex. TP53, RB1, BRCA1). Genom att klicka på PubMed eller Monarch Box, kan man identifiera vissa sjukdomsrelaterade papper som inte är curated i OMIM. Se figur 5 för hela MARRVEL produktionen för fly Gene N och Human Gene NOTCH4.

Figure 1
Figur 1 . En representativ utgång från en MARRVEL-sökning. Detta specifika exempel visar en gen/variant Sök efter "TBX2/17:59477596 G > A" (http://marrvel.org/search/pair/TBX2/17:59477596%20G%3EA). Sidofältet till vänster stöder navigering via data utdata. Den "externa länken" tecken här ger länkar till lämpliga sidor i UCSC Genome browser (https://genome.ucsc.edu/). Flikarna på toppen tillåter en att utföra modellorganism gen-baserade sökningar, få ytterligare information om MARRVEL och ge användaren återkopplingar. Panelerna "sökresultat" visar gen-och variantinformation från källorna som anges i bilden. Vänligen klicka här för att se en större version av denna siffra.

Figure 2
Figur 2 . Sammanfattning av modellorganismen ortoolog tabell och multi-Art anpassning för TBX2. A) marrvel väljer Top ortholog kandidat för varje art baserat på diopt verktyget. Till exempel, en DIOPT poäng på 10/12 visas för Drosophila bi gen betyder 10 av 12 ortologi förutsägelse program som används av diopt förutspådde att bi är den mest sannolika flyga Ortoolog av Human TBX2. Eftersom 25% av generna dupliceras i zebrafiskar jämfört medmänniska, visar marrvel två paralogous gener (i detta fall tbx2a och tbx2b) när detta är tillämpligt. B) ögonblicksbild av justeringsfönstret för flera arter. Genom att välja en specifik organism [i detta fall Human (HS)] och ange aminosyran av intresse, kan man lyfta fram den specifika aminosyran i Teal. I detta exempel, p. R20 av Human TBX2 verkar vara bevaras i mus (MM1), både zebrafiskar ortologgar (DR1 och DR2), Drosophila (DM1) och C. elegans (CE1). Råtta Tbx2 synes inte till anpassa brunn jämförde med annan arten, mest sannolik på grund av den isoform Använd vid den DIOPT till utföra den många--arten uppriktning. Vänligen klicka här för att se en större version av denna siffra.

Figure 3
Figur 3 : Hela produktionen för TBX2 17:59477596 G ≫ A. Vänligen klicka här för att ladda ner denna fil.

Figure 4
Figur 4 : Marrvel utgång för ogdhl 10:50946295 G > A. Vänligen klicka här för att ladda ner denna fil.

Figure 5
Figur 5 : Marrvel utgång för fluga genen N och Human Gene NOTCH4. Vänligen klicka här för att ladda ner denna fil.

Typ av databas Databasens namn URL/länk till databas Motivering för införande i MARRVEL Referens (PMID)
Human gen etik ClinVar https://www.ncbi.nlm.nih.gov/clinvar/ ClinVar är ett offentligt Arkiv med rapporter om sambandet mellan mänskliga variationer och fenotyper, med stödjande bevis. Varianter med tolkningar som rapporteras av forskare och kliniker är värdefulla för att analysera hur sannolikt en variant är patogena. PMID: 29165669
Human gen etik Dechiffrera https://decipher.sanger.ac.uk/ De DECHIFFRERA data som visas på MARRVEL innehåller vanliga varianter från kontroll populationen. De data som visas innehåller strukturella varianter som täcker den genomiska placeringen av den ingående varianten. DECHIFFRERA innehåller också variant och fenotypisk information för drabbade individer, men kan endast nås direkt via deras hemsida. PMID: 19344873
Human gen etik V http://dgv.tcag.ca/dgv/app/home Till vår kännedom är DGV den största offentliga tillgången samling av strukturella varianter från mer än 54 000 individer. Databasen innehåller prover av enligt uppgift friska individer, vid tidpunkten för fastställelse, från upp till 72 olika studier. Eventuella begränsningar av dessa uppgifter omfattar variationer i källan och metoden för de uppgifter som erhållits bristen på information om ofullständiga penetrans av patogena CNVs, och om individer kommer att utveckla associerade sjukdomar efter uppgiftsinsamling. PMID: 24174537
Ortologi förutsägelse DIOPT https://www.flyrnai.org/cgi-bin/DRSC_orthologs.pl DIOPT förutsatt flera proteinsekvens anpassning av de bästa förväntade ortologgar i sex modellorganismer mot proteinsekvensen av den mänskliga genen av intresse. Anpassningen kommer att ge information om bevarandet av specifika aminosyror samt funktionella protein domäner. PMID: 21880147
Nomenklatur för mänskliga gener/transkription Häckning https://useast.ensembl.org/ Ensembl gen ID används för att länka de olika databaserna. PMID: 29155950
Human gen etik ExAC http://exac.broadinstitute.org/ ExAC innehåller mer än 60 000 exomes och är, annat än gnomAD (http://gnomad.broadinstitute.org/), den största offentliga samling av exomes som har valts ut mot personer med allvarliga tidig debut av Mendelian fenotyper. För marrvel syften, exac och gnomad fungerar som den bästa kontrollen population datauppsättning för att beräkna mindre allel frekvens. Vi erbjuder två uppsättningar av utgångar från ExAC. Den första produktionen är gen-centrerad översikt över förväntade kontra observerade antalet genom och förlust av funktion (LOF) alleler. Ett mått som kallas pLI (sannolikhet för LOF intolerans) varierar mellan 0,00 och 1,00 återspeglar det selektiva trycket på vissa varianter före reproduktiv ålder. pLI poäng på 1,00 innebär att denna gen är mycket intoleranta mot någon LOF varianter och haploinsufficiens av denna gen kan orsaka sjukdom hos människa. Den andra utdata är data från ExAC som avser den specifika varianten. Om identisk variant ses i ExAC kommer MARRVEL att visa den mindre allelefrekvensen. PMID: 27535533
Primära Modellorganismens databaser FlyBase (Drosophila) http://flybase.org MARRVEL samlar in och visar data från flera modellorganismens databaser. Vi ger en sammanfattning av den molekylära, cellulära och biologiska funktionen hos genen med GO-termer. Den mest sannolika ortoolog härstammar från DIOPT. PMID: 26467478
Modell organism databas integrations verktyg Gene2Function http://www.gene2function.org/search/ MARRVEL samarbetar med DIOPT och Gene2Function för att tillhandahålla funktionen "Modellorganismsökning". Hyperlänk tillhandahålls för användare att komma åt sin webbplats som integrerar ett antal MO-databaser och visar dem i en annan stil än hur MARREL gör. PMID: 28663344
Human gen etik Geno2MP http://geno2mp.gs.washington.edu/Geno2MP/ Geno2MP är en samling prover från University of Washington Center for Mendelian Genetics. Den innehåller ~ 9 650 exomes av drabbade individer och opåverkade släktingar. Denna databas länkar fenotypisk samt läge arvs information till specifika alleler. För fenotyp, genom att jämföra det drabbade organsystemet hos patienten av intresse för de drabbade personerna i Geno2MP, kan man hitta potentiella matchningar. En matchning i allele, arvs läge och fenotyp ger en ökad sannolikhet att varianten sannolikt patogena. Men på grund av liten urvalsstorlek en negativ Association inte nödvändigtvis minska en variant är patogena prioritet. En mekanism för att kontakta den primära läkaren av en patient av intresse ges i den ursprungliga källan. N/A
Human gen etik gnomAD http://gnomad.broadinstitute.org/ gnomAd innehåller totalt 123 136 Helexomanalyserna sekvenser och 15 496 hel arvsmassa sekvenser från icke-närstående individer sekvenserade som en del av olika sjukdomsspecifika och populationsgenetiska studier. Betydande del av ExAC data är integrerade i gnomAD. I MARRVEL visar vi för närvarande de befolknings frekvenser som hänför sig till specifik variant. PMID: 27535533
Genontologi GO Central http://www.geneontology.org/ MARRVEL visar endast gen ontologi (GO) termer (molekylär funktion, cellulära komponent, och biologisk process) som härrör från experimentella bevis för varje gen. De filtreras av "experimentella bevis koder" och gå termer som bygger på "beräknings analys bevis koder" och "elektronisk anteckning bevis koder" (förutsägelser) undviks. PMID: 10802651, 25428369
Mänskligt gen/protein uttryck GTEx https://gtexportal.org/home/ MARRVEL visar både mRNA och protein uttrycksmönster i mänskliga vävnader i varje gen. Uttrycksmönstret kan tillföra insikt i de fenotyper som observerats hos patienter och/eller modellorganismer. PMID: 29019975, 23715323
Människans Gennomenklatur HGNC https://www.genenames.org/ HGNC officiella gen symboler används för MARRVEL sökningar. PMID: 27799471
Primära Modellorganismens databaser IMPC (mus) http://www.mousephenotype.org/ MARRVEL ger en hyperlänk till medsvarande mus gen sidor på IMPC webbplats. Om det har förekommit en knock-out mus från IMPC, en uttömmande förteckning över analyser och deras resultat görs tillgängliga offentligt och kan ge insikt i fenotyp när en gen går förlorad. Viss information är curated i MGI men det kanske en tidsfördröjning. PMID: 27626380
Primära Modellorganismens databaser MGI (mus) http://www.informatics.jax.org/ MARRVEL samlar in och visar data från flera modellorganismens databaser. Vi ger en sammanfattning av den molekylära, cellulära och biologiska funktionen hos genen med GO-termer. Den mest sannolika ortoolog härstammar från DIOPT. PMID: 25348401
Modell organism databas integrations verktyg Monarch Initiative https://monarchinitiative.org/ MARRVEL ger en länk till Phenogrid av en mänsklig gen på Monarch Initiative. Detta rutnät ger jämförelser mellan fenotyp av modellorganismer och kända mänskliga sjukdomar. PMID: 27899636
Mänsklig variant nomenklatur Mutalysator https://mutalyzer.nl/ MARRVEL använder Mutalyzers API för att omvandla olika variantnomenklaturer till genomisk lokalisering. PMID: 18000842
Human gen etik OMIM https://omim.org/ De tre viktigaste bitarna av information som vi drar från OMIM är: genfunktion, associerade fenotyper, och rapporterade alleler. Det är bra att veta om en gen är associerad med en känd Mendelian fenotyp (# poster) vars molekylära grund är känd. Gener utan denna kunskap är kandidater för ny gen upptäckt. För gener som är denna kategori, om patientens fenotyp inte matchar den rapporterade sjukdomen och fenotyp samt de av patienterna i litteraturen, då detta ökar möjligheten att ge en fenotypisk expansion för genen av intresse. PMID: 28654725
Primära Modellorganismens databaser PomBase (fission jäst) https://www.pombase.org/ MARRVEL samlar in och visar data från flera modellorganismens databaser. Vi ger en sammanfattning av den molekylära, cellulära och biologiska funktionen hos genen med GO-termer. Den mest sannolika ortoolog härstammar från DIOPT. PMID: 22039153
Litteratur Pubmed https://www.ncbi.nlm.nih.gov/pubmed/ MARRVEL ger en hyperlänk till "Gene" baserad PubMed sökning. Genom att klicka på denna länk kan man söka biomedicinska papper som hänvisar till genen av intresse baserat på tidigare gen namn och symboler. N/A
Primära Modellorganismens databaser RGD (råtta) https://rgd.mcw.edu/ MARRVEL samlar in och visar data från flera modellorganismens databaser. Vi ger en sammanfattning av den molekylära, cellulära och biologiska funktionen hos genen med GO-termer. Den mest sannolika ortoolog härstammar från DIOPT. PMID: 25355511
Primära Modellorganismens databaser SGD (spirande jäst) https://www.yeastgenome.org/ MARRVEL samlar in och visar data från flera modellorganismens databaser. Vi ger en sammanfattning av den molekylära, cellulära och biologiska funktionen hos genen med GO-termer. Den mest sannolika ortoolog härstammar från DIOPT. PMID: 22110037
Mänskligt gen/protein uttryck Den humana proteinatlasen https://www.proteinatlas.org/ MARRVEL visar både mRNA och protein uttrycksmönster i mänskliga vävnader i varje gen. Uttrycksmönstret kan tillföra insikt i de fenotyper som observerats hos patienter och/eller modellorganismer. PMID: 21752111
Primära Modellorganismens databaser WormBase (C. elegans) http://wormbase.org MARRVEL samlar in och visar data från flera modellorganismens databaser. Vi ger en sammanfattning av den molekylära, cellulära och biologiska funktionen hos genen med GO-termer. Den mest sannolika ortoolog härstammar från DIOPT. PMID: 26578572
Primära Modellorganismens databaser ZFIN (Zebrafish) https://zfin.org/ MARRVEL samlar in och visar data från flera modellorganismens databaser. Vi ger en sammanfattning av den molekylära, cellulära och biologiska funktionen hos genen med GO-termer. Den mest sannolika ortoolog härstammar från DIOPT. PMID: 26097180

Tabell 1. Lista över data källor för MARRVEL. Alla databaser där MARRVEL erhåller data från listas i den här tabellen. För varje databas, Vi listar den typ av databas, URL/länk, motivering för att inkludera i MARRVEL, och primära referenser.

Subscription Required. Please recommend JoVE to your librarian.

Discussion

Kritiska steg i det här protokollet inkluderar inledande indata (steg 1.1-1.3) och efterföljande tolkning av utdata. Den vanligaste orsaken till att sökresultaten är negativa är att en gen och/eller variant kan beskrivas på många sätt. Även om MARRVEL uppdateras enligt schemaläggning, kan dessa uppdateringar orsaka kopplingar mellan de olika databaserna som MARRVEL länkar till. Således är det första steget i Felsökning alltid kontrollera om alternativa namn på genen eller variant kommer att leda till ett lyckat sökresultat. Om det fortfarande inte kan lösas, vänligen skicka ett meddelande till utvecklingsteamet med hjälp av feedbackformuläret i http://marrvel.org/message.

En begränsning till MARRVEL är att den ännu inte innehåller alla användbara databaser som behövs för gen-och variantanalys. Till exempel, pathogenicitetsförutsägelse algoritmer som CADD18 för närvarande inte tillhandahålls. Likaså, proteinstruktur information och protein-protein interaktion information som också kan ge strukturella och funktionella länkar till kända sjukdomsframkallande varianter i gener visas inte för närvarande i MARRVEL. I vår nästa stora uppdatering, planerar vi att integrera denna information i MARRVEL, förutom att införliva mer fenotypisk information från modell organism webbplatser, IMPC, Monarch Initiative och Alliance of Genome Resources (AGR, https://www.alliancegenome.org/). Eftersom marrvel utformades för att underlätta forskning om sällsynta sjukdomar fokuserar programmet för närvarande på köns cells-varianter och ger inte tillgång till somatisk variantinformation. Inga Cancergenetik relaterade databaser är integrerade vid offentliggörandet av detta protokoll. Eftersom MARRVEL är aktivt utvecklas och uppgraderas, uppskattar vi starkt feedback, och starkt uppmuntra de befintliga användarna att registrera dig för nyhetsbrev på http://marrvel.org/message för eventuella framtida ytterligare databaser som blir integrerade.

Även om data från MARRVEL kan användas för att prioritera varianter som kan vara patogena. För att påvisa patogenicitet måste man dock identifiera andra patienter med liknande genotyper och fenotyper eller utföra funktionella studier för att ge solida belägg för att den variant av intresse som har funktionella konsekvenser som är relevanta för sjukdomstillstånd. För mer information om ytterligare information utanför MARRVEL som kan vara användbar för att bedöma om en variant är värt experimentellt undersöker i modellorganismen, hänvisas till den medföljande artikeln Harnish et al21. För att ta nästa steg i att använda modellorganismerna för att studera mänskliga varianter måste mänskliga genetiker och modellorganismforskare kunna ansluta och samarbeta. GeneMatcher och andra genomiska konsortier som ingår i matchmaker Exchange Consortium är resurser som underlättar nästa steg. Om användarna bor i Kanada, kan man också registrera sig i sällsynta sjukdomar modeller och mekanismer nätverk (RDMM, http://www.rare-diseases-catalyst-network.ca/) för att identifiera kliniker och/eller modell organism forskare som är villiga att samarbeta39 . Japan (J-RDMM, https://irudbeyond.nig.ac.jp/en/index.html), Europa (RDMM-Europe, http://solve-rd.eu/rdmm-europe/) och Australien (australiska funktionella Genomics-nätverket: https://www.functionalgenomics.org.au/) har nyligen antagit En kanadensisk RDMM-modell för att underlätta liknande samarbeten inom sina länder/regioner. Genom att använda verktyg som BioLitMine (https://www.flyrnai.org/tools/biolitmine/web/) kan man dessutom söka efter potentiella samarbetspartners bland de främsta utredarna som tidigare har arbetat med genen av intresse.

Slutligen, förutom MARRVEL, det finns ett antal andra Cross-Art data mining verktyg tillgängliga inklusive Gene2Function40 (http://www.gene2function.org/), Monarch Initiative29 (https://monarchinitiative.org/) och Alliance of Resurser (AGR, https://www.alliancegenome.org/). Medan Gene2Function ger tillgång till data över flera arter och Monarch Initiative ger fenotypiska jämförelser, har MARRVEL en större betoning på mänskliga varianter och länka mänskliga genomiska data med modellorganismer. AGR är ett initiativ som involverar sex modellorganismdatabaser och konsortiet för gen ontologi som integrerar data från olika databaser på ett enhetligt sätt för att öka tillgängligheten för data som samlats in av varje databas. Dessa resurser kompletterar varandra, och användarna bör förstå styrkan i varje databas för att navigera den stora mängd kunskap som har samlats av forskare i gemenskaperna. Som MARRVEL Development fortsätter, planerar vi att inkludera fler databaser som är relevanta för att studera mänskliga varianter i modellorganismer. Det övergripande målet med MARRVEL är att tillhandahålla ett lättillgängligt sätt för kliniker och forskare att analysera mänskliga gener och varianter för vidare studier genom att integrera användbar information samtidigt som gränssnittet är så enkelt som vi kan.

Subscription Required. Please recommend JoVE to your librarian.

Disclosures

Författarna har inget att avslöja.

Acknowledgments

Vi tackar DRS. Rami Al-Ouran, Seon-Young Kim, Yanhui (Claire) hu, Ying-Wooi WAN, Naveen Manoharan, Sasidhar Pasupuleti, Aram Comjean, Dongxue Mao, Michael Wangler, Hsiao-Tuan Chao, Stephanie Mohr och Norbert Perrimon för deras stöd i utvecklingen och underhåll av MARRVEL. Vi är tacksamma för Samantha L. Deal och J. Michael Harnish för deras input på detta manuskript.

Den initiala utvecklingen av MARRVEL stöddes delvis av den odiagnostiserade sjukdomar nätverk modell organismer screening Center genom NIH Commonfund (U54NS093793) och genom NIH kontor forskningsinfrastruktur program (ORIP) (R24OD022005). JW stöds av NIH Eunice Kennedy Shriver National Institute of Child Health & mänsklig utveckling (F30HD094503) och Robert och Janice McNair stiftelsen McNair MD/PhD Student Scholar program på BCM. HJB stöds ytterligare av NIH National Institute of General Medical Sciences (R01GM067858) och är en utredare av Howard Hughes Medical Institute. ZL stöds av NIH National Institute of General Medical Science (R01GM120033), National Institute of aging (R01AG057339), och Huffington Foundation. SY fick ytterligare stöd från NIH National Institute on Deafness och andra kommunikationsstörningar (R01DC014932), The Simons Foundation (SFARI Award: 368479), The Alzheimer ' s Association (ny utredare Research Grant: 15-364099), Naman familj Fonden för grundforskning och Caroline Wiess Law Fund för forskning inom molekylär medicin.

Materials

Name Company Catalog Number Comments
Human Genetics ClinVar PMID: 29165669 https://www.ncbi.nlm.nih.gov/clinvar/
Human Genetics DECIPHER PMID: 19344873  https://decipher.sanger.ac.uk/
Human Genetics DGV PMID: 24174537 http://dgv.tcag.ca/dgv/app/home
Orthology Prediction DIOPT PMID: 21880147  https://www.flyrnai.org/cgi-bin/DRSC_orthologs.pl
Human Gene/Transcript Nomenclature Ensembl PMID: 29155950  https://useast.ensembl.org/
Human Genetics ExAC  PMID: 27535533 http://exac.broadinstitute.org/
Primary Model Organism Databases FlyBase (Drosophila) PMID:26467478 http://flybase.org
Model Organism Database Integration Tools Gene2Function PMID: 28663344 http://www.gene2function.org/search/
Human Genetics Geno2MP N/A http://geno2mp.gs.washington.edu/Geno2MP/
Human Genetics gnomAD PMID: 27535533 http://gnomad.broadinstitute.org/
Gene Ontology GO Central PMID: 10802651, 25428369  http://www.geneontology.org/
Human Gene/Protein Expression GTEx PMID: 29019975, 23715323  https://gtexportal.org/home/
Human Gene Nomenclature HGNC PMID: 27799471  https://www.genenames.org/
Primary Model Organism Databases IMPC (mouse) PMID: 27626380 http://www.mousephenotype.org/
Primary Model Organism Databases MGI (mouse) PMID:25348401 http://www.informatics.jax.org/
Model Organism Database Integration Tools Monarch Initiative PMID: 27899636 https://monarchinitiative.org/
Human Variant Nomenclature Mutalyzer PMID: 18000842  https://mutalyzer.nl/
Human Genetics OMIM PMID: 28654725 https://omim.org/
Primary Model Organism Databases PomBase (fission yeast) PMID:22039153 https://www.pombase.org/
Literature PubMed N/A https://www.ncbi.nlm.nih.gov/pubmed/
Primary Model Organism Databases RGD (rat) PMID:25355511 https://rgd.mcw.edu/
Primary Model Organism Databases SGD (budding yeast) PMID: 22110037 https://www.yeastgenome.org/
Human Gene/Protein Expression The Human Protein Atlas PMID: 21752111 https://www.proteinatlas.org/
Primary Model Organism Databases WormBase (C. elegans) PMID:26578572 http://wormbase.org
Primary Model Organism Databases ZFIN (zebrafish) PMID:26097180 https://zfin.org/

DOWNLOAD MATERIALS LIST

References

  1. Yang, Y., et al. Clinical whole-exome sequencing for the diagnosis of mendelian disorders. New England Journal of Medicine. 369 (16), 1502-1511 (2013).
  2. Richards, S., et al. Standards and guidelines for the interpretation of sequence variants: a joint consensus recommendation of the American College of Medical Genetics and Genomics and the Association for Molecular Pathology. Genetics in Medicine. 17 (5), 405-424 (2015).
  3. MacArthur, D. G., et al. Guidelines for investigating causality of sequence variants in human disease. Nature. 508 (7497), 469-476 (2014).
  4. Wang, J., et al. MARRVEL: Integration of Human and Model Organism Genetic Resources to Facilitate Functional Annotation of the Human Genome. American Journal of Human Genetics. 100 (6), 843-853 (2017).
  5. Povey, S., et al. The HUGO Gene Nomenclature Committee (HGNC). Human Genetics. 109 (6), 678-680 (2001).
  6. Lek, M., et al. Analysis of protein-coding genetic variation in 60,706 humans. Nature. 536 (7616), 285-291 (2016).
  7. Wildeman, M., van Ophuizen, E., den Dunnen, J. T., Taschner, P. E. Improving sequence variant descriptions in mutation databases and literature using the Mutalyzer sequence variation nomenclature checker. Human Mutation. 29 (1), 6-13 (2008).
  8. Zhou, W., et al. TransVar: a multilevel variant annotator for precision genomics. Nature Methods. 12 (11), 1002-1003 (2015).
  9. Hu, Y., et al. An integrative approach to ortholog prediction for disease-focused and other functional studies. BMC Bioinformatics. 12, 357 (2011).
  10. Amberger, J. S., Hamosh, A. Searching Online Mendelian Inheritance in Man (OMIM): A Knowledgebase of Human Genes and Genetic Phenotypes. Current Protocols in Bioinformatics. 58, 1 (2017).
  11. Amberger, J. S., Bocchini, C. A., Scott, A. F., Hamosh, A. OMIM.org: leveraging knowledge across phenotype-gene relationships. Nucleic Acids Research. 47, 1038-1043 (2019).
  12. Liu, N., et al. Functional variants in TBX2 are associated with a syndromic cardiovascular and skeletal developmental disorder. Human Molecular Genetics. 27 (14), 2454-2465 (2018).
  13. Ropers, H. H., Wienker, T. Penetrance of pathogenic mutations in haploinsufficient genes for intellectual disability and related disorders. European Journal of Medical Genetics. 58 (12), 715-718 (2015).
  14. Shashi, V., et al. De Novo Truncating Variants in ASXL2 Are Associated with a Unique and Recognizable Clinical Phenotype. American Journal of Human Genetics. 100 (1), 179 (2017).
  15. Chen, R., et al. Analysis of 589,306 genomes identifies individuals resilient to severe Mendelian childhood diseases. Nature Biotechnology. 34 (5), 531-538 (2016).
  16. Halvorsen, M., et al. Mosaic mutations in early-onset genetic diseases. Genetics in Medicine. 18 (7), 746-749 (2016).
  17. Kohler, S., et al. The Human Phenotype Ontology in 2017. Nucleic Acids Research. 45 (1), 865-876 (2017).
  18. Rentzsch, P., Witten, D., Cooper, G. M., Shendure, J., Kircher, M. CADD: predicting the deleteriousness of variants throughout the human genome. Nucleic Acids Research. 47 (1), 886-894 (2019).
  19. Sobreira, N., Schiettecatte, F., Valle, D., Hamosh, A. GeneMatcher: a matching tool for connecting investigators with an interest in the same gene. Human Mutation. 36 (10), 928-930 (2015).
  20. Sobreira, N. L. M., et al. Matchmaker Exchange. Current Protocols in Human Genetics. 95 (9), 31-39 (2017).
  21. Harnish, M., Deal, S., Wangler, M., Yamamoto, S. In vivo functional study of disease-associated rare human variants using Drosophila. Journal of Visualized Experiments. , (2019).
  22. Harrison, S. M., et al. Using ClinVar as a Resource to Support Variant Interpretation. Current Protocols in Human Genetics. 89, 11-18 (2016).
  23. MacDonald, J. R., Ziman, R., Yuen, R. K., Feuk, L., Scherer, S. W. The Database of Genomic Variants: a curated collection of structural variation in the human genome. Nucleic Acids Research. 42, Database issue 986-992 (2014).
  24. Firth, H. V., et al. DECIPHER: Database of Chromosomal Imbalance and Phenotype in Humans Using Ensembl Resources. American Journal of Human Genetics. 84 (4), 524-533 (2009).
  25. Thurmond, J., et al. FlyBase 2.0: the next generation. Nucleic Acids Research. 47, 759-765 (2019).
  26. Consortium, G. T. Human genomics. The Genotype-Tissue Expression (GTEx) pilot analysis: multitissue gene regulation in humans. Science. 348 (6235), 648-660 (2015).
  27. Ponten, F., Jirstrom, K., Uhlen, M. The Human Protein Atlas--a tool for pathology. Journal of Pathology. 216 (4), 387-393 (2008).
  28. The Gene Ontology, C. The Gene Ontology Resource: 20 years and still GOing strong. Nucleic Acids Research. , (2018).
  29. Mungall, C. J., et al. The Monarch Initiative: an integrative data and analytic platform connecting phenotypes to genotypes across species. Nucleic Acids Research. 45 (1), 712-722 (2017).
  30. Meehan, T. F., et al. Disease model discovery from 3,328 gene knockouts by The International Mouse Phenotyping Consortium. Nature Genetics. 49 (8), 1231-1238 (2017).
  31. Katoh, K., Rozewicki, J., Yamada, K. D. MAFFT online service: multiple sequence alignment, interactive sequence choice and visualization. Brief Bioinform. , (2017).
  32. Sievers, F., Higgins, D. G. Clustal Omega for making accurate alignments of many protein sequences. Protein Science. 27 (1), 135-145 (2018).
  33. Yoon, W. H., et al. Loss of Nardilysin, a Mitochondrial Co-chaperone for alpha-Ketoglutarate Dehydrogenase, Promotes mTORC1 Activation and Neurodegeneration. Neuron. 93 (1), 115-131 (2017).
  34. Deal, S., Yamamoto, S. Unraveling novel mechanisms of neurodegeneration through a large-scale forward genetic screen in Drosophila. Frontiers in Genetics. 9, (2019).
  35. Matamoros, A. J., Baas, P. W. Microtubules in health and degenerative disease of the nervous system. Brain Research Bulletin. 126, Pt 3 217-225 (2016).
  36. Theodosiou, A., Arhondakis, S., Baumann, M., Kossida, S. Evolutionary scenarios of Notch proteins. Molecular Biology and Evolution. 26 (7), 1631-1640 (2009).
  37. Shayevitz, C., Cohen, O. S., Faraone, S. V., Glatt, S. J. A re-review of the association between the NOTCH4 locus and schizophrenia. American Journal of Medical Genetics. Part B: Neuropsychiatric Genetics. 159 (5), 477-483 (2012).
  38. Wang, Z., et al. A review and re-evaluation of an association between the NOTCH4 locus and schizophrenia. American Journal of Medical Genetics. Part B: Neuropsychiatric Genetics. 141 (8), 902-906 (2006).
  39. Oriel, C., Lasko, P. Recent Developments in Using Drosophila as a Model for Human Genetic Disease. International Journal of Molecular Sciences. 19 (7), (2018).
  40. Hu, Y., Comjean, A., Mohr, S. E., FlyBase, C., Perrimon, N. Gene2Function: An Integrated Online Resource for Gene Function Discovery. G3. 7 (8), Bethesda. 2855-2858 (2017).

Tags

Genetik fråga 150 Human Genomics variant prioritering modellorganismer genetik sällsynta och odiagnostiserade sjukdomar funktionsgenomik databas integration translationell forskning medicinsk diagnos variant av okänd betydelse gen av osäker betydelse webbaserat verktyg
Navigera i MARRVEL, ett webbaserat verktyg som integrerar Human Genomics och Modellorganismens gen etik information
Play Video
PDF DOI DOWNLOAD MATERIALS LIST

Cite this Article

Wang, J., Liu, Z., Bellen, H. J.,More

Wang, J., Liu, Z., Bellen, H. J., Yamamoto, S. Navigating MARRVEL, a Web-Based Tool that Integrates Human Genomics and Model Organism Genetics Information. J. Vis. Exp. (150), e59542, doi:10.3791/59542 (2019).

Less
Copy Citation Download Citation Reprints and Permissions
View Video

Get cutting-edge science videos from JoVE sent straight to your inbox every month.

Waiting X
Simple Hit Counter