Navigering MARRVEL, en Web-basert verktøy som integrerer Human Genomics og modell organisme genetikk informasjon

JoVE Journal
Genetics

Your institution must subscribe to JoVE's Genetics section to access this content.

Fill out the form below to receive a free trial or learn more about access:

 

Summary

Her presenterer vi en protokoll for å få tilgang til og analysere mange menneskelige og modell organisme databaser effektivt. Denne protokollen demonstrerer bruken av MARRVEL å analysere kandidat sykdomsfremkallende varianter identifisert fra neste generasjons sekvensering innsats.

Cite this Article

Copy Citation | Download Citations | Reprints and Permissions

Wang, J., Liu, Z., Bellen, H. J., Yamamoto, S. Navigating MARRVEL, a Web-Based Tool that Integrates Human Genomics and Model Organism Genetics Information. J. Vis. Exp. (150), e59542, doi:10.3791/59542 (2019).

Please note that all translations are automatically generated.

Click here for the english version. For other languages click here.

Abstract

Gjennom hel-exome/Genova sekvensering, menneskelige Genetikere identifisere sjeldne varianter som skille med sykdom fenotyper. For å vurdere om en bestemt variant er patogene, må man spørre mange databaser for å avgjøre om genet av interesse er knyttet til en genetisk sykdom, om den spesifikke varianten er rapportert før, og hvilke funksjonelle data som er tilgjengelig i modellen organisme databaser som kan gi ledetråder om genet funksjon i menneske. MARRVEL (modell organisme aggregerte ressurser for rare variant ExpLoration) er en one-stop datainnsamlingsverktøy for menneskelige gener og varianter og deres orthologous gener i sju modell organismer inkludert i mus, rotte, sebrafisk, frukt fly, nematode orm, fisjon gjær, og spirende gjær. I denne protokoll, gir vi en oversikt over hva MARRVEL kan brukes til og diskutere hvordan ulike datasett kan brukes til å vurdere om en variant av ukjent betydning (VUS) i et kjent sykdomsfremkallende gen eller en variant i et gen av usikker betydning (GUS) kan være Sykdomsfremkallende. Denne protokollen vil lede en bruker gjennom å søke flere menneskelige databaser samtidig starter med en menneskelig genet med eller uten en variant av interesse. Vi diskuterer også hvordan man bruker data fra OMIM, ExAC/gnomAD, ClinVar, Geno2MP, DGV og DECHIPHER. Videre illustrerer vi hvordan man tolker en liste over ortholog kandidat gener, uttrykks mønstre og GO-termer i modell organismer som er knyttet til hvert menneske gen. Videre diskuterer vi verdien protein strukturelle domene merknader gitt og forklarer hvordan du bruker flere arter protein justering funksjonen for å vurdere om en variant av interesse påvirker en evolutionarily bevart domene eller aminosyre. Til slutt vil vi diskutere tre forskjellige bruksområder-tilfeller av dette nettstedet. MARRVEL er en lett tilgjengelig åpen tilgang nettsted designet for både kliniske og grunnleggende forskere og fungerer som et utgangspunkt for å designe eksperimenter for funksjonell studier.

Introduction

Bruk av neste generasjons sekvensering teknologi vokser i både forskning og kliniske genetiske laboratorier1. Hel-exome (WES) og hele-Genova sekvensering (WGS) analyser avslører en rekke sjeldne varianter av ukjent betydning (VUS) i kjente sykdomsfremkallende gener, samt varianter av gener som ennå ikke er assosiert med en Mendelsk sykdom (GUS: gener av usikre betydning). Presentert med en liste over gener og varianter i en klinisk sekvens rapport, må medisinsk Genetikere manuelt besøke flere elektroniske ressurser for å få mer informasjon for å vurdere hvilken variant kan være ansvarlig for en viss fenotype sett hos pasienten av interesse . Denne prosessen er tidkrevende, og effekten er svært avhengig av kompetansen til den enkelte. Selv om flere retningslinjer papirer har blitt publisert2,3, tolkning av Wes og WGS krever manuell håndplukking siden det ennå ikke er en standardisert metodikk for variant analyse. For tolkningen av VUS, kunnskap om tidligere rapportert genotype-fenotype forhold, modus for arv, og allel frekvenser i befolkningen generelt blir verdifulle. I tillegg kunnskap om varianten påvirker et kritisk protein domene, eller en evolutionarily bevarte rester kan øke eller redusere sannsynligheten for patogenitet. For å samle all denne informasjonen, trenger man vanligvis å navigere gjennom 10-20 menneskelige og modell organisme databaser siden informasjonen er spredt gjennom World Wide Web.

Tilsvarende modell organisme forskere som jobber med spesifikke gener og trasé er ofte interessert i å koble sine funn til menneskelig sykdom mekanismer og ønsker å dra nytte av den kunnskapen som blir generert i den menneskelige Genomics feltet. Men på grunn av den raske ekspansjon og utvikling av datasett om den menneskelige Genova, har det vært utfordrende å identifisere databaser som gir nyttig informasjon. I tillegg, siden de fleste modell organisme databaser er designet for forskere som arbeider med den spesifikke organismen på daglig basis, er det svært vanskelig, for eksempel, for en mus forsker for å søke etter spesifikk informasjon i en Drosophila database og vice versa. I likhet med den varianten tolkning søk utført av medisinsk Genetikere, identifisere nyttig menneskelig og annen modell organisme informasjon er tidkrevende og sterkt avhengig av bakgrunnen av modellen organisme forsker. MARRVEL (modell organisme aggregerte ressurser for rare variant ExpLoration)4 er et verktøy utviklet for begge brukergrupper for å effektivisere arbeidsflyten.

MARRVEL (http://marrvel.org) ble utformet som en sentralisert søkemotor som samler inn data systematisk på en effektiv og konsistent måte for klinikere og forskere. Med informasjon fra 20 eller flere offentlig tilgjengelige databaser, dette programmet lar brukerne raskt samle informasjon og få tilgang til et stort antall menneskelige og modell organisme databaser uten reiterative søk. Søkeresultatsidene inneholder også hyperkoblinger til de opprinnelige informasjonskildene, slik at enkeltpersoner kan få tilgang til rådata og innhente tilleggsinformasjon fra kildene.

I motsetning til mange av varianten prioritering verktøy som krever store sekvensering data input i form av VCF eller BAM filer og installasjoner av ofte proprietære/kommersiell programvare, MARRVEL opererer på alle Web-Browser. Den kan brukes uten kostnader og er kompatibel med bærbare enheter (for eksempel smarttelefoner, nettbrett) så lenge en er koblet til Internett. Vi valgte dette formatet siden mange klinikere og forskere vanligvis trenger å søke en eller noen få gener og varianter på en gang. Note det vi er utvikler bakst-dataoverføre og API (søknad Programmerer Grenseflate) vise egenskaper for MARRVEL å senere tillate brukernes å kapellan flere hundre av gener og varianter med ett tid igjennom tilpasses spørsmål verktøy dersom det er nødvendig.

På grunn av det brede spekteret av applikasjoner, vil vi i denne protokollen beskrive en omfattende tilnærming til hvordan man navigerer gjennom ulike datasett som MARRVEL viser. Mer målrettede eksempler som er skreddersydd mot spesifikke brukeres behov, vil bli beskrevet i delen representative resultater. Det er viktig å merke seg at produksjonen av MARRVEL fortsatt krever en viss grad av bakgrunn kunnskap i enten menneskelig genetikk eller modell organismer å trekke ut verdifull informasjon. Vi henviser leserne til tabellen som viser primære papirer som beskriver funksjonen til hver av de opprinnelige databasene som er utvalgt av MARRVEL (tabell 1). Følgende protokoll er delt inn i tre seksjoner: (1) Hvordan starte et søk, (2) hvordan du tolker MARRVEL menneskelige genetikk utganger, og (3) hvordan å gjøre bruk av modellen organisme data i MARRVEL. I delen representative resultater beskrives mer fokuserte og spesifikke tilnærminger. MARRVEL blir aktivt oppdatert, så henvises det til gjeldende nettstedets FAQ-side for detaljer om datakilder. Vi anbefaler på det sterkeste brukerne av MARRVEL å registrere deg for å motta oppdateringsvarsler via e-post innsending skjemaet nederst på MARRVEL hjemmeside.

Subscription Required. Please recommend JoVE to your librarian.

Protocol

1. Hvordan starte et søk

  1. For den menneskelige genet og variant-basert søk, gå til trinn 1.1.1.-1.1.2. For menneskelig gen BAS ert søk (ingen variant input), gå til trinn 1,2. For modell organisme gen-baserte søk, se trinn 1.3.1.-1.3.2.
    1. Gå til startsiden for MARRVEL4 på http://marrvel.org/. Begynn med å skrive inn et menneskelig gen symbol. Kontroller at kandidat gen navnene er listet under inntastingsboksen med hvert tegn inn. Hvis søket kommer tilbake negativt, sørg for at genet symbolet som brukes er oppdatert ved hjelp av HUGO Gene nomenklatur Committee nettside5 (HGNC; https://www.genenames.org/).
    2. Angi en menneskelig variant. Søkefeltet er kompatibelt med to typer variant nomenklatur: Genova sted ligner på hvordan varianter vises på ExAC og GnomAD6 og transkripsjon-baserte nomenklatur i henhold til tungtransportkjøretøy retningslinjer. Eksempler på slike formater vises i grå tekst i søkeboksen. For genomisk steds terminologi, bruk koordinatene i henhold til hg19/GRCh37. gå videre til trinn 2.
      Merk: Hvis et søk returnerer en feil, vil de vanligste problemene enten være at gen-symbolet ikke er oppdatert eller at variant terminologien er feil. Inne dem sakene, det HGNC (https://www.genenames.org/), Mutalyzer7 (https://www.mutalyzer.nl/), og TransVar8 (https://Bioinformatics.mdanderson.org/transvar/) websites er stor ressursene å korrekt feilen. HGNC gir offisielle gen symboler og deres aliaser for alle menneskelige gener.
    3. Hvis det fortsatt oppstår feilmeldinger etter å ha bekreftet at gen navnet er oppdatert, kan du bruke Mutalyzer og TransVar til å kontrollere og konvertere variant nomenklatur.
    4. I noen situasjoner, for eksempel et svært nylig gen symbol endring i HGNC, prøv å bruke et synonym for genet og ta kontakt med MARRVEL-teamet ved å bruke "feedback"-fanen så for å oppdatere kildedataene, ettersom MARRVEL kanskje ikke gir riktig informasjon på grunn av et etterslep i data opp Dato.
  2. Angi et menneskelig gen-symbol, og la søkefeltet for den menneskelige varianten stå tomt. Hvis det oppstår en feil, går du til HGNC (https://www.genenames.org/) for å se etter det offisielle gen symbolet eller prøve et eldre gen symbol.
    1. Klikk på modell organismer søk kategorien på toppen banneret (figur 1) eller gå til http://marrvel.org/Model. Velg den modellen organismen av valget og angi en modell organisme genet symbol. Klikk på genet symbolet som navnet er autokomplett og klikk deretter Søk. Hvis søkeresultatet er negativt, sjekk det offisielle genet symbolet som brukes i modellen organisme databaser (tabell 1).
    2. Hvis søkeresultatet fortsatt er negativt, får du tilgang til DIOPT (DRSC Integrative Ortholog prediksjon Tool, https://www.flyrnai.org/cgi-bin/DRSC_orthologs.pl) og HCOP (https://www.genenames.org/tools/hcop/) for å vurdere om det ikke er noen god spådd orthologs for genet av interesse. DIOPT er en ortholog prediksjon søkemotor drives av DRSC (Drosophila RNAi screening Center) og HCOP er en lignende Suite utviklet av HGNC.
      Merk: ytterligere søk ved hjelp av BLAST (https://blast.ncbi.nlm.nih.gov/Blast.cgi) kan tillate brukere å finne orthologs som kan bli savnet av prediksjon algoritmer som brukes i DIOPT og HCOP.
    3. Klikk på MARRVEL den på bunnen for spådd menneskelige ortholog av valget. Sjekk DIOPT score9 og beste poengsum fra Human Gene til modellen organisme? for valg av det menneskelige genet. Gå videre til trinn 2.
      Merk: DIOPT score9 (https://www.flyrnai.org/cgi-bin/DRSC_orthologs.pl) er en verdi på hvor mange ortholog prediksjon algoritmer forutsi et par av gener i to organismer å være orthologous til hverandre. Hvis du vil ha mer informasjon om disse verdiene og de spesifikke algoritmene som brukes til å beregne dette resultatet, kan du se Hu et al9. Når beste poengsum fra humant genet til modell organisme? er Ja, det indikerer at det menneskelige genet er mer sannsynlig en sann menneskelig orthologs av genet av interesse, men det kan være unntak, spesielt når flere menneskelige gener er orthologous til flere modell organisme gener på grunn av gen duplisering hendelser under evolusjon. Dersom genet av interesse er medlem av en kompleks gen familie som har gjennomgått avvikende utvikling i flere arter, bør brukerne identifisere en publikasjon som har utført en omfattende Fylogenetiske analyse av genet familien av interesse å identifisere de mest sannsynlige ortholog kandidat genet.

2. Hvordan tolke MARRVEL Human genetikk utganger for et gen og variant søk

Merk: på resultatsiden er det sju menneskelige databaser som vises (tabell 1, figur 1). For hver utgang boks, er det en ekstern lenke knapp (liten boks med en Diagonal pil) i øvre høyre hjørne som vil lenke til den opprinnelige databasen for flere detaljer.

  1. Klikk OMIM (online mendelsk arv i Man, https://www.OMIM.org/)10, den første databasen som vises.
    Merk: OMIM er en manuelt utvalgt database som samler og oppsummerer informasjon om genetiske sykdommer og egenskaper i mennesket.
    1. Bruk den menneskelige genet beskrivelse BOKSEN fra OMIM for en kort oppsummering av hva som er kjent om genet og genet produktet.
    2. Bruk boksen Gene-fenotype relasjoner for å finne ut om dette genet er et kjent sykdomsfremkallende gen eller ikke. Denne boksen gir en manuelt utvalgt kjent sykdom eller fenotype assosiasjoner til genet av interesse.
    3. Bruk den rapporterte alleler fra OMIM -boksen for å få en liste over sykdomsfremkallende varianter som er utvalgt av OMIM.
      Merk: siden manuell håndplukking av en publikasjon om en ny sykdoms gen oppdagelse er nødvendig for at enhver gen-sykdoms tilknytning skal vises i OMIM, kan noen tidsforsinkelser og/eller ubesvarte publikasjoner føre til misforståelse. Det anbefales at brukere utfører PubMed-søk (https://www.ncbi.nlm.nih.gov/pubmed/) for å se inn i nyere litteratur også (se 4.1.2.). For ytterligere informasjon som er utvalgt i OMIM, se Amberger10,11.
  2. KlikkExAC(Exome aggregering Consortium, http://exac.broadinstitute.org/)6og gnomAD(Genova aggregering database, http://gnomad.broadinstitute.org/), store befolkningen Genomics databaser basert på WES og WGS av folk som er valgt å utelukke alvorlig pediatric sykdommer.
    Merk: ExAC inneholder ~ 60 000 WES mens gnomAD inneholder ~ 120 000 WES og ~ 15 000 WGS. Både ExAC og gnomAD kan brukes som en kontroll befolkningen database, spesielt for alvorlige pediatric lidelser, men dens tolkning krever en viss grad av forsiktighet. Generelt kan gnomAD betraktes som en oppdatert og utvidet versjon av ExAC siden de fleste kohorter som er inkludert i ExAC er også inkludert i gnomAD. Men siden det er noen unntak (se kohort informasjon i http://exac.broadinstitute.org/about og http://gnomad.broadinstitute.org/about, henholdsvis), MARRVEL viser data fra begge kildene.
    1. Bruk kontrollen populasjons gen Sammendrag for å oppnå statistikk på gen nivå, slik som sannsynligheten for å finne alleler for tap av funksjon (LoF) i befolkningen generelt. Dette kalles pLI (sannsynligheten for LOF intoleranse) score i ExAC og kan brukes til å antyde hvor sannsynlig en enkelt kopi av en LOF allel for et bestemt gen kan føre til en dominerende sykdom gjennom haplo-utilstrekkelig mekanismer.
      Merk: ser på pLI score på et gen har verdi, spesielt når du arbeider med dominerende lidelser som presenterer som alvorlig pediatric sykdommer knyttet til de Novo varianter. Hvis et gen har en pLI score på 0,00, betyr det at det er svært tolerant av LOF varianter dermed genet usannsynlig forårsake sykdom via en dominerende haploinsufficiency mekanisme. Dette betyr imidlertid ikke nødvendigvis utelukke andre dominerende gevinst av funksjon (GOF) eller dominerende negative mediert mekanismer kan forårsake sykdom. I tillegg kan gener som forårsaker resessivt sykdommer har lave pLI score siden karrierer forventes å bli funnet i den generelle befolkningen. På den annen side, hvis et gen har en pLI score på 1,00, er det mulig at tapet av ett eksemplar av dette genet er skadelig for menneskers helse. Ytterligere søk på nettsteder som DOMINO (https://wwwfbm.unil.ch/domino/) kan også brukes i kombinasjon for å vurdere sannsynligheten for en variant i et bestemt gen som forårsaker en dominerende lidelse.
    2. Bruk de to neste boksene for å få de allel frekvensene av den varianten av interesse i ExAC og gnomAD, henholdsvis for å bidra til å tolke hvorvidt varianten kan være patogene avhengig av om pasienten har den dominerende eller resessivt sykdommen. Denne boksen vises bare når brukeren setter inn variant informasjon ved initiering av søket.
      Merk: Hvis en hypothesizes en resessivt sykdom scenario og pLI score av genet av interesse er lav, bør man ta hensyn til allel frekvensen oppført her. Noen Genetikere kan etablere et cut-off punkt på 0,005 til 0,0001 som maksimal allel frekvens for patogene varianter som kan forårsake en alvorlig resessivt arvet sykdom2. På den annen side, hvis man hypothesizes et dominerende sykdoms scenario, er det mindre sannsynlighet for å finne den identiske eller lignende varianten i en kontroll populasjon. Igjen, dette krever forsiktighet fordi personer med sen-utbruddet lidelser, sykdommer med mild presentasjon, psykiatriske lidelser eller sykdommer som ikke er vist av ExAC/gnomAD forskere kan fortsatt være inkludert og varianten kan fortsatt være en dominerende patogene Variant. Det har også vært noen tilfeller av varianter knyttet til pediatric forhold som finnes i noen få individer i disse databasene12,13,14, potensielt på grunn av ufullstendige penetrans eller somatiske mosaikk13 , 15 priser og , 16. i tillegg, selv om ExAC og gnomAD vil vise varianter som er funnet i en homozygote tilstand, vil det ikke indikere om noen av variantene er funnet i en sammensatt heterozygot tilstand. Til slutt, noen varianter som finnes i disse databasene er kodet som lav tillit på grunn av tekniske utfordringer i sekvensering (f. eks lav sekvensdekning, repeterende sekvens). For å se mer nøye inn i disse datasettene, er brukere anbefalt å bruke ekstern lenke -knappen for å besøke de opprinnelige ExAC og gnomAD nettsteder for å få mer informasjon.
  3. Klikk Geno2MP (genotype til mendelsk fenotype Browser, http://geno2mp.gs.Washington.edu/Geno2MP/), en samling av Wes-baserte data fra University of Washington Center for mendelsk genetikk. Den inneholder ca 9 600 exomes (fra 1/18/2019) av berørte individer og upåvirket slektninger med noen fenotypiske beskrivelser (figur 1).
    1. Bruk boksen for sykdoms populasjonen til å oppnå den allel frekvensen til den varianten av interesse i denne kohort.
    2. Bruk Gene-fenotype relasjoner boksen for å få HPO (Human fenotype ontologi)17 vilkår for personer med den varianten av interesse. Dette er en av mange måter for en å se etter pasienter som kan ha samme sykdom.
      Merk: Hvis et gen av interesse mistenkes for å være assosiert med pasientens sykdom og det finnes fyrstikker i Geno2MP, kan ytterligere viktig informasjon finnes i datakilden utover det som vises.
      1. Klikk på ekstern lenke -knappen til den gen spesifikke siden på Geno2MP, filter for mutasjoner som ligner på pasientens (f.eks. missense, LoF), og se nøye gjennom listene over varianter. Legg merke til variantene med høy CADD18 score og klikk inn i HPO profiler. For eksempel CADD score høyere enn 20 er innenfor toppen 1% av alle varianter spådd til å bli skadelige, CADD score som er høyere enn 10 er innenfor topp 10%. HPO termer gir en standardisert beskrivelse av menneskelig fenotyper. Her må du kontrollere om varianten ble identifisert i en berørt person eller i en slektning.
      2. Hvis varianter er funnet hos pasienter som er berørt i samme organ system som pasienten, vurdere å bruke e-post-skjemaet for å kontakte legen som sendte disse sakene til Geno2MP bruke funksjonen gitt på Geno2MP nettstedet.
        Merk: ikke alle leger svare på slike spørsmål, så man bør utforske andre veier av pasienten matchmaking. Andre måter å samle en kohort av pasienter rammet av de samme sykdommene er å bruke verktøy som GeneMatcher19 (https://www.genematcher.org/) og andre databaser som er en del av matchmaker Exchange19,20 ( https://www.matchmakerexchange.org/). Se med følgende JoVE-artikkel for mer informasjon om matchmaking21.
  4. Bruk ClinVar (https://www.ncbi.nlm.nih.gov/clinvar/)22 database, støttet av National INSTITUTES of Health (NIH), der forskere og klinikere sender varianter med eller uten bestemmelse av patogenitet, for å kontrollere enkelt nukleotid varianter (SNV), små indeler og større kopierings nummer variasjoner (CNV).
    1. Bruk den øverste raden til å gå gjennom et sammendrag av antallet av hver type varianter som rapporteres i ClinVar (figur 1).
    2. Sjekklisten over varianter nedenfor i boksen rapporterte alleler fra ClinVar.
      Merk: Hvis en variant ble inkludert i det første søket, de markerte variantene i lyseblå er alle varianter som inkluderer genomisk plassering av varianten av interesse [inkludert store CNVs, som ofte er merket som; genomisk koordinat... X1 (sletting) og... X3 (duplisering)].
  5. Bruk DGV23 (database av genomisk varianter, http://dgv.tcag.ca/dgv/app/Home) og dechiffrere24 (database av genomisk variasjon og fenotype i mennesker bruker Ensembl ressurser, https://Decipher.sanger.ac.uk/), både samlinger av CNVs. DGV er den største offentlige-tilgang samling av strukturelle varianter fra mer enn 54 000 individer. Denne databasen inneholder eksempler på angivelig friske individer, på tidspunktet for ascertainment, fra opp til 72 forskjellige studier. På samme måte inneholder dataene som vises fra DECHIFFRERE vanlige varianter fra kontroll populasjonen.
    Merk: siden MARRVEL ikke har tillatelse til å vise pasient avledede data fra DECIPHIER, oppfordres brukerne til å besøke DECHIFFRERE-nettsiden direkte for å få tilgang til potensielt patogene CNV-informasjon.
    1. Klikk boksen Kopier tall variasjon i kontroll populasjon (DGV-database) for å få tak i varianter som inneholder genet av interesse. Informasjon som størrelse, under type og referanse for kopi nummer variasjonen finnes i samme boks.
    2. Klikk i boksen vanlige Kopier nummer varianter (dechiffrere database) for å få tak i varianter som inneholder genomisk lokasjon for den aktuelle varianten. Denne informasjonen kan bidra til å avgjøre om genet dupliseres eller slettes i kontrollen individer.
      Merk: Hvis genet av interesse er slettet hos mange individer i kontrollen befolkningen, betyr det at dette genet er sannsynlig å være svært tolerant for LOF varianter. Som lav pLI score, tyder dette på at et enkelt eksemplar tap av dette genet er mindre sannsynlighet for å forårsake en alvorlig sykdom via en haploinsufficiency mekanisme. Dette betyr imidlertid ikke nødvendigvis utelukke andre dominerende gevinst av funksjon eller dominerende negative mekanismer (f. eks antimorphic, hypermorphic og neomorphic alleler) forårsaket av bestemte missense og avkorting alleler.  Mulige begrensninger på disse dataene inkluderer variasjon i kilde og metode for data ervervet, mangel på informasjon om ufullstendig penetrans av patogene CNVs, og om individer utviklet visse sykdommer etter datainnsamling.

3. Hvordan bruke modell organisme data i MARRVEL

  1. Bruk Gene Funksjonstabell for å få følgende informasjon for åtte modell organismer, inkludert menneskelige (menneske, rotte, mus, sebrafisk, Drosophila, C elegans, spirende gjær og fisjon gjær):
    1. Gen navn: siden hvert gen navn er hyperkoblet til gen sider på respektive modell organisme databaser, klikk på disse linkene for å finne ut mer om fenotypiske informasjon og ressurser tilgjengelig for hver modell organisme. For eksempel på FlyBase25 (http://flybase.org/), vil det være en liste over alle alleler som er generert, deres respektive fenotyper og tilgjengeligheten av hver allel fra offentlige lager sentre.
    2. PubMed link: Klikk på PubMed linken for å gå til en liste over publikasjoner som er relatert til genet av interesse for hver organisme. Uten å bruke disse lenkene, søker etter den menneskelige genet direkte i PubMed kan føre til mangler noen publikasjoner som brukte et gammelt gen alias for å referere til det menneskelige genet. Tilsvarende kan modell organisme gen navn har svingt historisk.
    3. DIOPT 9 poeng: Sjekk denne kolonnen for en poengsum på hvor mange ortholog prediksjon algoritmer forutsi genet er sannsynlig å være en ortholog av det menneskelige genet av interesse. Man kan bruke en DIOPT score på 3 eller høyere som en rimelig cut-off for å identifisere solide ortholog kandidater. Imidlertid, der er sakene der hvor ekte orthologs bare har en DIOPT snes av 1 på grunn av begrenset homologi. På toppen av genet funksjonstabellen, un-sjekk "Vis bare best DIOPT score gen" boksen for å vise alle kandidater som vanligvis inkluderer homologe gener som ikke nødvendigvis orthologs.
    4. Uttrykk: Sjekk denne kolonnen for listen over vev der genet eller protein av interesse har blitt rapportert å uttrykkes i menneskelige eller modell organisme databaser. Human gen og protein uttrykk data er fra GTEx26 (https://gtexportal.org/) og Human protein Atlas27 (https://www.proteinatlas.org/), henholdsvis. Noen har en knapp med pop-up koblinger, for eksempel for mennesker og for fly som viser uttrykket mønster ved hjelp av en varmekartet, mens andre er hyperkoblet til respektive modellen organisme databaser sider.
    5. Gene ontologi 28 (Go) termer: Filtrer etter eksperimentelle bevis koder og få fra respektive menneskelige eller modell organisme databaser. GO vilkår basert på "beregningsorientert analyse bevis koder" og "elektronisk merknad bevis koder" (spådommer) vises ikke. Vennligst besøk hver modell organisme nettsted for å samle denne informasjonen hvis nødvendig.
    6. Andre lenker som Monarch Initiative29 (https://monarchinitiative.org/) og IMPC30 (http://www.mousephenotype.org/): Bruk Monarch Initiative Hyperlink for å navigere til Phenogrid IDen for den spesifikke menneskelige genet, et diagram som gir en rask sammenligning mellom fenotyper knyttet til genet av interesse for kjente menneskelige sykdommer og modell organisme mutanter som har fenotypiske overlappinger. Hvis en mus genet har en knockout mus laget eller planlagt av International Mouse bestemmelse av fenotype Consortium (IMPC), den "IMPC" linker til siden som detaljer fenotype av knockout musen og dens tilgjengelighet fra offentlige lager sentre.
  2. Menneskers Protein domener: Bruk den menneskelige genet protein domener boksen for å få spådd protein domener av det menneskelige genet. Dataene er avledet fra DIOPT, som bruker Pfam (https://pfam.xfam.org/) og CCD (bevart Domains database, https://www.ncbi.nlm.nih.gov/Structure/CDD/CDD.shtml). En enkelt rester kanskje kommentert mer enn en gang på grunn av noen overlapping i domener kommentert i de to kildene.
  3. Bruk flere protein Alignment boksen for å få aminosyren flere justering generert av DIOPT9 som inkluderer menneskelige (HS), rotte (RN), mus (mm), sebrafisk (Dr), frukt fly (DM), orm (CE), og gjær (SC og SP). For å fremheve aminosyren av interesse, bla ned til bunnen av boksen og angi aminosyre tallene nedenfor og aminosyrer av interesse vil bli uthevet i lyseblå. Justeringen er levert av DIOPT og bruker MAFFT aligner (Multiple justering program for aminosyre eller nukleotid sekvenser, https://mafft.cbrc.jp/alignment/software/31).
    Merk: Hvis aminosyren som er uthevet basert på tallet er ikke den forventede, kan det skyldes forskjellige skjøting isoformene brukes for justeringen. I prinsippet bruker DIOPT den lengste isoformen som skal vises i denne boksen. Også for segmenter av gener som ikke er godt bevart, kan justeringen av multi-Art sekvenser ved hjelp av standard parametre ikke være optimal. Vi anbefaler å bruke andre nettsteder og programvare som Clustal Omega og ClustalW/X (http://www.clustal.org/)32 å optimalisere justeringen parametre og matriser tilsvarende.

Subscription Required. Please recommend JoVE to your librarian.

Representative Results

Human Genetikere og modell organisme forskere bruker MARRVEL i forskjellige måter, hver med ulike ønskede utfall. Nedenfor er tre scener av mulige bruksområder for MARRVEL.

Evaluere patogenitet av en variant i en dominerende sykdom
De fleste av brukerne som besøker MARRVEL bruke dette nettstedet til å analysere sannsynligheten for at en sjelden menneskelig variant kan forårsake en viss sykdom. For eksempel, en missense (17:59477596 G > A, p. R20Q) variant i TBX2 ble funnet å skille i en autosomal dominerende måte i en liten familie med Dysmorfofobi funksjoner og ganespalte, hjertesvikt, skjelettlidelser og siffer unormalt, thyroid-relaterte fenotyper og immun feil12. Moren og to barn berørt med disse symptomene gjennomført varianten, mens faren ikke. Den 9 år gamle sønnen hadde den mest alvorlige fenotype, mens den 36 år gamle moren og den 6 år gamle datteren hadde mildere former for denne sykdommen. For å vurdere om denne varianten sannsynligvis er patogene, kan man starte et MARRVEL-søk ved å skrive inn genet og variantene på startsiden på http://MARRVEL.org. Legg merke til at variant søkelinjen krever fjerning av Chr foran varianten Hvis dette er oppført i den opprinnelige kliniske rapporten for å indikere "kromosom". På tidspunktet for den opprinnelige studien, viste resultatsiden at det ikke er noen OMIM fenotype knyttet til dette genet, og denne varianten er funnet bare én gang i gnomAD, men ikke i ExAC, ClinVar, eller Geno2MP. Man kan tro at denne identifikasjonen av en person kan være bevis mot p. R20Q være en sykdomsfremkallende variant, men det er viktig å merke seg at mor til familien viste en mild form av sykdommen. En variant som finnes i 1/~ 150000 individ er faktisk en svært sjelden variant og identifisering av en person med samme variant kan forklares med redusert ekspressivitet eller penetrans. I Gene Function-tabellen er det ofte nyttig å kontrollere om genet uttrykkes i relevant vev hos mennesker (via GTEx og protein Atlas) i referanse til pasientens fenotyper. I dette tilfellet samsvarer uttrykket mønsteret siden pasienten har fenotyper i flere vev og genet er også mye uttrykt, inkludert CARDIAC, og immun-relaterte organer.

Basert på modell organisme informasjon som vises i MARRVEL, kan man raskt se at genet er bevart fra C. elegans og Drosophila til menneske og aminosyre av interesse, p. R20 er også svært bevart gjennom evolusjon som vist i Figur 2 (Merk at rotte Tbx2 ikke justere godt i denne regionen, sannsynligvis på grunn av transkripsjon som brukes for justering). Fenotypiske informasjon i mus og sebrafisk indikerer at dette genet påvirker utvikling eller funksjon av en rekke vev inkludert det kardiovaskulære systemet, kraniofacial/gane, og sifre. I sum disse dataene tyder på at denne varianten er muligens patogene og videre funksjonell studie er verdifullt. Tatt i betraktning at genet og varianten er bevart i organismer som C. elegans og Drosophila, funksjonelle studier i virvelløse dyr vil være raskere og billigere i forhold til å utføre det samme eksperimentet i virveldyr modell organismer som sebrafisk, mus og rotte. Vennligst se vedlagte artikkel av høste et al.21 om hvordan vi designet og utførte funksjonelle analyser for dette tilfellet12. Involvering av dette genet/varianten i denne familiens sykdom ble ytterligere styrket ved identifisering av en uavhengig 8 år gammel mannlig pasient med overlappende fenotyper med en de Novo missense variant i det samme genet som brukte GeneMatcher. Variantene i de to familiene ble begge funnet å være funksjonell ved hjelp av eksperimenter i Drosophila, ytterligere støtte patogenitet av de sjeldne variantene i TBX2. Sykdommen har nylig blitt vurdert som ' vertebrale uregelmessigheter og variabel endokrine og T-celle dysfunksjon (VETD, OMIM #618223) ' i OMIM. Se Figur 3 for hele PRODUKSJONEN for TBX2 17:59477596 G > A.

Evaluere patogenitet av en variant i en resessivt sykdom
Det er betydelige forskjeller mellom å analysere menneskelige varianter i dominerende og resessivt sykdommer. For eksempel blir pLI poengsum, mindre allel frekvens og tilstedeværelsen av slettinger i kontroll populasjonen mindre viktig fordi to alleler er nødvendige for å avdekke eventuelle fenotype.

Et eksempel på analyse av en resessivt sykdom er beskrevet i Yoon et al33 og Wang et al4 som er oppsummert her. En 15 år gammel jente utstilt utviklingsmessige forsinkelse, microcephaly, ataksi, motorisk svekkelse, hypotoni, språk hemminger, hjerne misdannelser, og hypoplasia av corpus callosum33. Proband, hennes upåvirket foreldre, og en upåvirket søsken mottatt WES. Etter å ha filtrert etter varianter som var både unike for proband og sjeldne i befolkningen, forble varianter i 13 forskjellige gener. Manuell filtrering og analyse av de 13 kandidatene ved å følge protokollen beskrevet her resulterte i prioritering av en bestemt variant i OGDHL som en god kandidat for funksjonelle studier. Nøkkelen biter av informasjon som førte til prioritering p. S778L i OGDHL (10:50946295 G > A) over andre varianter inkluderer: (1) ingen tidligere sykdom forening i OMIM, (2) variant ikke funnet i kontroll populasjoner, (3) gen ontologi forbundet med mikrotubulinettverket og mitokondrier, to systemer som har mange koblinger til nevrologiske lidelser34,35, (4) svært uttrykt i humant lillehjernen, et vev alvorlig påvirket i denne pasienten, og (5) varianten av interesse som påvirker en svært bevarte aminosyre (fra gjær til menneske) og ligger innenfor katalysatoren4. pLI poeng for dette genet er 0,00, men dette påvirker ikke prioriteringen av denne varianten/genet for dette tilfellet siden vi mistenker en resessivt modus av arv og at bærere av skadelige varianter i dette genet kan presentere i den generelle befolkningen. Se Figur 4 for MARRVEL-utgang for OGDHL 10:50946295 G > A.

Modell organisme studier utført parallelt viste at tap av Ogdh (også referert til som Nc73EF), den Drosophila ortholog av OGDHL, i nervesystemet utstillinger en nevrodegenerative fenotype i samsvar med proband nevrologiske lidelser33. Funksjonelle studier i Drosophila viste at varianten av interesse (p. S778L) påvirker protein funksjon, noe som gjør dette til en sterk kandidat genet for denne sykdommen. Siden da denne informasjonen om en potensiell sykdomsfremkallende variant i OGDHL knyttet til en roman nevrologisk lidelse har blitt INNLEMMET i OMIM (https://www.OMIM.org/Entry/617513) nylig, men har ennå ikke fått tildelt en sykdom-fenotype nummeret fordi bare ett tilfelle er rapportert fra og med januar 2019.

Er den menneskelige ortholog av en modell organisme genet av interesse forbundet med genetiske sykdommer?
Mange modell organisme forskere kan være interessert i å se om den menneskelige ortholog av deres gen av interesse kan ha lenker til genetiske sykdommer. I dette eksempelet vil vi søke om den menneskelige ortholog (e) av fly notch (N) genet har noen relevans for genetiske sykdommer. For å gjøre dette, vil vi starte med å utføre en "modell organismer søk (1.3.1.-1.3.2.)" og velg "Drosophila melanogaster" som arten navn og "N" som modell organisme genet navn. De fire spådde menneskelige orthologs for dette flue genet vil bli vist i resultatvinduet som NOTCH1, NOTCH2, NOTCH3 og NOTCH4. De fire genene har forskjellige DIOPT-poeng (10/12 for NOTCH1, 8/12 for NOTCH2 og NOTCH3, 5/12 for NOTCH4) på grunn av graden av homologi mellom fly N og hvert menneske gen. Med tanke på "beste poengsum fra humant genet å fly" er oppført som "ja" for alle fire gener, den omvendte søk fra hvert menneske genet plukker opp fly N Gene som den mest sannsynlige ortholog kandidat. Faktisk er de fire menneskelige hakk gener antas å ha oppstått fra et enkelt hakk genet i løpet av de to rundene av hele Genova duplisering hendelser som skjedde i virveldyr avstamning etter splitting fra virvelløse avstamning36. Ved å klikke på "MARRVEL IT" knappene for hver menneskelige genet, kan man få den menneskelige genet-baserte utganger for NOTCH1-4.  På resultatsiden for hvert gen, de øverste boksene for OMIM indikere at mens NOTCH1, 2 og 3 er forbundet med genetiske sykdommer, NOTCH4 er for tiden ikke forbundet med noen menneskelige sykdommer. Merk at det har vært debatter om hvorvidt varianter i NOTCH4 er forbundet med schizofreni basert på Genova-bred forening studier (GWAS)37,38. Siden OMIM generelt ikke passer til GWAS-data med noen unntak (f.eks. APOE, PTPN22), er ikke denne informasjonen tilgjengelig fra OMIM-vinduet. På samme måte, siden OMIM ikke generelt har en kreft tilknyttet somatiske mutasjon informasjon, informasjon om somatiske mutasjoner i disse genene er forbundet med visse krefttyper vil ikke bli listet med noen få unntak (f. eks TP53, RB1, BRCA1). Ved å klikke på PubMed eller Monarch boks, kan man identifisere noen sykdom relaterte papirer som ikke er vurdert i OMIM. Se figur 5 for hele MARRVEL-utgangen for fly genet N og Human Gene NOTCH4.

Figure 1
Figur 1 . En representant utdata fra et MARRVEL-søk. Dette konkrete eksempelet viser et gen/variant-Søk etter "TBX2/17:59477596 G > A" (http://marrvel.org/search/pair/TBX2/17:59477596%20G%3EA). Sidefelt til venstre støtter navigasjoner gjennom data utgang. Merk den "eksterne link" skiltene her gir lenker til de aktuelle sidene i UCSC Genova nettleser (https://genome.ucsc.edu/). Fanene på toppen tillater en å utføre modellen organisme genet-baserte søk, få ytterligere informasjon om MARRVEL og gi brukeren tilbakemeldinger. "Søkeresultater"-panelene viser gen-og variant informasjon fra kildene som er angitt i bildet. Vennligst klikk her for å se en større versjon av dette tallet.

Figure 2
Figur 2 . Oppsummering av modellen organisme ortholog bord og multi-Art justering for TBX2. A) MARRVEL velger topp ortholog kandidat for hver art basert på DIOPT verktøyet. For eksempel betyr en DIOPT-poengsum på 10/12 som vises for Drosophila bi -genet 10 av 12 orthology forutsigelse programmer som brukes av DIOPT spådd at bi er den mest sannsynlige fly ortholog av menneskelig TBX2. Siden 25% av genene dupliseres i sebrafisk sammenlignet med mennesker, viser MARRVEL to paralogous gener (i dette tilfellet tbx2a og tbx2b) når dette er aktuelt. B) øyeblikksbilde av den multi-Art justering vinduet. Ved å velge en bestemt organisme [i dette tilfellet Human (HS)] og inn i aminosyren av interesse, kan man markere den spesifikke aminosyren i lyseblå. I dette eksempelet, p. R20 av menneskelig TBX2 synes å være bevart i mus (mm1), både sebrafisk orthologs (DR1 og DR2), Drosophila (dm1) og C. elegans (CE1). Rat Tbx2 ser ikke ut til å justere godt i forhold til andre arter, mest sannsynlig på grunn av isoformen brukes av DIOPT å utføre multi-arter innretting. Vennligst klikk her for å se en større versjon av dette tallet.

Figure 3
Figur 3 : Hele utgangen for TBX2 17:59477596 G ≫ A. Vennligst klikk her for å laste ned denne filen.

Figure 4
Figur 4 : MARRVEL-utgang for OGDHL 10:50946295 G > A. Vennligst klikk her for å laste ned denne filen.

Figure 5
Figur 5 : MARRVEL-utgang for fly genet N og humant gen NOTCH4. Vennligst klikk her for å laste ned denne filen.

Type database Navn på database URL/kobling til database Begrunnelse for inkludering i MARRVEL Referanse (PMID)
Human genetikk ClinVar https://www.ncbi.nlm.nih.gov/clinvar/ ClinVar er et offentlig arkiv av rapporter om forholdet mellom menneskelige variasjoner og fenotyper, med støtte bevis. Varianter med tolkninger rapportert av forskere og klinikere er verdifulle for å analysere hvor sannsynlig en variant er patogene. PMID: 29165669
Human genetikk Dechiffrere https://decipher.sanger.ac.uk/ De DECHIFFRERE data som vises på MARRVEL inkluderer vanlige varianter fra kontrollen befolkningen. Dataene som vises, inkluderer strukturelle varianter som dekker den genomisk plasseringen til inn datavarianten. DECHIFFRERE inneholder også variant og fenotypiske informasjon for berørte individer, men kan bare nås direkte via deres hjemmeside. PMID: 19344873
Human genetikk DGV http://dgv.tcag.ca/dgv/app/home Til vår kunnskap, DGV er den største offentlige-tilgang samling av strukturelle varianter fra mer enn 54 000 individer. Databasen inneholder eksempler på angivelig friske individer, på tidspunktet for ascertainment, fra opp til 72 forskjellige studier. Mulige begrensninger på disse dataene inkluderer variasjon i kilde og metode for dataene ervervet mangelen på informasjon om ufullstendige penetrans av patogene CNVs, og om individer vil utvikle tilknyttede sykdommer etter datainnsamling. PMID: 24174537
Orthology prediksjon DIOPT https://www.flyrnai.org/cgi-bin/DRSC_orthologs.pl DIOPT gitt flere protein sekvens justering av de beste spådde orthologs i seks modell organismer mot protein sekvensen av den menneskelige genet av interesse. Justeringen vil gi informasjon om bevaring av bestemte aminosyrer, samt funksjonelle protein domener. PMID: 21880147
Menneskelig gen/transkripsjon nomenklatur Ensembl https://useast.ensembl.org/ Ensembl gen-IDer brukes til å knytte sammen de ulike databasene. PMID: 29155950
Human genetikk ExAC http://exac.broadinstitute.org/ ExAC inneholder mer enn 60 000 exomes og er, annet enn gnomAD (http://gnomad.broadinstitute.org/), den største offentlige samlingen av exomes som har blitt valgt mot personer med alvorlig tidlig utbruddet Mendelsk fenotyper. For MARRVEL formål, ExAC og gnomAD fungerer som den beste kontrollen befolkningen datasett å beregne mindre allel frekvens. Vi tilbyr to sett med utganger fra ExAC. Den første utgangen er genet-sentriske oversikt over forventet versus observert antall missense og tap av funksjon (LOF) alleler. En beregning kalt pLI (sannsynligheten for LOF intoleranse) varierer mellom 0,00 og 1,00 reflekterer selektiv press på enkelte varianter før reproduktiv alder. pLI score på 1,00 betyr at dette genet er svært tåler noen LOF varianter og haploinsufficiency av dette genet kan forårsake sykdom hos mennesker. Den andre utdataene er data fra ExAC som gjelder for den spesifikke varianten. Hvis identiske varianten ses i ExAC, vil MARRVEL vise den mindre allel frekvensen. PMID: 27535533
Primær modell organisme databaser FlyBase (Drosophila) http://flybase.org MARRVEL samler inn og viser data fra flere modell organisme databaser. Vi gir et sammendrag av den molekylære, cellulære og biologiske funksjonen til genet ved bruk av GO-vilkår. Den mest sannsynlige ortholog er avledet av DIOPT. PMID: 26467478
Modell organisme database Integration verktøy Gene2Function http://www.gene2function.org/search/ MARRVEL samarbeider med DIOPT og Gene2Function å gi "Model organisme søk"-funksjonen. Hyperlink er gitt for brukere å få tilgang til deres hjemmeside som integrerer en rekke MO databaser og viser dem i en annen stil fra hvordan MARREL gjør. PMID: 28663344
Human genetikk Geno2MP http://geno2mp.gs.washington.edu/Geno2MP/ Geno2MP er en samling av prøver fra University of Washington Center for Mendelsk genetikk. Den inneholder ~ 9 650 exomes av berørte individer og upåvirket slektninger. Denne databasen kobler fenotypiske i tillegg til modus for arve informasjon til bestemte alleler. For fenotype, ved å sammenligne det berørte organ systemet til pasienten av interesse for de berørte individer i Geno2MP, kan man finne potensielle kamper. En kamp i allel, modus for arv, og fenotype gir en økt sannsynlighet for at varianten sannsynlig patogene. Men på grunn av liten utvalgsstørrelse en negativ assosiasjon ikke nødvendigvis redusere en variant ' s patogene prioritet. En mekanisme for å kontakte den primære lege av en pasient av interesse er gitt i den opprinnelige kilden. N/a
Human genetikk gnomAD http://gnomad.broadinstitute.org/ gnomAd inneholder totalt 123 136 exome sekvenser og 15 496 hel-Genova sekvenser fra urelaterte individer sekvensert som en del av ulike sykdom-spesifikke og befolkning genetiske studier. Betydelig del av ExAC data er integrert i gnomAD. I MARRVEL vi i dag viser befolkningen frekvenser som gjelder spesifikke varianten. PMID: 27535533
Gene ontologi GO sentralt http://www.geneontology.org/ MARRVEL viser bare Gene ontologi (GO) termer (molekylær funksjon, cellular Component, og biologisk prosess) avledet fra eksperimentelle bevis for hvert gen. De er filtrert etter "eksperimentelle bevis koder" og GO vilkår basert på "beregningsorientert analyse bevis koder" og "elektronisk merknad bevis koder" (spådommer) unngås. PMID: 10802651, 25428369
Human Gene/protein uttrykk GTEx https://gtexportal.org/home/ MARRVEL viser både mRNA og protein uttrykk mønster i menneskelig vev av hvert gen. Uttrykks mønsteret kan gi innsikt i fenotyper observert hos pasienter og/eller modell organismer. PMID: 29019975, 23715323
Human Gene nomenklatur HGNC https://www.genenames.org/ HGNC offisielle gen symboler brukes til MARRVEL-søk. PMID: 27799471
Primær modell organisme databaser IMPC (mus) http://www.mousephenotype.org/ MARRVEL gir en hyperkobling til coresponding mus genet sider på IMPC nettsted. Hvis det har vært en knock-out mus laget av IMPC, en uttømmende liste over analyser og deres resultater er gjort tilgjengelig offentlig og kan gi innsikt i fenotype når et gen er tapt. Noe informasjon er vurdert i MGI men det kanskje en tid lag. PMID: 27626380
Primær modell organisme databaser MGI (mus) http://www.informatics.jax.org/ MARRVEL samler inn og viser data fra flere modell organisme databaser. Vi gir et sammendrag av den molekylære, cellulære og biologiske funksjonen til genet ved bruk av GO-vilkår. Den mest sannsynlige ortholog er avledet av DIOPT. PMID: 25348401
Modell organisme database Integration verktøy Monarch initiativ https://monarchinitiative.org/ MARRVEL gir en link til Phenogrid av et menneskelig gen om Monarch Initiative. Dette rutenettet gir sammenligninger mellom fenotype av modell organismer og kjente menneskelige sykdommer. PMID: 27899636
Nomenklatur for menneskelig variant Mutalyzer https://mutalyzer.nl/ MARRVEL bruker Mutalyzer ' s API til å konvertere ulike variant terminologiene til genomisk plassering. PMID: 18000842
Human genetikk OMIM https://omim.org/ De tre viktigste opplysninger som vi trekker fra OMIM er: gen funksjon, tilhørende fenotyper, og rapporterte alleler. Det er nyttig å vite om et gen er forbundet med en kjent Mendelsk fenotype (# entries) som molekylær grunnlag er kjent. Gener uten denne kunnskapen er kandidater til romanen gen funn. For gener som er denne kategorien, hvis pasientens fenotype ikke samsvarer med den rapporterte sykdommen og fenotype så vel som de av pasientene i litteraturen, så dette øker muligheten til å gi en fenotypiske ekspansjon for genet av interesse. PMID: 28654725
Primær modell organisme databaser PomBase (fisjon gjær) https://www.pombase.org/ MARRVEL samler inn og viser data fra flere modell organisme databaser. Vi gir et sammendrag av den molekylære, cellulære og biologiske funksjonen til genet ved bruk av GO-vilkår. Den mest sannsynlige ortholog er avledet av DIOPT. PMID: 22039153
Litteratur Pubmed https://www.ncbi.nlm.nih.gov/pubmed/ MARRVEL gir en hyperkobling til "Gene" basert PubMed søk. Ved å klikke på denne linken vil tillate en å søke biomedisinsk papirer som refererer til genet av interesse basert på tidligere gen navn og symboler. N/a
Primær modell organisme databaser RGD (rotte) https://rgd.mcw.edu/ MARRVEL samler inn og viser data fra flere modell organisme databaser. Vi gir et sammendrag av den molekylære, cellulære og biologiske funksjonen til genet ved bruk av GO-vilkår. Den mest sannsynlige ortholog er avledet av DIOPT. PMID: 25355511
Primær modell organisme databaser SGD (spirende gjær) https://www.yeastgenome.org/ MARRVEL samler inn og viser data fra flere modell organisme databaser. Vi gir et sammendrag av den molekylære, cellulære og biologiske funksjonen til genet ved bruk av GO-vilkår. Den mest sannsynlige ortholog er avledet av DIOPT. PMID: 22110037
Human Gene/protein uttrykk Human protein Atlas https://www.proteinatlas.org/ MARRVEL viser både mRNA og protein uttrykk mønster i menneskelig vev av hvert gen. Uttrykks mønsteret kan gi innsikt i fenotyper observert hos pasienter og/eller modell organismer. PMID: 21752111
Primær modell organisme databaser WormBase (C. elegans) http://wormbase.org MARRVEL samler inn og viser data fra flere modell organisme databaser. Vi gir et sammendrag av den molekylære, cellulære og biologiske funksjonen til genet ved bruk av GO-vilkår. Den mest sannsynlige ortholog er avledet av DIOPT. PMID: 26578572
Primær modell organisme databaser ZFIN (sebrafisk) https://zfin.org/ MARRVEL samler inn og viser data fra flere modell organisme databaser. Vi gir et sammendrag av den molekylære, cellulære og biologiske funksjonen til genet ved bruk av GO-vilkår. Den mest sannsynlige ortholog er avledet av DIOPT. PMID: 26097180

Tabell 1. Liste over data kilder for MARRVEL. Alle databaser der MARRVEL henter data fra, er oppført i denne tabellen. For hver database, lister vi den typen database, URL/link, begrunnelse for blant annet i MARRVEL, og primære referanser.

Subscription Required. Please recommend JoVE to your librarian.

Discussion

Kritiske trinn i denne protokollen inkluderer den opprinnelige input (trinn 1.1-1.3) og påfølgende tolkning av utdataene. Den vanligste grunnen til at søkeresultatene er negative, er på grunn av de mange måtene et gen og/eller en variant kan beskrives på. Mens MARRVEL oppdateres på en planlagt basis, kan disse oppdateringene forårsake frakobling mellom de ulike databasene som MARRVEL kobler til. Det første trinnet i feilsøkingen sjekker derfor alltid for å se om alternative navn på genet eller varianten vil føre til et vellykket søkeresultat. Hvis det fortsatt ikke kan løses, kan du sende en melding til utviklingsteamet ved hjelp av tilbakemeldingsskjemaet i http://marrvel.org/message.

En begrensning til MARRVEL er at den ennå ikke inkluderer alle de nyttige databasene som er nødvendige for gen-og variant analysen. For eksempel, patogenitet prediksjon algoritmer som CADD18 er for øyeblikket ikke gitt. På samme måte, protein struktur informasjon og protein-protein interaksjon informasjon som også kan gi strukturelle og funksjonelle koblinger til kjente sykdomsfremkallende varianter i gener er foreløpig ikke vist i MARRVEL. I vår neste store oppdateringen, planlegger vi å integrere denne informasjonen i MARRVEL, i tillegg til å innlemme mer fenotypiske informasjon fra modellen organisme nettsteder, IMPC, Monarch Initiative og Alliansen av Genova Resources (AGR, https://www.alliancegenome.org/). Siden MARRVEL ble utviklet for å legge til rette for sjelden sykdoms forskning, fokuserer programmet for tiden på germline varianter og gir ikke tilgang til somatiske variant informasjon. Ingen kreft genetikk relaterte databaser er integrert som for publisering av denne protokollen. Som MARRVEL er aktivt under utvikling og oppgradert, vi setter pris på tilbakemeldinger, og sterkt oppfordre eksisterende brukere til å melde seg på nyhetsbrev på http://marrvel.org/message for eventuelle fremtidige flere databaser som blir integrert.

Selv om data fra MARRVEL kan brukes til å prioritere varianter som kan være patogene. Men for å demonstrere patogenitet, må man identifisere andre pasienter med lignende genotyper og fenotyper eller utføre funksjonelle studier for å gi solide bevis på at den varianten av interesse har funksjonelle konsekvenser som er relevante for sykdomstilstand. For mer informasjon om ytterligere informasjon utenfor MARRVEL som kan være nyttig å dømme hvis en variant er verdt eksperimentelt gransker i modellen organisme, henvises det til den med følgende artikkel høste et al21. For at ta neste skritt inne benytter modell organisere å studere Human varianter, Human Genetikere og modell organisme forskning må være i stand til forbinde og samarbeide. GeneMatcher og andre genomisk konsortier som er en del av matchmaker Exchange-konsortiet, er ressurser som forenkler dette neste trinnet. Hvis brukerne bor i Canada, kan man også registrere i sjeldne sykdom modeller og mekanismer Network (RDMM, http://www.rare-diseases-catalyst-network.ca/) å identifisere klinikere og/eller modell organisme forskere som er villige til å samarbeide39 . Japan (J-RDMM, https://irudbeyond.nig.ac.jp/en/index.html), Europa (RDMM-Europa, http://solve-rd.eu/rdmm-europe/), og Australia (Australian funksjonell Genomics Network: https://www.functionalgenomics.org.au/) har nylig vedtatt Canadian RDMM modell for å lette lignende samarbeid innenfor sine land/regioner. Videre, ved hjelp av verktøy som BioLitMine (https://www.flyrnai.org/tools/biolitmine/web/) kan man søke etter potensielle samarbeidspartnere blant Principal etterforskere som tidligere har jobbet på genet av interesse.

Til slutt, i tillegg til MARRVEL, er det en rekke andre tverr arter data mining verktøy tilgjengelig, inkludert Gene2Function40 (http://www.gene2function.org/), Monarch Initiative29 (https://monarchinitiative.org/) og Alliansen av Ressurser i Genova (AGR, https://www.alliancegenome.org/). Mens Gene2Function gir tilgang til kryss-arter data og Monarch Initiative gir fenotypiske sammenligninger, MARRVEL har en større vekt på menneskelige varianter og linking menneskelig genomisk data med modellen organismer. AGR er et initiativ som involverer seks modell organisme databaser og Gene ontologi Consortium som integrerer data fra ulike database på en enhetlig måte å øke tilgjengeligheten av data akkumulert av hver database. Disse ressursene er komplementære, og brukerne bør forstå styrkene til hver database for å navigere den enorme mengden kunnskap som har blitt akkumulert av forskere i lokalsamfunnene. Som MARRVEL utvikling fortsetter, planlegger vi å inkludere flere databaser som er relevante for å studere menneskelige varianter i modell organismer. Det overordnede målet med MARRVEL er å gi en lett tilgjengelig måte for klinikere og forskere både å analysere menneskelige gener og varianter for videre studier ved å integrere nyttig informasjon samtidig som grensesnittet så enkelt som mulig.

Subscription Required. Please recommend JoVE to your librarian.

Disclosures

Forfatterne har ingenting å avsløre.

Acknowledgments

Vi takker DRS. Rami Al-Ouran, seon-Young Kim, Yanhui (Claire) Hu, Ying-Wooi WAN, Naveen Manoharan, Sasidhar Pasupuleti, Aram Comjean, Dongxue Mao, Michael Wangler, Hsiao-Tuan Chao, Stephanie Mohr, og Norbert Perrimon for deres støtte i utvikling og vedlikehold av MARRVEL. Vi er takknemlige for Samantha L. Deal og J. Michael høste for deres innspill på dette manuskriptet.

Den første utviklingen av MARRVEL ble støttet delvis av udiagnostisert sykdommer nettverket modell organismer screening sentrum gjennom NIH Commonfund (U54NS093793) og gjennom NIH kontoret til forskning infrastruktur programmer (ORIP) (R24OD022005). JW er støttet av NIH Eunice Kennedy Shriver National Institute of Child Health & Human Development (F30HD094503) og The Robert og Janice McNair Foundation McNair MD/PhD student Scholar program ved BCM. HJB er videre støttet av NIH National Institute of General Medical Sciences (R01GM067858) og er en etterforsker av Howard Hughes Medical Institute. ZL er støttet av NIH National Institute of General Medical Science (R01GM120033), National Institute of aging (R01AG057339), og Huffington Foundation. SY fikk ekstra støtte fra NIH National Institute on døvhet og andre kommunikasjons forstyrrelser (R01DC014932), Simons Foundation (SFARI Award: 368479), Alzheimer ' s Association (ny etterforsker Research Grant: 15-364099), naman familie Fund for Basic Research og Caroline Wiess Law Fund for forskning i molekylær medisin.

Materials

Name Company Catalog Number Comments
Human Genetics ClinVar PMID: 29165669 https://www.ncbi.nlm.nih.gov/clinvar/
Human Genetics DECIPHER PMID: 19344873  https://decipher.sanger.ac.uk/
Human Genetics DGV PMID: 24174537 http://dgv.tcag.ca/dgv/app/home
Orthology Prediction DIOPT PMID: 21880147  https://www.flyrnai.org/cgi-bin/DRSC_orthologs.pl
Human Gene/Transcript Nomenclature Ensembl PMID: 29155950  https://useast.ensembl.org/
Human Genetics ExAC  PMID: 27535533 http://exac.broadinstitute.org/
Primary Model Organism Databases FlyBase (Drosophila) PMID:26467478 http://flybase.org
Model Organism Database Integration Tools Gene2Function PMID: 28663344 http://www.gene2function.org/search/
Human Genetics Geno2MP N/A http://geno2mp.gs.washington.edu/Geno2MP/
Human Genetics gnomAD PMID: 27535533 http://gnomad.broadinstitute.org/
Gene Ontology GO Central PMID: 10802651, 25428369  http://www.geneontology.org/
Human Gene/Protein Expression GTEx PMID: 29019975, 23715323  https://gtexportal.org/home/
Human Gene Nomenclature HGNC PMID: 27799471  https://www.genenames.org/
Primary Model Organism Databases IMPC (mouse) PMID: 27626380 http://www.mousephenotype.org/
Primary Model Organism Databases MGI (mouse) PMID:25348401 http://www.informatics.jax.org/
Model Organism Database Integration Tools Monarch Initiative PMID: 27899636 https://monarchinitiative.org/
Human Variant Nomenclature Mutalyzer PMID: 18000842  https://mutalyzer.nl/
Human Genetics OMIM PMID: 28654725 https://omim.org/
Primary Model Organism Databases PomBase (fission yeast) PMID:22039153 https://www.pombase.org/
Literature PubMed N/A https://www.ncbi.nlm.nih.gov/pubmed/
Primary Model Organism Databases RGD (rat) PMID:25355511 https://rgd.mcw.edu/
Primary Model Organism Databases SGD (budding yeast) PMID: 22110037 https://www.yeastgenome.org/
Human Gene/Protein Expression The Human Protein Atlas PMID: 21752111 https://www.proteinatlas.org/
Primary Model Organism Databases WormBase (C. elegans) PMID:26578572 http://wormbase.org
Primary Model Organism Databases ZFIN (zebrafish) PMID:26097180 https://zfin.org/

DOWNLOAD MATERIALS LIST

References

  1. Yang, Y., et al. Clinical whole-exome sequencing for the diagnosis of mendelian disorders. New England Journal of Medicine. 369, (16), 1502-1511 (2013).
  2. Richards, S., et al. Standards and guidelines for the interpretation of sequence variants: a joint consensus recommendation of the American College of Medical Genetics and Genomics and the Association for Molecular Pathology. Genetics in Medicine. 17, (5), 405-424 (2015).
  3. MacArthur, D. G., et al. Guidelines for investigating causality of sequence variants in human disease. Nature. 508, (7497), 469-476 (2014).
  4. Wang, J., et al. MARRVEL: Integration of Human and Model Organism Genetic Resources to Facilitate Functional Annotation of the Human Genome. American Journal of Human Genetics. 100, (6), 843-853 (2017).
  5. Povey, S., et al. The HUGO Gene Nomenclature Committee (HGNC). Human Genetics. 109, (6), 678-680 (2001).
  6. Lek, M., et al. Analysis of protein-coding genetic variation in 60,706 humans. Nature. 536, (7616), 285-291 (2016).
  7. Wildeman, M., van Ophuizen, E., den Dunnen, J. T., Taschner, P. E. Improving sequence variant descriptions in mutation databases and literature using the Mutalyzer sequence variation nomenclature checker. Human Mutation. 29, (1), 6-13 (2008).
  8. Zhou, W., et al. TransVar: a multilevel variant annotator for precision genomics. Nature Methods. 12, (11), 1002-1003 (2015).
  9. Hu, Y., et al. An integrative approach to ortholog prediction for disease-focused and other functional studies. BMC Bioinformatics. 12, 357 (2011).
  10. Amberger, J. S., Hamosh, A. Searching Online Mendelian Inheritance in Man (OMIM): A Knowledgebase of Human Genes and Genetic Phenotypes. Current Protocols in Bioinformatics. 58, 1 (2017).
  11. Amberger, J. S., Bocchini, C. A., Scott, A. F., Hamosh, A. OMIM.org: leveraging knowledge across phenotype-gene relationships. Nucleic Acids Research. 47, 1038-1043 (2019).
  12. Liu, N., et al. Functional variants in TBX2 are associated with a syndromic cardiovascular and skeletal developmental disorder. Human Molecular Genetics. 27, (14), 2454-2465 (2018).
  13. Ropers, H. H., Wienker, T. Penetrance of pathogenic mutations in haploinsufficient genes for intellectual disability and related disorders. European Journal of Medical Genetics. 58, (12), 715-718 (2015).
  14. Shashi, V., et al. De Novo Truncating Variants in ASXL2 Are Associated with a Unique and Recognizable Clinical Phenotype. American Journal of Human Genetics. 100, (1), 179 (2017).
  15. Chen, R., et al. Analysis of 589,306 genomes identifies individuals resilient to severe Mendelian childhood diseases. Nature Biotechnology. 34, (5), 531-538 (2016).
  16. Halvorsen, M., et al. Mosaic mutations in early-onset genetic diseases. Genetics in Medicine. 18, (7), 746-749 (2016).
  17. Kohler, S., et al. The Human Phenotype Ontology in 2017. Nucleic Acids Research. 45, (1), 865-876 (2017).
  18. Rentzsch, P., Witten, D., Cooper, G. M., Shendure, J., Kircher, M. CADD: predicting the deleteriousness of variants throughout the human genome. Nucleic Acids Research. 47, (1), 886-894 (2019).
  19. Sobreira, N., Schiettecatte, F., Valle, D., Hamosh, A. GeneMatcher: a matching tool for connecting investigators with an interest in the same gene. Human Mutation. 36, (10), 928-930 (2015).
  20. Sobreira, N. L. M., et al. Matchmaker Exchange. Current Protocols in Human Genetics. 95, (9), 31-39 (2017).
  21. Harnish, M., Deal, S., Wangler, M., Yamamoto, S. In vivo functional study of disease-associated rare human variants using Drosophila. Journal of Visualized Experiments. (2019).
  22. Harrison, S. M., et al. Using ClinVar as a Resource to Support Variant Interpretation. Current Protocols in Human Genetics. 89, 11-18 (2016).
  23. MacDonald, J. R., Ziman, R., Yuen, R. K., Feuk, L., Scherer, S. W. The Database of Genomic Variants: a curated collection of structural variation in the human genome. Nucleic Acids Research. 42, Database issue 986-992 (2014).
  24. Firth, H. V., et al. DECIPHER: Database of Chromosomal Imbalance and Phenotype in Humans Using Ensembl Resources. American Journal of Human Genetics. 84, (4), 524-533 (2009).
  25. Thurmond, J., et al. FlyBase 2.0: the next generation. Nucleic Acids Research. 47, 759-765 (2019).
  26. Consortium, G. T. Human genomics. The Genotype-Tissue Expression (GTEx) pilot analysis: multitissue gene regulation in humans. Science. 348, (6235), 648-660 (2015).
  27. Ponten, F., Jirstrom, K., Uhlen, M. The Human Protein Atlas--a tool for pathology. Journal of Pathology. 216, (4), 387-393 (2008).
  28. The Gene Ontology, C. The Gene Ontology Resource: 20 years and still GOing strong. Nucleic Acids Research. (2018).
  29. Mungall, C. J., et al. The Monarch Initiative: an integrative data and analytic platform connecting phenotypes to genotypes across species. Nucleic Acids Research. 45, (1), 712-722 (2017).
  30. Meehan, T. F., et al. Disease model discovery from 3,328 gene knockouts by The International Mouse Phenotyping Consortium. Nature Genetics. 49, (8), 1231-1238 (2017).
  31. Katoh, K., Rozewicki, J., Yamada, K. D. MAFFT online service: multiple sequence alignment, interactive sequence choice and visualization. Brief Bioinform. (2017).
  32. Sievers, F., Higgins, D. G. Clustal Omega for making accurate alignments of many protein sequences. Protein Science. 27, (1), 135-145 (2018).
  33. Yoon, W. H., et al. Loss of Nardilysin, a Mitochondrial Co-chaperone for alpha-Ketoglutarate Dehydrogenase, Promotes mTORC1 Activation and Neurodegeneration. Neuron. 93, (1), 115-131 (2017).
  34. Deal, S., Yamamoto, S. Unraveling novel mechanisms of neurodegeneration through a large-scale forward genetic screen in Drosophila. Frontiers in Genetics. 9, (2019).
  35. Matamoros, A. J., Baas, P. W. Microtubules in health and degenerative disease of the nervous system. Brain Research Bulletin. 126, Pt 3 217-225 (2016).
  36. Theodosiou, A., Arhondakis, S., Baumann, M., Kossida, S. Evolutionary scenarios of Notch proteins. Molecular Biology and Evolution. 26, (7), 1631-1640 (2009).
  37. Shayevitz, C., Cohen, O. S., Faraone, S. V., Glatt, S. J. A re-review of the association between the NOTCH4 locus and schizophrenia. American Journal of Medical Genetics. Part B: Neuropsychiatric Genetics. 159, (5), 477-483 (2012).
  38. Wang, Z., et al. A review and re-evaluation of an association between the NOTCH4 locus and schizophrenia. American Journal of Medical Genetics. Part B: Neuropsychiatric Genetics. 141, (8), 902-906 (2006).
  39. Oriel, C., Lasko, P. Recent Developments in Using Drosophila as a Model for Human Genetic Disease. International Journal of Molecular Sciences. 19, (7), (2018).
  40. Hu, Y., Comjean, A., Mohr, S. E., FlyBase, C., Perrimon, N. Gene2Function: An Integrated Online Resource for Gene Function Discovery. G3. 7, (8), Bethesda. 2855-2858 (2017).

Comments

0 Comments


    Post a Question / Comment / Request

    You must be signed in to post a comment. Please sign in or create an account.

    Usage Statistics