IR-TEx: en åpen kilde data integrasjon verktøyet for stor data Transcriptomics designet for malaria Vector Anopheles gambiae

Biology
 

Summary

IR-TEx Utforsker insektmiddel motstand-relaterte transcriptional profiler i arten Anopheles gambiae. Forutsatt her er full instruksjoner for bruk av programmet, modifikasjoner for å utforske flere transcriptomic datasett, og bruke rammeverket til å bygge en interaktiv database for samlinger av transcriptomic data fra alle organisme, generert i noen plattform.

Cite this Article

Copy Citation | Download Citations | Reprints and Permissions

Ingham, V. A., Bennett, A., Peng, D., Wagstaff, S. C., Ranson, H. IR-TEx: An Open Source Data Integration Tool for Big Data Transcriptomics Designed for the Malaria Vector Anopheles gambiae. J. Vis. Exp. (155), e60721, doi:10.3791/60721 (2020).

Please note that all translations are automatically generated.

Click here for the english version. For other languages click here.

Abstract

IR-TEx er et program skrevet i Shiny (en R-pakke) som gjør det mulig utforskning av uttrykk for (samt tilordne funksjoner til) transkripsjoner hvis uttrykk er forbundet med insektmiddel motstand fenotyper i Anopheles gambiae mygg. Søknaden kan brukes online eller dataoverførte og anvendt lokal av noen. Den lokale program kan endres for å legge til nye insektmiddel motstand datasett generert fra flere omics plattformer. Denne veiledningen beskriver hvordan du legger til nye datasett og håndterer manglende data. Videre kan IR-TEx være helt og enkelt omkodet å bruke-omics datasett fra alle eksperimentelle data, noe som gjør det til en verdifull ressurs for mange forskere. Protokollen illustrerer nytten av IR-TEx i å identifisere nye insektmiddel motstand kandidater ved hjelp av den mikrosomale glutation glutamyltransferase, GSTMS1, som et eksempel. Denne transkripsjon er upregulated i flere pyrethroid resistente populasjoner fra Elfenbenskysten og Burkina Faso. Identifiseringen av co-korrelert transkripsjoner gir ytterligere innsikt i antatte roller av dette genet.

Introduction

Evnen til å måle uttrykk for et stort antall transkripsjoner samtidig gjennom Microarray plattformer og RNAseq teknologi har resultert i generering av enorme datasett knytte transkripsjon uttrykk med en bestemt fenotype i både modell og ikke-modell organismer. Disse datasettene er en svært rik ressurs for forskere, kraften som kan økes ved å kombinere relevante sett i en stor dataintegrering tilnærming. Imidlertid er denne metodikken begrenset til de med spesielle bioinformatikk ferdigheter. Beskrevet her er et program, IR-TEx (tidligere utgitt av Ingham et al.1) som er skrevet i en R-pakke som heter Shiny2 og lar brukere med lite bioinformatikk trening for å integrere og forhøre disse datasettene med relativ letthet.

IR-TEx, funnet på http://www.lstmed.ac.uk/Projects/IR-TEx, ble skrevet for å utforske transkripsjoner forbundet med insektmiddel motstand i Anopheles gambiae, de store afrikanske malaria vektor1. Malaria er en parasitt sykdom forårsaket av Plasmodium arter, overføres mellom mennesker gjennom bitt av kvinnelige Anopheles mygg. Rettet mot mygg vektor med insektmidler har vist seg å være det mest effektive middel til å forebygge malaria-relaterte sykelighet og dødelighet i Afrika. Den oppskalering av verktøy (dvs. langvarig insecticidal garn) har også vært sentral i den dramatiske reduksjoner i malaria tilfeller siden 20003. Med et svært begrenset antall insektmidler tilgjengelig, det er sterke evolusjonære press på myggen, og motstanden er nå utbredt i afrikanske malaria vektorer4.

I tillegg er målområdet mutasjoner5 og metabolsk clearance av insektmidler6,7 fortsatt den primære studerte mekanismer for motstand, men andre potente resistente mekanismer er nå nye1. Mange av disse nye mekanismene har ikke tidligere vært forbundet med insektmiddel motstand, men har blitt oppdaget ved å søke etter felles mønstre av genuttrykk på tvers av flere resistente populasjoner ved hjelp av IR-TEx app og deretter funksjonelt validert av Genomics tilnærminger1.

Beskrevet her er en steg-for-steg tilnærming til bruk av IR-TEx, både på nettet og når installert lokalt. Protokollen beskriver hvordan nytt insektmiddel motstand datasett kan integreres i den eksisterende pakken og forklarer hvordan du skal operere med manglende data. Til slutt, den beskriver hvordan du bruker denne programvaren med andre-omics datasett som er relatert til insektmiddel motstand, og dermed kombinere data fra varierende-omics tilnærminger samtidig opererer med manglende verdier og normalisering slik at data er sammenlignbare.

Protocol

1. Bruk av IR-TEx webapplikasjon

  1. Kjøre programmet i en nettleser
    1. Åpne webprogrammet for IR-TEx ved å følge koblingen nederst på siden som du finner på http://www.lstmed.ac.uk/Projects/IR-TEx.
    2. Når nettsiden er initialisert, klikker du på program -knappen øverst på siden, som vil vise programmet og tilhørende utganger.
    3. Les hver utgang knyttet til standardoppføring av AGAP008212-ra (CYP6M2) i transkripsjon ID-boksen med følgende betingelser: an. coluzzii datasett som er (i) utsatt for pyrethroid insektmidler eller (II) ikke utsatt for noen insektmiddel klasse, og tilknyttede transkripsjoner med en korrelasjon av | r | > 0.98.
  2. Exploring uttrykk for en transkripsjon av interesse
    1. For å velge en transkripsjon av interesse, Skriv inn transkripsjon ID i transkripsjon ID- boksen, huske at transkripsjoner end in -RX avhengig isoformen av interesse.
    2. Velg datasettene for å forhøre ved å krysse av i de relevante boksene for (i) land; (II) eksponerings status, (III) arter av interesse; og (IV) interesse av insektmiddel klasse, samtidig som vi sikrer at disse kriteriene resulterer i > 1 inkludert datasett (se supplerende tabell 1 i Ingham et al.1).
      Merk: (III) refererer til medlemmet av an. gambiae arter kompleks som brukeren er interessert i. For øyeblikket er data tilgjengelig for en. coluzzii og en. arabiensis.
    3. Klikk på Oppdater visning nederst i valgmenyen eller trykk på Returnog Ignorer absolutt korrelasjons verdi (for nå).
    4. Gi programmet tid til å oppdatere.
    5. Les den første grafen som: log2 fold bytte mellom en resistent befolkning og Lab-mottakelige mygg befolkning av transkripsjon av interesse på tvers av hvert datasett som oppfyller kriteriene som er valgt i trinn 1,2 (figur 1). Detaljene for alle datasettene finnes i Ingham et al.1.
    6. Les informasjonen under grafen som: den fold endringer mellom motstandsdyktig og mottakelige mygg for hvert relevante datasett, i tillegg til de korrigerte p-verdier (Q). Hver rad representerer individuelle sonder på Microarray. Metoden for grafisk visning har blitt rapportert tidligere1.
    7. Les den ekstra tabellen nedenfor som antall eksperimenter der transkripsjon av interesse er betydelig, samt det totale antall eksperimenter som samsvarer med kriteriene som er valgt i trinn 1,2.
    8. Hvis du vil laste ned dataene i kategorien atskilt format, klikker du Last ned -knappen under de to tabellene. Dette gjør det mulig for brukeren å utforske data på en enklere måte ved hjelp av et program som Excel.
    9. Tolke kartet som følger: hvert punkt representerer omtrentlig samling nettsteder av resistente mygg i hvert datasett der transkripsjon av interesse er differensielt uttrykt. Fargene følger et trafikklys system som forklares i appen (figur 2).
    10. For trinn 1.2.5 og 1.2.8, lagre den grafiske utganger ved å høyreklikke, klikke lagre bildet som..., og velge en passende mappe.
      Merk: i forekomsten av en utdata-feil av programmet, er det sannsynlig at ingen datasett samsvarer med angitt kriteriene. Sjekk tilleggs tabell 1 i Ingham et al.1 Hvis dette skjer.
  3. Identifisering antatte funksjoner/trasé av transkripsjon av interesse
    1. Sammenhenger (minimum r2 Value angitt) av uttrykket mønstre av transkripsjoner på tvers av flere datasett kan brukes til å forutsi transkripsjon funksjon og potensielt belyse coregulated transkripsjoner fra samme vei. Bruk eksempelet fra Ingham et al.1 (AGAP001076-ra; CYP4G16), Følg trinn 1.2.1 – 1.2.2 i avsnittet ovenfor, og velg alle datasettene for maksimal effekt.
    2. Før du klikker Oppdater visning, flytter du glidebryteren for absolutt korrelasjons verdi til 0,85, og klikker Oppdater visning eller trykker retur.
    3. Undersøk korrelasjons tabellen (nederste-tabellen) for å finne flere transkripsjoner som nå vises og er korrelert (| r | = 0,85) med angitt transkripsjon.
    4. Manipulere absolutt korrelasjons verdi skyvekontrollen og observere eventuelle endringer i nederste grafen og tabellen; utganger fra trinn 1.3.2 vil forbli uendret. Som vist i Figur 3 (| r | > 0,9, | r | > 0,8), vil det å senke stringens av korrelasjons verdien vise flere transkripsjoner, men vil innføre mer støy.
    5. Les tabellen under det grafiske resultatet, som (i tillegg til parametrene beskrevet i trinn 1.2.6) inneholder korrelasjons verdien for hver transkripsjon.
    6. Hvis du vil laste ned dataene i et tabulatordelt format, klikker du Last ned -knappen.
    7. Funksjonell berikelse analyse kan utføres på den nedlastede transkripsjon ID-listen ved hjelp av DAVID analyse8. Når på DAVID nettsted (funnet på https://David.ncifcrf.gov/), velg funksjonell analyse. Lim inn hele gen listen, ved hjelp av gen-IDer [identifikator uten-RX, som kan gjøres i Excel ved å sette inn en kolonne til høyre for systematisk ID og skrive = Left (X1, 10), der X1 er systematisk ID-cellen]. Velg identifikatoren som VectorBase_ID og gen listen, og klikk på Send liste.
    8. Klikk knappen funksjonell merknad Clustering for å gi en oversikt over elementene som finnes i dette korrelasjons nettverket, slik at en potensiell funksjon kan tilordnes til utskriften. Utforsk grundige elementene ved å se gjennom de ulike kategoriene og klikke på + -knappene for hvert av dem og deretter klikke på diagram.

2. laste ned og implementere IR-TEx lokalt

  1. Laste ned og kjøre IR-TEx
    1. Gå til linken funnet på http://GitHub.com/LSTMScientificComputing/IR-TEx; og klikk Klon eller laste ned | Last ned zip. Direkte til en mappe med valg og pakk ut filen i denne mappen.
    2. Last ned den nyeste versjonen av R-programvare for det aktuelle operativsystemet fra koblingen som finnes på http://Cran.r-Project.org/Mirrors.html. Installere programmet.
    3. Last ned og Installer den nyeste R Studio programvare, igjen for det aktuelle operativsystemet fra linken funnet på http://www.rstudio.com/products/rstudio/Download/.
    4. Når den er installert, åpne R Studio | Supplerende koding fil 1 og kjøre hver linje for å sette opp systemet for IR-TEx.
    5. Når alle pakkene er installert og oppdatert etter behov, gå til fil | Åpne, Finn IR-TEx. R, Uthev og åpne. Dette skal nå være synlig i det øverste vinduet i R Studio.
    6. For å kjøre appen, trykk på Run app -knappen øverst til høyre i vinduet, og et nytt vindu vil dukke opp der appen lastes inn. En gang det lessing er fullstendig, for i sin helhet funksjonaliteten falle i staver åpen inne kikker lokalisert inne overdelen rett av det lastet vindu.
  2. Legge motstand datasett til IR-TEx (generert ved hjelp Anopheles gambiae 15k Agilent array)
    1. Hvis du vil legge til et nytt analysert datasett som er generert på samme Microarray plattform (A-MEXP-2196), i det tilgjengelige datasettet, laster du ned appen og finner den utpakkede mappen lastet ned i avsnitt 2,1.
    2. Åpne ekstra fil 1, som representerer en utdata fra en limma analyse på a-MEXP-2196- 1. Bruke Excel, i kolonne H1, skrive Fold_Change, og i H2, skriver = 2 ^ B2, der B2 er loggen fold endres. Bruk dette i hele kolonne H å produsere rå fold endringer.
    3. Ordne ekstra fil 1 slik at kolonne A er ID, kolonne B er flippen endres fra kolonne h (Kopier kolonne h, Merk kolonne B, deretter høyreklikk og lim inn verdier) og kolonne C er den justerte p-verdi. Slett alle andre kolonner, og lagre den som en tabulatordelt fil.
    4. Åpne supplerende koding fil 2 og kjøre ved hjelp av tabulatordelt ark produsert i trinn 2.2.3.
      NEWFILE_FC = c (' land ', ' eksponerings STATUS ', ' Art ', ' INSEKTMIDDEL ')
      NEWFILE_Q = c (' land ', ' eksponerings STATUS ', ' Art ', ' INSEKTMIDDEL ')
      Merk: felt i enkle anførselstegn bør endres for å gjenspeile informasjon fra det nye datasettet. Eksponerings status viser om prøvene ble samlet inn etter eksponering for insektmiddel (eksponert/ueksponerte). Insektmiddel: Hvis ' ueksponerte ', bruk ' none '. Se Fold_Changes. txt. for metadata fra andre prøver. Kontroller at stavemåten er konsekvent.
    5. Åpne geografi. txt, bla til den siste raden som er okkupert, og velg nedenfor. Skriv inn navnet på datasettet, etterfulgt av Q og NEWFILE_Q i kolonne 1, Latitude på eksempel samlingsområdet i kolonne 2 og lengdegrad i kolonne 3. Lagre endringene.
    6. Hvis noen nye oppføringer brukes (f.eks. Gambia), som ikke er tilgjengelig for valg i datasettet (se Ingham et al. supplerende tabell 11), disse må legges inn i koden. For å gjøre dette, åpne IR-TEx. R i RStudio og finne linje 26 som indikert av RStudio, noe som peker på følgende bør begynne:
      'sidebarPanel (.... '.
      Merk: hver av de fortsetter radene er relatert til et element av metadata angitt i radene under DataSet navnet i Fold_Changes. txt i trinn 2.2.5.
    7. For å legge til romanen metadata, bla til slutten av linjen av metadata av valget, og finne begrepet ' valgt = '. Umiddelbart etter dette bør være et komma og lukket brakett; på dette punktet, klikker du markøren i den lukkede braketten. Etter den endelige apostrof, skriver du inn et komma, etterfulgt av en apostrof, etterfulgt av de nye metadataene (for eksempel "Gambia"), og lagre endringene. Se nedenfor for et eksempel.
      checkboxGroupInput (' CountryInput ', ' Velg relevante land ', c (' Burkina Faso ', ' Cote d'Ivoire ', ' Kamerun ', ' Ekvatorial-Guinea ', ' Zambia ', ' Tanzania ', ' Sudan ', ' Uganda ', ' Togo ', ' Gambia '), valgt = c (' Burkina Faso ', ' Cote d'Ivoire ', ' Kamerun ', ' Ekvatorial-Guinea ', ' Zambia ', ' Tanzania ', ' Sudan ', ' Uganda ', ' Togo ')
    8. Kjør appen. Den nye metadata-oppføringen skal vises som en umerket avmerkingsboks under den aktuelle overskriften. Hvis brukeren ønsker det å bli valgt, bør det legges til etter den valgte = c (..., som vist nedenfor:
      checkboxGroupInput (' CountryInput ', ' Velg relevante land ', c (' Burkina Faso ', ' Cote d'Ivoire ', ' Kamerun ', ' Ekvatorial-Guinea ', ' Zambia ', ' Tanzania ', ' Sudan ', ' Uganda ', ' Togo ', ' Gambia '), valgt = c (' Burkina Faso ', ' Cote d'Ivoire ', ' Kamerun ', ' Ekvatorial-Guinea ', ' Zambia ', ' Tanzania ', ' Sudan ', ' Uganda ', ' Togo ', ' Gambia ')
    9. For å legge til motstand datasett som ikke er utført på A-MEXP-2196, se avsnitt 3.

3. endre IR-TEx for bruk med forskjellige datasett

  1. Bruk på tvers av flere omics plattformer og fortsetter med manglende data
    1. For å fortsette med "0" i datasett: se datasett kilden for den spesifikke betydningen av "0". Det anbefales at "0" er (konservativt) erstattet med "NA". Som med rå fold endringer (B/A), "0" indikerer en uoppdaget signal i eksperimentell tilstand B. I det tilfelle at eksperimentell tilstand A utstillinger betydelig uttrykk, kan brukeren bruke en liten fold endre verdi.
    2. Åpne ytterligere fil 2. txt, en RNAseq fil tilpasset fra Uyhelji et al.9. Denne filen representerer malen der nye data skal baseres: kolonne A = identifikator, kolonne B = rå fold endring og kolonne C = justert p-verdi. Bruk denne filen til å kjøre gjennom trinnene nedenfor.
    3. Kjør R-koden for å samsvare identifikatorer i en enkelt tabulatordelt fil på tvers av plattformer, og organiser og normalisere dataene (Tilleggskode fil 2). Instruksjoner finnes i filen. Eventuelle FILEPATH vil bli skilt med "/" for MacOS eller "//" for Windows (endre disse fra "\", som de vil vises).
    4. Output filen produsert på slutten av supplerende Coding File 2 til en plassering av valget for bruk i trinn 3.1.5. Supplerende Coding File 2 vil sende ut en ny Fold_Changes. txt fil. Sikkerhetskopier den opprinnelige filen.
    5. Utfør koden som finnes i supplerende koding fil 3. Finn utdatafilen som heter FC_distribPlot. png i mappen som er angitt som FilePath. Sjekk fordelingen av loggen2 fold endre for å bekrefte at loggen2 fold endre distribusjoner er nesten identiske på tvers av datasett.
    6. Følg instruksjonene fra trinn 2.2.6 for å redigere flere filer og sikre kompatibiliteten til den nye Fold_Changes. txt.
  2. Endre IR-TEx for bruk med helt nye datasett
    1. Åpne IR-TEx. R i RStudio og Finn linjene (23 – 34) som begynner med:
      'tabPanel ('
      og slutter på:
      submitButton ("Oppdater visning", ikon ("refresh"))
      ),
    2. Endre AGAP008212-ra funnet i linjene nedenfor til en transkripsjon av interesse for de nye dataene.
      textInput (' textInput ', ' transkripsjon ID ', verdi = ' AGAP008212-RA '),
    3. Finn de fire alternativene som begynner med:
      checkboxGroupInput(
      Disse alternativene kan endres til å representere viktige metadata som brukeren ønsker å filtrere de nye dataene etter. I hver forekomst bør brukeren endre Velg relevante land; Velg eksponerings status; Velg relevante arter; og Velg insektmiddel klasse for å være representativ for dataene (dvs. Velg vevs type; Velg kjønn; Velg aldersgruppe; Velg sykdoms status).
    4. Identifiser metadataene som er tilknyttet datasettet og inn dataene, for å erstatte de eksisterende alternativene umiddelbart etter den første c ('. I hver forekomst vil alternativene ligge i tale merker og skilles fra det neste merkede området med komma. Etter det endelige valget bør braketten lukkes. Et eksempel på Velg sykdoms status er:
      c (' Infected ', ' infisert ', ' ukjent ')
    5. Velg hvilke av disse metadataene som skal velges når appen åpnes. Disse kan endres ved å endre alternativene etter valgt = c ('. Et eksempel på Velg sykdoms status er:
      Selected = c (' infisert ', ' infisert ')
      Dette vil instruere appen til å velge bare datasett som samsvarer med disse kriteriene ved første innlasting.
    6. Hvis du vil opprette en ny datatabell, følger du oppsettet som finnes i Fold_Changes. txt og instruksjonene i del 2. Endre metadataene til hver respektive endring skissert i trinn 3.2.4, akkurat som skrevet inn i koden (R skiller mellom store og små bokstaver). Into The avgiftning kolonnen, input gen navn, og i transkripsjon type kolonne, input gen beskrivelser for hver transkripsjon. Følg avsnitt 3,2 når du legger til nye datasett.
    7. Hvis tilordningen ikke er relevant for de eksperimentelle kravene, Finn følgende linjer med kode og plasser "#" foran:
      Linje 49 – 51:
      br (), br (),
      withSpinner (plotOutput ("geografi")),
      textOutput (' Geography_legend '),
      Linjer 493 starter:
      output $ geografi <-renderPlot ({
      Til linje 602 som slutter:
      output $ Geography_legend <-renderText ({
      Lim inn ("bare signifikante transkripsjoner (p", AS. Expression ("< ="), "0,05): FC > 5 = rød, FC > 1 = Amber, FC < 1 = grønn", Sep = "")
      })

Representative Results

Ved hjelp av Fold_Changes. txt-filen som følger med IR-TEx, sammenlignet vi transkripsjoner som var signifikant differensielt uttrykt i resistente Anopheles coluzzii og Anopheles gambiae datasett til mottakelige kontroller fra Elfenbenskysten og Burkina Faso. Dette gav 18 utskrifter av interesse (tabell 1; dette søket kan utføres ved hjelp av Excel, R eller andre programmer). To av disse, en ATPase (AGAP006879) og α-crystallin (AGAP007160), har tidligere blitt rapportert, med det tidligere har en betydelig effekt på pyrethroid motstand1. I tillegg til disse to transkripsjoner, var to avgiftning transkripsjoner, GSTMS1 (FCμ = 1,95 og 1,85) og UGT306A2 (FCμ = 2,29 og 2,28) til stede.

qPCR validering av to av disse transkripsjoner (GSTMS1, en avgiftning transkripsjon, og AGAP009110-ra, en ukjent, mygg-spesifikk transkripsjon inneholder en β-1, 3-Glukan bindende domene) ble utført som tidligere beskrevet1. Analysen ble utført ved hjelp av primer sett beskrevet i ytterligere fil 3 og viste at disse transkripsjoner var signifikant upregulated i en multiresistant befolkning fra Elfenbenskysten (Tiassalé) og en annen fra Burkina Faso (Banfora), sammenlignet med Lab-mottakelige N'Gousso (Figur 4a).

Begge transkripsjoner viste signifikant oppregulering i hver av de resistente populasjoner, RNAi-indusert knockdown ble utført på mygg fra LSTM laboratoriet Tiassalé koloni. Denne kolonien stammer fra Elfenbenskysten og er motstandsdyktig mot alle store klasser av insektmiddel brukes i folkehelsen, som tidligere beskrevet1,10. Demping av uttrykk for GSTMS1 resulterte i en signifikant økning (p = 0,021) i jordelivet etter deltamethrin eksponering SAMMENLIGNET med GFP-injisert kontroller, noe som viser viktigheten av denne transkripsjon i pyrethroid resistens (Figur 4B). AGAP009110-RA knockdown resulterte derimot i ingen signifikant (p = 0,082) endring i dødelighet etter eksponering (Figur 4B).

GSTMS1 er en mikrosomale GST og er en av tre funnet i a. gambiae mygg11. Selv om medlemmer av Epsilon og delta klasser av GSTs har tidligere vært innblandet i insektmiddel avrusning12,13,14, er dette det første beviset til vår kunnskap for en rolle mikrosomale GSTs i pyrethroid motstand15. For å utforske antatte funksjon av denne transkripsjon i Anopheles gambiae SL mygg, uttrykket og korrelasjon i IR-TEx ble identifisert. GSTMS1 var signifikant overexpressed i 20 av 21 datasett tilgjengelig for disse artene, med unntak av Bioko Island. I hvert sted var overuttrykte mindre enn fem ganger i forhold til mottakelige populasjoner (figur 5).

Som mikrosomale GSTs har i stor grad blitt ignorert som potensielle insektmiddel detoxifiers, lite er kjent om sin rolle i insektmiddel motstand15. Ved å utforske co-korrelasjon av andre transkripsjoner, antatte funksjoner kan belyst gjennom forutsetning av coregulation eller engasjement i samme trasé. For å maksimere kraften i korrelasjons nettverket ble alle Microarray datasett som finnes i IR-TEx valgt, og en | r | på > 0,75 ble valgt. Tabell 2 viser resultatet fra IR-TEx.

Disse transkripsjoner er beriket i oxioreductase aktivitet og glukose/karbohydrat metabolisme i DAVIDS funksjonelle merknadsverktøyet8. Både glukose-6-fosfat dehydrogenase og cytathione gamma-lyase opprettholde nivået av glutation i pattedyrceller16,17 og dermed koble direkte med GSTMS1, en glutation-S-glutamyltransferase. Catalase er en hurtigvirkende oksidativt stress responder som beskytter celler fra reaktive oksygen arter skade, et biprodukt av pyrethroid eksponering. Valacyclovir Hydrolase er en Hydrolase som kan spille en rolle i avgiftning i pattedyrceller18. CYP4H17 er også til stede i korrelasjon nettverket. Cytokrom p450s er direkte metabolizers av pyrethroid insektmidler, og disse sammenbrudd produkter kan bli ytterligere metaboliseres av GSTs. Endelig har CYP4H17 vært innblandet i pyrethroid resistens i A. funestus19. Samlet disse dataene støtter sterkt en rolle for GSTMS1 i xenobiotic oval avgiftning.

Figure 1
Figur 1: Logg2 fold endring av AGAP002865-ra i alle datasett. X-aksen detaljer de ulike datasettene, informasjon som kan finnes i supplerende tabell 1 i en tidligere publikasjon1, og y-aksen viser loggen2 fold endring i transkripsjon av interesse. Den lysegrå stiplede linjer indikerer omtrentlige terskler for betydning, tatt her for å være en fold endring av < 0.8 eller fold endring av > 1.2. Den stiplede svarte linjen indikerer en fold endring av 1 (dvs. ingen forskjell i uttrykk mellom resistente og mottakelige populasjoner). Vennligst klikk her for å se en større versjon av dette tallet.

Figure 2
Figur 2: fordeling av Microarrays som viser signifikant differensial uttrykk for AGAP002865-ra i resistente populasjoner. Fold endringer er representert i et trafikklys system: grønn fold endring av < 1, oransje fold endring av > 1, og rød fold endring av > 5. Bare datasett med signifikant (p ≤ 0,05) differensial uttrykk vises. Vennligst klikk her for å se en større versjon av dette tallet.

Figure 3
Figur 3: korrelasjon nettverk av AGAP001076-RA (CYP4G16). Parvis sammenhenger beregnes på tvers av alle transkripsjoner på tvers av 31 Microarray datasett, med en brukerdefinert cut-off anvendt. Vist her er (A) | r | > 0,9 og (B) | r | > 0,8. Alle transkripsjoner som vises på grafen oppfyller dette kriteriet og følger uttrykket endringer av AGAP001076-RA. Vennligst klikk her for å se en større versjon av dette tallet.

Figure 4
Figur 4: mRNA uttrykk og fenotype ved demping av GSTMS1 og AGAP009110-ra. (A) mRNA uttrykk for GSTMS1 og AGAP009110-ra i to multi-resistente en. Coluzzii populasjoner fra Elfenbenskysten og Burkina Faso, henholdsvis. Nivåene ble sammenlignet med Lab-mottakelige an. coluzzii N'Gousso. Viktighets nivåer beregnet av ANOVA med en post-hoc Dunnett test. (B) RNAi-indusert demping av begge transkripsjoner SAMMENLIGNET med GFP-injisert kontroller. GSTMS1 demping viser betydelig økning i dødelighet etter deltamethrin eksponering (beregnet av Anova med en post-hoc Tukey test; * p ≤ 0,05, * * p ≤ 0,01). Vennligst klikk her for å se en større versjon av dette tallet.

Figure 5
Figur 5: uttrykk for GSTMS1 i Anopheles gambiae og Anopheles coluzzii populasjoner. Kart som viser signifikant differensial uttrykk for GSTMS1 i tilgjengelige Microarray datasett. GSTMS1 ble funnet å være signifikant differensial i 20 av 21 Microarray datasett. Vennligst klikk her for å se en større versjon av dette tallet.

Transkripsjon ID Beskrivelse Burkina Faso Elfenbenskysten
AGAP006879-RA ATPase 27,94 43,05
AGAP007160-RB a-crystallin 11,49 10,58
AGAP007160-RC a-crystallin 11,14 10,38
AGAP007160-RA a-crystallin 9,78 9,84
AGAP009110-RA Ukjent 9,26 5,96
AGAP007780-RA NADH dehydrogenase 10,49 3,77
AGAP006383-RA oligosaccharyltransferase komplekse delenhet beta 3,69 5,57
AGAP007249-RB Flightin 4,61 3,86
AGAP003357-RA RAG1-aktivere protein 1-lignende protein 4,31 4,05
AGAP007249-RA Flightin 4,48 3,46
AGAP001998-RA mRpS10 3,46 2,85
AGAP007589-RA UGT306A2 2,29 2,28
AGAP000165-RA GSTMS1 1,95 1,85
AGAP002101-RA isoleucyl-tRNA syntetase 0,57 0,59
AGAP002969-RA asparaginyl-tRNA syntetase 0,45 0,45
AGAP004199-RA stoff carrier familie 5 (natrium-koplet monocarboxylate transporter), medlem 8 0,35 0,48
AGAP004684-RA rRNA-behandling protein CGR1 0,36 0,22
AGAP006414-RA Cht8 0,024 0,36

Tabell 1: transkripsjoner signifikant differensial i samme fold endre retning over Burkina Faso og Elfenbenskysten populasjoner. Transkripsjon ID, gen beskrivelse, og gjennomsnittlig fold endring for hvert datasett fra de to landene som representerer en. coluzzii og en. gambiae populasjoner.

Korrelasjon Systematisk navn Transkripsjon type
1 AGAP000165-RA GSTMS1
0,82 AGAP004904-RA Catalase
0,76 AGAP007243-RA 26S protease regulatoriske delenhet 8
0,79 AGAP008358-RA CYP4H17
0,76 AGAP009436-RA Valacyclovir Hydrolase
0,75 AGAP010739-RA Glukose-6-fosfat 1-dehydrogenase
0,85 AGAP011172-RA cystathionine gamma-lyase
0,76 AGAP012678-RA Glukose-6-fosfat 1-dehydrogenase

Tabell 2: transkripsjoner co-korrelert med GSTMS1. Tabellen viser utdata fra korrelasjons nettverket for GSTMS1 på IR-TEx med | r | på > 0,75. Tabellen viser Spearman korrelasjon, transkripsjon ID, og gen beskrivelse for hver co-korrelert transkripsjon.

Tilleggsfil 1: utdatafil fra A-MEXP-2196 array analysert på limma. Filen stammer fra en Met knockdown sammenlignet med en GFP kontroll array, beskrevet i mer detalj i ARRAYEXPRESS (E-MTAB-4043) og en annen tidligere publikasjon1. Kolonner representerer AGAP-ID (SystematicName), Logg endringer (logFC), Logg uttrykks verdier (AveExpr), t-statistikk (t), uncorrected p-verdi (P. Value), justert p-verdi (justering. P. Val) og B-statistikken (B)20. Ved anvendelsen av denne filen, myggen er Anopheles coluzzi fra Elfenbenskysten og er ueksponerte til insektmidler, med en samling breddegrad og lengdegrad for-5,4 og 6,0, henholdsvis. Vennligst klikk her for å se denne filen (Høyreklikk for å laste ned).

Ytterligere fil 2: output fil fra RNAseq eksperimentet. RNAseq analyse Hentet fra Uyhelji et al.9 beskrive endringer i Transcriptome av Anopheles mygg når de utsettes for 50% saltinnhold. Denne filen er tilpasset fra tabell S2 i publikasjonen og inkluderer AGAP identifikator (SystematicID), rå fold endring (Fold_Change), og justert p-verdi (q_value). Vennligst klikk her for å se denne filen (Høyreklikk for å laste ned).

Ytterligere fil 3: primer liste for representative resultater. AGAP identifikator, gen navn, dsRNA fremover, dsRNA revers, qPCR fremover, og qPCR omvendt primer sett for hver transkripsjon. Vennligst klikk her for å se denne filen (Høyreklikk for å laste ned).

Supplerende koding fil 1. Vennligst klikk her for å se denne filen (Høyreklikk for å laste ned).

Supplerende koding fil 2. Vennligst klikk her for å se denne filen (Høyreklikk for å laste ned).

Supplerende koding fil 3. Vennligst klikk her for å se denne filen (Høyreklikk for å laste ned).

Discussion

Big data transcriptomics produserer lister over tusenvis av transkripsjoner som er differensielt uttrykt for hver eksperimentelle tilstand. Mange av disse eksperimentene er utført på beslektede organismer og fenotyper og er nesten utelukkende analysert som uavhengige eksperimenter. Bruk av disse rike datakilder ved å undersøke dataene helhetlig og uten teoretiske forutsetninger vil 1) føre til identifisering av ny kandidat transkripsjoner og 2) hindre forkaster av verdifulle data bare fordi det er for mye informasjon å validere in vivo1.

IR-TEx gir brukere en begrenset bioinformatikk bakgrunn med muligheten til enkelt å undersøke flere datasett, visualisere endringer i datasettene og laste ned den tilknyttede informasjonen1. Selv om IR-TEx ikke støtter søking etter mer enn én transkripsjon i hvert søk, kan brukerne undersøke de tilknyttede Fold_Changes. txt-filene ved hjelp av Excel, R eller andre aktuelle programmer. Videre nytte av IR-TEx stammer fra bruk av korrelasjon nettverk for å forutsi transkripsjon funksjon, input av hypotetiske proteiner eller transkripsjoner med ukjente funksjoner og bruk av nedstrøms programvare for å søke etter elementene1.

I eksempelet demonstrert i denne protokollen, er IR-TEx brukes i henhold til sin opprinnelige funksjon. Her tillater det utforskning av transkripsjoner forbundet med insektmiddel motstand og visualisering av fordelingen av over-og under-uttrykk gjennom kartlegging grafikk. Transkripsjoner av interesse er validert in vivo for å avgjøre om over-eller under-uttrykk for gitte transkripsjoner bidrar til en observert fenotype1 (f.eks. insektmiddel motstand). Det ble demonstrert her, som tidligere rapportert1, at et datasett kan brukes i en hypotese-drevet tilnærming for å identifisere transkripsjoner av interesse på et land-spesifikk basis. IR-TEx kan deretter brukes til 1) utforske uttrykk for transkripsjon og 2) kontekstualisere transkripsjon funksjon ved å bruke en parvis korrelasjon nettverk på tvers av alle transkripsjoner som finnes i hver-omics datasett. Her ble GSTMS1 vist å være co-korrelert med en rekke andre transkripsjoner innblandet i avgiftning. Disse dataene (sammen med knockdown av transkripsjon som resulterte i en betydelig økning i dødelighet etter insektmiddel eksponering) demonstrerer viktigheten av denne transkripsjon i xenobiotic oval clearance.

IR-TEx representerer en verdifull ressurs for å utforske insektmiddel resistens-relaterte transkripsjoner på nettet eller ved hjelp av lokale programmer. Denne protokollen demonstrerer hvordan du endrer IR-TEx for ulike omics plattformer, så vel som helt nye data. Guiden illustrerer hvordan du bruker IR-TEx til å integrere data fra omics plattformer og datasett med manglende informasjon, samt hvordan du Recode IR-TEx enkelt så det er nyttig for alle som undersøker transcriptomic datasett.

Disclosures

Forfatterne har ingenting å avsløre.

Acknowledgments

Dette arbeidet ble finansiert av et MRC kompetanse utviklings fellesskap til V.I. (MR/R024839/1) og Royal Society Challenge Grant (CH160059) til HR

Materials

Name Company Catalog Number Comments
Laptop with browser Any - -
R Program The R Project for Statistical Computing - https://www.r-project.org/
R Studio R Studio - https://www.rstudio.com/

DOWNLOAD MATERIALS LIST

References

  1. Ingham, V. A., Wagstaff, S., Ranson, H. Transcriptomic meta-signatures identified in Anopheles gambiae populations reveal previously undetected insecticide resistance mechanisms. Nature Communications. 9, (1), 5282 (2018).
  2. Chang, W., Cheng, J., Allaire, J., Xie, Y., McPherson, J. shiny: Web Application Framework for R. (2017).
  3. Bhatt, S., et al. The effect of malaria control on Plasmodium falciparum in Africa between 2000 and 2015. Nature. 526, (7572), 207-211 (2015).
  4. Ranson, H., Lissenden, N. Insecticide Resistance in African Anopheles Mosquitoes: A Worsening Situation that Needs Urgent Action to Maintain Malaria Control. Trends in Parasitology. 32, (3), 187-196 (2016).
  5. Donnelly, M. J., et al. Does kdr genotype predict insecticide-resistance phenotype in mosquitoes. Trends in Parasitology. 25, (5), 213-219 (2009).
  6. Stevenson, B. J., et al. Cytochrome P450 6M2 from the malaria vector Anopheles gambiae metabolizes pyrethroids: Sequential metabolism of deltamethrin revealed. Insect Biochemistry and Molecular Biology. 41, (7), 492-502 (2011).
  7. Müller, P., et al. Field-Caught Permethrin-Resistant Anopheles gambiae Overexpress CYP6P3, a P450 That Metabolises Pyrethroids. PLoS Genetics. 4, (11), 1000286 (2008).
  8. Huang, D., et al. The DAVID Gene Functional Classification Tool: a novel biological module-centric algorithm to functionally analyze large gene lists. Genome Biology. 8, (9), 183 (2007).
  9. Uyhelji, H. A., Cheng, C., Besansky, N. J. Transcriptomic differences between euryhaline and stenohaline malaria vector sibling species in response to salinity stress. Molecular Ecology. 25, (10), 2210-2225 (2016).
  10. Edi, C. V., Benjamin, K. G., Jones, C. M., Weetman, D., Ranson, H. Multiple-Insecticide Resistance in Anopheles gambiae Mosquitoes, Southern Côte d’Ivoire. Emerging Infectious Diseases. 18, (9), 1508-1511 (2012).
  11. Ding, Y., Ortelli, F., Rossiter, L., Hemingway, J., Ranson, H. The Anopheles gambiae glutathione transferase supergene family: annotation, phylogeny and expression profiles. BMC Genomics. 4, (1), 1-16 (2003).
  12. Enayati, A. A., Ranson, H., Hemingway, J. Insect glutathione transferases and insecticide resistance. Insect Molecular Biology. 14, (1), 3-8 (2005).
  13. Ranson, H., et al. Identification of a novel class of insect glutathione S-transferases involved in resistance to DDT in the malaria vector Anopheles gambiae. The Biochemical Journal. 359, 295-304 (2001).
  14. Riveron, J. M., et al. A single mutation in the GSTe2 gene allows tracking of metabolically based insecticide resistance in a major malaria vector. Genome Biology. 15, (2), 27 (2014).
  15. Pavlidi, N., Vontas, J., Van Leeuwen, T. The role of glutathione S-transferases (GSTs) in insecticide resistance in crop pests and disease vectors. Current Opinion in Insect Science. 27, 97-102 (2018).
  16. Salvemini, F., et al. Enhanced glutathione levels and oxidoresistance mediated by increased glucose-6-phosphate dehydrogenase expression. Journal of Biological Chemistry. 274, (5), 2750-2757 (1999).
  17. Deplancke, B., Gaskins, H. R. Redox control of the transsulfuration and glutathione biosynthesis pathways. Current Opinion in Clinical Nutrition & Metabolic Care. 5, (1), (2002).
  18. Puente, X. S., López-Otn, C. Cloning and expression analysis of a novel human serine hydrolase with sequence similarity to prokaryotic enzymes involved in the degradation of aromatic compounds. Journal of Biological Chemistry. 270, (21), 12926-12932 (1995).
  19. Riveron, J. M., et al. Genome-wide transcription and functional analyses reveal heterogeneous molecular mechanisms driving pyrethroids resistance in the major malaria vector Anopheles funestus across Africa. G3: Genes, Genomes, Genetics. 7, (6), 1819-1832 (2017).
  20. Smyth, G. K. Linear models and empirical bayes methods for assessing differential expression in microarray experiments. Statistical Applications in Genetics and Molecular Biology. 3, (1), 3 (2004).

Comments

0 Comments


    Post a Question / Comment / Request

    You must be signed in to post a comment. Please or create an account.

    Usage Statistics