Waiting
Login processing...

Trial ends in Request Full Access Tell Your Colleague About Jove
Click here for the English version

Biology

IR-TEx: en open source data integration værktøj til Big data transkriptomics designet til malaria vektor Anopheles malariamyg

Published: January 15, 2020 doi: 10.3791/60721

Summary

IR-TEx udforsker insekt bekæmpende modstands relaterede transkriptionelle profiler i arten Anopheles malariamyg. Forudsat her er fulde instruktioner til brug af programmet, ændringer for at udforske flere transcriptomic datasæt, og ved hjælp af rammerne til at opbygge en interaktiv database for samlinger af transkriptomic data fra enhver organisme, genereret i enhver platform.

Abstract

IR-TEx er et program skrevet i skinnende (en R-pakke), der tillader udforskning af ekspression af (samt tildele funktioner til) udskrifter, hvis udtryk er forbundet med insektresistens fænotyper i Anopheles malariamyg mosquitoes. Applikationen kan bruges online eller downloades og bruges lokalt af alle. Det lokale program kan ændres for at tilføje nye insekters resistens datasæt genereret fra multi-omics-platforme. Denne vejledning viser, hvordan du tilføjer nye datasæt og håndterer manglende data. Desuden kan IR-TEx være helt og let omlægges til at anvende data fra enhver form for eksperimenter, hvilket gør det til en værdifuld ressource for mange forskere. Protokollen illustrerer nytten af IR-TEx i at identificere nye insektresistens kandidater ved hjælp af den mikrosomale glutathion transferase, GSTMS1, som et eksempel. Denne udskrift er upregulated i flere pyrethroide resistente populationer fra Côte D'Ivoire og Burkina Faso. Identifikationen af co-korrelerede udskrifter giver yderligere indsigt i de formodede roller af dette gen.

Introduction

Evnen til at måle ekspression af et stort antal udskrifter samtidigt gennem mikroarray-platforme og RNAseq-teknologi har resulteret i generering af store datasæt, der knytter transskriptionen til en bestemt fænotype i både model-og ikke-modelorganismer. Disse datasæt er en ekstremt rig ressource for forskere, hvis effekt kan øges ved at kombinere relevante sæt i en Big dataintegration tilgang. Denne metode er dog begrænset til personer med særlige Bioinformatik færdigheder. Beskrevet her er et program, IR-TEx (tidligere udgivet af Ingham et al.1), der er skrevet i en R-pakke kaldet Shiny2 og giver brugerne med lidt Bioinformatik uddannelse til at integrere og afhøre disse datasæt med relativ lethed.

IR-TEx, fundet på http://www.lstmed.ac.uk/projects/IR-TEx, blev skrevet for at udforske udskrifter forbundet med insektresistens i Anopheles malariamyg, den store afrikanske malaria vektor1. Malaria er en parasitisk sygdom forårsaget af Plasmodium arter, overføres mellem mennesker gennem bid af kvindelige Anopheles myg. Målretning af myg vektor med insekticider har vist sig at være den mest effektive middel til at forebygge malaria-relaterede sygelighed og dødelighed i Afrika. Opskalering af værktøjer (dvs. langtidsholdbare insekt bekæmpende garn) har også været afgørende i de dramatiske reduktioner i malaria tilfælde siden 20003. Med et meget begrænset antal insekticider til rådighed, er det stærkt evolutionært pres på myg, og modstanden er nu udbredt i afrikanske malaria vektorer4.

Derudover er Target site mutationer5 og metabolisk clearance af insekticider6,7 fortsat de primære studerede mekanismer af resistens, men andre potente resistente mekanismer er nu nye1. Mange af disse nye mekanismer har ikke tidligere været forbundet med insekt bekæmpende resistens, men er blevet påvist ved at søge efter fælles mønstre for genekspression på tværs af flere resistente populationer ved hjælp af IR-TEx app og efterfølgende funktionelt valideret af genomforskning tilgange1.

Beskrevet her er en trinvis tilgang til at bruge IR-TEx, både på nettet og når de installeres lokalt. Protokollen beskriver, hvordan nye data om insekternes resistens kan integreres i den eksisterende pakke og forklarer, hvordan de skal fungere med manglende oplysninger. Endelig, det beskriver, hvordan man bruger denne software med andre-omics datasæt, der ikke er relateret til insekt bekæmpende resistens, og dermed kombinere data fra varierende omics tilgange, mens også opererer med manglende værdier og normalisering, så data er sammenlignelige.

Protocol

1. brug af IR-TEx-webapplikationen

  1. Køre programmet i en webbrowser
    1. Åbn IR-TEx-webprogrammet ved at følge linket nederst på siden, som findes på http://www.lstmed.ac.uk/projects/IR-TEx.
    2. Når websiden er initialiseret, skal du klikke på applikations knappen øverst på siden, som viser applikationen og de tilhørende udgange.
    3. Læs hvert output i forbindelse med standardindgangen for AGAP008212-RA (CYP6M2) i feltet transkriptid med følgende betingelser: et. coluzzii -datasæt, der er (i) eksponeret for pyrethroidinsekt bekæmpende midler eller (II) ikke eksponeret for insekticid klasse, og tilhørende udskrifter med en korrelation på | r | > 0.98.
  2. Undersøgelse af udtryk for en udskrift af interesse
    1. Hvis du vil vælge en udskrift af interesse, skal du indtaste transskriptions-id'et i feltet transskription-id og huske, at transskriptioner slutter i RX afhængig af isoform af interesse.
    2. Vælg de datasæt, du vil afhøre ved at afkryde de relevante rubrikker for (i) lande; II) eksponerings status, III) arter af interesse og (IV) Insektorklasse af interesse, samtidig med at det sikres, at disse kriterier resulterer i > 1 inkluderet datasæt (Se supplerende tabel 1 i Ingham et al.1).
      Bemærk: (III) henviser til det medlem af an. malariamyg Arts Complex, som brugeren er interesseret i. I øjeblikket er data tilgængelige for en. coluzzii og en. arabiensis.
    3. Klik på Opdater visning nederst i menuen valg, eller tryk på Returtastenfor at ignorere den absolutte korrelations værdi (for nu).
    4. Giv programmet tid til at opdatere.
    5. Læs den første graf som: log2 fold Skift mellem en resistent population og lab-modtagelig myg population af udskriften af interesse på tværs af hvert datasæt, der opfylder kriterierne valgt i trin 1,2 (figur 1). Detaljerne for alle datasæt findes i Ingham et al.1.
    6. Læs oplysningerne under grafen som: folden skifter mellem de resistente og modtagelige myg for hvert relevant datasæt ud over de korrigerede p-værdier (Q). Hver række repræsenterer individuelle sonder på mikromatrixen. Metoden til grafisk visning er tidligere blevet rapporteret1.
    7. Læs den ekstra tabel nedenfor som antallet af eksperimenter, hvor udskriften af interesse er signifikant, samt det samlede antal eksperimenter, der svarer til de kriterier, der blev valgt i trin 1,2.
    8. Hvis du vil hente dataene i tabulatorsepareret format, skal du klikke på knappen Hent under de to tabeller. Dette giver brugeren mulighed for at udforske data på en nemmere måde ved hjælp af et program som Excel.
    9. Fortolke kortet som følger: hvert punkt repræsenterer de omtrentlige indsamlingssteder for resistente myg i hvert datasæt, hvor udskriften af interesse er differentieret udtrykt. Farverne følger et trafiklys system, der forklares i appen (figur 2).
    10. For trin 1.2.5 og 1.2.8 skal du gemme de grafiske udgange ved at højreklikke, klikke på Gem billede som... og vælge en passende mappe.
      Bemærk: i tilfælde af en output fejl af programmet, er det sandsynligt, at ingen datasæt matcher de indtastede kriterier. Tjek supplerende tabel 1 i Ingham et al.1 , hvis dette sker.
  3. Identificering af formodede funktioner/forløb af afskrift af interesse
    1. Korrelationer (minimum r2 værdi indtastet) af udtrykket mønstre af udskrifter på tværs af flere datasæt kan bruges til at forudsige transskriptionen funktion og potentielt belyse coregulerede udskrifter fra samme vej. Brug af eksemplet fra Ingham et al.1 (AGAP001076-RA; CYP4G16), Følg trin 1.2.1-1.2.2 i afsnittet ovenfor, og vælg alle datasæt for maksimal effekt.
    2. Før du klikker på Opdater visning, skal du flytte skyderen absolut korrelations værdi til 0,85 og klikke på Opdater visning eller trykke på retur.
    3. Undersøg sammenligningstabellen (nederste tabel) for at finde de flere udskrifter, der nu vises og er korrelerede (| r | = 0,85) med det indtastede transskriptet.
    4. Manipulere skyderen absolutte korrelations værdi og observere eventuelle ændringer i den nederste graf og tabel; output fra trin 1.3.2 vil forblive uændret. Som vist i figur 3 (| r | > 0,9, | r | > 0,8) vil en sænkning af korrelations værdiens strenghed vise flere udskrifter, men vil introducere mere støj.
    5. Læs tabellen under den grafiske udgang, som (ud over de parametre, der er beskrevet i trin 1.2.6) indeholder korrelations værdien for hver udskrift.
    6. Hvis du vil hente dataene i et tabulatorsepareret format, skal du klikke på knappen Hent .
    7. Funktionel berigelse analyse kan udføres på den downloadede transkriptionsid liste ved hjælp af DAVID Analysis8. Når du er på DAVID-webstedet (findes på https://David.ncifcrf.gov/), skal du vælge funktionel analyse. Indsæt hele genlisten ved hjælp af genid'er [identifikator uden-RX, hvilket kan gøres i Excel ved at indsætte en kolonne til højre for det systematiske ID og skrive = Left (x1, 10), hvor x1 er den systematiske id-celle]. Vælg id'et som VectorBase_ID og genliste, og klik på Send liste.
    8. Klik på knappen funktionel anmærknings klynge for at give en oversigt over de beridelser, der findes i dette korrelations netværk, så der kan tildeles en potentiel funktion til udskriften. Udforsk dybtgående beridelser ved at kigge gennem de forskellige kategorier og klikke på + knapperne for hver og derefter klikke på diagram.

2. download og implementering af IR-TEx lokalt

  1. Download og kørsel af IR-TEx
    1. Gå til linket findes på http://github.com/LSTMScientificComputing/IR-TEx; og klik på klon eller download | Hent zip. Direkte til en mappe af valg og unzip filen i denne mappe.
    2. Download den nyeste version af R software til det relevante operativsystem fra linket findes på http://Cran.r-Project.org/mirrors.html. Installere programmet.
    3. Download og Installer den nyeste R Studio software, igen for det relevante operativsystem fra linket findes på http://www.rstudio.com/products/rstudio/download/.
    4. Når det er installeret, åben R Studio | Supplerende kodnings fil 1 , og Kør hver linje for at konfigurere systemet til IR-TEx.
    5. Når alle pakker er installeret og opdateret efter behov, skal du gå til fil | Åbn, Find IR-TEx. R, Fremhæv, og Åbn. Dette bør nu være synlig i det øverste vindue i R Studio.
    6. Hvis du vil køre appen, skal du trykke på knappen Kør app øverst til højre i vinduet, hvorefter der vises et andet vindue, hvor appen indlæses. Når belastningen er færdig, for fuld funktionalitet Klik på Åbn i browser placeret øverst til højre i det indlæste vindue.
  2. Tilføjelse af modstands datasæt til IR-TEx (genereret ved hjælp af Anopheles malariamyg 15k Agilent array)
    1. Hvis du vil tilføje et nyt analyseret datasæt, der genereres på den samme microarray platform (A-MEXP-2196), til det tilgængelige datasæt, skal du downloade appen og finde den udpakkede mappe, der er hentet i afsnit 2,1.
    2. Åbn yderligere fil 1, som repræsenterer et output fra en limma-analyse på a-mexp-2196 1. Brug Excel, i kolonne H1, Skriv Fold_Change, og i H2, Skriv = 2 ^ B2, hvor B2 er loggen fold ændring. Anvend dette i hele kolonne H for at producere rå fold ændringer.
    3. Arranger yderligere fil 1 sådan, at kolonne A er id'et, kolonne B er fold ændringen fra kolonne h (Kopiér kolonne h, Fremhæv kolonne B, højreklik og Indsæt værdier) og kolonne C er den justerede p-værdi. Slet alle andre kolonner, og Gem som en tabulatorsepareret fil.
    4. Åbn supplerende kodnings fil 2 , og Kør ved hjælp af det tabulatorseparerede ark, der produceres i trin 2.2.3.
      NEWFILE_FC = c (» land «,» eksponerings STATUS «,» art «,» INSEKDE «)
      NEWFILE_Q = c (» land «,» eksponerings STATUS «,» art «,» INSEKDE «)
      Bemærk: felter inden for enkelte anførselstegn skal ændres, så de afspejler oplysninger fra det nye datasæt. Eksponerings status refererer til, om der er indsamlet prøver efter insekternes eksponering (eksponeret/ikke eksponeret). Insektet: Hvis ' ikke eksponeret ', skal du bruge ' none '. Se Fold_Changes. txt. metadata fra andre prøver. Kontroller, at stavning er konsistent.
    5. Åbn geografi. txt, Rul til den endelige besatte række, og vælg nedenfor. Indtast navnet på datasættet efterfulgt af Q og NEWFILE_Q i kolonne 1, breddegraden af prøve indsamlingsstedet i kolonne 2 og længdegraden i kolonne 3. Gem ændringerne.
    6. Hvis der anvendes nye angivelser (f. eks. Gambia), som ikke kan vælges i datasættet (Se Ingham et al. supplerende tabel 11), skal disse tilføjes i koden. For at gøre dette, skal du åbne IR-TEx. R i RStudio og finde linje 26 som angivet af RStudio, hvorefter følgende skal begynde:
      'Sidebarpanel (.... '.
      Bemærk: hver af procedure rækkerne relaterer til et metadataelement, som indsættes i rækkerne under Datasætnavnet i Fold_Changes. txt i trin 2.2.5.
    7. Hvis du vil tilføje de nye metadata, skal du rulle til slutningen af linjen med de foretrukne metadata og finde udtrykket ' Selected = '. Umiddelbart efter dette bør være et komma og lukket beslag; på dette tidspunkt, klik på markøren i den lukkede beslag. Efter den sidste apostrof, Skriv et komma, efterfulgt af en apostrof, efterfulgt af de nye metadata (f. eks ' Gambia '), og gemme ændringerne. Se nedenfor for et eksempel.
      checkboxGroupInput (» CountryInput «,» udvalgte relevante lande «, c (» Burkina Faso «,» Cote D'Ivoire «,» Cameroun «,» Ækvatorialguinea «,» Zambia «,» Tanzania «,» Sudan «,» Uganda «,» Togo «, » Gambia «), udvalgt = c (» Burkina Faso «,» Cote d'Ivoire «,» Cameroun «,» Ækvatorialguinea «,» Zambia «,» Tanzania «,» Sudan «,» Uganda «,» Togo «)
    8. Kør appen. Den nye metadatapost skal vises som et ikke-markeret afkrydsningsfelt under den relevante overskrift. Hvis brugeren ønsker det skal vælges, skal det tilføjes efter den valgte = c (..., som vist nedenfor:
      checkboxGroupInput (» CountryInput «,» udvalgte relevante lande «, c (» Burkina Faso «,» Cote D'Ivoire «,» Cameroun «,» Ækvatorialguinea «,» Zambia «,» Tanzania «,» Sudan «,» Uganda «,» Togo «, » Gambia «), udvalgt = c (» Burkina Faso «,» Cote d'Ivoire «,» Cameroun «,» Ækvatorial Guinea «,» Zambia «,» Tanzania «,» Sudan «,» Uganda «,» Togo «, » Gambia «))
    9. For at tilføje modstands datasæt, der ikke udføres på A-MEXP-2196, se afsnit 3.

3. ændring af IR-TEx til brug med forskellige datasæt

  1. Brug på tværs af multi-omics platforme og fortsætter med manglende data
    1. Hvis du vil fortsætte med "0" i datasæt: Se datasætkilden for den specifikke betydning af "0". Det anbefales, at "0" er (konservativt) erstattet med "NA". Som med rå fold ændringer (B/A), "0" indikerer et uopdaget signal i eksperimentel tilstand B. I tilfælde af, at eksperimentel tilstand A udviser betydelige udtryk, kan brugeren anvende en lille fold ændre værdi.
    2. Åbn yderligere fil 2. txt, en RNAseq-fil tilpasset fra Uyhelji et al.9. Denne fil repræsenterer den skabelon, som nye data skal baseres på: kolonne A = identifikator, kolonne B = rå fold ændring og kolonne C = justeret p-værdi. Brug denne fil til at køre gennem nedenstående trin.
    3. Kør R-koden for at matche id'er til en enkelt tabulatorsepareret fil på tværs af platforme, og Organiser og normaliserer derefter dataene (supplerende kodnings fil 2). Instruktionerne er indeholdt i filen. Enhver FILEPATH vil blive adskilt af "/" for MacOS eller "//" for Windows (ændre disse fra "\", som de vil blive vist).
    4. Output filen produceret i slutningen af supplerende kodning fil 2 til en placering af valg til brug i trin 3.1.5. Supplerende kodnings fil 2 vil udsende en ny Fold_Changes. txt -fil. Sikkerhedskopiere den oprindelige fil.
    5. Udfør koden indeholdt i supplerende kodning fil 3. Find outputfilen med navnet FC_distribPlot. png i den mappe, der er angivet som FilePath. Kontroller fordelingen af log2 fold Change for at kontrollere, at loggen2 fold Change distributioner er næsten identiske på tværs af datasæt.
    6. Følg instruktionerne fra trin 2.2.6 for at redigere yderligere filer og sikre kompatibiliteten af den nye Fold_Changes. txt.
  2. Ændring af IR-TEx til brug med helt nye datasæt
    1. Åbn IR-TEx. R i rstudio og Find linjerne (23 – 34) begyndende med:
      »TabPanel ('
      og slutter i:
      submitButton ("opdaterings visning", ikon ("refresh"))
      ),
    2. Skift AGAP008212-RA , der findes i nedenstående linjer, til en udskrift af interesse i de nye data.
      textInput ("textInput", "Transkriptet ID", value = ' AGAP008212-RA '),
    3. Find de fire indstillinger, som begynder med:
      checkboxGroupInput (
      Disse indstillinger kan ændres, så de repræsenterer vigtige metadata, som brugeren ønsker at filtrere de nye data efter. I hvert enkelt tilfælde skal brugeren ændre de udvalgte relevante lande. Vælg eksponerings status; Udvælge relevante arter og Vælg Insektelklasse for at være repræsentativ for dataene (dvs. vælge vævs type; Vælg køn; Vælg aldersgruppe; Vælg sygdoms status).
    4. Identificer de metadata, der er knyttet til datasættet, og input til at erstatte de eksisterende indstillinger umiddelbart efter den første c ('. I hvert enkelt tilfælde vil indstillingerne være indeholdt i tale mærkerne og adskilles fra den næste markering med et komma. Efter den endelige udvælgelse, skal beslaget lukkes. Et eksempel på Select disease status er:
      c (» inficeret «,» ikke-inficeret «,» ukendt «)
    5. Vælg, hvilke af disse metadata der skal vælges ved åbning af appen. Disse kan ændres ved at ændre indstillingerne efter valgt = c ('. Et eksempel på Select disease status er:
      Selected = c ("inficeret", "ikke-inficeret")
      Dette vil instruere appen til kun at vælge datasæt, som matcher disse kriterier ved første indlæsning.
    6. Hvis du vil oprette en ny datatabel, skal du følge det layout, der findes i Fold_Changes. txt og instruktionerne i afsnit 2. Skift metadata til hver enkelt ændring, der er skitseret i trin 3.2.4, nøjagtigt som skrevet i koden (R er store og små bogstaver). I kolonnen afgiftning, input-gennavne og i kolonnen afskrift type, input genbeskrivelser for hver udskrift. Følg afsnit 3,2, når du tilføjer nye datasæt.
    7. Hvis tilknytningen ikke er relevant for forsøgskravene, skal du finde følgende kodelinjer og placere ' # ' foran:
      Linje 49 – 51:
      br (), br (),
      withSpinner (plot output ("geografi")),
      textOutput (' Geography_legend ')
      Linje 493 start:
      udgang $ geografi <-renderPlot ({
      Til linje 602 slutter:
      output $ Geography_legend <-renderText ({
      paste ("kun signifikante udskrifter (p", som. Expression ("< ="), "0,05): FC > 5 = rød, FC > 1 = rav, FC < 1 = grøn", sep = "")
      })

Representative Results

Ved hjælp af Fold_Changes. txt-filen, der fulgte med IR-TEx, sammenlignede vi udskrifter, som var signifikant differentieret i resistente Anopheles coluzzii og Anopheles malariamyg -datasæt til modtagelige Kontroller fra Côte d'Ivoire og Burkina Faso. Dette gav 18 udskrifter af interesse (tabel 1; denne søgning kan udføres ved hjælp af Excel, R eller andre programmer). To af disse, en ATPase (AGAP006879) og α-crystallin (AGAP007160), er tidligere blevet rapporteret, idet førstnævnte har en signifikant virkning på pyrethroideresistens1. Ud over disse to udskrifter, to afgiftnings transskriptioner, GSTMS1 (FCμ = 1,95 og 1,85) og UGT306A2 (FCμ = 2,29 og 2,28) var til stede.

qPCR validering af to af disse udskrifter (GSTMS1, en afgiftning afskrift; og AGAP009110-RA, en ukendt, myg-specifikke afskrift indeholdende en β-1, 3-glucan bindende domæne) blev udført som tidligere beskrevet1. Analyse blev udført ved hjælp af primer sæt beskrevet i yderligere fil 3 og viste, at disse udskrifter var signifikant upregulated i en multiresistent population fra Côte d'Ivoire (Tiassalé) og en anden fra Burkina Faso (Banfora), sammenlignet med Lab-følsomme N'Gousso (figur 4a).

Da begge udskrifter viste signifikant docetaxels Opregulering i hver af de resistente populationer, RNAi-induceret Knockdown blev udført på myg fra lstm laboratorium tiassalé koloni. Denne koloni stammer fra Côte d'Ivoire og er modstandsdygtig over for alle større klasser afinsekti, der anvendes i folkesundheden, som tidligere beskrevet som1,10. Dæmpning af ekspression af GSTMS1 resulterede i en signifikant stigning (p = 0,021) i dødeligheden efter deltamethrin eksponering sammenlignet med gfp-injicerede Kontroller, hvilket viste betydningen af denne udskrift i pyrethroid resistens (figur 4B). Omvendt resulterede AGAP009110-RA-Knockdown ikke i nogen signifikant (p = 0,082) ændring i dødelighed efter eksponering (figur 4B).

GSTMS1 er en mikrosomal GST og er en af tre fundet i a. malariamyg myg11. Selv om medlemmerne af Epsilon-og Delta-klasserne af gsts tidligere har været impliceret i insekt bekæmpende afgiftning12,13,14, er dette det første bevis på vores viden om en rolle som mikrosomale gsts i pyrethroid Resistance15. For at udforske den formodede funktion af denne udskrift i Anopheles malariamyg SL myg, blev udtrykket og korrelationen i IR-TEx identificeret. GSTMS1 var signifikant overudtrykt i 20 ud af 21 datasæt til rådighed for disse arter, med undtagelse af Bioko Island. På hvert sted var overekspression mindre end fem gange sammenlignet med de modtagelige populationer (figur 5).

Da mikrosomale GSTs i vid udstrækning er blevet ignoreret som potentielle insektide afgiftnings midler, er der kun lidt kendskab til deres rolle i insekt bekæmpel-resistens15. Ved at udforske Co-korrelationen mellem andre udskrifter, kan formodede funktioner belyses ved antagelse af koregulering eller involvering i de samme veje. For at maksimere strømmen i korrelations netværket blev alle mikroarray datasæt til stede i IR-TEx valgt, og en | r | af > 0,75 blev valgt. Tabel 2 viser outputtet fra IR-TEx.

Disse udskrifter er beriget med oxioreductase aktivitet og glukose/kulhydrat metabolisme i DAVIDS funktionelle annotation værktøj8. Både glucose-6-fosfat dehydrogenase og cytathion gamma-lyase opretholder niveauet af glutathion i pattedyrsceller16,17 og dermed linker direkte med GSTMS1, en glutathion-S-transferase. Catalase er en hurtigtvirkende oxidativ stress responder, der beskytter celler mod reaktive oxygenarter skader, et biprodukt af pyrethroid eksponering. Valacyclovir hydrolase er en hydrolase, der kan spille en rolle i afgiftning i pattedyrsceller18. CYP4H17 er også til stede i korrelations netværket. Cytochrom p450s er direkte metabolisatorer af pyrethroid insekticider, og disse nedbrydningsprodukter kan yderligere metaboliseres af GSTs. Endelig, CYP4H17 har været impliceret i pyrethroid resistens i A. funestus19. Tilsammen støtter disse data kraftigt en rolle for GSTMS1 i xenobiotisk afgiftning.

Figure 1
Figur 1: log2 fold ændring af AGAP002865-RA i alle datasæt. X-aksen beskriver de forskellige datasæt, oplysninger, som kan findes i supplerende tabel 1 i en tidligere publikation1, og y-aksen viser loggen2 fold ændring i udskriften af interesse. De lysegrå punkterede linjer indikerer omtrentlige tærskler for betydning, taget her for at være en fold ændring af < 0,8 eller fold ændring af > 1.2. Den stiplede sorte linje indikerer en fold ændring på 1 (dvs. ingen forskel i ekspression mellem de resistente og modtagelige populationer). Venligst klik her for at se en større version af dette tal.

Figure 2
Figur 2: fordeling af mikroarrays, der viser signifikant differens ekspression af AGAP002865-RA i resistente populationer. Fold ændringer er repræsenteret i et trafiklys system: grøn fold ændring af < 1, orange fold ændring af > 1, og rød fold ændring af > 5. Kun datasæt med signifikant (p ≤ 0,05) differentialekspression vises. Venligst klik her for at se en større version af dette tal.

Figure 3
Figur 3: korrelations netværk af AGAP001076-RA (CYP4G16). Parvis korrelationer beregnes på tværs af alle udskrifter på tværs af de 31 mikroarray datasæt, med en brugerdefineret cut-off anvendt. Vist her er (a) | r | > 0,9 ogB) | r | > 0,8. Alle udskrifter, som vises på grafen, opfylder dette kriterium og følger udtryks ændringerne i AGAP001076-RA. Venligst klik her for at se en større version af dette tal.

Figure 4
Figur 4: mRNA-udtryk og fænotype ved dæmpning af GSTMS1 og AGAP009110-ra. A) mRNA-ekspression af GSTMS1 og AGAP009110-RA i to multiresistente a. coluzzii -populationer fra henholdsvis Côte d'Ivoire og Burkina Faso. Niveauer blev sammenlignet med Lab-modtagelige an. coluzzii n'gousso. Signifikansniveauer beregnet ved ANOVA med en post-hoc-Dunnet's test. B) RNAi-induceret dæmpning af begge udskrifter sammenlignet med gfp-injicerede kontroller. GSTMS1 dæmpning viser signifikant stigning i dødeligheden efter deltamethrin eksponering (beregnet ved ANOVA med en post-hoc Tukey test; * p ≤ 0,05, * * p ≤ 0,01). Venligst klik her for at se en større version af dette tal.

Figure 5
Figur 5: udtryk for GSTMS1 i Anopheles malariamyg og Anopheles coluzzii populationer. Kort, der viser det signifikant differentierede udtryk for GSTMS1 i tilgængelige mikroarray datasæt. GSTMS1 blev fundet signifikant differentiel i 20 ud af 21 mikroarray datasæt. Venligst klik her for at se en større version af dette tal.

Transskription-ID Beskrivelse Burkina Faso Côte D'Ivoire
AGAP006879-RA Atpase 27,94 43,05
AGAP007160-RB a-crystallin 11,49 10,58
AGAP007160-RC a-crystallin 11,14 10,38
AGAP007160-RA a-crystallin 9,78 9,84
AGAP009110-RA Ukendt 9,26 5,96
AGAP007780-RA NADH dehydrogenase 10,49 3,77
AGAP006383-RA oligosaccharyltransferase kompleks underenhed beta 3,69 5,57
AGAP007249-RB Flightin 4,61 3,86
AGAP003357-RA RAG1-aktivering af protein 1-lignende protein 4,31 4,05
AGAP007249-RA Flightin 4,48 3,46
AGAP001998-RA mRpS10 3,46 2,85
AGAP007589-RA UGT306A2 2,29 2,28
AGAP000165-RA GSTMS1 1,95 1,85
AGAP002101-RA isoleucyl-tRNA-syntetase 0,57 0,59
AGAP002969-RA asparinyl-tRNA-syntetase 0,45 0,45
AGAP004199-RA solut Carrier familie 5 (natriumkoblet monocarboxylat-transportør), medlem 8 0,35 0,48
AGAP004684-RA rRNA-Processing protein CGR1 0,36 0,22
AGAP006414-RA Cht8 0,024 0,36

Tabel 1: transskriptioner, som er væsentligt forskellige i samme fold Skift retning i hele Burkina Faso og Côte d'Ivoire befolkninger. Transskriptions-id, genbeskrivelse og gennemsnitlig fold ændring for hvert datasæt fra de to lande, der repræsenterer en. coluzzii -og en. malariamyg -population.

Sammenhæng Systematisk navn Transskriptions type
1 AGAP000165-RA GSTMS1
0,82 AGAP004904-RA Katalase
0,76 AGAP007243-RA 26S regulatoriske underafdeling 8
0,79 AGAP008358-RA CYP4H17
0,76 AGAP009436-RA Valacyclovir hydrolase
0,75 AGAP010739-RA Glucose-6-fosfat 1-dehydrogenase
0,85 AGAP011172-RA cystathionin gamma-lyase
0,76 AGAP012678-RA Glucose-6-fosfat 1-dehydrogenase

Tabel 2: transskriptioner Co-korreleret med GSTMS1. Tabellen viser output fra korrelations netværket for GSTMS1 på IR-TEx med | r | på > 0,75. Tabellen viser Spearman ' korrelation, transkriptet ID og genbeskrivelse for hver Co-korreleret udskrift.

Yderligere fil 1: output fil fra A-MEXP-2196 array analyseret på limma. Filen stammer fra en met Knockdown sammenlignet med en gfp kontrol array, beskrevet mere detaljeret i ArrayExpress (E-MTAB-4043) og en anden tidligere publikation1. Kolonnerne repræsenterer AGAP-identifikator (SystematicName), logfold-ændring (log-omskifter), logudtryks værdier (AveExpr), t-statistik (t), ikke-korrigeret p-værdi (P. værdi), justeret p-værdi (adj. P. Val) og B-statistik (B)20. Med henblik på denne fil, myg er Anopheles Coluzzi fra Côte d'Ivoire og er ikke eksponeret for insekticider, med en samling bredde og længde på-5,4 og 6,0, hhv. Klik venligst her for at se denne fil (Højreklik for at downloade).

Yderligere fil 2: output-fil fra RNAseq eksperiment. RNAseq analyse taget fra Uyhelji et al.9 beskriver ændringer i transkriptomen af Anopheles myg når de udsættes for 50% saltholdighed. Denne fil er tilpasset fra tabel S2 i publikationen og omfatter AGAP-identifikator (SystematicID), rå fold-ændring (Fold_Change) og justeret p-værdi (q_value). Klik venligst her for at se denne fil (Højreklik for at downloade).

Yderligere fil 3: primer liste for repræsentative resultater. AGAP-identifikator, gennavn, dsRNA fremad, dsRNA reverse, qPCR fremad og qPCR reverse primer-sæt til hver udskrift. Klik venligst her for at se denne fil (Højreklik for at downloade).

Supplerende kodnings fil 1. Klik venligst her for at se denne fil (Højreklik for at downloade).

Supplerende kodnings fil 2. Klik venligst her for at se denne fil (Højreklik for at downloade).

Supplerende kodnings fil 3. Klik venligst her for at se denne fil (Højreklik for at downloade).

Discussion

Big data transkriptomics producerer lister over tusinder af udskrifter, der differentielt udtrykkes for hver eksperimentel tilstand. Mange af disse eksperimenter udføres på beslægtede organismer og fænotyper og er næsten udelukkende analyseres som uafhængige eksperimenter. Udnytte disse rige datakilder ved at undersøge data holistisk og uden teoretiske antagelser vil 1) føre til identifikation af nye kandidat udskrifter og 2) forhindre udsmid af værdifulde data, blot fordi der er for mange oplysninger til at validere in vivo1.

IR-TEx giver brugerne en begrænset Bioinformatik baggrund med mulighed for nemt at undersøge flere datasæt, visualisere ændringer i datasæt, og downloade de tilhørende oplysninger1. Selvom IR-TEx ikke understøtter søgning efter mere end én udskrift i hver søgning, kan brugerne undersøge de tilknyttede Fold_Changes. txt-filer ved blot at bruge Excel, R eller andre relevante programmer. Yderligere anvendelighed af IR-TEx stammer fra brugen af korrelations netværk til at forudsige transskriptionen funktion, input af hypotetiske proteiner eller udskrifter med ukendte funktioner og brug af downstream-software til at søge efter beridelser1.

I eksemplet vist i denne protokol anvendes IR-TEx i overensstemmelse med sin oprindelige funktion. Her, det giver mulighed for udforskning af udskrifter forbundet med insektresistens og visualisering af fordelingen af over-og under-udtryk gennem kortlægning grafik. Udskrifter af interesse er valideret in vivo for at afgøre, om over-eller under-ekspression af givne udskrifter bidrager til en observeret fænotype1 (f. eks. insektresistens). Det blev påvist her, som tidligere rapporteret1, at et datasæt kan anvendes i en hypotese-drevet tilgang til at identificere udskrifter af interesse på et landespecifikt grundlag. IR-TEx kan derefter bruges til 1) Udforsk udtryk for udskriften og 2) kontekstualisere transkriptets funktion ved at anvende et parvis korrelations netværk på tværs af alle udskrifter i hvert-omics-datasæt. Her, GSTMS1 viste sig at være co-korreleret med en række andre udskrifter impliceret i afgiftning. Disse data (sammen med Knockdown af udskriften, der resulterede i en signifikant stigning i dødeligheden efter insekteksponering) viser betydningen af denne udskrift i xenobiotisk clearance.

IR-TEx repræsenterer en værdifuld ressource til at udforske insektresistans-relaterede udskrifter på nettet eller ved hjælp af lokale applikationer. Denne protokol demonstrerer, hvordan du ændrer IR-TEx for forskellige omics-platforme samt helt nye data. Vejledningen illustrerer, hvordan man bruger IR-TEx til at integrere data fra multiple-omics platforme og datasæt med manglende data samt hvordan man recode IR-TEx simpelthen så det er nyttigt for alle, der forsker transcriptomic datasæt.

Disclosures

Forfatterne har intet at afsløre.

Acknowledgments

Dette arbejde blev finansieret af en MRC kompetenceudvikling stipendium til V.I. (MR/R024839/1) og Royal Society Challenge Grant (CH160059) til hr

Materials

Name Company Catalog Number Comments
Laptop with browser Any - -
R Program The R Project for Statistical Computing - https://www.r-project.org/
R Studio R Studio - https://www.rstudio.com/

DOWNLOAD MATERIALS LIST

References

  1. Ingham, V. A., Wagstaff, S., Ranson, H. Transcriptomic meta-signatures identified in Anopheles gambiae populations reveal previously undetected insecticide resistance mechanisms. Nature Communications. 9 (1), 5282 (2018).
  2. Chang, W., Cheng, J., Allaire, J., Xie, Y., McPherson, J. shiny: Web Application Framework for R. , (2017).
  3. Bhatt, S., et al. The effect of malaria control on Plasmodium falciparum in Africa between 2000 and 2015. Nature. 526 (7572), 207-211 (2015).
  4. Ranson, H., Lissenden, N. Insecticide Resistance in African Anopheles Mosquitoes: A Worsening Situation that Needs Urgent Action to Maintain Malaria Control. Trends in Parasitology. 32 (3), 187-196 (2016).
  5. Donnelly, M. J., et al. Does kdr genotype predict insecticide-resistance phenotype in mosquitoes. Trends in Parasitology. 25 (5), 213-219 (2009).
  6. Stevenson, B. J., et al. Cytochrome P450 6M2 from the malaria vector Anopheles gambiae metabolizes pyrethroids: Sequential metabolism of deltamethrin revealed. Insect Biochemistry and Molecular Biology. 41 (7), 492-502 (2011).
  7. Müller, P., et al. Field-Caught Permethrin-Resistant Anopheles gambiae Overexpress CYP6P3, a P450 That Metabolises Pyrethroids. PLoS Genetics. 4 (11), 1000286 (2008).
  8. Huang, D., et al. The DAVID Gene Functional Classification Tool: a novel biological module-centric algorithm to functionally analyze large gene lists. Genome Biology. 8 (9), 183 (2007).
  9. Uyhelji, H. A., Cheng, C., Besansky, N. J. Transcriptomic differences between euryhaline and stenohaline malaria vector sibling species in response to salinity stress. Molecular Ecology. 25 (10), 2210-2225 (2016).
  10. Edi, C. V., Benjamin, K. G., Jones, C. M., Weetman, D., Ranson, H. Multiple-Insecticide Resistance in Anopheles gambiae Mosquitoes, Southern Côte d’Ivoire. Emerging Infectious Diseases. 18 (9), 1508-1511 (2012).
  11. Ding, Y., Ortelli, F., Rossiter, L., Hemingway, J., Ranson, H. The Anopheles gambiae glutathione transferase supergene family: annotation, phylogeny and expression profiles. BMC Genomics. 4 (1), 1-16 (2003).
  12. Enayati, A. A., Ranson, H., Hemingway, J. Insect glutathione transferases and insecticide resistance. Insect Molecular Biology. 14 (1), 3-8 (2005).
  13. Ranson, H., et al. Identification of a novel class of insect glutathione S-transferases involved in resistance to DDT in the malaria vector Anopheles gambiae. The Biochemical Journal. 359, 295-304 (2001).
  14. Riveron, J. M., et al. A single mutation in the GSTe2 gene allows tracking of metabolically based insecticide resistance in a major malaria vector. Genome Biology. 15 (2), 27 (2014).
  15. Pavlidi, N., Vontas, J., Van Leeuwen, T. The role of glutathione S-transferases (GSTs) in insecticide resistance in crop pests and disease vectors. Current Opinion in Insect Science. 27, 97-102 (2018).
  16. Salvemini, F., et al. Enhanced glutathione levels and oxidoresistance mediated by increased glucose-6-phosphate dehydrogenase expression. Journal of Biological Chemistry. 274 (5), 2750-2757 (1999).
  17. Deplancke, B., Gaskins, H. R. Redox control of the transsulfuration and glutathione biosynthesis pathways. Current Opinion in Clinical Nutrition & Metabolic Care. 5 (1), (2002).
  18. Puente, X. S., López-Otn, C. Cloning and expression analysis of a novel human serine hydrolase with sequence similarity to prokaryotic enzymes involved in the degradation of aromatic compounds. Journal of Biological Chemistry. 270 (21), 12926-12932 (1995).
  19. Riveron, J. M., et al. Genome-wide transcription and functional analyses reveal heterogeneous molecular mechanisms driving pyrethroids resistance in the major malaria vector Anopheles funestus across Africa. G3: Genes, Genomes, Genetics. 7 (6), 1819-1832 (2017).
  20. Smyth, G. K. Linear models and empirical bayes methods for assessing differential expression in microarray experiments. Statistical Applications in Genetics and Molecular Biology. 3 (1), 3 (2004).

Tags

Biologi insekt bekæmpende resistens transkriptomik dataintegration RNAseq microarray afgiftning Anopheles bioinformatik skinnende
IR-TEx: en open source data integration værktøj til Big data transkriptomics designet til malaria vektor <em>Anopheles malariamyg</em>
Play Video
PDF DOI DOWNLOAD MATERIALS LIST

Cite this Article

Ingham, V. A., Bennett, A., Peng,More

Ingham, V. A., Bennett, A., Peng, D., Wagstaff, S. C., Ranson, H. IR-TEx: An Open Source Data Integration Tool for Big Data Transcriptomics Designed for the Malaria Vector Anopheles gambiae. J. Vis. Exp. (155), e60721, doi:10.3791/60721 (2020).

Less
Copy Citation Download Citation Reprints and Permissions
View Video

Get cutting-edge science videos from JoVE sent straight to your inbox every month.

Waiting X
Simple Hit Counter