Summary

IR-TEx: ett open source data integreringsverktyg för stordata transcriptomics avsedda för malaria vektorn Anopheles gambiae

Published: January 15, 2020
doi:

Summary

IR-TEx utforskar insekticid resistensrelaterade transkriptionella profiler i arten Anopheles gambiae. Förutsatt här är fullständiga instruktioner för att använda programmet, ändringar för att utforska flera transcriptomic datauppsättningar, och med hjälp av ramverket för att bygga en interaktiv databas för samlingar av transkriptomic data från någon organism, som genereras i någon plattform.

Abstract

IR-TEx är ett program skrivet i Shiny (ett R-paket) som möjliggör utforskning av uttrycket av (samt tilldela funktioner till) avskrifter vars uttryck är associerad med insekticid resistens fenotyper i Anopheles gambiae myggor. Ansökan kan användas online eller laddas ner och användas lokalt av någon. Det lokala programmet kan ändras för att lägga till nya insekticid resistens dataset genereras från flera omics plattformar. Den här guiden visar hur du lägger till nya datauppsättningar och hanterar saknade data. Dessutom kan IR-TEx helt och enkelt kodas om till att använda-omics-dataset från alla experimentella data, vilket gör det till en värdefull resurs för många forskare. Protokollet illustrerar nyttan av IR-TEx att identifiera nya insekticid resistens kandidater med hjälp av den mikrosomal glutation transferase, GSTMS1, som ett exempel. Denna avskrift är uppreglerad i flera pyretroidbaserade resistenta populationer från Elfenbenskusten och Burkina Faso. Identifieringen av samkorrelerade utskrifter ger ytterligare insikt i den här genens förmodade roll.

Introduction

Förmågan att mäta uttrycket av ett stort antal utskrifter samtidigt genom microarray plattformar och RNAseq teknik har resulterat i generering av stora datamängder associera avskrift uttryck med en viss fenotyp i både modell och icke-modellorganismer. Dessa dataset är en oerhört rik resurs för forskare, vars kraft kan ökas genom att kombinera relevanta uppsättningar i en stor data integrationsstrategi. Denna metod är dock begränsad till personer med särskild bioinformatikkompetens. Beskrivs här är ett program, IR-TEx (tidigare utgiven av Ingham et al.1) som är skriven i ett R-paket som heter Shiny2 och tillåter användare med lite bioinformatik utbildning för att integrera och förhöra dessa dataset med relativ lätthet.

IR-TEx, som finns på http://www.lstmed.AC.uk/Projects/IR-TEx, skrevs för att utforska transkriptioner i samband med insekticid resistens i Anopheles gambiae, den stora afrikanska malaria vektor1. Malaria är en parasitsjukdom orsakad av Plasmodium arter, överförs mellan människor genom bett av kvinnliga Anopheles myggor. Inriktning på Mosquito Vector med insekticider har visat sig vara det mest effektiva sättet att förebygga malaria-relaterade sjuklighet och dödlighet i Afrika. Upptrappningen av verktyg (dvs. långvariga insekticid nät) har också varit avgörande för de dramatiska minskningarna av malaria fall sedan 20003. Med ett mycket begränsat antal insekticider tillgängliga, det finns ett starkt evolutionärt tryck på myggor, och resistens är nu utbredd i afrikanska malaria vektorer4.

Dessutom, mål plats mutationer5 och metabolisk clearance av insekticider6,7 förbli den primära studerade mekanismerna för resistens, men andra potenta resistenta mekanismer är nu framväxande1. Många av dessa nya mekanismer har inte tidigare förknippats med insekticid resistens men har upptäckts genom att söka efter gemensamma mönster av genuttryck över flera resistenta populationer med hjälp av IR-TEx app och därefter funktionellt validerade av Genomics metoder1.

Beskrivs här är en steg-för-steg-metod för att använda IR-TEx, både på webben och när de installeras lokalt. Protokollet beskriver hur nya datauppsättningar för insekticid resistens kan integreras i det befintliga paketet och förklarar hur man arbetar med saknade data. Slutligen beskriver det hur du använder denna programvara med andra-omics datauppsättningar som är relaterade till insekticid resistens, vilket kombinerar data från varierande-omics metoder samtidigt som de arbetar med saknade värden och normalisering så att data är jämförbara.

Protocol

1. använda IR-TEx webbapplikation Köra programmet i en webbläsare Öppna IR-TEx webbprogram genom att följa länken längst ner på sidan som finns på http://www.lstmed.AC.uk/Projects/IR-TEx. När webbsidan har initierats klickar du på knappen program överst på sidan, som visar programmet och tillhörande utdata. Läs varje utdata som är relaterade till standardposten AGAP008212-ra (CYP6M2) i rutan avskrift-ID med följande villkor: en. coluzzii datauppsättningar som är (i) utsätts för pyretroidbaserade insekticider eller (II) inte utsätts för någon insekticid klass, och tillhörande utskrifter med en korrelation av | r | > 0,98. Utforska uttrycket av en avskrift av intresse För att välja en avskrift av intresse, mata in avskriften ID i rutan avskrift-ID , kom ihåg att utskrifter slutar i -RX beroende på isoform av intresse. Välj de datauppsättningar som ska förhöra genom att kryssa i relevanta rutor för (i) länder. II) exponerings status, (III) arter av intresse. och (IV) insekticid klass av intresse, samtidigt se till att dessa kriterier resultera i > 1 ingår dataset (se kompletterande tabell 1 i Ingham et al.1).Anmärkning: (III) avser den medlem av Art komplexet an. gambiae som användaren är intresserad av. För närvarande finns data för en. coluzzii och en. arabiensis. Klicka på uppdatera vy längst ned på Urvalsmenyn eller tryck på RETURoch ignorera absolut korrelationsvärde (för tillfället). Ge programmet tid att uppdatera. Läs den första grafen som: log2 faldig förändring mellan en resistent population och Lab-mottagliga myggor population av avskrift av intresse över varje datauppsättning som uppfyller de kriterier som valts i steg 1,2 (figur 1). Information om alla datauppsättningar finns i Ingham et al.1. Läs informationen under grafen som: luckan ändras mellan resistenta och mottagliga myggor för varje relevant datauppsättning, förutom de korrigerade p-värdena (Q). Varje rad representerar enskilda avsökningar på mikromatrisen. Metoden för grafisk visning har rapporterats tidigare1. Läs ytterligare tabellen nedan som antalet experiment där avskriften av intresse är betydande samt det totala antalet experiment som matchar de kriterier som valts i steg 1,2. Om du vill hämta data i tabbavgränsat format klickar du på knappen Hämta under de två tabellerna. Detta gör det möjligt för användaren att utforska data på ett enklare sätt med hjälp av ett program som Excel. Tolka kartan enligt följande: varje punkt representerar den ungefärliga uppsamlingsplatser för resistenta myggor i varje dataset där avskriften av intresse är Differentiellt uttryckt. Färgerna följer ett trafikljus system som förklaras i appen (bild 2). För steg 1.2.5 och 1.2.8, spara de grafiska utgångarna genom att högerklicka, klicka på Spara bild som…, och välja en lämplig mapp.Anmärkning: i en instans av ett utdatafel av programmet är det troligt att inga datauppsättningar matchar de inmatade kriterierna. Kontrollera tilläggstabell 1 i Ingham et al.1 om detta inträffar. Identifiera olika funktioner/vägar för avskrift av intresse Korrelationer (minsta r2 -värde matas in) av uttrycks mönstren för utskrifter över flera datauppsättningar kan användas för att förutsäga avskrift funktion och potentiellt belysa coreglerade avskrifter från samma väg. Med hjälp av exemplet från Ingham et al.1 (AGAP001076-ra; CYP4G16), Följ stegen 1.2.1 – 1.2.2 i avsnittet ovan, välja alla datauppsättningar för maximal effekt. Innan du klickar på uppdatera vy, flytta skjutreglaget absolut korrelationsvärde till 0,85 och klicka på uppdatera vy eller tryck på RETUR. Undersök jämförelsetabellen (den nedersta tabellen) för att hitta de flera avskrifter som nu visas och är korrelerade (| r | = 0,85) med den inmatade avskriften. Manipulera skjutreglaget för absolut korrelationsvärde och observera eventuella ändringar i den nedersta grafen och tabellen. utgångarna från steg 1.3.2 förblir oförändrade. Som visas i figur 3 (| r | > 0,9, | r | > 0,8), kommer en sänkning av korrelationsvärdet att visa fler utskrifter men kommer att introducera mer brus. Läs tabellen nedan den grafiska utgången, som (förutom de parametrar som beskrivs i steg 1.2.6) innehåller Korrelationsvärde för varje avskrift. Om du vill hämta data i ett tabbavgränsat format klickar du på knappen Hämta . Funktionell anriknings analys kan utföras på den nedladdade avskrift-ID-listan med hjälp av DAVID Analysis8. En gång på Davids webbplats (finns på https://David.ncifcrf.gov/), Välj funktionell analys. Klistra in den fullständiga gen listan, med hjälp av gen-ID [identifierare utan-RX, vilket kan göras i Excel genom att infoga en kolumn till höger om det systematiska ID: n och skriva = Left (x1, 10), där x1 är den systematiska ID-cellen]. Välj identifieraren som VectorBase_ID och gen lista och klicka på Skicka lista. Klicka på knappen funktionella antecknings kluster för att ge en översikt över de enrichments som finns i det här korrelations nätverket, så att en potentiell funktion kan tilldelas till avskriften. Utforska djupgående beriteringar genom att titta igenom de olika kategorierna och klicka på + -knapparna för varje och därefter klicka på diagram. 2. nedladdning och implementering av IR-TEx lokalt Ladda ner och köra IR-TEx Gå till länken som finns på http://github.com/LSTMScientificComputing/IR-TEx; och klicka på klona eller ladda ner | Ladda ner zip. Direkt till en mapp att välja och packa upp filen i den mappen. Ladda ner den senaste versionen av R programvara för lämpligt operativsystem från länken finns på http://cran.r-Project.org/Mirrors.html. Installera programmet. Data överför och installera den senast R studion mjukvaran, igen för den lämplig arbetsdrift systemet från länk grunda på http://www.RStudio.com/products/RStudio/Download/. En gång installerat, öppna R Studio | Kompletterande kodnings fil 1 och kör varje rad för att ställa in systemet för IR-TEx. När alla paket har installerats och uppdaterats efter behov, gå till Arkiv | Öppna, leta upp IR-TEx. R, markera och öppna. Detta bör nu synas i det övre fönstret av R Studio. För att köra appen, tryck på knappen kör app längst upp till höger i fönstret, så dyker ett andra fönster upp där appen laddas. När inläsningen är klar, för full funktionalitet klickar du på Öppna i webbläsaren som finns uppe till höger i det laddade fönstret. Lägga till resistensdata uppsättningar till IR-TEx (genereras med Anopheles gambiae 15K Agilent array) Om du vill lägga till en ny analyserade datauppsättning som genererats på samma microarray-plattform (A-MEXP-2196) i den tillgängliga datauppsättningen, hämtar du appen och letar upp den uppackade mappen som hämtats i avsnitt 2,1. Öppna ytterligare fil 1, som representerar en utdata från en limma-analys på a-mexp-2196 1. Använda Excel, i kolumn H1, skriva Fold_Change, och i H2, skriva = 2 ^ B2, där B2 är loggen vika förändring. Tillämpa detta hela kolumnen H för att producera rå vik förändringar. Ordna ytterligare fil 1 sådan att kolumn A är ID, kolumn B är luckan förändring från kolumn h (kopiera kolumn h, Markera kolumn B, sedan högerklicka och klistra in värden) och kolumn C är den justerade p-värde. Ta bort alla andra kolumner och Spara som en tabbavgränsad fil. Öppna kompletterande kodnings fil 2 och kör med tabbavgränsat ark som produceras i steg 2.2.3.NEWFILE_FC = c (“land”, “EXPONERINGS STATUS”, “Art”, “insekticid”)NEWFILE_Q = c (“land”, “EXPONERINGS STATUS”, “Art”, “insekticid”)Anmärkning: fält inom enkla citattecken ska ändras för att återspegla information från den nya datauppsättningen. Exponerings status avser huruvida prover samlades in efter exponering för insekticid (exponerad/oexponerad). Insekticid: om “oexponerad”, Använd “ingen”. Se Fold_Changes. txt. för metadata från andra exempel. Kontrollera att stavningen är konsekvent. Öppna geography. txt, bläddra till den sista ockuperade raden och välj nedan. Skriv in namnet på datamängden, följt av Q och NEWFILE_Q i kolumn 1, latitud för prov samlingsplatsen i kolumn 2 och longituden i kolumn 3. Spara ändringarna. Om några nya poster används (dvs. Gambia), som inte är tillgängliga för val i datauppsättningen (se Ingham et al. tilläggstabell 11), måste dessa läggas till i koden. För att göra detta, öppna IR-TEx. R i RStudio och lokalisera rad 26 som anges av RStudio, vid vilken tidpunkt följande bör inledas:’Sidebarpanel (…. ‘.ANMÄRKNINGAR: varje förfarande rader avser ett objekt av metadata matas in i raderna under datamängds namnet i Fold_Changes. txt i steg 2.2.5. Om du vill lägga till romanen metadata, bläddrar du till slutet av raden av metadata för val och leta upp termen “selected =”. Omedelbart efter detta bör vara ett kommatecken och sluten hakparentes; vid denna punkt, klicka på markören i det stängda fästet. Efter den sista apostrofen skriver du ett kommatecken, följt av en apostrof, följt av de nya metadatan (t. ex. “Gambia”) och spara ändringarna. Se nedan för ett exempel.checkboxGroupInput (“CountryInput”, “Välj relevanta länder”, c (“Burkina Faso”, “Elfenbenskusten”, “Kamerun”, “Ekvatorialguinea”, “Zambia”, “Tanzania”, “Sudan”, “Uganda”, “Togo”, “Gambia”), utvalda = c (“Burkina Faso”, “Elfenbenskusten”, “Kamerun”, “Ekvatorialguinea”, “Zambia”, “Tanzania”, “Sudan”, “Uganda”, “Togo”)) Kör appen. Den nya metadataposten ska visas som en omarkerade kryssruta under relevant rubrik. Om användaren vill att det ska väljas, bör det läggas efter den valda = c (…, som visas nedan:checkboxGroupInput (“CountryInput”, “Välj relevanta länder”, c (“Burkina Faso”, “Elfenbenskusten”, “Kamerun”, “Ekvatorialguinea”, “Zambia,” Tanzania “,” Sudan “,” Uganda “,” Togo “, ” Gambia “), utvalda = c (” Burkina Faso “,” Elfenbenskusten “,” Kamerun “,” Ekvatorialguinea “,” Zambia “,” Tanzania “,” Sudan “,” Uganda “,” Togo “, ” Gambia “)) Om du vill lägga till resistensdata uppsättningar som inte utförts på A-MEXP-2196, se avsnitt 3. 3. ändra IR-TEx för användning med olika datauppsättningar Använda över flera omics-plattformar och fortsätta med saknade data Så här fortsätter du med “0” i datauppsättningar: Läs datakällans källa för den specifika innebörden av “0”. Det rekommenderas att “0” är (konservativt) ersätts med “NA”. Som med RAW Fold förändringar (B/A), “0” indikerar en oupptäckt signal i experimentell skick B. I fallet det experimentellt villkora ett utställningar väsentlighet uttryck, kan användaren Applicera ett litet veck ändring värderar. Öppna ytterligare fil 2. txt, en RNAseq fil som anpassats från Uyhelji et al.9. Den här filen representerar den mall där nya data ska baseras: kolumn A = identifierare, kolumn B = RAW Fold-ändring och kolumn C = justerat p-värde. Använd den här filen för att köra igenom nedanstående steg. Kör R-kod för att matcha identifierare i en enda tabbavgränsad fil mellan plattformar och sedan ordna och normalisera data (kompletterande kodnings fil 2). Instruktioner finns i filen. Alla FILEPATH kommer att separeras med “/” för MacOS eller “//” för Windows (ändra dessa från “\”, som de kommer att visas). Utdata filen produceras i slutet av kompletterande kodning fil 2 till en plats för val för användning i steg 3.1.5. Kompletterande kodnings fil 2 kommer att mata ut en ny Fold_Changes. txt fil. Säkerhetskopiera originalfilen. Kör koden som finns i den kompletterande kodningsfilen 3. Hitta utdatafilen med namnet FC_distribPlot. png i den mapp som anges som filepath. Kontrollera distributioner av log2 Fold ändra för att kontrollera att loggen2 gånger ändra distributioner är nästan identiska över datauppsättningar. Följ instruktionerna från steg 2.2.6 för att redigera ytterligare filer och se till att den nya Fold_Changes. txtär kompatibel. Ändra IR-TEx för användning med helt nya datauppsättningar Öppna IR-TEx. R i RStudio och lokalisera raderna (23 – 34) som börjar med:’TabPanel (‘och slutar på:submitButton (“Uppdateringsvy”, ikon (“uppdatera”))), Ändra AGAP008212-ra som finns i nedanstående rader till en avskrift av intresse för nya data.textInput (‘ textInput ‘, ‘ avskrift-ID ‘, värde = ‘ AGAP008212-RA ‘), Leta reda på de fyra alternativen som börjar med:checkboxGroupInput (Dessa alternativ kan ändras för att representera viktiga metadata som användaren vill filtrera nya data efter. I varje instans bör användaren ändra de utvalda länderna. Välj exponerings status; Välj relevanta arter; och Välj insekticid klass att vara representativ för data (dvs, Välj vävnadstyp; Välj kön; Välj åldersgrupp; Välj sjukdoms status). Identifiera metadata som är associerade med datauppsättningen och indata för att ersätta de befintliga alternativen direkt efter det första c (‘. I varje exempel kommer alternativen att finnas inom tal markeringar och skiljas från nästa markering med kommatecken. Efter det slutliga urvalet ska fästet stängas. Ett exempel på Välj sjukdoms status är:c (“infekterade”, “icke-infekterade”, “okända”) Välj vilken av dessa metadata som ska väljas när du öppnar appen. Dessa kan ändras genom att ändra alternativen efter vald = c (‘. Ett exempel på Välj sjukdoms status är:selected = c (‘ infekterad ‘, ‘ Ej infekterad ‘)Detta instruerar appen att välja endast datauppsättningar som matchar dessa kriterier vid den första inläsningen. Om du vill skapa en ny datatabell följer du den layout som finns i Fold_Changes. txt och instruktionerna i avsnitt 2. Ändra metadata till varje respektive ändring som beskrivs i steg 3.2.4, exakt som skrivet i koden (R är skiftlägeskänsligt). In i avgiftnings kolumnen, mata in gen namn, och i kolumnen avskrift typ, mata in gen beskrivningar för varje utskrift. Följ avsnitt 3,2 när du lägger till nya datauppsättningar. Om mappningen inte är relevant för de experimentella kraven letar du upp följande rader med kod och placerar ‘ # ‘ framför:Linjer 49 – 51:br (), br (),withSpinner (plotOutput (“geografi”)),textOutput (‘ Geography_legend ‘),Linjer 493 start:utdata $ geografi <-renderPlot ({Till rad 602 slutar:utdata $ Geography_legend <-renderText ({Paste (“signifikanta utskrifter endast (p”, as. Expression (” 5 = röd, FC > 1 = Amber, FC < 1 = grön", sep = "")})

Representative Results

Med hjälp av filen Fold_Changes. txt som ingår i IR-TEx jämförde vi transkriptioner som var betydligt Differentiellt uttryckta i resistenta Anopheles coluzzii -och Anopheles gambiae -dataset till mottagliga kontroller från Elfenbenskusten och Burkina Faso. Detta gav 18 avskrifter av intresse (tabell 1; den här sökningen kan utföras med Excel, R eller andra program). Två av dessa, en ATPas (AGAP006879) och α-crystallin (AGAP007160), har tidigare rapporterats, med den tidigare har en signifikant effekt på pyretroidbaserade resistens1. Förutom dessa två avskrifter var två avgiftnings intyg, GSTMS1 (FCμ = 1,95 och 1,85) och UGT306A2 (FCμ = 2,29 och 2,28) närvarande. qPCR validering av två av dessa avskrifter (GSTMS1, en avgiftning avskrift; och AGAP009110-ra, en okänd, mygg-specifik avskrift som innehåller en β-1, 3-glukan bindande domän) utfördes som tidigare beskrivits1. Analysen utfördes med hjälp av primer-uppsättningar som beskrivs i ytterligare fil 3 och visade att dessa utskrifter var betydligt uppreglerad i en multiresistent population från Elfenbenskusten (Tiassalé) och en annan från Burkina Faso (Banfora), jämfört med den Lab-mottagliga N’ Gousso (figur 4a). Eftersom båda transkriptioner uppvisade signifikant uppreglering i var och en av de resistenta populationerna utfördes knockdown på myggor från LSTM Laboratory Tiassalé Colony. Denna koloni härstammar från Elfenbenskusten och är resistent mot alla större klasser av insekticid som används inom folkhälsan, som tidigare beskrivits1,10. Försvagning av uttrycket av GSTMS1 resulterade i en signifikant ökning (p = 0,021) i mortalitet efter deltametrin exponering jämfört med GFP-injicerade kontroller, visar vikten av denna avskrift i pyretroidbaserade resistens (figur 4B). Omvänt resulterade AGAP009110-RA knockdown i ingen signifikant (p = 0,082) förändring i mortalitet efter exponering (figur 4B). GSTMS1 är en mikrosomal gst och är en av tre som finns i a. gambiae myggor11. Även medlemmar av Epsilon och delta klasser av GSTs har tidigare inblandad i insektsmedel avgiftning12,13,14, detta är det första beviset på vår kunskap för en roll av mikrosomala GSTs i pyretroidbaserade motstånd15. För att utforska den förmodade funktionen av denna avskrift i Anopheles gambiae SL myggor, uttryck och KORRELATION i IR-TEx identifierades. GSTMS1 var signifikant överuttryckt i 20 av 21 dataset tillgängliga för dessa arter, med undantag för Bioko Island. På varje plats var överuttrycket mindre än femfaldigt jämfört med de mottagliga populationerna (figur 5). Som mikrosomalt GSTs har till stor del ignorerats som potentiella insekticid detoxifiers, lite är känt om deras roll i insekticid Resistance15. Genom att utforska Co-korrelation av andra utskrifter, kan förmodade funktioner klarläggas genom antagandet av samreglering eller inblandning i samma vägar. För att maximera kraften i korrelations nätverket valdes alla microarray-dataset som finns i IR-TEx, och | r | > 0,75 valdes. Tabell 2 visar utdata från IR-TEx. Dessa transkriptioner är berikade i oxioreduktas aktivitet och glukos/kolhydrat metabolism i Davids funktionella anteckningsverktyg8. Både glukos-6-fosfatdehydrogenas och cytathione gamma-lyase bibehålla nivån av glutation i däggdjursceller16,17 och därmed länka direkt med GSTMS1, en glutation-S-transferas. Catalase är en snabbverkande oxidativ stress responder som skyddar celler från reaktiva syre arter skador, en biprodukt av pyretroidbaserade exponering. Valacyclovir hydrolas är en hydrolas som kan spela en roll i avgiftning i däggdjursceller18. CYP4H17 är också närvarande i korrelations nätverket. Cytokrom p450s är direkta metaboliserare av pyretroidbaserade insekticider, och dessa nedbrytningsprodukter kan ytterligare metaboliseras av GSTs. Slutligen har CYP4H17 varit inblandad i pyretroidbaserade motstånd i A. funestus19. Sammantaget, dessa data stöder starkt en roll för GSTMS1 i xenobiotiska avgiftning. Figur 1: log2 -faldig ändring av AGAP002865-ra i alla datauppsättningar. X-axeln specificerar de olika datauppsättningarna, information som kan hittas i tilläggstabell 1 i en tidigare publikation1, och y-axeln visar loggen2 faldig förändring i avskriften av intresse. De ljusgråa prickade linjerna anger ungefärliga tröskelvärden för betydelse, tagna här för att vara en vik förändring på 1,2. Den streckade svarta linjen indikerar en viknings förändring på 1 (dvs. ingen skillnad i uttryck mellan resistenta och mottagliga populationer). Vänligen klicka här för att se en större version av denna siffra. Figur 2: distribution av mikromatriser som visar signifikanta differential uttryck av AGAP002865-ra i resistenta populationer. Fold förändringar representeras i ett trafikljus system: grön vik förändring av 1, och röd vik förändring av > 5. Endast datauppsättningar med signifikanta (p ≤ 0,05) differential uttryck visas. Vänligen klicka här för att se en större version av denna siffra. Figur 3: korrelations nätverk av AGAP001076-RA (CYP4G16). Pairwise korrelationer beräknas över alla avskrifter över 31 microarray datauppsättningar, med en användardefinierad cut-off tillämpas. Här visas (a) | r | > 0,9 ochB| r | > 0,8. Alla avskrifter som visas i grafen uppfyller detta kriterium och följer uttrycks ändringarna i AGAP001076-RA. Vänligen klicka här för att se en större version av denna siffra. Figur 4: mRNA-uttryck och fenotyp vid försvagning av GSTMS1 och AGAP009110-ra. AmRNA-uttryck för GSTMS1 och AGAP009110-ra i två multiresistenta a . coluzzii -populationer från Elfenbenskusten respektive Burkina Faso. Nivåer jämfördes med den Lab-mottagliga an. coluzzii N’ gousso. Signifikansnivå beräknade av ANOVA med en post-hoc Dunnetts test. B) RNAi-inducerad dämpning av båda transkriptioner jämfört med GFP-injicerade kontroller. GSTMS1 dämpning visar signifikant ökning av dödligheten efter deltametrin exponering (beräknad av ANOVA med en post-hoc Tukey test, * p ≤ 0,05, * * p ≤ 0,01). Vänligen klicka här för att se en större version av denna siffra. Figur 5: uttryck för GSTMS1 i Anopheles gambiae och Anopheles coluzzii populationer. Karta som visar det betydligt differentiella uttrycket för GSTMS1 i tillgängliga mikroarray-DataSet. GSTMS1 konstaterades vara signifikant differentiell i 20 av 21 microarray datauppsättningar. Vänligen klicka här för att se en större version av denna siffra. Avskrift-ID Beskrivning Burkina Faso Elfenbenskusten AGAP006879-RA Atpas 27,94 43,05 AGAP007160-RB a-crystallin 11,49 10,58 AGAP007160-RC a-crystallin 11,14 10,38 AGAP007160-RA a-crystallin 9,78 9,84 AGAP009110-RA Okänd 9,26 5,96 AGAP007780-RA NADH dehydrogenas 10,49 3,77 AGAP006383-RA oligosaccharyltransferas komplex subenhet beta 3,69 5,57 AGAP007249-RB Flightin 4,61 3,86 AGAP003357-RA RAG1-aktivera protein 1-liknande protein 4,31 4,05 AGAP007249-RA Flightin 4,48 3,46 AGAP001998-RA mRpS10 3,46 2,85 AGAP007589-RA UGT306A2 2,29 2,28 AGAP000165-RA GSTMS1 1,95 1,85 AGAP002101-RA isoleucyl-tRNA-syntetas 0,57 0,59 AGAP002969-RA med asparaginyl-tRNA-syntetas 0,45 0,45 AGAP004199-RA solute Carrier familj 5 (natriumkopplad monokarboxylattransportör), ledamot 8 0,35 0,48 AGAP004684-RA rRNA-bearbetning protein CGR1 0,36 0,22 AGAP006414-RA Cht8 0,024 0,36 Tabell 1: transkriptioner betydligt differentiella i samma vik ändra riktning över Burkina Faso och Elfenbenskusten populationer. Avskriften ID, gen beskrivning, och genomsnitt veck ändra för var datauppsättningen från två land representerande en. coluzzii och en. gambiae populationerna. Korrelation Systematiskt namnge Typ av avskrift 1 AGAP000165-RA GSTMS1 0,82 AGAP004904-RA Katalas 0,76 AGAP007243-RA 26S reglerande subenhet för proteas 8 0,79 AGAP008358-RA CYP4H17 0,76 AGAP009436-RA Valacyklovir hydrolas 0,75 AGAP010739-RA Glukos-6-fosfat 1-dehydrogenas 0,85 AGAP011172-RA cystathion syntetas gamma-lyase 0,76 AGAP012678-RA Glukos-6-fosfat 1-dehydrogenas Tabell 2: transkriptioner Co-korrelerade med GSTMS1. Tabellen visar utdata från korrelations nätverket för GSTMS1 på IR-TEx med | r | av > 0,75. Tabellen visar Spearman korrelation, avskrift ID, och gen beskrivning för varje Co-korrelerade avskrift. Ytterligare fil 1: utdatafilen från A-MEXP-2196 array analyseras på limma. Filen kommer från en met -knockdown jämfört med en GFP -kontrollmatris, som beskrivs mer detaljerat i ArrayExpress (E-MTAB-4043) och en annan tidigare publikation1. Kolumnerna representerar AGAP-identifierare (SystematicName), logg viknings ändring (logFC), logg uttrycksvärden (AveExpr), t-statistik (t), okorrigerat p-värde (P. värde), justerat p-värde (adj. P. val) och B-statistik (B)20. Vid tillämpningen av denna fil, myggor är Anopheles coluzzi från Elfenbenskusten och är oexponerad för insekticider, med en samling latitud och longitud för-5,4 och 6,0, respektive. Vänligen klicka här för att se denna fil (Högerklicka för att ladda ner). Ytterligare fil 2: utdatafilen från RNAseq experiment. RNAseq analys tas från Uyhelji et al.9 beskriver förändringar i transkriptome av Anopheles myggor när de utsätts för 50% salthalt. Den här filen är anpassad från tabell S2 i publikationen och innehåller AGAP-identifierare (SystematicID), RAW Fold-ändring (Fold_Change) och justerat p-värde (q_value). Vänligen klicka här för att se denna fil (Högerklicka för att ladda ner). Ytterligare fil 3: primer lista för representativa resultat. AGAP-identifierare, gen namn, dsRNA framåt, dsRNA omvänd, qPCR forward och qPCR Reverse primer-uppsättningar för varje utskrift. Vänligen klicka här för att se denna fil (Högerklicka för att ladda ner). Kompletterande kodnings fil 1. Vänligen klicka här för att se denna fil (Högerklicka för att ladda ner). Kompletterande kodnings fil 2. Vänligen klicka här för att se denna fil (Högerklicka för att ladda ner). Kompletterande kodnings fil 3. Vänligen klicka här för att se denna fil (Högerklicka för att ladda ner).

Discussion

Big data transkriptomik producerar listor över tusentals utskrifter som är differentially uttrycks för varje försöks tillstånd. Många av dessa experiment utförs på relaterade organismer och fenotyper och är nästan uteslutande analyseras som oberoende experiment. Utnyttja dessa rika datakällor genom att undersöka data holistiskt och utan teoretiska antaganden kommer 1) leda till identifiering av nya kandidat betyg och 2) förhindra att värdefulla data kastas överbord helt enkelt eftersom det finns för mycket information att validera in vivo1.

IR-TEx förser användare med begränsad bioinformatikbakgrund med möjligheten att enkelt granska flera datauppsättningar, visualisera ändringar i datauppsättningarna och ladda ner tillhörande information1. Även om IR-TEx inte stöder sökning efter mer än en avskrift i varje sökning, kan användarna undersöka de associerade Fold_Changes. txt-filerna genom att helt enkelt använda Excel, R eller andra lämpliga program. Ytterligare nytta av IR-TEx härrör från användningen av korrelation nätverk för att förutsäga avskrift funktion, inmatning av hypotetiska proteiner eller utskrifter med okända funktioner och användning av nedströms programvara för att söka efter enrichments1.

I det exempel som visas i detta protokoll används IR-TEx enligt dess ursprungliga funktion. Här, det möjliggör utforskning av utskrifter i samband med insekticid motstånd och visualisering av distributionen av över-och under uttryck genom kartläggning grafik. Avskrifter av intresse valideras in vivo för att avgöra om över-eller under uttryck av givna avskrifter bidrar till en observerad fenotyp1 (t. ex. insekticid resistens). Det visades här, som tidigare rapporterats1, att en datauppsättning kan användas i en hypotes driven metod för att identifiera avskrifter av intresse på en landsspecifik basis. IR-TEx kan sedan användas för att 1) utforska uttrycket av avskriften och 2) kontextualisera avskriften funktion genom att tillämpa en Pairwise korrelation nätverk över alla avskrifter som finns i varje-omics DataSet. Här var GSTMS1 visat sig vara co-korrelerad med ett antal andra utskrifter inblandade i avgiftning. Dessa data (tillsammans med knockdown av avskriften som resulterade i en signifikant ökning av dödligheten efter insekticid exponering) visar vikten av denna transkription i xenobiotiska clearance.

IR-TEx representerar en värdefull resurs för att utforska insekticid resistens-relaterade utskrifter på webben eller med hjälp av lokala applikationer. Det här protokollet visar hur du ändrar IR-TEx för olika omics-plattformar samt helt nya data. Guiden visar hur du använder IR-TEx för att integrera data från flera omics plattformar och datauppsättningar med saknade data samt hur man omkodar IR-TEx helt enkelt så det är användbart för alla som forskar på transcriptomic datauppsättningar.

Disclosures

The authors have nothing to disclose.

Acknowledgements

Detta arbete finansierades av en MRC kompetensutveckling Fellowship till V.I. (MR/R024839/1) och Royal Society Challenge Grant (CH160059) till HR

Materials

Laptop with browser Any
R Program The R Project for Statistical Computing https://www.r-project.org/
R Studio R Studio https://www.rstudio.com/

References

  1. Ingham, V. A., Wagstaff, S., Ranson, H. Transcriptomic meta-signatures identified in Anopheles gambiae populations reveal previously undetected insecticide resistance mechanisms. Nature Communications. 9 (1), 5282 (2018).
  2. Chang, W., Cheng, J., Allaire, J., Xie, Y., McPherson, J. . shiny: Web Application Framework for R. , (2017).
  3. Bhatt, S., et al. The effect of malaria control on Plasmodium falciparum in Africa between 2000 and 2015. Nature. 526 (7572), 207-211 (2015).
  4. Ranson, H., Lissenden, N. Insecticide Resistance in African Anopheles Mosquitoes: A Worsening Situation that Needs Urgent Action to Maintain Malaria Control. Trends in Parasitology. 32 (3), 187-196 (2016).
  5. Donnelly, M. J., et al. Does kdr genotype predict insecticide-resistance phenotype in mosquitoes. Trends in Parasitology. 25 (5), 213-219 (2009).
  6. Stevenson, B. J., et al. Cytochrome P450 6M2 from the malaria vector Anopheles gambiae metabolizes pyrethroids: Sequential metabolism of deltamethrin revealed. Insect Biochemistry and Molecular Biology. 41 (7), 492-502 (2011).
  7. Müller, P., et al. Field-Caught Permethrin-Resistant Anopheles gambiae Overexpress CYP6P3, a P450 That Metabolises Pyrethroids. PLoS Genetics. 4 (11), 1000286 (2008).
  8. Huang, D., et al. The DAVID Gene Functional Classification Tool: a novel biological module-centric algorithm to functionally analyze large gene lists. Genome Biology. 8 (9), 183 (2007).
  9. Uyhelji, H. A., Cheng, C., Besansky, N. J. Transcriptomic differences between euryhaline and stenohaline malaria vector sibling species in response to salinity stress. Molecular Ecology. 25 (10), 2210-2225 (2016).
  10. Edi, C. V., Benjamin, K. G., Jones, C. M., Weetman, D., Ranson, H. Multiple-Insecticide Resistance in Anopheles gambiae Mosquitoes, Southern Côte d’Ivoire. Emerging Infectious Diseases. 18 (9), 1508-1511 (2012).
  11. Ding, Y., Ortelli, F., Rossiter, L., Hemingway, J., Ranson, H. The Anopheles gambiae glutathione transferase supergene family: annotation, phylogeny and expression profiles. BMC Genomics. 4 (1), 1-16 (2003).
  12. Enayati, A. A., Ranson, H., Hemingway, J. Insect glutathione transferases and insecticide resistance. Insect Molecular Biology. 14 (1), 3-8 (2005).
  13. Ranson, H., et al. Identification of a novel class of insect glutathione S-transferases involved in resistance to DDT in the malaria vector Anopheles gambiae. The Biochemical Journal. 359, 295-304 (2001).
  14. Riveron, J. M., et al. A single mutation in the GSTe2 gene allows tracking of metabolically based insecticide resistance in a major malaria vector. Genome Biology. 15 (2), 27 (2014).
  15. Pavlidi, N., Vontas, J., Van Leeuwen, T. The role of glutathione S-transferases (GSTs) in insecticide resistance in crop pests and disease vectors. Current Opinion in Insect Science. 27, 97-102 (2018).
  16. Salvemini, F., et al. Enhanced glutathione levels and oxidoresistance mediated by increased glucose-6-phosphate dehydrogenase expression. Journal of Biological Chemistry. 274 (5), 2750-2757 (1999).
  17. Deplancke, B., Gaskins, H. R. Redox control of the transsulfuration and glutathione biosynthesis pathways. Current Opinion in Clinical Nutrition & Metabolic Care. 5 (1), (2002).
  18. Puente, X. S., López-Otn, C. Cloning and expression analysis of a novel human serine hydrolase with sequence similarity to prokaryotic enzymes involved in the degradation of aromatic compounds. Journal of Biological Chemistry. 270 (21), 12926-12932 (1995).
  19. Riveron, J. M., et al. Genome-wide transcription and functional analyses reveal heterogeneous molecular mechanisms driving pyrethroids resistance in the major malaria vector Anopheles funestus across Africa. G3: Genes, Genomes, Genetics. 7 (6), 1819-1832 (2017).
  20. Smyth, G. K. Linear models and empirical bayes methods for assessing differential expression in microarray experiments. Statistical Applications in Genetics and Molecular Biology. 3 (1), 3 (2004).

Play Video

Cite This Article
Ingham, V. A., Bennett, A., Peng, D., Wagstaff, S. C., Ranson, H. IR-TEx: An Open Source Data Integration Tool for Big Data Transcriptomics Designed for the Malaria Vector Anopheles gambiae. J. Vis. Exp. (155), e60721, doi:10.3791/60721 (2020).

View Video