July 29th, 2022
DiCoExpress is een script-gebaseerde tool geïmplementeerd in R om een RNA-Seq analyse uit te voeren van kwaliteitscontrole tot co-expressie. DiCoExpress verwerkt een compleet en onevenwichtig ontwerp tot 2 biologische factoren. Deze videozelfstudie leidt de gebruiker door de verschillende functies van DiCoExpress.
DiCoExpress biedt een complete aoristische analyse van kwaliteitscontrole tot co-expressie. Het voert differentiële analyse uit op basis van contrasten binnen het gegeneraliseerde lineaire model. Bovendien kan het ook een verrijkingsanalyse uitvoeren op de lijst van differentieel tot expressie gebrachte genen en de co-expressiegenclusters.
Het grote voordeel van DiCoExpress is dat het kan worden gebruikt door mensen zoals ik, zonder enige specifieke kennis van statistieken of luchtprogrammering. Het helpt een niet-gespecialiseerde gebruiker echt om het contrast te schrijven dat nodig is voor differentiële genexpressieanalyse. Het biedt ook grafische uitvoer die de resultaten illustreert die klaar zijn voor publicatie.
DiCoExpress is geen plan dedicated tool. Het kan voor elk organisme worden gebruikt, zolang het experimentele ontwerp compleet is met maximaal twee biologische factoren. Bovendien is het ontwerp van een membraan met een ongelijk aantal replicaties tussen condities ook mogelijk.
Een beginner moet voorlopige kennis hebben van R.U moet weten hoe u een functie moet gebruiken en vereiste en optionele argumenten moet identificeren. Vervolgens is de kritieke stap om de bestanden met het en het experimentele ontwerp correct te leveren. Open om te beginnen de R-studiosessie.
Stel de map in op sjabloonscripts en open het DiCoExpress-zelfstudiepunt R-script. Laad de DiCoExpress-functies in de R-sessie. Laad vervolgens gegevensbestanden in de R-sessie en splits de objectgegevensbestanden in verschillende objecten om de bestanden eenvoudig te manipuleren.
Selecteer vervolgens een strategie tussen NB-condities of NB-replicaties en een drempel om genen met lage expressie te filteren. Geef groepskleuren op en selecteer een normalisatiemethode. Voer vervolgens de kwaliteitscontrole uit.
Als gegevens worden gekoppeld aan de replicatiefactorstatus repliceert als true, anders wordt de status als false weergegeven. Wijs de interactie toe als waar om een interactie tussen de twee biologische factoren te overwegen. Wijs anders false toe, geef vervolgens het statistische model op en definieer de drempelwaarde voor de false discovery rate.
Voer de differentiële analyse uit, gevolgd door het vaststellen van een drempel voor de verrijkingsanalyse en het uitvoeren van de verrijkingsanalyse van differentieel tot expressie gebrachte genenlijsten. Selecteer de DEG-lijsten die u wilt vergelijken. Geef een naam op voor de lijstvergelijking en gebruik dezelfde naam voor de map waarin de uitvoerbestanden worden opgeslagen.
Stel de parameterbewerking in op samenvoeging of snijpunt voor het opgeven van de actie die moet worden uitgevoerd op de DEG-lijsten en vergelijk de lijsten. Voer een co-expressieanalyse uit, gevolgd door het uitvoeren van de verrijkingsanalyse van de co-expressieclusters. En genereer ten slotte twee logbestanden met alle benodigde informatie om de analyse te reproduceren.
De totale genormaliseerde tellingen per monster moeten vergelijkbaar zijn bij het vergelijken van zowel intra- als intercondities. De genormaliseerde genexpressietellingen vertoonden vergelijkbare mediaan en variantie, zowel in intra- als intercondities. Voor het identificeren van de potentiële onderliggende gegevensstructuren werden PCA-plots gegenereerd.
Er werd een duidelijk onderscheid waargenomen tussen de behandelingen en clustering was afwezig, wat wijst op een dataset van goede kwaliteit. De ruwe pvalue histogrammen werden uitgezet om de kwaliteit van de modellering te beoordelen. De verdeling van ruwe pvalues was uniform, met een piek aan de linkerkant van de verdeling, zoals verwacht.
De afwezigheid van een piek aan de rechterkant geeft aan dat de statistische modellering correct lijkt. Het expressieprofiel van Gene CIG62301.1, in elk genotype en elke aandoening, werd uitgezet. Naast het aantal op en neer differentieel tot expressie gebrachte genen, werden ook uitgezet voor elk getest contrast.
De co-expressieanalyse werd uitgevoerd op de unie van vijf DEG-lijsten. Geïdentificeerd door contrast, op zoek naar behandelingsresponsvariatie tussen genotype één of twee tegen anderen. De co-expressiegenen voor elk geïdentificeerd cluster werden afgedrukt in individuele tekstbestanden en het expressieprofiel van genen werd uitgezet.
Met DiCoExpress krijgen biologen genexpressieanalyses die statistisch verantwoord zijn. De volgende stap is biologisch zinvol maken, uit deze resultaten.
View the full transcript and gain access to thousands of scientific videos
DiCoExpress is een op scripts gebaseerd hulpmiddel geïmplementeerd in R voor RNA-Seq analyse, van kwaliteitscontrole tot co-expressie. Het is ontworpen voor gebruikers zonder uitgebreide statistische kennis, waardoor het toegankelijk is voor niet-specialisten.