September 18th, 2021
Een gedetailleerd protocol van differentiële expressie analysemethoden voor RNA-sequencing werd verstrekt: limma, EdgeR, DESeq2.
Drie differentiële expressieanalysemethoden voor RNA-sequencing: limma, EdgeR en DESeq2. Open het RStudio-programma en laad vervolgens het R-bestand, DEGs. Het bestand kan worden verkregen uit aanvullende bestanden. Een.
Downloaden en voorverwerking van gegevens.1.1. Download de gegevens over het aantal sequencings met hoge doorvoer van Cholangiocarcinoom uit de Kankergenoomatlas. Dit tabblad kan gemakkelijk worden bereikt door de volgende code.
Klik op uitvoeren om het R-pakket te installeren. Klik op uitvoeren om het R-pakket te laden. Werkmap instellen.
Kies het kankertype. Voer R-code uit het GDCquery-bestand uit om de gegevens te downloaden. Bestand GDCquery kan worden verkregen uit aanvullende bestanden / scripts.
Na uitvoering kunnen de Cholangiocarcinoom RNA-sequencing-tellingsgegevens worden gedownload en CNT worden genoemd, waarbij rijen ensemblegen-ID's vertegenwoordigen en kolommen symbolen-ID's vertegenwoordigen. Let op de nummers op positie 14 t/m 15 in de symbolen-ID's. Getallen variëren van 01 tot 09 wijzen op tumoren en 10 tot 19 op normale weefsels.1.2.
Gesprek van ensemblegen-ID's aan gensymbolen. Importeer het annotatiebestand in R, afhankelijk van het opslagpad. Het annotatiebestand kan worden verkregen uit aanvullende bestanden.
Voer de R-code uit vanuit het gtf v22-bestand. Die kan worden verkregen uit aanvullende bestanden / scripts. Pas de herbergfunctie toe en converteer de gen-ID's van het ensemble naar gensymbolen.1.3.
Filter laag-uitgedrukte genen. Klik op uitvoeren om pakketrand te installerenR"Klik op uitvoeren om de R-pakketrand te laden"Voer de R-code uit om genen te behouden met aantallen per miljoen waarden groter dan één in ten minste twee voor beelden. Twee. Differentiële expressieanalyse via limma"Klik op Uitvoeren om R-pakket limma te installeren"Klik op Uitvoeren om R-pakket limma"edgeR te laden"Voer de volgende R-code uit om ontwerpmatrix te maken.
Groepsinformatie extraheren. Stel 01" in als tumorweefsel. Stel 11"als normaal weefsel in.
Ontwerpmatrix maken. Maak het object DGEList. Normaliseer de gegevens.
Voer de volgende R-code uit om de op limma-trendmethode gebaseerde differentiële expressieanalyse uit te voeren. Bereken de CPM-waarde. Klik op Uitvoeren om een lineair model te passen om de gegevens te voorspellen of de relatie tussen variabelen af te leiden.
Bereken de T-waarde, de F-waarde en de log-odds op basis van Bayesian. Pak de resultatentabel uit. De resultaten van differentiële expressieanalyse worden opgeslagen in res_limma", waaronder de log2-vouwwijzigingswaarde.
Het gemiddelde log2 expressieniveau van het gen in het experiment. De gewijzigde T-statistiek, P-waarde, de valse detectiesnelheid corrigeerden de p-waarde en de log-odds van differentieel uitgedrukte genen. Identificeer de differentieel uitgedrukte genen.
Dus de aangepaste P-waarde kleiner dan 0,05 en de absolute waarde van log false change groter dan of gelijk aan twee zijn drempels om de differentieel uitgedrukte genen te screenen. De resultaten res limma toont aan dat in vergelijking met de normale weefsels, 1, 443 genen up-gereguleerd zijn, en 1, 880 genen zijn down-gereguleerd in Cholangiocarcinoom weefsels. Voer de resultaattabel uit naar een bestand.
Klik op Uitvoeren om R-pakket ggplot2 te installeren"Klik op Uitvoeren om R-pakket ggplot2 te laden"Voer R-code uit het vulkaanbestand uit om het vulkaanplot te maken en de bestandsvulkaan kan worden verkregen uit aanvullende bestanden. Genen kunnen worden toegewezen aan verschillende posities op basis van hun log2-vouwverandering en aangepaste P-waarden. Dus up-gereguleerde differentieel uitgedrukte genen zijn rood gekleurd.
en de down-gereguleerde differentieel uitgedrukte genen zijn groen gekleurd. Klik op exporteren"om het vulkaanplot op te slaan. Drie. Differentiële expressieanalyse via edgeR"Klik op Uitvoeren om R-pakketrand te laden"Voer de volgende R-code uit om ontwerpmatrix te maken.
Klik op Uitvoeren om het DGEList-object te maken en de gegevens te normaliseren. Klik op Uitvoeren om de dispersie van de genexpressiewaarde te schatten. Klik op Uitvoeren om het model aan te passen om gegevens te tellen.
Voer een statistische test uit. De resultaattabel extraheren. Het resultaat wordt opgeslagen in res edgeR", waaronder de wijzigingswaarde van de logboekvouw, logCPM, F, p-waarde en de fout-detectiesnelheid gecorrigeerde p-waarde.
Identificeer de differentieel uitgedrukte genen. Het resultaat res edgeR"toont aan dat in vergelijking met de normale weefsels, 3, 121 genen up-gereguleerd zijn, en 1, 578 genen zijn down-gereguleerd in Cholangiocarcinoom weefsels. Voer de resultaattabel uit naar een bestand.
Maak het vulkaanperceel. Klik op exporteren om het vulkaanplot op te slaan. Vier. Differentiële expressieanalyse via DESeq2.
Klik op Uitvoeren om R-pakket DESeq2 te installeren"Klik op Uitvoeren om R-pakket DESeq2 te laden"Voer de volgende R-code uit om de gropingfactor te bepalen. Maak het DESeq2-gegevenssetobject. Voer een analyse uit.
Genereer de resultatentabel. Het resultaat wordt opgeslagen in res DESeq2, dat het gemiddelde van het genormaliseerde aantal lees, de wijzigingswaarde van de logboekplooi, de standaardpijl voor het wijzigen van de logboekvouw, de lasstatistiek, de oorspronkelijke P-waarde en de gecorrigeerde P-waarde omvat. Identificeer DEG's.
Het resultaat res DESeq2 toont aan dat in vergelijking met de normale weefsels, tweeduizend negenhonderd achtendertig genen zijn up-gereguleerd, en duizend zeshonderd zestien genen zijn down-gereguleerd in Cholangiocarcinoom weefsels. Voer de resultaattabel uit naar een bestand. Maak het vulkaanperceel.
Klik op exporteren om het vulkaanplot op te slaan. Vijf. Venn diagram. Klik op Uitvoeren om het venn-diagram van het R-pakket te installeren.
Klik op Uitvoeren om het venn-diagram van het R-pakket te laden. Maak een venndiagram van up-gereguleerde differentieel uitgedrukte genen. Klik op exporteren om het bestelwagendiagram op te slaan, Maak een venndiagram van downgereguleerde differentieel uitgedrukte genen.
Klik op exporteren om het venn-diagram op te slaan. Zes. Representatieve resultaten. Figuur één toont de vulkaanplots van alle genen verworven door limma, edgeR en DESeq2.
Negatieve log p-waarde wordt geplot tegen de wijziging van de logboekvouw. Rode punten vertegenwoordigen de omhoog-gereguleerde differentieel uitgedrukte genen, en de groene punten vertegenwoordigen de naar beneden gereguleerde differentieel uitgedrukte genen. Limma identificeert de duizend achthonderdtachtig down-gereguleerde differentieel uitgedrukte genen, en de duizend vierhonderddrieenveertig omhoog-gereguleerde differentieel uitgedrukte genen in Cholangiocarcinoom weefsels.
EdgeR identificeert de duizend vijfhonderd achtenzeventig down-gereguleerde differentieel uitgedrukte genen, en drieduizend eenentwintig omhoog-gereguleerde differentieel uitgedrukte genen. DESeq2 identificeert duizend zeshonderd zestien down-gereguleerde differentieel uitgedrukte genen, en tweeduizend negenhonderd achtendertig up-gereguleerde differentieel uitgedrukte genen. Figuur twee, venn diagrammen tonen overlap tussen de resultaten scheiding van limma edgeR en DESeq2.
Vergelijk de resultaten van deze drie methoden, Duizend vierhonderd eenendertig omhoog-gereguleerde differentieel uitgedrukte genen, en duizend vijfhonderd en eenendertig down-gereguleerde differentieel uitgedrukte genen overlappen elkaar. Seven.Conclusion. In dit protocol hebben we hier een gedetailleerd protocol van verschillende soorten meetanalyses voor een hoge reeks telgegevens verstrekt met behulp van R-pakketten, limma, edgeR en DESeq2. Drie methoden hebben vergelijkbare en medewerkers in hun analyseproces.
En dan overlappen hun van die drie medicijnen gedeeltelijk. Alle drie de geneesmiddelen hebben hun eigen voordelen. En de keuze hangt af van het tijdstip van uw gegevens.
Als er mijn huidige gegevens zijn, moet limma prioriteit krijgen, maar generatiesequencinggegevens, in edgeR en DESeq2 hebben de voorkeur.
View the full transcript and gain access to thousands of scientific videos
Dit artikel presenteert een gedetailleerd protocol voor methoden voor differentiële expressieanalyse die van toepassing zijn op RNA-sequencing. De besproken methoden omvatten limma, EdgeR en DESeq2, die essentieel zijn voor het analyseren van genexpressiegegevens.