Ett detaljerat protokoll av differentiala uttryck analysmetoder för RNA sekvensering tillhandahölls: limma, EdgeR, DESeq2.
RNA-sekvensering (RNA-seq) är en av de mest använda teknikerna inom transkriptomik eftersom det kan avslöja förhållandet mellan den genetiska förändringen och komplexa biologiska processer och har stort värde i diagnostik, prognostik och terapier av tumörer. Differentialanalys av RNA-seq-data är avgörande för att identifiera avvikande transkriptioner, och limma, EdgeR och DESeq2 är effektiva verktyg för differentialanalys. RNA-seq differentialanalys kräver dock vissa färdigheter med R-språk och förmågan att välja en lämplig metod, vilket saknas i läroplanen för medicinsk utbildning.
Häri tillhandahåller vi det detaljerade protokollet för att identifiera differentiellt uttryckta gener (DEGs) mellan cholangiocarcinoma (CHOL) och normala vävnader genom limma, DESeq2 respektive EdgeR, och resultaten visas i vulkanområden och Venn diagram. De tre protokollen limma, DESeq2 och EdgeR är liknande men har olika steg mellan analysprocesserna. En linjär modell används till exempel för statistik i limma, medan den negativa binomialfördelningen används i edgeR och DESeq2. Dessutom är de normaliserade RNA-seq count data nödvändiga för EdgeR och limma men är inte nödvändigt för DESeq2.
Här tillhandahåller vi ett detaljerat protokoll för tre differentialanalysmetoder: limma, EdgeR och DESeq2. Resultaten av de tre metoderna överlappar delvis varandra. Alla tre metoderna har sina egna fördelar, och valet av metod beror bara på data.
RNA-sekvensering (RNA-seq) är en av de mest använda teknikerna inom transkriptomik med många fördelar (t.ex. hög data reproducerbarhet), och har dramatiskt ökat vår förståelse för funktionerna och dynamiken i komplexa biologiska processer1,2. Identifiering av aberrate transkript under olika biologiska sammanhang, som också kallas differentiellt uttryckta gener (DEGs), är ett viktigt steg i RNA-seq analys. RNA-seq gör det möjligt att få en djup förståelse för patogenesrelaterade molekylära mekanismer och biologiska funktioner. Därför har differentiell analys betraktats som värdefull för diagnostik, prognostika och terapier avtumörer 3,4,5. För närvarande har fler R/Bioconductor-paket med öppen källkod utvecklats för RNA-seq differentialuttrycksanalys, särskilt limma, DESeq2 och EdgeR1,6,7. Differentiell analys kräver dock vissa färdigheter med R-språk och förmågan att välja lämplig metod, vilket saknas i läroplanen för medicinsk utbildning.
I detta protokoll, baserat på cholangiocarcinoma (CHOL) RNA-seq count data extraherade från Cancer Genome Atlas (TCGA), utfördes tre av de mest kända metoderna (limma8,EdgeR9 och DESeq210)av R program11 för att identifiera DEGs mellan CHOL och normala vävnader. De tre protokollen limma, EdgeR och DESeq2 är liknande men har olika steg mellan analysprocesserna. Till exempel är de normaliserade RNA-seq-räknedata nödvändiga för EdgeR och limma8,9, medan DESeq2 använder sina egna biblioteksavvikelser för att korrigera data istället förnormalisering 10. Dessutom är edgeR särskilt lämplig för RNA-seq-data, medan limman används för mikroarrayer och RNA-seq. En linjär modell antas av limma för att bedöma degs12, medan statistiken i edgeR baseras på de negativa binomialfördelningarna, inklusive empirisk Bayes uppskattning, exakta tester, generaliserade linjära modeller och kvasi-sannolikhetstester9.
Sammanfattningsvis tillhandahåller vi detaljerade protokoll för RNA-seq differentialuttrycksanalys med hjälp av limma, DESeq2 respektive EdgeR. Genom att hänvisa till den här artikeln kan användare enkelt utföra RNA-seq differentialanalysen och välja lämpliga differentiella analysmetoder för sina data.
Rikliga aberrate transkript i cancer kan lätt identifieras genom RNA-seq differentialanalys5. Tillämpningen av RNA-seq differential uttryck analys är dock ofta begränsad eftersom det kräver vissa färdigheter med R språk och förmågan att välja lämpliga metoder. För att lösa detta problem ger vi en detaljerad introduktion till de tre mest kända metoderna (limma, EdgeR och DESeq2) och handledningar för tillämpning av RNA-seq differentialuttryck analys. Detta kommer att underlätta fö…
The authors have nothing to disclose.
Detta arbete stöddes av National Natural Science Foundation of China (Grant No. 81860276) och Key Special Fund Projects of National Key R&D Program (Grant No. 2018YFC1003200).