Method Article

Анализ многофакторных экспериментов с РНК-Seq с помощью DiCoExpress

DOI:

10.3791/62566

July 29th, 2022

In This Article

Summary

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

DiCoExpress - это инструмент на основе скриптов, реализованный в R для выполнения анализа RNA-Seq от контроля качества до совместной экспрессии. DiCoExpress обрабатывает полный и несбалансированный дизайн до 2 биологических факторов. Этот видеоурок проведет пользователя через различные функции DiCoExpress.

Abstract

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

Правильное использование статистического моделирования в анализе данных NGS требует продвинутого уровня знаний. В последнее время растет консенсус в отношении использования обобщенных линейных моделей для дифференциального анализа данных RNA-Seq и преимущества смешанных моделей для выполнения анализа коэкспрессии. Чтобы предложить управляемую настройку для использования этих подходов к моделированию, мы разработали DiCoExpress, который предоставляет стандартизированный конвейер R для выполнения анализа RNA-Seq. Без каких-либо специальных знаний в области статистики или R-программирования новички могут выполнять полный анализ RNA-Seq от контроля качества до совместного выражения посредством дифференциального анализа на основе контрастов внутри обобщенной линейной модели. Предложен анализ обогащения как по спискам дифференциально экспрессированных генов, так и по коэкспрессированным кластерам генов. Этот видеоурок задуман как пошаговый протокол, чтобы помочь пользователям в полной мере воспользоваться преимуществами DiCoExpress и его потенциала в расширении возможностей биологической интерпретации эксперимента RNA-Seq.

Introduction

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

Технология секвенирования РНК следующего поколения (RNA-Seq) в настоящее время является золотым стандартом анализа транскриптома1. С первых дней существования технологии совместные усилия биоинформатиков и биостатистиков привели к разработке многочисленных методов, охватывающих все основные этапы транскриптомного анализа, от картирования до количественной оценки транскриптов2. Большинство инструментов, доступных сегодня биологу, разработаны в программной среде R для статистических вычислений и графиков3, а многие пакеты для анализа биологических данных доступны в репозитории Bioconductor

Access restricted. Please log in or start a trial to view this content.

Protocol

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

1. ДиКоЭкспресс

  1. Откройте сеанс R studio и задайте для каталога значение Template_scripts.
  2. Откройте сценарий DiCoExpress_Tutorial.R в R studio.
  3. Загрузите функции DiCoExpress в сеансЕ R с помощью следующих команд:
    > источник(".. /Источники/Load_Functions.R")
    > Load_Functions()
    > Data_Directory = ".. /Данные"
    > Results_Directory = ".. /Результаты/"
  4. Загрузите файлы данных в сеансе R с помощью следующих команд:
    > Project_Name = "Учебник"
    > фильтр = NULL
    > Sep="\t"
    > Data_Files = Load_Data_Files(Data_Directory, Project_Name, Фильтр, Сент)
  5. Разделите объект Data_Files на несколько объектов, чтобы легко ....

Access restricted. Please log in or start a trial to view this content.

Results

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

Все выходные данные DiCoExpress сохраняются в каталоге Tutorial/, который сам помещается в каталог Results/. Здесь мы приводим некоторые рекомендации по оценке общего качества анализа.

Контроль качества
Выходные данные контроля качества, расположенные в каталоге Quality_Control/, необходимы для проверки надежности результатов анализа RNA-Seq. Файл Data_Quality_Control.pdf содержит несколько графиков, полученных с необработанными и нормализованными данными, которые можно исп.......

Access restricted. Please log in or start a trial to view this content.

Discussion

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

Поскольку RNA-Seq стал повсеместным методом в биологических исследованиях, существует постоянная необходимость в разработке универсальных и удобных для пользователя аналитических инструментов. Критическим шагом в большинстве аналитических рабочих процессов часто является достоверная идентификация генов, дифференциально экспрессируемых между биологическими состояниями и/или методами лечения15. Получение достоверных результатов требует надлежащего статистического моделирования, которое послужило мот.......

Access restricted. Please log in or start a trial to view this content.

Disclosures

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

Авторам нечего раскрывать

Acknowledgements

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

Эта работа была в основном поддержана ANR PSYCHE (ANR-16-CE20-0009). Авторы благодарят Ф. Депре за постройку контейнера DiCoExpress. Работа КБ поддерживается программой «Инвестиции в будущее» ANR-10-BTBR-01-01 Amaizing. Лаборатории GQE и IPS2 пользуются поддержкой Saclay Plant Sciences-SPS (ANR-17-EUR-0007).

....

Access restricted. Please log in or start a trial to view this content.

References

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,
  1. Wang, Z., Gerstein, M., Snyder, M. RNA-Seq: a revolutionary tool for transcriptomics. Nature reviews. Genetics. 10 (1), 57-63 (2009).
  2. Yang, I. S., Kim, S. Analysis of Whole Transcriptome Sequencing Data: Workflow and Software. Genomics & Informatics.

Access restricted. Please log in or start a trial to view this content.

Reprints and Permissions

Request permission to reuse the text or figures of this JoVE article

Request Permission

Tags

RNA Seq AnalysisDifferential AnalysisCo Expression AnalysisGeneralized Linear ModelEnrichment AnalysisQuality ControlGene ExpressionNormalization MethodPrincipal Component AnalysisDiCoExpress Pipeline

Related Articles