Method Article

用于研究宿主-病原体相互作用的高通量转录组分析

DOI:

10.3791/62324

March 5th, 2022

In This Article

Summary

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

这里介绍的方案描述了一个完整的管道,用于分析从原始读数到功能分析的RNA测序转录组数据,包括质量控制和预处理步骤到高级统计分析方法。

Abstract

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

病原体可引起多种传染病。宿主对感染的反应诱导的生物过程决定了疾病的严重程度。为了研究这些过程,研究人员可以使用高通量测序技术(RNA-seq),以测量宿主转录组在感染的不同阶段,临床结果或疾病严重程度的动态变化。这项调查可以更好地了解疾病,并发现潜在的药物靶点和治疗方法。这里介绍的方案描述了一个完整的管道,用于分析从原始读取到功能分析的RNA测序数据。管道分为五个步骤:(1)数据的质量控制;(2)基因的作图和注释;(3)统计分析,鉴定差异表达基因和共表达基因;(4)测定样品扰动的分子程度;(5)功能分析。步骤 1 删除了可能影响下游分析质量的技术工件。在第2步中,根据标准文库协议绘制基因图谱并进行注释。步骤3中的统计分析可识别感染样本中差异表达或共表达的基因,与未感染的基因进行比较。在步骤4中使用分子扰动度方法验证样品变异性和潜在生物异常值的存在。最后,步骤5中的功能分析揭示了与疾病表型相关的途径。所提出的管道旨在通过来自宿主 - 病原体相互作用研究的RNA-seq数据分析来支持研究人员,并推动未来的体外体内 实验,这对于了解感染的分子机制至关重要。

Introduction

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

登革热、黄热病、基孔肯雅热和寨卡等虫媒病毒与几次地方性疫情广泛相关,并已成为过去几十年中导致人类感染的主要病原体之一12。感染基孔肯雅病毒(CHIKV)的个体经常出现发热、头痛、皮疹、多关节痛和关节炎345。病毒可以破坏细胞的基因表达并影响各种宿主信号通路。最近,血液转录组研究利用RNA-seq鉴定与急性CHIKV感染相关的差异表达基因(DEGs)与康复6 或健康对照组7进行比较。CHIKV感染的儿童具有上调的基因,这些基因参与先天免疫,例如与病毒RNA,JAK / STAT信号传导和Toll样受体信号通路的细胞传感器相关的基因6。急性感染CHIKV的成人还显示出与先天免疫相关的基因的诱导,例如与单核细胞和树突状细胞活化相关的基因,以及与抗病毒反应相关的基因7。富含下调基因的信号通路包括与适应性免疫相关的信号通路,例如T细胞活化以及T细胞和B细胞的分化和富集7

Access restricted. Please log in or start a trial to view this content.

Protocol

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

该协议中使用的样品由圣保罗大学生物医学科学研究所微生物学系和塞尔希培联邦大学伦理委员会批准(协议分别为54937216.5.0000.5467和54835916.2.0000.5546)。

1. Docker 桌面安装

注意:准备 Docker 环境的步骤因操作系统 (OS) 而异。因此,Mac 用户必须遵循列为 1.1 的步骤,Linux 用户必须遵循列为 1.2 的步骤,Windows 用户必须遵循列为 1.3 的步骤。

  1. 在 MacOS 上安装。
    1. 访问 Get Docker 网站(材料表),单击 Docker Desktop for Mac ,然后单击" 从 Docker Hub 下载 "链接。
    2. 通过单击" 获取 Docker "按钮下载安装文件。
    3. 执行 Docker.dmg文件以打开安装程序,然后将图标拖到 "应用程序" 文件夹中。本地化并执行" 应用程序" 文件夹中的 Docker.app 以启动程序。
      注:顶部状态栏中的软件特定菜单指示软件正在运行,并且可从终端访问该软件。

Access restricted. Please log in or start a trial to view this content.

Results

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

转录组分析的计算环境是在 Docker 平台上创建和配置的。这种方法允许初学者Linux用户在没有先验管理知识的情况下使用Linux终端系统。Docker 平台使用主机操作系统的资源来创建包含特定用户工具的服务容器(图 1B)。创建了一个基于Linux OS Ubuntu 20.04发行版的容器,并完全配置为转录组分析, 可通过 命令行终端访问。在此容器中,有一个用于数据集和脚本的预定义文件夹结构,这是所有管道分析所必需的(图 1C)。我们的研究小组7 发表的一项研究用于分析,其中包括来自健康个体的20个样本和来自CHIKV急性感染个体的39个样本(图1D)。

总RNA测序过程可能会产生读取错误,这可能是由具有两个或多个转录本的簇或试剂耗尽引起的。测序平台返回一组"FASTQ"文件,其中包含每个核苷酸碱基的序列(读取)和相关质量(

Access restricted. Please log in or start a trial to view this content.

Discussion

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

测序文库的制备是以最佳方式回答生物学问题的关键一步。该研究感兴趣的转录本类型将指导选择哪种类型的测序文库并推动生物信息学分析。例如,根据测序的类型,从病原体和宿主相互作用的测序中,可以识别来自两者的序列或仅来自宿主转录本的序列。

下一代测序设备,例如Illumina平台,测量测序质量评分,这代表了碱基被错误调用的概率。下游分析对低质量序列非常敏感,并导致基因表达不足或误读。执行正确分析和解释的另一个障碍是适配器序列。适配器序列有助于文库的制备和测序,在大多数情况下,适配器也是测序的。最近的研究发现,制图工具对最终结果的影响很小13。然而,在病原体 - 宿主研究中,当测试不同的阈值以最小化多映射位点序列问题时,映射过程可以产生稍微更好的结果。

差异基因表达结果应谨慎解释,特别是当每组样本数量非常少且样本来自不同的测定并受到批次效应干扰DEG结果时。这些结果对几个因素很敏感:(一)所应用的数据过滤,例如去除低表达基因和要维持的样本数量;(ii)研究设计,仅比较样本组或每个感染患者与所.......

Access restricted. Please log in or start a trial to view this content.

Disclosures

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

作者没有什么可透露的。

Acknowledgements

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

HN由FAPESP(资助编号:#2017/50137-3,2012/19278-6,2018/14933-2,2018/21934-5和2013/08216-2)和CNPq(313662/2017-7)资助。

我们特别感谢为研究员提供的以下赠款:ANAG(FAPESP Process 2019/13880-5),VEM(FAPESP Process 2019/16418-0),IMSC(FAPESP Process 2020/05284-0),APV(FAPESP Process 2019/27146-1)和RLTO(CNPq Process 134204/2019-0)。

....

Access restricted. Please log in or start a trial to view this content.

Materials

List of materials used in this article
NameCompanyCatalog NumberComments
CEMiTool计算系统生物学实验室1.12.2以全自动方式发现和分析共表达基因模块,同时提供带有高质量图表的用户友好型 HTML 报告。
EdgeRBioconductor(维护者:Yunshun Chen [yuchen at wehi.edu.au])3.30.3具有生物复制的 RNA-seq 表达谱的差异表达分析
EnhancedVolcanoBioconductor(维护者:Kevin Blighe [kevin at clinicalbioinformatics.co.uk])1.6.0具有增强着色和标记的可发表的火山图
FastQCBabraham Bioinformatics0.11.9旨在提供一种简单的方法来对来自高通量测序的原始序列数据进行一些质量控制检查
FeatureCounts生物信息学部,Walter 和 Eliza Hall 医学研究所2.0.0将映射测序读数分配给指定的基因组特征
MDP计算系统生物学实验室1.8.0扰动分子度 根据来自对照
RR 核心组4.0.3计算统计计算和图形的编程语言和免费软件环境
STAR生物信息学部,沃尔特和伊丽莎霍尔医学研究所2.7.6aAligner 旨在专门解决 RNA-seq 数据映射的许多挑战,使用一种策略来解释剪接比对
Bowtie2约翰霍普金斯大学2.4.2用于将测序读数与长参考序列比对的超快速且节省内存的工具
TrimmomaticTHE USADEL LAB0.39修剪 Illumina 双端和单端数据的 Trimming 接头序列任务
获取 DockerDocker20.10.2创建可重复且可预测的 (https://docs.docker.com/get-docker/)
WSL2 内核WindowsNAhttps://docs.microsoft.com/en-us/windows/wsl/wsl2-kernel
获取 Docker LinuxDockerNAhttps://docs.docker.com/engine/install/ubuntu/
Docker Linux 存储库DockerNAhttps://docs.docker.com/engine/install/ubuntu/#install-using-the-repository
MDP 网站计算系统生物学实验室NAhttps://mdp.sysbio.tools
Enrichr 网站MaayanLabNAhttps://maayanlab.cloud/Enrichr/
webCEMiTool计算系统生物学实验室NAhttps://cemitool.sysbio.tools/
gProfiler生物信息学、算法学和数据挖掘小组NAhttps://biit.cs.ut.ee/gprofiler/gost
goseqBioconductor(维护者:Matthew Young [my4 at sanger.ac.uk])NAhttp://bioconductor.org/packages/release/bioc/html/goseq.html
SRA NCBI 研究NCBINAhttps://www.ncbi.nlm.nih.gov/bioproject/PRJNA507472/
统计

References

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,
  1. Weaver, S. C., Charlier, C., Vasilakis, N., Lecuit, M. Zika, Chikungunya, and Other Emerging Vector-Borne Viral Diseases. Annual Review of Medicine. 69, 395-408 (2018).
  2. Burt, F. J., et al. Chikungunya virus: an update o....

Access restricted. Please log in or start a trial to view this content.

Reprints and Permissions

Request permission to reuse the text or figures of this JoVE article

Request Permission

Tags

Transcriptome AnalysisHost Pathogen InteractionsRNA SequencingDifferential Gene ExpressionCo Expression AnalysisQuality ControlFunctional EnrichmentMolecular PerturbationBlood TranscriptomeGene Annotation

Related Articles