Method Article

基于体型RNA测序数据的转录组分析

DOI:

10.3791/69611

January 16th, 2026

In This Article

Summary

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

本方案建立了一套完整的流程,用于分析从原始数据到功能富集分析的体质RNA测序过程。

Abstract

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

非酒精性脂肪肝(NAFL)通常被认为是良性疾病;然而,一旦发展为非酒精性脂肪性肝炎(NASH),患者罹患末期肝病的风险显著增加。许多研究正试图阐明从NAFL向NASH转变的分子机制。高通量测序技术(如体型RNA-seq)通过检查转录组,揭示了分子表达、信号通路激活及其他与疾病进展相关的因素,为研究人员提供了更深入的理解。研究人员有大量开源数据可供分析,以识别潜在的疾病治疗靶点。然而,相关研究受限于缺乏高效可靠的转录组上游分析流程。这里提供了高度可重复且用户友好的上游分析及后续的差异基因分析流程,以实现对私密或公共数据的标准化处理和深度解析。该流程分为四个步骤:(1)数据质量控制;(2)基因定位;(3)差异基因分析;以及(4)泛函分析。该过程旨在揭示疾病转化的分子机制,并通过分析Bulk RNA-seq数据,协助研究人员筛选潜在药物靶点和治疗方法。

Introduction

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

非酒精性脂肪肝(NAFLD)是全球最常见的慢性肝病,影响超过四分之一的人口。近几十年来,其发病率急剧上升,1,2,3。日益增长的疾病负担,尤其是其更为严重的形式——非酒精性脂肪肝炎(NASH),构成了全球重大健康挑战和沉重的经济负担4.NAFLD的第一阶段是非酒精性脂肪肝(NAFL),伴有炎症和纤维化,可能进展为NASH。后者显著增加肝病末期发展的风险,包括肝硬化和肝细胞癌(HCC)5,6,7。HCC的发生率和死亡率与NASH的增加相关预计到2030年,NAFLD/NASH将成为肝移植的主要适应症。然而,NAFLD的临床进展极为异质,严重阻碍了相关药物的开发,因此精确探究相关分子机制尤为重要。

Access restricted. Please log in or start a trial to view this content.

Protocol

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

为示范目的,Lan Bai等人生成的公开数据集被用来说明上下游分析的每一步PRJNA102350220。由于该数据集来源于开放访问的NCBI SRA数据库,无需额外的权限或伦理审批。请参阅 材料表 以核实所有必需的软件和R包版本。公开数据集PRJNA1023502包括6个非NASH、6个NAFL和6个NASH肝RNA测序样本。该方案中,该数据集展示了体型RNA测序工作流程的所有步骤,包括从SRA数据库检索数据、质量控制(fastp)、比对(HISAT2)、定量(featureCounts)以及下游差异表达和功能富集分析。

1. SRA工具包安装

  1. 请访问SRA工具包官方网站并下载3.2.1版本。

2. 公共数据下载

  1. 获取SRA号码。
    1. 可通过文章补充20、数据可用性部分访问,或在NCBI SRA数据库中搜索关键词访问。
    2. 在终端输入预取即可下载。

Access restricted. Please log in or start a trial to view this content.

Results

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

体型RNA测序的上游分析流程如 图1A所示。该工作流程在 Linux 平台上依次执行以下关键步骤:首先,使用 fastp 对原始测序数据进行严格质量控制,以去除低质量读段和适配器序列;随后,HISAT2 将高质量读段比对到参考基因组,Samtools 对比对文件进行转换和排序;最后,FeatureCounts执行基因级定量,生成基因表达矩阵,为后续分析提供高质量输入。后续对生成表达式矩阵的处理和统计分析在R环境中进行,相关工作流程和所需软件包如 图1B所示。分析中选取了一项已发表研究的数据,包括6个非NASH、6个NAFL和6个NASH样本20见图1C)。非NASH对照样本来自不符合肝移植标准且无NAFLD或NASH的个体。

需要注意的是,由于Bai等人公开的数据未提供明确的批次信息(如.......

Access restricted. Please log in or start a trial to view this content.

Discussion

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

体质RNA测序数据分析被定义为一项跨学科任务,融合了基因组学、生物信息学、统计学和计算机科学。完整的分析流程涵盖多个上下游步骤,包括原始数据预处理、质量控制、序列比对、基因级定量、数据归一化、差异表达分析和生物解读。在这些步骤中,准确将原始测序读段转换为高质量的基因表达矩阵尤为关键,因为上游处理过程中引入的错误可能传递到所有下游生物学结论中。因此,建立透明且标准化的上游分析工作流程对于提高转录组研究的可重复性至关重要。

该协议提供了一个简化的、完全基于脚本的工作流程,集成了广泛使用的工具,如fastp(用于读取裁剪和质量控制)、HISAT2(用于剪接感知比对)和featureCounts(用于基因级定量)。这些工具已被广泛应用于成熟的RNA-seq分析框架中——包括基于Tuxedo的流程和常用的协议工作流程——并经过了准确性和效率的严格验证(21,22)。在这些基础方法的基础上,工作流程通过在 Li.......

Access restricted. Please log in or start a trial to view this content.

Disclosures

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

作者声明他们没有利益冲突。

Acknowledgements

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

作者感谢本研究所用公开数据库的维护者。

....

Access restricted. Please log in or start a trial to view this content.

Materials

List of materials used in this article
NameCompanyCatalog NumberComments
生物体生物导体2.64.0来自Ensembl的基因注释
clusterProfiler生物导体4.16.0功能富集分析
DESeq2生物导体1.48.1差分表达分析
事实矿山R农业巴黎科技2.11.0主主成分分析与多变量分析
FASTP开放基因1.0.1FASTQ数据的质量控制与过滤
功能计数沃尔特与伊丽莎白·霍尔医学研究所生物信息学部2.0.0 统计每个基因映射的读段数量以定量基因表达
GGPLOT2假设3.5.2数据可视化
格雷佩尔卡米尔·斯沃维科夫斯基0.9.6不重叠的文本标签
格里奇斯克劳斯·O·威尔克0.5.6创建山脊线地块
HISAT2约翰斯·霍普金斯大学2.2.1将过滤后的高质量读段与参考基因组比对
RR核心团队 4.5.0一个用于数据计算、分析和可视化的环境
RColor酿酒师埃里希·诺伊维尔特1.1.3用于绘图的色彩调色板
samtools大规模基因组学工作流1.22.0转换和处理SAM文件,以实现高效的检索和访问
SRA工具包国家生物技术信息中心3.2.1从NCBI SRA数据库获取并预处理原始测序数据

References

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,
  1. Asrani, S. K., Devarbhavi, H., Eaton, J., Kamath, P. S. Burden of liver diseases in the world. J Hepatol. 70 (1), 151-171 (2019).
  2. Friedman, S. L., Neuschwander-Tetri, B. A., Rinella, M., Sanyal, A. J. Mechanisms of NAFLD development and therapeutic strategies. Nat Med. 24 (7), 908-922 (2018).
  3. <....

Access restricted. Please log in or start a trial to view this content.

Reprints and Permissions

Request permission to reuse the text or figures of this JoVE article

Request Permission

Tags

Bulk RNA SeqTranscriptomic AnalysisDifferential Gene AnalysisFunctional AnalysisQuality ControlGene MappingNonalcoholic Fatty LiverSteatohepatitis ProgressionMolecular MechanismsDisease Biomarkers

Related Articles