Method Article

使用 R 进行 MiRNA-Seq 数据处理和生物信息学分析的经过验证的工作流程

DOI:

10.3791/68760

October 24th, 2025

In This Article

Summary

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

在这里,我们提出了一种使用 R 分析 miRNA-Seq 数据的协议。该工作流程使研究人员能够探索 miRNA 调控网络及其在各种生物学和临床问题中的重要性。这项工作旨在为 miRNA 生物信息学领域的新手和经验丰富的研究人员提供实用指南。

Abstract

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

MicroRNA (miRNA) 是影响广泛生理和病理过程的关键转录后调节因子。随着高通量测序技术的进步,miRNA-Seq 已成为分析 miRNA 表达模式的强大工具。然而,对此类数据的可靠解释需要标准化且可重复的分析管道。在这里,我们提出了一个经过验证的工作流程,用于使用 R 进行 miRNA-Seq 数据处理和生物信息学分析。该协议包含所有基本步骤,包括原始数据预处理、质量控制、比对、定量、归一化、差异表达分析、靶点预测、功能富集和调控网络构建。该工作流程旨在实现灵活性和透明度,集成了广泛采用的 R 包,并支持特定物种的注释和模块化定制。此外,还指导用户利用精选数据库和可视化工具(如 Cytoscape)进行下游生物学解释。该协议不仅支持稳健的统计分析,而且还可以对 miRNA-mRNA 相互作用及其在疾病机制中的作用有意义的见解。它特别适合进行 miRNA 生物标志物发现、疾病建模或综合多组学研究的新手和经验丰富的研究人员。

Introduction

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

MicroRNA (miRNA) 是短的非编码 RNA 分子,通过在转录后阶段1 起作用显着影响基因表达。它们通常通过与靶信使 RNA (mRNA) 的 3' 非翻译区 (UTR) 中的互补序列结合来发挥作用,导致 mRNA 降解或翻译抑制1。在过去的二十年里,miRNA越来越被认为是各种生物过程的中心调节因子,包括细胞增殖、分化、细胞灭亡、免疫反应和器官发育2。此外,miRNA表达失调与癌症、心血管疾病、神经系统疾病和肾脏疾病等多种疾病的发病机制有关3。这些发现凸显了 miRNA 不仅作为治疗靶点,而且作为临床诊断中微创生物标志物的潜力。

随着下一代测序(NGS)技术的出现,miRNA的研究进入了一个新的时代。与仅限于已知 miRNA 的基于微阵列的方法不同,miRNA 测序 (miRNA-Seq) 能够对不同样品类型和条件下的已知和新型 miRNA 进行全面、高通量和无偏见的分析4。miRNA-Seq 提供卓越的灵敏度、准确性和动态范围,使其成为研究生理和病理环境中 miRNA 表达模式和发现调控机制的首选方法5。然而,m....

Access restricted. Please log in or start a trial to view this content.

Protocol

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

注意:带有软件链接的材料列在 材料表中。

1. 制备 RNA 样品和序列文库

注意:在此计算工作流程之外执行 RNA 提取和测序。分析miRNA测序数据的方法不止一种。本节提供了一种实践的背景。

  1. 提取总 RNA:使用针对小 RNA 分离优化的试剂盒(例如 miRNA 分离试剂盒)从生物样品中提取总 RNA。仔细遵循制造商的协议。确保使用不含 RNase 的耗材,并将样品放在冰上,以尽量减少降解。
  2. 评估 RNA 的完整性和数量:在生物分析仪或等效设备上运行 1-2 μL 提取的 RNA。检查 RNA 完整性数 (RIN) 并确保其≥ 7.0 以实现可靠的测序。使用分光光度计或荧光计记录浓度。
  3. 构建小 RNA 文库:使用商用小 RNA-seq 文库制备试剂盒从 1 μg 总 RNA 制备测序文库。按照试剂盒方案连接接头、逆转录和扩增 cDNA。通过大小选择(例如,18-30 nt插入片段)纯化PCR产物,以富集miRNA片段。
  4. 序列文库:将文库加载到高通量测序平台上。设置读取长度为 ~50 bp 的单端测序的运行配置。确保每个样本生成大约 1000 万个原始读数,以达到足够的深度。
  5. 导出测....

Access restricted. Please log in or start a trial to view this content.

Results

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

我们从GSE133530下载了microRNA表达基质,并直接进行了差异表达分析。我们在 补充文件 1 中为数据集提供了一个示例分析 R 脚本。该数据集对16个不同大小的肾囊肿(最小囊肿:小于1-5 mL,n = 10;中型囊肿:10-25 mL之间,n = 4;大囊肿:大于50 mL,n = 4)和来自四个PKD1多囊肾的微囊性组织(MCT,n = 7,包括1个重复)进行了全局miRNA分析。此外,从三个诊断为孤立性肾细胞癌的肾切除术标本中获得了无恶性肿瘤的肾皮质组织,并作为正常对照 (n = 4)。为了找出最明显变化的miRNA,我们比较了来自小、中和大囊肿的样本与正常对照组织。如 图1A 所示,ADPKD样品的miRNA表达模式明显与对照样品不同。随后,我们利用生物分析仪工具(R 包 DESeq2)在两组之间产生了显着不同表达的 miRNA。另一个工具 Limma 似乎也提供了合理的结果。 图1B 显示了所有显着变.......

Access restricted. Please log in or start a trial to view this content.

Discussion

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

由于读数尺寸小且冗余,miRNA-Seq 数据的分析面临明显的挑战,因此严格的质量控制和预处理至关重要。工作流程中最重要的步骤之一是适配器修剪。由于 miRNA 大约有 22 个核苷酸长,因此如果去除不当,接头序列很容易主导读数。未能执行准确的修剪可能会导致误对和误报读数膨胀。同样,在对齐之前应实施质量过滤,以消除可能影响测绘精度的低质量基础。映射和量化是另一个重要阶段。与标准 mRNA-Seq 数据不同,标准 mRNA-Seq 数据的读数通常跨越外显子,miRNA 读数紧凑,必须与已知的 miRNA 位点完美对齐。使用具有严格参数的 Bowtie 可确保精确比对,尤其是在映射到 miRBase 等数据库中的成熟 miRNA 序列时。在基因组比对与 miRBase 指数比对之间做出选择应取决于实验设计 - miRBase 比对适用于表达定量,而当需要发现新的 miRNA 时,基因组比对更好

该工作流程适用于不同的实验设置。例如,当排序深度低于预期时,Bowtie 中的对齐参数可能.......

Access restricted. Please log in or start a trial to view this content.

Disclosures

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

作者声明没有利益冲突。

Acknowledgements

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

我们感谢支持该项目的资助机构和合作者。上海市科技创新行动计划(22Y11905500,24142201800)、解放军海军第905医院机构项目(2024Q021)、长宁区卫健委青年科研项目(2024QN29)、海军军医大学科研项目(2024QN040)。

....

Access restricted. Please log in or start a trial to view this content.

Materials

List of materials used in this article
NameCompanyCatalog NumberComments
Agilent-021827 人 miRNA 微阵列安捷伦/用于分析人类样本 microRNA 的商业阵列
领结约翰·霍普金斯大学http://bowtie-bio.sourceforge.net/index.shtml用于将测序读数与长参考序列对齐的软件工具
clusterProfiler(R 包)生物导体https://bioconductor.org/packages/clusterProfiler/专为高通量生物数据的功能富集分析和可视化而设计的 R 包。
剪接开源https://cutadapt.readthedocs.io一种命令行工具,可从高通量测序读数中去除接头序列、引物、poly-A 尾部和其他不需要的片段。
细胞景观Cytoscape 联盟https://cytoscape.org/一个开源软件平台,专为复杂生物网络的可视化和分析而设计。
DESeq2(R 封装)生物导体https://bioconductor.org/packages/DESeq2/专为计数数据的差异基因表达分析而设计的 R 包
增强型火山(R 包)生物导体https://bioconductor.org/packages/EnhancedVolcano/ 一个 R 包,旨在创建出版质量的火山图。
快速质量控制巴伯拉罕生物信息学https://www.bioinformatics.babraham.ac.uk/projects/fastqc/用于高通量测序数据的开源质量控制工具。
功能计数子阅读 / SourceForgehttp://subread.sourceforge.net/用于计数映射到基因组特征的读数的程序
HTSeq 计数Python 包https://htseq.readthedocs.io一种命令行工具,用于计算有多少比对的高通量测序读数重叠基因组特征,例如基因或外显子。我
Illumina Human v2 MicroRNA 表达磁珠芯片Illumina /用于分析人类样本 microRNA 的商业阵列
multiMiR(R包)生物导体https://bioconductor.org/packages/multiMiR/一个 R 包,提供最大的预测和实验验证的 microRNA 集成集合–靶向相互作用及其与疾病和药物的关联。
组织。Hs.eg.db(R 包)生物导体https://bioconductor.org/packages/org.Hs.eg.db/专为人类(智人)基因组学研究而设计的注释包。
R 软件R项目https://www.r-project.org/统计计算开源项目
Rstudio 工作室假设 PBC/集成开发环境有助于提高 R 和 Python 的工作效率
SAM工具开源http://www.htslib.org/用于处理下一代测序 (NGS) 数据的软件包。

References

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,
  1. Hsu, P. W., et al. miRNAMap: genomic maps of microRNA genes and their target genes in mammalian genomes. Nucleic Acids Res. 34 (Database issue), D135-D139 (2006).
  2. Fragiadaki, M. Lessons from....

Access restricted. Please log in or start a trial to view this content.

Reprints and Permissions

Request permission to reuse the text or figures of this JoVE article

Request Permission

Tags

MiRNA SeqMiRNA ExpressionData ProcessingBioinformatics AnalysisDifferential ExpressionTarget PredictionFunctional EnrichmentRegulatory NetworkR PackagesCytoscape Visualization

Related Articles