本文介绍了一种使用DeepSpaceDB的协议,DeepSpaceDB是一个用于空间转录组学的动态交互式数据库,提供了分析工作流程和示例来探索组织组织和疾病相关基因表达。
Method Article
本文介绍了一种使用DeepSpaceDB的协议,DeepSpaceDB是一个用于空间转录组学的动态交互式数据库,提供了分析工作流程和示例来探索组织组织和疾病相关基因表达。
空间转录组学是一项快速发展的技术,能够捕获组织样本中的基因表达模式,同时保留位置信息。它在生物学研究和生物信息学中有着广泛的应用,使研究人员能够调查和跟踪不同组织、条件和疾病中基因表达的空间变异。随着空间转录组学数据分析的普及,公开数据集的数量正在增加。然而,空间转录组学仍然是一种高度专业化的实验技术,存在重大的技术和财务限制。为了方便访问空间数据,我们最近开发了 DeepSpaceDB,这是一个用于空间转录组学数据探索的综合动态数据库。本文通过一些示例概述了数据库的组件及其导航的详细工作流程。首先,演示了小鼠大脑样本的分析,探索了质量指标、空间变异的基因和途径以及海马体和下丘脑之间的基因表达变异。接下来,通过比较小鼠肝脏中结直肠来源的转移区域与健康组织的远处区域,进一步探索与免疫活性相关的差异表达基因的鉴定和注释。DeepSpaceDB 凭借其先进的工具和交互功能,成为空间转录组学研究的宝贵资源,能够更深入地探索组织组织和疾病生物学。
空间转录组学是一项新技术,使研究人员能够分析基因表达,同时保留组织切片内的空间信息,从而能够以前所未有的分辨率研究组织结构、细胞异质性和微环境影响1,2。然而,尽管这项技术具有潜力,但可及性和分析仍然有限,空间转录组学对许多实验室来说成本过高,而且数据分析需要先进的生物信息学技能。
开发公共数据库是扩大对这种新兴实验模式的访问的一种方式。已经创建了多个空间转录组学数据库。第一个是 SpatialDB,但它只包含有限数量的样本,并且没有更新3.SODB、SOAR和STOmicsDB数据库包括来自许多不同平台的大量样本,并作为数据存储库4,5,6发挥着重要作用。然而,分析工具有限且缺乏交互性。为了解决这个问题,我们最近开发了 DeepSpaceDB,这是一个精心策划的、用户友好的公开空间转录组学数据集数据库,旨在降低技术壁垒并扩大可访问性7。本文说明了该数据库中的几种工具,包括搜索数据库、检查样本质量、可视化工具以及组织切片中交互式选择区域的比较。它使用两个代表性的例子提出了详细的方案:分析小鼠大脑样本和患有结直肠转移的小鼠肝脏,以在实际环境中展示这些工具。通过这些工具,DeepSpaceDB 使更广泛的研究人员能够利用空间转录组学,而无需他们自己的数据或内部生物信息学能力。Honcharuk 等人7 详细介绍了数据收集、质量控制、处理工作流程以及 DeepSpaceDB 中包含的数据和功能。
1. 示例 1:小鼠大脑样本的分析
注意:在本节中,说明了小鼠大脑样本的分析,浏览了 DeepSpaceDB 中可用的不同特征和图( 材料表中提供了数据库链接)。
2.实施例2:小鼠肝脏结直肠转移区域免疫活性相关差异表达基因的鉴定和注释
注意:本节探讨了样本内比较。这通过基于两个不同样本的结直肠转移区域和肝脏切片内健康组织的远处区域之间差异表达基因的鉴定和注释来说明。与免疫活性相关的特定失调基因的空间表达在组织切片中进一步可视化。
实施例 1 演示了对小鼠大脑样本的分析,验证了读取计数、空间可变基因和途径以及海马体和皮层之间的基因表达变异等参数。首先,根据几个质量指标评估小鼠大脑样本DSID001557的质量:“检测到的基因”(图1A),“读取计数”(图1B)和“Mito”(线粒体读取的百分比;图1C)。这清楚地突出了大脑样本左侧质量较低的区域,这是基于检测到的基因数量少和读取计数低。为了了解样本相对于所有其他样本的相对质量,单击了数据库中的样本相对质量选项卡,其中显示了计数与否的图表。每个点检测到的基因数(平均值)。对于正在分析的样品,每个点检测到3500-4000个基因(图1D)。使用图像注释选项卡进一步分析样品的解剖特征。一般来说,这些注释是通过将组织图像切割成更小的部分并要求LLM描述可观察到的特征8而生成的。它们是帮助解读样本的粗略指示,需要谨慎解读。对于样本子集(尤其是人类乳腺癌样本),也可以由人类专家进行注释。然而,考虑到与用于常规诊断的图像相比,Visium H&E 图像的质量较低,因此提供的注释仅用于研究目的。对于样本DSID001557,将光标移动到显示小鼠大脑不同区域注释的切片上,例如海马区域,皮质层,具有神经胶质增生的致密细胞层等。通过了解样本切片的基本解剖特征,进一步探索了细胞类型簇和空间可变基因和通路等详细特征。小鼠大脑样本总共有15个簇,在样本切片上用颜色编码表示(图1E)。与样品相关的一些空间变异性最大的基因是 Nrgn、Slc17a7、Ly6h 和 Ddn(图 2)。根据文献证据表明 Nrgn 编码蛋白(神经颗粒蛋白)在介导突触可塑性和空间学习中的作用,Nrgn 在海马区域表现出高表达15。Slc17a7 是一种编码对谷氨酰胺能神经元神经传递至关重要的囊泡谷氨酸转运蛋白的基因16,以及 Ddn(一种编码调节突触后细胞骨架结构的蛋白质的基因17),也在海马区高度表达。相比之下,基因 Ly6h 的表达定位于皮质区域,根据文献表明 Ly6h 在皮质细胞膜中的限制性突触作用18。以类似的方式,在样品切片上可视化通路的活性(图 3)。观察到空间可变通路的激活与空间可变基因的功能作用一致,调节海马区的突触可塑性和神经递质活性,以及皮质区的神经肽信号传导。
最后,为了识别小鼠大脑样本的海马区和下丘脑之间差异表达的基因,使用了 “组织浏览器” 选项卡。在图像注释的指导下选择与感兴趣区域相关的点(图4A)。从生成的散点图中,一些鉴定出的差异表达基因属于空间可变性最高的基因(Nrgn、 Slc17a7、 Ddn),此外还有一些其他基因,例如 Pmch 和 Ttr。这些基因的表达在样品切片中可视化。 Pmch 在下丘脑外侧区域特异性过表达(图4B;与 图4A中的绿色选择区域相比)。该基因编码黑色素浓缩激素的前体,并参与能量稳态的维持19。相比之下, 基因Ttr 在海马区域特异性表达(图4C;与 图4A中的红色选择区域相比),根据其在学习和空间记忆中的功能作用20。通过使用该数据库对不同小鼠大脑区域进行样本内比较,我们能够根据空间基因表达和通路活性突出区域特异性功能特征。
在实施例2中,该数据库用于鉴定与肝脏结直肠转移相关的免疫特征。通过对两个样本进行适当的点选择,在结直肠转移的肿瘤区域和远处健康的肝组织之间进行样本内比较:DSID001005(图5A-C)和DSID001007(图5D-F)。使用R对数据进行两次重复,每个条件重复两次,根据所选参数,在结直肠转移的肿瘤区域和健康肝组织之间进行差异表达分析,显示138个基因下调,115个基因上调(图6A,B)。KEGG通路分析表明,下调基因的通路富集,如药物代谢和化学致癌(图6C),而上调基因表现出与白细胞跨内皮迁移、粘连斑和细胞周期等相对应的特征(图6D)。着眼于白细胞跨内皮迁移与免疫活性的相关性,鉴定了该类别中检测到的顶级基因,并在DeepSpaceDB中观察了它们的空间表达。有趣的是,在白细胞跨内皮迁移类别下检测到的基因Cldn7,Cldn4和Actg1在样本的肿瘤区域(Epcam+位点)表现出上调,而不是在具有健康肝组织的远处区域(图7)。 这提供了对肝脏肿瘤部位驱动的免疫活性的性质以及白细胞的主动募集的见解。总之,使用 DeepSpaceDB 进行样本内分析可以提取不同的生物学见解。通过交互式工具和重新分析工作流程比较空间转录组数据,研究人员可以生成和验证有关组织特异性基因表达和功能异质性的假设。

图 1:样品的质量测量。 (A)检测到的基因数量,(B)读取计数和(C)每个点的线粒体读取百分比。(D)与数据库中所有其他样本的分布相比,该样本中每个点的平均检测到的基因数。(E)组织切片上的斑点簇。 请点击此处查看此图的大图。

图 2:顶部空间变异基因的表达。 (A) Nrgn,(B) Slc17a7,(C) Ly6h 和 (D) Ddn。请点击此处查看此图的大图。

图 3:顶部空间可变途径的活性。 (A)神经肽信号传导,(B)突触可塑性的调节,(C)神经递质转运。 请点击此处查看此图的大图。

图4:小鼠大脑两个选定区域之间的基因表达模式比较。 (A)下丘脑和海马区域的点选择,用于样本内比较。所选区域 1 显示为红色,区域 2 显示为绿色。差异表达基因 (B) Pmch 和 (C) Ttr 在下丘脑和海马区域之间的空间表达模式。 请点击此处查看此图的大图。

图5:两个转移性小鼠肝脏样本的特性。 对于样本DSID001005:(A) Epcam 标记物表达,(B)斑点簇,以及(C)癌性和远处区域的选定区域,用于样本内比较。对于样品DSID001007:(D) Epcam 标记物表达,(E)斑簇,以及(F)癌性和远处区域的选定区域,用于样品内比较。对于这两个样本,肿瘤斑点位于红色显示的区域,非肿瘤斑点位于绿色显示的区域。 请点击此处查看此图的大图。

图 6:重新分析结果。 (A) 重新分析中使用的工作流程的示意图摘要。(B)代表癌变和远处区域之间差异表达基因的火山图。(C)上调基因和(D)下调基因的KEGG通路富集。 请点击此处查看此图的大图。

图7:基因的空间表达。 (A) Cldn7,(B) Cldn4和(C)组织切片DSID001005中的 Actg1 。基因的空间表达。(D) Cldn7,(E) Cldn4和(F)组织切片DSID001007中的 Actg1 。 请点击此处查看此图的大图。
补充文件 1-4:肝转移的数据文件和 R 脚本示例。请点击此处下载此文件。
在这里,我们介绍了两个综合协议,概述了 DeepSpaceDB 中空间转录组学数据的导航、检索和分析。虽然大多数空间组学数据库专注于从使用各种平台3,4,5,6生成的大量样本中收集数据,但DeepSpaceDB专注于开发交互式工具,允许用户深入有效地探索空间转录组学特征。为了实现这种级别的功能,当前版本专门关注 Visium 平台。随着高分辨率平台的出现,我们计划相应地扩展 DeepSpaceDB,以用户友好的方式开发处理和集成此类数据的新策略。
DeepSpaceDB 使用户能够评估样本质量指标(例如,基因计数、读取深度)并在数据集中进行比较。该数据库包括多层注释:使用分配标签的整个数据库进行无监督聚类,基于 LLM 的组织学图像结构和病理特征检测,以及针对不断增长的样本子集的专家组织学注释。此外,用户可以交互式地选择样本内或样本之间的感兴趣区域来比较基因表达,从而能够研究肿瘤与基质或患病与健康区域等区域之间的空间对比。其他数据库通常缺乏此类特征 3,4,5,6。还提供其他功能,例如空间可变的基因和途径、细胞类型预测和聚类结果。总而言之,该数据库显着降低了探索空间转录组学数据的障碍。来自各种组织和条件的样本可以自由访问,用户可以通过简单的点击式交互来导航它们;无需高级生物信息学专业知识。也就是说,对于准确解释表达模式和在 Tissue Explorer 工具中选择感兴趣区域可能需要一些标记基因和组织结构的先验知识。
虽然这里没有介绍,但用户也可以上传自己的样本并应用许多相同的工具来分析它们。该数据库还支持2个不同组织切片之间的样本间比较,例如,允许在患病组织和健康对照组织之间进行比较。最后,原始数据和处理后的数据以及所有派生的分析输出可供下载,支持下游工作流程和自定义分析。对于其中几个工具,数据库的教程页面上提供了简短的教程视频。
数据库仍有一些方面需要改进。一种是准确预测组织切片内每个位置的细胞类型和细胞类型组成。在当前版本的DeepSpaceDB(1.0版)中,我们使用一种称为稳健细胞类型分解(RCTD)21的方法预测了每个Visium斑点的细胞类型组成。RCTD 在最近的一项基准研究中表现相对较好22.RCTD 所做的预测也可以在我们最近对患癌小鼠肝脏的研究中得到实验验证23。然而,尚未对细胞类型预测的准确性进行全面评估。一个相关的问题是 RCTD 和其他细胞类型预测方法需要具有带注释的细胞类型的参考数据集。一般来说,每个空间位置的细胞类型(或细胞类型组成)是通过与该参考数据集中的基因表达模式的比较来预测的。然而,为每个 Visium 样品选择合适的参考并不总是那么简单。参考文献可能缺乏关键细胞类型,或者相反,可能包括组织切片中不存在的细胞类型24。此外,在一种细胞类型中,细胞可以处于截然不同的状态,例如非活性免疫细胞与激活免疫细胞25。参考数据集中存在的细胞状态不一定与空间样本的细胞状态相匹配,空间样本通常是从患者的疾病模型中获得的。这两个问题都可能导致预测不准确。我们希望将来能解决这个问题。
随着空间转录组学领域的不断快速发展,越来越多的计算工具正在开发中,用于分析空间数据的各个方面,包括细胞间相互作用、空间域和空间可变基因的预测(例如,参见 26,27,28)。虽然这种激增反映了该领域的活力,但它也给策划工具和集成到该数据库中带来了挑战。为确保包括最稳健和最广泛适用的方法,迫切需要系统基准研究来评估跨数据集和分析任务的工具性能22,29,30。这些努力对于指导在知情的情况下选择纳入数据库的工具并确定其优先次序至关重要。
虽然其他空间转录组学数据库试图收集许多不同平台的大量样本,但在 DeepSpaceDB 中,我们决定使用不同的策略:专注于几个流行的平台,并实施交互式和直观的工具,使用户能够轻松地更详细地探索数据。虽然我们的数据库仅包含当前 1.0 版中的 Visium 样本,但我们计划在未来的更新中也包含来自其他平台的样本。
作者没有什么可透露的。
作者要感谢Y. Harada的秘书协助。这项工作得到了JST NBDC(授权编号JPMJND2303,A.V.)和AMED(授权编号JP24gm2010003,A.V.)的支持。这项工作还得到了日本学术振兴会科研费(20H03451、24K02236 和 24KK0147;S.K.)、JST FOREST(JPMJFR2062;S.K)、JST 登月计划 (JPMJMS2011-61;S.K)。资助者在研究设计、数据收集和分析、发表决定或手稿准备方面没有任何作用。
| Name | Company | Catalog Number | Comments |
|---|---|---|---|
| clusterProfiler | R 包 - 版本 4.14.6 | ||
| DeepSpace数据库 | 版本 > 1.0 | 数据库链接:www.deepspacedb.com | |
| 利马 | R 包 - 版本 3.62.2 | ||
| R | 版本 4.4.2 | ||
| RS图迪奥 | 安置 | 版本 2024.12 |
Request permission to reuse the text or figures of this JoVE article
Request Permission