Method Article

使用 DeepSpaceDB 挖掘空间转录组学数据集

DOI:

10.3791/68892

September 5th, 2025

In This Article

Summary

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

本文介绍了一种使用DeepSpaceDB的协议,DeepSpaceDB是一个用于空间转录组学的动态交互式数据库,提供了分析工作流程和示例来探索组织组织和疾病相关基因表达。

Abstract

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

空间转录组学是一项快速发展的技术,能够捕获组织样本中的基因表达模式,同时保留位置信息。它在生物学研究和生物信息学中有着广泛的应用,使研究人员能够调查和跟踪不同组织、条件和疾病中基因表达的空间变异。随着空间转录组学数据分析的普及,公开数据集的数量正在增加。然而,空间转录组学仍然是一种高度专业化的实验技术,存在重大的技术和财务限制。为了方便访问空间数据,我们最近开发了 DeepSpaceDB,这是一个用于空间转录组学数据探索的综合动态数据库。本文通过一些示例概述了数据库的组件及其导航的详细工作流程。首先,演示了小鼠大脑样本的分析,探索了质量指标、空间变异的基因和途径以及海马体和下丘脑之间的基因表达变异。接下来,通过比较小鼠肝脏中结直肠来源的转移区域与健康组织的远处区域,进一步探索与免疫活性相关的差异表达基因的鉴定和注释。DeepSpaceDB 凭借其先进的工具和交互功能,成为空间转录组学研究的宝贵资源,能够更深入地探索组织组织和疾病生物学。

Introduction

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

空间转录组学是一项新技术,使研究人员能够分析基因表达,同时保留组织切片内的空间信息,从而能够以前所未有的分辨率研究组织结构、细胞异质性和微环境影响1,2。然而,尽管这项技术具有潜力,但可及性和分析仍然有限,空间转录组学对许多实验室来说成本过高,而且数据分析需要先进的生物信息学技能。

开发公共数据库是扩大对这种新兴实验模式的访问的一种方式。已经创建了多个空间转录组学数据库。第一个是 SpatialDB,但它只包含有限数量的样本,并且没有更新3.SODB、SOAR和STOmicsDB数据库包括来自许多不同平台的大量样本,并作为数据存储库4,5,6发挥着重要作用。然而,分析工具有限且缺乏交互性。为了解决这个问题,我们最近开发了 DeepSpaceDB,这是一个精心策划的、用户友好的公开空间转录组学数据集数据库,旨在降低技术壁垒并扩大可访问性7。本文说明了该数据库中的几种工具,包括搜索数据库、检查样本质量、可视化工具以及组织切片中交互式选择区域的比较。它使用两个代表性的例子提出了详细的方案:分析小鼠大脑样本和患有结直肠转移的小鼠肝脏,以在实际环境中展示这些工具。通过这些工具,DeepSpaceDB 使更广泛的研究人员能够利用空间转录组学,而无需他们自己的数据或内部生物信息学能力。Honcharuk 等人7 详细介绍了数据收集、质量控制、处理工作流程以及 DeepSpaceDB 中包含的数据和功能。

Protocol

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

1. 示例 1:小鼠大脑样本的分析

注意:在本节中,说明了小鼠大脑样本的分析,浏览了 DeepSpaceDB 中可用的不同特征和图( 材料表中提供了数据库链接)。

  1. 样品选择
    1. 单击 “数据库” 选项卡,然后使用过滤器选择生物体 小鼠、器官 大脑和源 zenodo。浏览生成的样本,然后选择样本 DSID001557。或者,使用搜索框在数据库中搜索术语“DSID001557”,然后选择此示例。
    2. 单击样品并确认描述为 100 μL 盐水 NK 细胞中的 2 × 10个 6 个细胞(静脉注射每周一次,共 5 次)。
  2. 质量分析
    1. 单击 “质量 ”选项卡以评估所选样品的质量。从 质量测量 下拉菜单中,选择不同的选项,如 检测到的基因图 1A)、 读取计数图 1B)和 Mito 图 1C),以可视化样品切片中每个点的相应参数。
  3. 图像注释
    1. 导航到 图像注释 选项卡以识别样本切片的不同区域。
    2. 将鼠标光标移到 样品切片上。大型语言模型 (LLM) 预测的注释以基于网格的方式显示样本图像的各个部分,并包含有关解剖结构和相关条件的信息8
  4. 聚类分析
    1. 要更深入地了解示例切片中的单元格类型聚类,请导航到 “聚类” 选项卡。将显示簇的 2D 嵌入,以及样品切片上点上颜色编码簇的表示(图 1E)。
  5. 空间可变的基因和途径
    1. 导航到“基因”选项卡并记下样品9,10中空间可变基因(SVG;表达水平因组织位置而异的基因)。这些SVG是使用singleCellHaystack函数预测的,该函数采用Kullback-Leibler发散度量(表中的D_KL)来评估每个基因的表达模式与随机预期的表达模式的区别(图2)。具有低 p 值(表中的大负 log.p.adj)的基因被列为 SVG。
      注意:基因表达数据使用 Seurat R(第 5 版)包11 中使用的默认参数进行归一化。在实践中,每个点上每个基因的读数除以该点的读长总数,然后乘以比例因子 10,000。接下来,在加 1 后计算自然对数,以避免出现 log(0) 问题。 基因 选项卡中显示的图显示了此归一化数据。
    2. 单击列表中的一些顶级基因。这为整个组织切片的基因生成了一个空间图,并针对表达水平对斑点进行了颜色编码(图 2)。得分最高的基因具有明显不同的空间表达模式。
    3. 进一步导航到“途径”选项卡,以检查基因集(例如,与共同生物途径相关的基因)而不是单个基因的活性。空间可变途径的列出方式与上面讨论的 SVG 类似(图 3)。根据与其相关的基因的表达水平来估计通路活性 7,11
      注意:使用 Seurat R 包函数 addModuleScore11 估计通路活动。简而言之,该函数将一组基因(例如,一组参与共同途径的基因)作为输入,并在几个处理步骤后返回它们的平均表达水平。在实践中,正值意味着高于平均水平的活动,负值意味着低于平均水平的活动。路径 选项卡中 显示的图显示了此模块分数数据。
    4. 单击列表中的一些热门路径。这为穿过组织切片的通路生成空间图,并针对活动水平对斑点进行颜色编码。几种途径具有不同的活动空间模式(图 3)。
  6. 样品内基因表达比较
    1. 导航到“ 组织资源管理器 ”选项卡并选择 “手动选择 ”(如果尚未选择)。接下来,使用鼠标光标选择左侧小鼠脑切片海马区域中的点。单击集 1,然后选择 添加到集。这将突出显示右侧切片上所有选定的点(图 4A)。
    2. 现在单击 集合 2,然后使用鼠标光标选择小鼠大脑切片下丘脑区域的点。单击 添加到设置,这将突出显示右侧切片上所有选定的点(图 4A)。
    3. 完成点选择过程后,单击 “比较基因表达” 按钮。这将生成一个表格,其中包含两个区域之间所选斑点的平均基因表达值,以及散点图表示。将光标移动到各个点上以确认基因名称和两个区域中基因的平均表达。
    4. 根据基因表达比较结果,识别差异表达的基因并重新导航到“基因”选项卡以可视化它们在样品切片中的表达(图4B,C)。
      注意:通过上述步骤,DeepSpaceDB可用于研究小鼠脑空间转录组学样本的特征。

2.实施例2:小鼠肝脏结直肠转移区域免疫活性相关差异表达基因的鉴定和注释

注意:本节探讨了样本内比较。这通过基于两个不同样本的结直肠转移区域和肝脏切片内健康组织的远处区域之间差异表达基因的鉴定和注释来说明。与免疫活性相关的特定失调基因的空间表达在组织切片中进一步可视化。

  1. 数据库导航和样本选择
    1. 单击 “数据库” 选项卡,然后使用过滤器选择生物体 小鼠、器官 肝脏和条件 癌症。从生成的样本中,选择样本 DSID001005。单击样本并确认描述,说明 样本来自含有结直肠癌来源转移的小鼠肝脏
    2. 导航到“ 组织资源管理器 ”选项卡,然后选择 “手动选择”。接下来,使用鼠标光标,选择肝脏样本DSID001005肿瘤区域(结直肠转移)中的斑点,根据 Epcam 标记物的阳性表达进行识别(图5A)。单击 集 1,然后选择 添加到集。这将突出显示右侧切片上的所有选定点(图5C)。
    3. 现在单击 集合 2,然后使用鼠标光标选择肝脏样本远处非肿瘤区域中的点。单击 添加到集,这将突出显示右侧切片上所有选定的点(图5C)。
  2. 选定点之间基因表达的比较
    1. 完成点选择过程后,单击 “比较基因表达” 按钮。这将生成一个表格,其中包含两个区域之间所选斑点的平均基因表达值,以及散点图表示。将鼠标光标移到各个点上,检查基因名称和两个区域中基因的平均表达。
    2. 要对基因表达数据进行更深入的分析,请选择“ 下载 CSV ”选项。这将生成样本两个区域的基因表达数据的逗号分隔值 (CSV) 文件。
    3. 对样本“DSID001007”重复步骤 2.1.1-2.1.3 和 2.2.1-2.2.2。确认其描述为含有结直肠癌来源转移的小鼠肝脏的另一片。
  3. 使用 R 编程进行数据分析
    1. 确认上述步骤生成了 2 个 CSV 文件,一个来自示例 DSID001005,一个来自示例 DSID001007。两个文件都包含 2 列,代表每个样本中进行的 2 种选择(肿瘤组织和非肿瘤组织)中的平均基因表达。
    2. 将 CSV 文件读取到 R 中并将它们合并以进行进一步的下游分析,每个条件进行两次重复(即,具有结直肠癌转移的肿瘤区域和肝脏中的远处健康组织)。请参阅 补充资料中的 R 脚本和数据文件。
    3. 使用R(版本4.4.2)12 中的limma包(版本3.62.2)对数据进行差异表达分析,将两个样本的结直肠转移区域分类为 癌症,将两个样本的远处健康区域分类为 对照。用logFC滤波器>0.5,调整后的p值<0.05,获得上调基因。类似地,用logFC滤波器<-0.5,调整后的p值<0.05获得下调基因。
      注意:这些基因集用于识别下一步中受肿瘤影响的生物途径(图6A,B)。
    4. 使用 R13 中的 clusterProfiler 包(版本 4.14.6)对京都基因和基因组百科全书 (KEGG)14 中下调和上调基因的通路进行分析。基于 q 值 < 0.05 的严格过滤,确定与下调和上调基因相关的重要途径。关注与免疫途径、免疫活性或相关特征相关的基因(图6B)。
  4. 基因特异性数据挖掘
    1. 接下来,在 空间可变基因 部分搜索基因名称,以确认靶基因的空间表达。单击基因名称以生成跨组织切片的基因空间图,并针对表达水平对斑点进行颜色编码(图 7)。
    2. 识别结直肠转移部位具有空间表达模式的特定基因,而不是远处的健康肝组织。基因的功能相关性,或它们在其他器官或条件下的表达,可以在数据库中进一步探索。
    3. 选择 “搜索 ”选项卡,然后选择物种作为 鼠标。单击按 基因搜索 选项,然后输入基因名称。将显示基因的器官和条件分布的概述,并可以进一步分析。
      注意:通过上述详述的步骤,DeepSpaceDB可用于研究小鼠肝脏空间转录组学样品中转移性和非转移性区域之间的基因表达模式。

Results

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

实施例 1 演示了对小鼠大脑样本的分析,验证了读取计数、空间可变基因和途径以及海马体和皮层之间的基因表达变异等参数。首先,根据几个质量指标评估小鼠大脑样本DSID001557的质量:“检测到的基因”(图1A),“读取计数”(图1B)和“Mito”(线粒体读取的百分比;图1C)。这清楚地突出了大脑样本左侧质量较低的区域,这是基于检测到的基因数量少和读取计数低。为了了解样本相对于所有其他样本的相对质量,单击了数据库中的样本相对质量选项卡,其中显示了计数与否的图表。每个点检测到的基因数(平均值)。对于正在分析的样品,每个点检测到3500-4000个基因(图1D)。使用图像注释选项卡进一步分析样品的解剖特征。一般来说,这些注释是通过将组织图像切割成更小的部分并要求LLM描述可观察到的特征8而生成的。它们是帮助解读样本的粗略指示,需要谨慎解读。对于样本子集(尤其是人类乳腺癌样本),也可以由人类专家进行注释。然而,考虑到与用于常规诊断的图像相比,Visium H&E 图像的质量较低,因此提供的注释仅用于研究目的。对于样本DSID001557,将光标移动到显示小鼠大脑不同区域注释的切片上,例如海马区域,皮质层,具有神经胶质增生的致密细胞层等。通过了解样本切片的基本解剖特征,进一步探索了细胞类型簇和空间可变基因和通路等详细特征。小鼠大脑样本总共有15个簇,在样本切片上用颜色编码表示(图1E)。与样品相关的一些空间变异性最大的基因是 NrgnSlc17a7Ly6hDdn图 2)。根据文献证据表明 Nrgn 编码蛋白(神经颗粒蛋白)在介导突触可塑性和空间学习中的作用,Nrgn 在海马区域表现出高表达15Slc17a7 是一种编码对谷氨酰胺能神经元神经传递至关重要的囊泡谷氨酸转运蛋白的基因16,以及 Ddn(一种编码调节突触后细胞骨架结构的蛋白质的基因17),也在海马区高度表达。相比之下,基因 Ly6h 的表达定位于皮质区域,根据文献表明 Ly6h 在皮质细胞膜中的限制性突触作用18。以类似的方式,在样品切片上可视化通路的活性(图 3)。观察到空间可变通路的激活与空间可变基因的功能作用一致,调节海马区的突触可塑性和神经递质活性,以及皮质区的神经肽信号传导。

最后,为了识别小鼠大脑样本的海马区和下丘脑之间差异表达的基因,使用了 “组织浏览器” 选项卡。在图像注释的指导下选择与感兴趣区域相关的点(图4A)。从生成的散点图中,一些鉴定出的差异表达基因属于空间可变性最高的基因(NrgnSlc17a7Ddn),此外还有一些其他基因,例如 PmchTtr。这些基因的表达在样品切片中可视化。 Pmch 在下丘脑外侧区域特异性过表达(图4B;与 图4A中的绿色选择区域相比)。该基因编码黑色素浓缩激素的前体,并参与能量稳态的维持19。相比之下, 基因Ttr 在海马区域特异性表达(图4C;与 图4A中的红色选择区域相比),根据其在学习和空间记忆中的功能作用20。通过使用该数据库对不同小鼠大脑区域进行样本内比较,我们能够根据空间基因表达和通路活性突出区域特异性功能特征。

在实施例2中,该数据库用于鉴定与肝脏结直肠转移相关的免疫特征。通过对两个样本进行适当的点选择,在结直肠转移的肿瘤区域和远处健康的肝组织之间进行样本内比较:DSID001005(图5A-C)和DSID001007(图5D-F)。使用R对数据进行两次重复,每个条件重复两次,根据所选参数,在结直肠转移的肿瘤区域和健康肝组织之间进行差异表达分析,显示138个基因下调,115个基因上调(图6A,B)。KEGG通路分析表明,下调基因的通路富集,如药物代谢和化学致癌(图6C),而上调基因表现出与白细胞跨内皮迁移、粘连斑和细胞周期等相对应的特征(图6D)。着眼于白细胞跨内皮迁移与免疫活性的相关性,鉴定了该类别中检测到的顶级基因,并在DeepSpaceDB中观察了它们的空间表达。有趣的是,在白细胞跨内皮迁移类别下检测到的基因Cldn7,Cldn4Actg1在样本的肿瘤区域(Epcam+位点)表现出上调,而不是在具有健康肝组织的远处区域(图7)。 这提供了对肝脏肿瘤部位驱动的免疫活性的性质以及白细胞的主动募集的见解。总之,使用 DeepSpaceDB 进行样本内分析可以提取不同的生物学见解。通过交互式工具和重新分析工作流程比较空间转录组数据,研究人员可以生成和验证有关组织特异性基因表达和功能异质性的假设。

figure-results-1
图 1:样品的质量测量。 A)检测到的基因数量,(B)读取计数和(C)每个点的线粒体读取百分比。(D)与数据库中所有其他样本的分布相比,该样本中每个点的平均检测到的基因数。(E)组织切片上的斑点簇。 请点击此处查看此图的大图。

figure-results-2
图 2:顶部空间变异基因的表达。 ANrgn,(BSlc17a7,(CLy6h 和 (D) Ddn请点击此处查看此图的大图。

figure-results-3
图 3:顶部空间可变途径的活性。 A)神经肽信号传导,(B)突触可塑性的调节,(C)神经递质转运。 请点击此处查看此图的大图。

figure-results-4
图4:小鼠大脑两个选定区域之间的基因表达模式比较。A)下丘脑和海马区域的点选择,用于样本内比较。所选区域 1 显示为红色,区域 2 显示为绿色。差异表达基因 (BPmch 和 (CTtr 在下丘脑和海马区域之间的空间表达模式。 请点击此处查看此图的大图。

figure-results-5
图5:两个转移性小鼠肝脏样本的特性。 对于样本DSID001005:(AEpcam 标记物表达,(B)斑点簇,以及(C)癌性和远处区域的选定区域,用于样本内比较。对于样品DSID001007:(DEpcam 标记物表达,(E)斑簇,以及(F)癌性和远处区域的选定区域,用于样品内比较。对于这两个样本,肿瘤斑点位于红色显示的区域,非肿瘤斑点位于绿色显示的区域。 请点击此处查看此图的大图。

figure-results-6
图 6:重新分析结果。 A) 重新分析中使用的工作流程的示意图摘要。(B)代表癌变和远处区域之间差异表达基因的火山图。(C)上调基因和(D)下调基因的KEGG通路富集。 请点击此处查看此图的大图。

figure-results-7
图7:基因的空间表达。ACldn7,(BCldn4和(C)组织切片DSID001005中的 Actg1 。基因的空间表达。(DCldn7,(ECldn4和(F)组织切片DSID001007中的 Actg1请点击此处查看此图的大图。

补充文件 1-4:肝转移的数据文件和 R 脚本示例。请点击此处下载此文件。

Discussion

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

在这里,我们介绍了两个综合协议,概述了 DeepSpaceDB 中空间转录组学数据的导航、检索和分析。虽然大多数空间组学数据库专注于从使用各种平台3,4,5,6生成的大量样本中收集数据,但DeepSpaceDB专注于开发交互式工具,允许用户深入有效地探索空间转录组学特征。为了实现这种级别的功能,当前版本专门关注 Visium 平台。随着高分辨率平台的出现,我们计划相应地扩展 DeepSpaceDB,以用户友好的方式开发处理和集成此类数据的新策略。

DeepSpaceDB 使用户能够评估样本质量指标(例如,基因计数、读取深度)并在数据集中进行比较。该数据库包括多层注释:使用分配标签的整个数据库进行无监督聚类,基于 LLM 的组织学图像结构和病理特征检测,以及针对不断增长的样本子集的专家组织学注释。此外,用户可以交互式地选择样本内或样本之间的感兴趣区域来比较基因表达,从而能够研究肿瘤与基质或患病与健康区域等区域之间的空间对比。其他数据库通常缺乏此类特征 3,4,5,6。还提供其他功能,例如空间可变的基因和途径、细胞类型预测和聚类结果。总而言之,该数据库显着降低了探索空间转录组学数据的障碍。来自各种组织和条件的样本可以自由访问,用户可以通过简单的点击式交互来导航它们;无需高级生物信息学专业知识。也就是说,对于准确解释表达模式和在 Tissue Explorer 工具中选择感兴趣区域可能需要一些标记基因和组织结构的先验知识。

虽然这里没有介绍,但用户也可以上传自己的样本并应用许多相同的工具来分析它们。该数据库还支持2个不同组织切片之间的样本间比较,例如,允许在患病组织和健康对照组织之间进行比较。最后,原始数据和处理后的数据以及所有派生的分析输出可供下载,支持下游工作流程和自定义分析。对于其中几个工具,数据库的教程页面上提供了简短的教程视频。

数据库仍有一些方面需要改进。一种是准确预测组织切片内每个位置的细胞类型和细胞类型组成。在当前版本的DeepSpaceDB(1.0版)中,我们使用一种称为稳健细胞类型分解(RCTD)21的方法预测了每个Visium斑点的细胞类型组成。RCTD 在最近的一项基准研究中表现相对较好22.RCTD 所做的预测也可以在我们最近对患癌小鼠肝脏的研究中得到实验验证23。然而,尚未对细胞类型预测的准确性进行全面评估。一个相关的问题是 RCTD 和其他细胞类型预测方法需要具有带注释的细胞类型的参考数据集。一般来说,每个空间位置的细胞类型(或细胞类型组成)是通过与该参考数据集中的基因表达模式的比较来预测的。然而,为每个 Visium 样品选择合适的参考并不总是那么简单。参考文献可能缺乏关键细胞类型,或者相反,可能包括组织切片中不存在的细胞类型24。此外,在一种细胞类型中,细胞可以处于截然不同的状态,例如非活性免疫细胞与激活免疫细胞25。参考数据集中存在的细胞状态不一定与空间样本的细胞状态相匹配,空间样本通常是从患者的疾病模型中获得的。这两个问题都可能导致预测不准确。我们希望将来能解决这个问题。

随着空间转录组学领域的不断快速发展,越来越多的计算工具正在开发中,用于分析空间数据的各个方面,包括细胞间相互作用、空间域和空间可变基因的预测(例如,参见 26,27,28)。虽然这种激增反映了该领域的活力,但它也给策划工具和集成到该数据库中带来了挑战。为确保包括最稳健和最广泛适用的方法,迫切需要系统基准研究来评估跨数据集和分析任务的工具性能22,29,30。这些努力对于指导在知情的情况下选择纳入数据库的工具并确定其优先次序至关重要。

虽然其他空间转录组学数据库试图收集许多不同平台的大量样本,但在 DeepSpaceDB 中,我们决定使用不同的策略:专注于几个流行的平台,并实施交互式和直观的工具,使用户能够轻松地更详细地探索数据。虽然我们的数据库仅包含当前 1.0 版中的 Visium 样本,但我们计划在未来的更新中也包含来自其他平台的样本。

Disclosures

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

作者没有什么可透露的。

Acknowledgements

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

作者要感谢Y. Harada的秘书协助。这项工作得到了JST NBDC(授权编号JPMJND2303,A.V.)和AMED(授权编号JP24gm2010003,A.V.)的支持。这项工作还得到了日本学术振兴会科研费(20H03451、24K02236 和 24KK0147;S.K.)、JST FOREST(JPMJFR2062;S.K)、JST 登月计划 (JPMJMS2011-61;S.K)。资助者在研究设计、数据收集和分析、发表决定或手稿准备方面没有任何作用。

Materials

List of materials used in this article
NameCompanyCatalog NumberComments
clusterProfilerR 包 - 版本 4.14.6
DeepSpace数据库版本 > 1.0数据库链接:www.deepspacedb.com
利马R 包 - 版本 3.62.2
R版本 4.4.2
RS图迪奥安置版本 2024.12

References

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,
  1. The expanding vistas of spatial transcriptomics. Nat Biotechnol. 41 (6), 773-782 (2023).">Tian, L., Chen, F., Macosko, E. Z. The expanding vistas of spatial transcriptomics. Nat Biotechnol. 41 (6), 773-782 (2023).
  2. Museum of spatial transcriptomics. Nat Methods. 19 (5), 534-546 (2022).">Moses, L., Pachter, L. Museum of spatial transcriptomics. Nat Methods. 19 (5), 534-546 (2022).
  3. SpatialDB: A database for spatially resolved transcriptomes. Nucleic Acids Res. 48 (D1), D233-D237 (2020).">Fan, Z., Chen, R., Chen, X. SpatialDB: A database for spatially resolved transcriptomes. Nucleic Acids Res. 48 (D1), D233-D237 (2020).
  4. SODB facilitates comprehensive exploration of spatial omics data. Nat Methods. 20 (3), 387-399 (2023).">Yuan, Z., et al. SODB facilitates comprehensive exploration of spatial omics data. Nat Methods. 20 (3), 387-399 (2023).
  5. STOmicsDB: A comprehensive database for spatial transcriptomics data sharing, analysis and visualization. Nucleic Acids Res. 52 (D1), 1053-1061 (2024).">Xu, Z., et al. STOmicsDB: A comprehensive database for spatial transcriptomics data sharing, analysis and visualization. Nucleic Acids Res. 52 (D1), 1053-1061 (2024).
  6. SOAR elucidates biological insights and empowers drug discovery through spatial transcriptomics. Sci Adv. 11 (24), 7450(2025).">Li, Y., et al. SOAR elucidates biological insights and empowers drug discovery through spatial transcriptomics. Sci Adv. 11 (24), 7450(2025).
  7. DeepSpaceDB: A spatial transcriptomics atlas for interactive in-depth analysis of tissues and tissue microenvironments. bioRxiv. , (2025).">Honcharuk, V., et al. DeepSpaceDB: A spatial transcriptomics atlas for interactive in-depth analysis of tissues and tissue microenvironments. bioRxiv. , (2025).
  8. arXiv. , OpenAI. http://arxiv.org/abs/2303.08774 (2023).">GPT-4 technical report. arXiv. , OpenAI. http://arxiv.org/abs/2303.08774 (2023).
  9. A clustering-independent method for finding differentially expressed genes in single-cell transcriptome data. Nat Commun. 11 (1), 1-10 (2020).">Vandenbon, A., Diez, D. A clustering-independent method for finding differentially expressed genes in single-cell transcriptome data. Nat Commun. 11 (1), 1-10 (2020).
  10. A universal tool for predicting differentially active features in single-cell and spatial genomics data. Sci Rep. 13 (1), 1-14 (2023).">Vandenbon, A., Diez, D. A universal tool for predicting differentially active features in single-cell and spatial genomics data. Sci Rep. 13 (1), 1-14 (2023).
  11. Dictionary learning for integrative, multimodal, and scalable single-cell analysis. Nat Biotechnol. 42 (2), 293-304 (2024).">Hao, Y., et al. Dictionary learning for integrative, multimodal, and scalable single-cell analysis. Nat Biotechnol. 42 (2), 293-304 (2024).
  12. Limma powers differential expression analyses for RNA-sequencing and microarray studies. Nucleic Acids Res. 43 (7), e47(2015).">Ritchie, M. E., et al. Limma powers differential expression analyses for RNA-sequencing and microarray studies. Nucleic Acids Res. 43 (7), e47(2015).
  13. ClusterProfiler: An R package for comparing biological themes among gene clusters. OMICS. 16 (5), 284-287 (2012).">Yu, G., Wang, L. G., Han, Y., He, Q. Y. ClusterProfiler: An R package for comparing biological themes among gene clusters. OMICS. 16 (5), 284-287 (2012).
  14. KEGG for taxonomy-based analysis of pathways and genomes. Nucleic Acids Res. 51 (D1), D587-D592 (2023).">Kanehisa, M., et al. KEGG for taxonomy-based analysis of pathways and genomes. Nucleic Acids Res. 51 (D1), D587-D592 (2023).
  15. Association between NRGN gene polymorphism and resting-state hippocampal functional connectivity in schizophrenia. BMC Psychiatry. 19 (1), 108(2019).">Zhang, Y., et al. Association between NRGN gene polymorphism and resting-state hippocampal functional connectivity in schizophrenia. BMC Psychiatry. 19 (1), 108(2019).
  16. Glutamate, aspartate and nucleotide transporters in the SLC17 family form four main phylogenetic clusters: evolution and tissue expression. BMC Genomics. 11, 17(2010).">Sreedharan, S., et al. Glutamate, aspartate and nucleotide transporters in the SLC17 family form four main phylogenetic clusters: evolution and tissue expression. BMC Genomics. 11, 17(2010).
  17. Sequencing of hippocampal and cerebellar transcriptomes provides new insights into the complexity of gene regulation in the human brain. Neurosci Lett. 541, 263-268 (2013).">Twine, N. A., Janitz, C., Wilkins, M. R., Janitz, M. Sequencing of hippocampal and cerebellar transcriptomes provides new insights into the complexity of gene regulation in the human brain. Neurosci Lett. 541, 263-268 (2013).
  18. Expression of the Ly-6 family proteins Lynx1 and Ly6H in the rat brain is compartmentalized, cell-type specific, and developmentally regulated. Brain Struct Funct. 219 (6), 1923-1934 (2014).">Thomsen, M. S., et al. Expression of the Ly-6 family proteins Lynx1 and Ly6H in the rat brain is compartmentalized, cell-type specific, and developmentally regulated. Brain Struct Funct. 219 (6), 1923-1934 (2014).
  19. The role of melanin concentrating hormone (MCH) in the central chemoreflex: A knockdown study by siRNA in the lateral hypothalamus in rats. PLoS ONE. 9 (8), e103585(2014).">Li, N., Nattie, E., Li, A. The role of melanin concentrating hormone (MCH) in the central chemoreflex: A knockdown study by siRNA in the lateral hypothalamus in rats. PLoS ONE. 9 (8), e103585(2014).
  20. Transthyretin-a key gene involved in regulating learning and memory in brain, and providing neuroprotection in Alzheimer disease via neuronal synthesis of transthyretin protein. J. Behav. Brain Sci. 8 (2), 77-92 (2018).">Iqbal, J. Transthyretin-a key gene involved in regulating learning and memory in brain, and providing neuroprotection in Alzheimer disease via neuronal synthesis of transthyretin protein. J. Behav. Brain Sci. 8 (2), 77-92 (2018).
  21. Robust decomposition of cell type mixtures in spatial transcriptomics. Nat Biotechnol. 40 (4), 517-526 (2021).">Cable, D. M., et al. Robust decomposition of cell type mixtures in spatial transcriptomics. Nat Biotechnol. 40 (4), 517-526 (2021).
  22. Benchmarking spatial and single-cell transcriptomics integration methods for transcript distribution prediction and cell type deconvolution. Nat Methods. 19 (6), 662-670 (2022).">Li, B., et al. Benchmarking spatial and single-cell transcriptomics integration methods for transcript distribution prediction and cell type deconvolution. Nat Methods. 19 (6), 662-670 (2022).
  23. Murine breast cancers disorganize the liver transcriptome in a zonated manner. Commun Biol. 6 (1), 1-12 (2023).">Vandenbon, A., et al. Murine breast cancers disorganize the liver transcriptome in a zonated manner. Commun Biol. 6 (1), 1-12 (2023).
  24. Missing cell types in single-cell references impact deconvolution of bulk data but are detectable. Genome Biol. 26 (1), 86(2025).">Ivich, A., et al. Missing cell types in single-cell references impact deconvolution of bulk data but are detectable. Genome Biol. 26 (1), 86(2025).
  25. A periodic table of cell types. Development. 146 (12), dev169854(2019).">Xia, B., Yanai, I. A periodic table of cell types. Development. 146 (12), dev169854(2019).
  26. Deciphering spatial domains from spatially resolved transcriptomics with an adaptive graph attention auto-encoder. Nat Commun. 13 (1), 1739(2022).">Dong, K., Zhang, S. Deciphering spatial domains from spatially resolved transcriptomics with an adaptive graph attention auto-encoder. Nat Commun. 13 (1), 1739(2022).
  27. Mapping cellular interactions from spatially resolved transcriptomics data. Nat Methods. 21, 1830-1842 (2024).">Zhu, J., et al. Mapping cellular interactions from spatially resolved transcriptomics data. Nat Methods. 21, 1830-1842 (2024).
  28. Giotto: A toolbox for integrative analysis and visualization of spatial expression data. Genome Biol. 22 (1), 1-31 (2021).">Dries, R., et al. Giotto: A toolbox for integrative analysis and visualization of spatial expression data. Genome Biol. 22 (1), 1-31 (2021).
  29. Benchmarking spatial clustering methods with spatially resolved transcriptomics data. Nat Methods. 21 (4), 712-722 (2024).">Yuan, Z., et al. Benchmarking spatial clustering methods with spatially resolved transcriptomics data. Nat Methods. 21 (4), 712-722 (2024).
  30. Benchmarking algorithms for spatially variable gene identification in spatial transcriptomics. Bioinformatics. 41 (4), btaf131(2025).">Chen, X., et al. Benchmarking algorithms for spatially variable gene identification in spatial transcriptomics. Bioinformatics. 41 (4), btaf131(2025).

Reprints and Permissions

Request permission to reuse the text or figures of this JoVE article

Request Permission

Tags

Spatial TranscriptomicsGene Expression PatternsDeepSpaceDB DatabaseTissue Slice AnalysisSpatially Variable GenesDifferential Gene ExpressionTumor MicroenvironmentMouse Brain SampleColorectal Cancer MetastasisBioinformatics Tools

Related Articles