September 5th, 2025
本文介绍了一种使用DeepSpaceDB的协议,DeepSpaceDB是一个用于空间转录组学的动态交互式数据库,提供了分析工作流程和示例来探索组织组织和疾病相关基因表达。
我们正在制作一个名为 DeepSpaceDB 的空间转录组学数据库。呼吁是让生物学家和生物信息学家更容易获得空间转录组学数据。已经开发了多个空间转录组学平台。
它们使研究人员能够研究组织切片内的基因表达模式。但这项技术价格昂贵,数据分析需要高水平的生物信息学技能。我们一直在使用节奏和 Xenium 空间平台,即我们的癌症 CEX 研究。
这个平台使我们能够在同一器官环境中确定肿瘤、肿胀甚至远处的宿主组织。它可以帮助我们分别解决每个区室中表达和细胞计算的变化。生物学家面临的主要挑战之一是进行数据分析。
因此,有许多研究人员缺乏必要的编程和计算技能,无法完全解释现在可用的越来越多的空间转录组学数据集。通过使空间转录组学数据集更容易访问,该数据库使用户能够生成新的假设,探索不同疾病背后的潜在机制。因此,例如,我们可以评估与肿瘤微环境相关的空间基因表达模式。
首先,单击数据库选项卡,然后选择生物体作为鼠标,器官作为大脑,将来源选择为 Zenodo。滚动浏览生成的样品,然后选择标有DSID001557的样品。然后单击所选样品并确认描述读取 100 微升盐水 NK 细胞中的 200 万个细胞。
单击质量选项卡以评估样品质量。从质量测量下拉菜单中,选择检测到的基因、读取计数和 mito 等选项,以查看样品切片中相应的参数分布。现在,导航到图像注释选项卡以识别示例切片中的不同区域。
将鼠标光标移到示例切片上以显示注释。查看大型语言模型生成的基于网格的注释,这些注释显示解剖特征和相关条件。然后导航到聚类选项卡以检查样本切片中的单元格类型聚类。
查看聚类的二维嵌入以及样品切片上点上相应的颜色编码表示。接下来,导航到基因选项卡以检查样本中的空间可变基因。单击列表中的一些顶级基因以生成它们在组织切片中表达的空间图。
观察颜色编码的表达模式,这些表达模式清楚地显示了得分最高的基因的不同空间分布。然后导航到“途径”选项卡,检查与常见生物途径相关的基因集的活性。查看空间可变通路列表,根据相关基因的表达水平估计通路活性。
单击列表中的一些顶级通路以生成它们在组织切片上的活动的空间图。观察不同组织区域通路活动的颜色编码模式。现在,转到组织浏览器选项卡,它允许用户自由选择感兴趣的区域并比较它们之间的基因表达模式。
确保手动选择已激活。使用鼠标光标,选择小鼠脑切片左侧海马区域中的点。单击设置一个,然后单击添加到设置以突出显示右侧面板上的选定点。
然后单击第二组并使用鼠标光标选择大脑切片下丘脑区域的点。单击添加以设置以突出显示右侧的这些选定点。完成点选择后,点击比较基因表达按钮。
这将生成一个表格,显示每个选定区域的平均基因表达值以及散点图表示。将光标移动到散点图上的各个点上,以确认两个区域的基因名称和平均表达值。根据比较结果,鉴定差异表达基因。
导航回基因选项卡并可视化这些基因在组织切片中的表达。单击数据库选项卡并使用过滤器选择生物体作为小鼠,器官作为肝脏,将病情选择为癌症。从生成的样本列表中,选择样本DSID001005。
单击所选样本并确认描述表明该样本来自小鼠肝脏,含有结直肠癌来源的转移。然后导航到组织浏览器选项卡并激活手动选择模式。使用鼠标光标,选择与样本DSID001005中EpCAM标记物阳性表达所识别的肿瘤区域相对应的斑点。
单击设置一。然后选择添加到设置以突出显示右侧选定的肿瘤点。现在,单击第二组并使用光标选择肝脏样本远处非肿瘤区域中的点。
单击添加以设置以突出显示显示屏右侧选定的非肿瘤点。要对基因表达数据进行进一步分析,请单击下载 CSV 选项,生成样品两个区域的基因表达数据的逗号分隔值文件。在对DSID001007重复数据库导航步骤后,确认描述表明它是来自小鼠肝脏的另一片,其中包含结直肠癌来源的转移。
接下来,确认已生成两个 CSV 文件,每个文件来自DSID001005和DSID001007样本,包含两列,代表肿瘤和非肿瘤区域的平均基因表达。将两个 CSV 文件加载到 R 编程环境中。合并数据集以执行下游分析,每个条件使用两个重复。
在 R 中,使用 limma 包对合并数据集进行差异基因表达分析。将两个样本的结直肠转移区域分配给癌症组,将远处健康区域分配给对照组。过滤结果以识别对数倍数变化大于 0.5 且调整后的 P 值小于 0.05 的上调基因。
同样,提取对数倍数变化小于负 0.5 且调整后的 P 值小于 0.05 的下调基因。在小鼠大脑样本的左侧观察到一个明显的低质量区域,其特征是检测到的基因数量减少和读取计数减少。该样本显示每个点平均检测到约 4, 000 个基因,与数据库中其他样本的分布非常吻合。
在小鼠大脑样本中鉴定出 15 个空间簇,具有代表解剖差异的不同边界。基因NRGN、SLC17A7和DDN在海马区表达较强。相比之下,LY6H 表达定位于皮质区域,特别是切片的左下和右外缘。
样品切片下皮质区域的神经肽信号活性显着增加。突触可塑性的调节在整个海马区域被激活,特别是在中上部区域。海马体右中部和右上部的神经递质转运活性升高。
CLDN7、CLDN4和ACTG1基因在肝脏样本DSID 001005中在结直肠转移的肿瘤区域表现出明显的上调。相比之下,CLDN7、CLDN4和ACTG1在DSID001007样本远处健康肝组织中的表达明显较低。
本文介绍了DeepSpaceDB,一个旨在提高空间转录组数据可访问性的交互式数据库。它为研究人员提供分析工作流,以研究与各种疾病相关的组织组织和基因表达。