September 5th, 2025
Este artículo presenta un protocolo para usar DeepSpaceDB, una base de datos dinámica e interactiva para transcriptómica espacial, que ofrece flujos de trabajo de análisis y ejemplos para explorar la organización de tejidos y la expresión génica relacionada con enfermedades.
Estamos creando una base de datos de transcriptómica espacial llamada DeepSpaceDB. El llamado es hacer que los datos de transcriptómica espacial sean más accesibles para biólogos y bioinformáticos. Se han desarrollado varias plataformas de transcriptómica espacial.
Permiten a los investigadores estudiar patrones de expresión génica dentro de cortes de tejido. Pero esta tecnología es costosa y el análisis de datos requiere habilidades bioinformáticas de alto nivel. Hemos estado utilizando el ritmo y la plataforma espacial Xenium, Our Cancer CEX Research.
Esta plataforma nos permite decidir el tumor, la hinchazón e incluso el tejido huésped distante dentro del mismo contexto del órgano. Puede ayudarnos a resolver los cambios en la expresión y el cálculo celular en cada compartimento por separado. Uno de los principales desafíos para los biólogos es realizar análisis de datos.
Por lo tanto, hay muchos investigadores que carecen de las habilidades computacionales y de programación necesarias para poder interpretar completamente un número cada vez mayor de conjuntos de datos transcriptómicos espaciales que ahora están disponibles. Al hacer que los conjuntos de datos de transcriptómica espacial sean más accesibles, la base de datos permite a los usuarios generar nuevas hipótesis, explorando los mecanismos subyacentes detrás de diferentes enfermedades. Entonces, por ejemplo, podemos evaluar los patrones de expresión génica espacial asociados con el microambiente tumoral.
Para comenzar, haga clic en la pestaña de la base de datos y seleccione el organismo como ratón, el órgano como cerebro y la fuente como Zenodo. Desplácese por las muestras resultantes y seleccione la muestra etiquetada DSID001557. Luego haga clic en la muestra seleccionada y confirme que la descripción dice 2 millones de células en 100 microlitros de células NK salinas.
Haga clic en la pestaña de calidad para evaluar la calidad de la muestra. En el menú desplegable de medidas de calidad, seleccione opciones como genes detectados, recuento de lecturas y mito para ver las respectivas distribuciones de parámetros en el segmento de muestra. Ahora, vaya a la pestaña de anotación de imagen para identificar diferentes regiones en el sector de muestra.
Mueva el cursor del mouse sobre el sector de muestra para mostrar las anotaciones. Vea las anotaciones basadas en cuadrículas generadas por un modelo de lenguaje grande que muestran características anatómicas y condiciones asociadas. A continuación, vaya a la pestaña clusters para examinar los clusters de tipo de celda en el segmento de muestra.
Vea la incrustación bidimensional de los clústeres y la representación codificada por colores correspondiente en los puntos del segmento de muestra. A continuación, vaya a la pestaña genes para examinar los genes espacialmente variables en la muestra. Haga clic en algunos de los genes principales de la lista para generar gráficos espaciales de su expresión en el corte de tejido.
Observe los patrones de expresión codificados por colores, que muestran claramente distribuciones espaciales distintas para los genes con la puntuación más alta. A continuación, vaya a la pestaña de vías para examinar la actividad de los conjuntos de genes asociados a las vías biológicas comunes. Vea la lista de vías espacialmente variables con actividad de vía estimada en función de los niveles de expresión de genes relacionados.
Haga clic en algunas de las vías principales de la lista para generar gráficos espaciales de su actividad en el corte de tejido. Observe los patrones codificados por colores de la actividad de la vía en diferentes regiones de tejido. Ahora, vaya a la pestaña del explorador de tejidos, que permite a los usuarios seleccionar libremente regiones de interés y comparar patrones de expresión génica entre ellas.
Asegúrese de que la selección manual esté activada. Con el cursor del mouse, seleccione los puntos en la región del hipocampo en el lado izquierdo del corte de cerebro del ratón. Haga clic en establecer uno y luego agregue al conjunto para resaltar los puntos seleccionados en el panel derecho.
Luego haga clic en el conjunto dos y use el cursor del mouse para seleccionar los puntos en la región hipotalámica del corte de cerebro. Haga clic en agregar para resaltar estos puntos seleccionados en el lado derecho. Después de completar la selección de puntos, haga clic en el botón Comparar expresión génica.
Esto genera una tabla que muestra los valores promedio de expresión génica para cada región seleccionada junto con una representación de diagrama de dispersión. Mueva el cursor sobre puntos individuales en el diagrama de dispersión para confirmar los nombres de los genes y los valores de expresión promedio en ambas regiones. Con base en los resultados de la comparación, identifique los genes expresados diferencialmente.
Vuelva a la pestaña genes y visualice la expresión de estos genes en el corte de tejido. Haga clic en la pestaña de la base de datos y use el filtro para seleccionar el organismo como ratón, el órgano como hígado y la condición como cáncer. En la lista de muestras resultante, seleccione DSID001005 de muestra.
Haga clic en la muestra seleccionada y confirme que la descripción indica que la muestra es de un hígado de ratón, que contiene metástasis de origen cáncer colorrectal. Luego navegue a la pestaña del explorador de tejidos y active el modo de selección manual. Con el cursor del ratón, seleccione los puntos correspondientes a la región tumoral identificada por la expresión positiva del marcador EpCAM en la muestra DSID001005.
Haga clic en establecer uno. Luego seleccione agregar para resaltar los puntos tumorales seleccionados en el lado derecho. Ahora, haga clic en el conjunto dos y use el cursor para seleccionar los puntos en la región distante no tumoral de la muestra de hígado.
Haga clic en agregar para configurar para resaltar los puntos no tumorales seleccionados en el lado derecho de la pantalla. Para realizar un análisis más detallado de los datos de expresión génica, haga clic en la opción descargar CSV, generando un archivo de valores separados por comas de los datos de expresión génica para las dos regiones de la muestra. Después de repetir los pasos de navegación de la base de datos para DSID001007, confirme que la descripción indica que es otro corte de un hígado de ratón que contiene metástasis de origen de cáncer colorrectal.
A continuación, confirme que se han generado dos archivos CSV, uno a partir de muestras DSID001005 y otro DSID001007, que contienen dos columnas que representan la expresión génica promedio en regiones tumorales y no tumorales. Cargue ambos archivos CSV en el entorno de programación de R. Combine los conjuntos de datos para realizar análisis posteriores utilizando dos réplicas por condición.
En R, use el paquete limma para realizar un análisis diferencial de expresión génica en el conjunto de datos de combinación. Asigne las regiones de metástasis colorrectales de ambas muestras al grupo de cáncer y las regiones sanas distantes al grupo de control. Filtre los resultados para identificar genes regulados al alza con un cambio de pliegue logarítmico superior a 0,5 y un valor de P ajustado inferior a 0,05.
De manera similar, extrae genes regulados a la baja con un cambio de pliegue logarítmico inferior a menos 0,5 y un valor de P ajustado inferior a 0,05. Se observó una región distinta de baja calidad en el lado izquierdo de la muestra de cerebro de ratón, caracterizada por un número reducido de genes detectados y un recuento de lecturas más bajo. La muestra mostró un promedio de aproximadamente 4.000 genes detectados por punto, alineándose bien con la distribución de otras muestras en la base de datos.
Se identificaron 15 grupos espaciales en la muestra de cerebro de ratón con límites distintos que representan diferencias anatómicas. Los genes NRGN, SLC17A7 y DDN mostraron una fuerte expresión en la región del hipocampo. Por el contrario, la expresión de LY6H se localizó en las regiones corticales, particularmente en los bordes exteriores inferior izquierdo y derecho del corte.
La actividad de señalización de neuropéptidos aumentó notablemente en las regiones corticales inferiores del corte de la muestra. La regulación de la plasticidad sináptica se activó en toda la región del hipocampo, particularmente en las zonas medias superiores. La actividad de transporte de neurotransmisores se elevó en las secciones media y superior derecha del hipocampo.
Los genes CLDN7, CLDN4 y ACTG1 mostraron una clara regulación positiva en la región tumoral con metástasis colorrectal en la muestra de hígado DSID 001005. Por el contrario, la expresión de CLDN7, CLDN4 y ACTG1 fue notablemente menor en el tejido hepático sano distante de la muestra DSID001007.
Este artículo describe DeepSpaceDB, una base de datos interactiva diseñada para mejorar la accesibilidad a datos de transcriptómica espacial. Proporciona flujos de trabajo de análisis para que los investigadores investiguen la organización del tejido y la expresión génica relacionada con varias enfermedades.