September 5th, 2025
Este artigo apresenta um protocolo para usar o DeepSpaceDB, um banco de dados dinâmico e interativo para transcriptômica espacial, oferecendo fluxos de trabalho de análise e exemplos para explorar a organização do tecido e a expressão gênica relacionada à doença.
Estamos fazendo um banco de dados de transcriptômica espacial chamado DeepSpaceDB. A chamada é para tornar os dados transcriptômicos espaciais mais facilmente acessíveis para biólogos e bioinformáticos. Várias plataformas de transcriptômica espacial foram desenvolvidas.
Eles permitem que os pesquisadores estudem os padrões de expressão gênica dentro de fatias de tecido. Mas essa tecnologia é cara e a análise de dados requer habilidades de bioinformática de alto nível. Temos usado o ritmo e a plataforma espacial Xenium, a Our Cancer CEX Research.
Esta plataforma nos permite decidir tumor, inchaço e até mesmo o tecido hospedeiro distante dentro do mesmo contexto de órgão. Isso pode nos ajudar a resolver as mudanças na expressão e na computação celular em cada compartimento separadamente. Um dos principais desafios para os biólogos é realmente realizar a análise de dados.
Portanto, há muitos pesquisadores que não possuem as habilidades computacionais e de programação necessárias para interpretar completamente um número cada vez maior de conjuntos de dados transcriptômicos espaciais que agora estão se tornando disponíveis. Ao tornar os conjuntos de dados transcriptômicos espaciais mais facilmente acessíveis, o banco de dados permite que os usuários gerem novas hipóteses, explorando os mecanismos subjacentes por trás de diferentes doenças. Assim, por exemplo, podemos avaliar os padrões espaciais de expressão gênica associados ao microambiente tumoral.
Para começar, clique na guia do banco de dados e selecione o organismo como mouse, o órgão como cérebro e a fonte como Zenodo. Percorra os exemplos resultantes e selecione o exemplo rotulado DSID001557. Em seguida, clique na amostra selecionada e confirme se a descrição diz 2 milhões de células em 100 microlitros de célula NK salina.
Clique na guia de qualidade para avaliar a qualidade da amostra. No menu suspenso de medidas de qualidade, selecione opções como genes detectados, contagem de leituras e mito para visualizar as respectivas distribuições de parâmetros na fatia de amostra. Agora, navegue até a guia de anotação de imagem para identificar diferentes regiões na fatia de amostra.
Mova o cursor do mouse sobre a fatia de amostra para exibir anotações. Exiba as anotações baseadas em grade geradas por um grande modelo de linguagem que mostram recursos anatômicos e condições associadas. Em seguida, navegue até a guia clusters para examinar os clusters de tipo de célula na fatia de amostra.
Visualize a incorporação bidimensional dos clusters e a representação codificada por cores correspondente em pontos na fatia de amostra. Em seguida, navegue até a guia genes para examinar os genes espacialmente variáveis na amostra. Clique em alguns dos principais genes da lista para gerar gráficos espaciais de sua expressão na fatia de tecido.
Observe os padrões de expressão codificados por cores, que mostram claramente distribuições espaciais distintas para os genes de maior pontuação. Em seguida, navegue até a guia de caminhos para examinar a atividade dos conjuntos de genes associados a vias biológicas comuns. Veja a lista de vias espacialmente variáveis com atividade de vias estimada com base nos níveis de expressão de genes relacionados.
Clique em algumas das principais vias da lista para gerar gráficos espaciais de sua atividade na fatia de tecido. Observe os padrões codificados por cores da atividade da via em diferentes regiões do tecido. Agora, vá para a guia do explorador de tecidos, que permite aos usuários selecionar livremente regiões de interesse e comparar os padrões de expressão gênica entre elas.
Certifique-se de que a seleção manual esteja ativada. Usando o cursor do mouse, selecione os pontos na região do hipocampo no lado esquerdo da fatia do cérebro do mouse. Clique no conjunto um e, em seguida, em adicionar ao conjunto para destacar os pontos selecionados no painel direito.
Em seguida, clique no conjunto dois e use o cursor do mouse para selecionar os pontos na região hipotalâmica da fatia do cérebro. Clique em adicionar para definir para destacar esses pontos selecionados no lado direito. Depois de concluir a seleção do local, clique no botão comparar expressão gênica.
Isso gera uma tabela, exibindo os valores médios de expressão gênica para cada região selecionada, juntamente com uma representação de gráfico de dispersão. Mova o cursor sobre pontos individuais no gráfico de dispersão para confirmar os nomes dos genes e os valores médios de expressão em ambas as regiões. Com base nos resultados da comparação, identifique genes diferencialmente expressos.
Navegue de volta para a guia de genes e visualize a expressão desses genes na fatia de tecido. Clique na guia do banco de dados e use o filtro para selecionar o organismo como camundongo, o órgão como fígado e a condição como câncer. Na lista de exemplos resultante, selecione DSID001005 de exemplo.
Clique na amostra selecionada e confirme se a descrição indica que a amostra é de fígado de camundongo, contendo metástase de origem de câncer colorretal. Em seguida, navegue até a guia do explorador de tecidos e ative o modo de seleção manual. Usando o cursor do mouse, selecione os pontos correspondentes à região do tumor identificada pela expressão positiva do marcador EpCAM no sample DSID001005.
Clique no conjunto um. Em seguida, selecione adicionar ao conjunto para destacar os pontos tumorais selecionados no lado direito. Agora, clique no conjunto dois e use o cursor para selecionar os pontos na região não tumoral distante da amostra de fígado.
Clique em adicionar para definir para destacar os pontos não tumorais selecionados no lado direito da tela. Para realizar uma análise mais aprofundada dos dados de expressão gênica, clique na opção de download CSV, gerando um arquivo de valores separados por vírgula dos dados de expressão gênica para as duas regiões da amostra. Depois de repetir as etapas de navegação do banco de dados para DSID001007, confirme se a descrição afirma que é outra fatia de fígado de camundongo contendo metástases de origem de câncer colorretal.
Em seguida, confirme se dois arquivos CSV foram gerados, um de cada amostra DSID001005 e outro DSID001007, contendo duas colunas que representam a expressão gênica média em regiões tumorais e não tumorais. Carregue os dois arquivos CSV no ambiente de programação do R. Mescle os conjuntos de dados para executar a análise downstream usando duas réplicas por condição.
Em R, use o pacote limma para realizar a análise de expressão gênica diferencial no conjunto de dados de mesclagem. Atribua as regiões de metástases colorretais de ambas as amostras ao grupo de câncer e as regiões saudáveis distantes ao grupo de controle. Filtre os resultados para identificar genes regulados positivamente com uma alteração de dobra logarítmica maior que 0,5 e um valor de P ajustado menor que 0,05.
Da mesma forma, extraia genes regulados negativamente com uma mudança de dobra logarítmica menor que menos 0,5 e um valor de P ajustado menor que 0,05. Uma região distinta de baixa qualidade foi observada no lado esquerdo da amostra de cérebro de camundongo, caracterizada por um número reduzido de genes detectados e uma contagem de leitura mais baixa. A amostra mostrou uma média de aproximadamente 4.000 genes detectados por mancha, alinhando-se bem com a distribuição de outras amostras no banco de dados.
15 clusters espaciais foram identificados na amostra de cérebro de camundongo com limites distintos representando diferenças anatômicas. Os genes NRGN, SLC17A7 e DDN apresentaram forte expressão na região do hipocampo. Em contraste, a expressão de LY6H foi localizada nas regiões corticais, particularmente nas bordas externas inferiores esquerda e direita da fatia.
A atividade de sinalização do neuropeptídeo foi notavelmente aumentada nas regiões corticais inferiores da fatia da amostra. A regulação da plasticidade sináptica foi ativada em toda a região do hipocampo, particularmente nas zonas médias superiores. A atividade de transporte de neurotransmissores foi elevada nas seções média e superior direita do hipocampo.
Os genes CLDN7, CLDN4 e ACTG1 exibiram clara regulação positiva na região do tumor com metástase colorretal na amostra de fígado DSID 001005. Em contraste, a expressão de CLDN7, CLDN4 e ACTG1 foi notavelmente menor no tecido hepático saudável distante da amostra DSID001007.
Este artigo descreve o DeepSpaceDB, um banco de dados interativo projetado para melhorar a acessibilidade a dados de transcriptômica espacial. Ele fornece fluxos de trabalho de análise para pesquisadores investigarem a organização do tecido e a expressão gênica relacionada a várias doenças.