Method Article

Mining Spatial Transcriptomics-datasets met behulp van DeepSpaceDB

DOI:

10.3791/68892

September 5th, 2025

In This Article

Summary

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

Dit artikel introduceert een protocol voor het gebruik van DeepSpaceDB, een dynamische, interactieve database voor ruimtelijke transcriptomics, die analyseworkflows en voorbeelden biedt om weefselorganisatie en ziektegerelateerde genexpressie te onderzoeken.

Abstract

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

Ruimtelijke transcriptomics is een snel evoluerende technologie die het mogelijk maakt om genexpressiepatronen in weefselmonsters vast te leggen met behoud van positionele informatie. Het heeft brede toepassingen in biologisch onderzoek en bio-informatica, waardoor onderzoekers ruimtelijke variaties in genexpressie in verschillende weefsels, aandoeningen en ziekten kunnen onderzoeken en volgen. Nu ruimtelijke transcriptomics-data-analyse aan kracht wint, neemt het aantal openbaar beschikbare datasets toe. Ruimtelijke transcriptomics blijft echter een zeer gespecialiseerde experimentele techniek, met aanzienlijke technische en financiële beperkingen. Om de toegang tot ruimtelijke gegevens te vergemakkelijken, hebben we onlangs DeepSpaceDB ontwikkeld, een uitgebreide en dynamische database voor ruimtelijke transcriptomics-gegevensexploratie. In dit artikel worden gedetailleerde workflows beschreven waarin de componenten van de database en de navigatie ervan worden beschreven aan de hand van enkele voorbeelden. Eerst wordt de analyse van een hersenmonster van muizen gedemonstreerd, waarbij kwaliteitsindicatoren, ruimtelijk variabele genen en routes en genexpressievariaties tussen de hippocampus en de hypothalamus worden onderzocht. Vervolgens wordt de identificatie en annotatie van differentieel tot expressie gebrachte genen geassocieerd met immuunactiviteit verder onderzocht door gemetastaseerde gebieden van colorectale oorsprong te vergelijken met verre gebieden van gezond weefsel in muizenlevers. DeepSpaceDB, met zijn geavanceerde tools en interactieve functies, dient als een waardevolle bron voor ruimtelijk transcriptomics-onderzoek, waardoor een diepere verkenning van weefselorganisatie en ziektebiologie mogelijk wordt.

Introduction

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

Ruimtelijke transcriptomics is een nieuwe technologie die onderzoekers in staat stelt genexpressie te analyseren met behoud van ruimtelijke informatie in een weefselsectie, waardoor de studie van weefselarchitectuur, cellulaire heterogeniteit en micro-omgevingsinvloeden met een ongekende resolutie mogelijk wordt 1,2. Ondanks het potentieel van deze technologie blijven toegang en analyse echter beperkt, is ruimtelijke transcriptomics voor veel laboratoria onbetaalbaar en vereist de gegevensanalyse geavanceerde bio-informaticavaardigheden.

Het ontwikkelen van openbare databases is een manier om de toegang tot deze opkomende experimentele modaliteit te verbreden. Er zijn verschillende databases met ruimtelijke transcriptomics gemaakt. De eerste was SpatialDB, maar deze bevat slechts een beperkt aantal voorbeelden en is niet bijgewerkt3. De SODB-, SOAR- en STOmicsDB-databases bevatten grote aantallen voorbeelden van veel verschillende platforms en spelen een grote rol als gegevensopslagplaatsen 4,5,6. Analysetools zijn echter beperkt en missen interactiviteit. Om dit probleem aan te pakken, hebben we onlangs DeepSpaceDB ontwikkeld, een samengestelde, gebruiksvriendelijke database van openbaar beschikbare ruimtelijke transcriptomics-datasets die zijn ontworpen om technische barrières te verlagen en de toegankelijkheid uit te breiden7. Dit artikel illustreert verschillende tools in deze database, waaronder het doorzoeken van de database, het inspecteren van de monsterkwaliteit, visualisatietools en de vergelijking van interactief geselecteerde regio's binnen weefselplakjes. Het presenteert gedetailleerde protocollen aan de hand van twee representatieve voorbeelden: de analyse van een hersenmonster van een muis en een muizenlever met colorectale metastasen om deze hulpmiddelen in praktische contexten te demonstreren. Via deze tools stelt DeepSpaceDB een breder scala aan onderzoekers in staat om gebruik te maken van ruimtelijke transcriptomics zonder dat ze hun eigen gegevens of interne bio-informaticacapaciteit nodig hebben. Een uitgebreide beschrijving van de gegevensverzameling, kwaliteitscontrole, verwerkingsworkflow, evenals de gegevens en functies die zijn opgenomen in DeepSpaceDB, wordt in detail gegeven door Honcharuk et al7.

Protocol

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

1. Voorbeeld 1: Analyse van een hersenmonster van een muis

OPMERKING: In dit gedeelte wordt de analyse van een hersenmonster van een muis geïllustreerd, waarbij wordt genavigeerd door de verschillende functies en grafieken die beschikbaar zijn in DeepSpaceDB (een link naar de database is beschikbaar in de Materiaaltabel).

  1. Selectie van monsters
    1. Klik op het tabblad Database en gebruik het filter om het organisme muis, het orgaanbrein en de bron zenodo te selecteren. Blader door de resulterende voorbeelden en selecteer voorbeeld DSID001557. U kunt ook het zoekvak gebruiken om in de database te zoeken naar de term 'DSID001557' en dit voorbeeld te selecteren.
    2. Klik op het monster en bevestig de beschrijving als 2 × 106 cellen in 100 μL zoutoplossing-NK-cel (i.v. injectie eenmaal per week voor een totaal van 5 keer).
  2. Kwaliteitsanalyse
    1. Klik op het tabblad Kwaliteit om de kwaliteit van het geselecteerde monster te evalueren. Selecteer in het vervolgkeuzemenu voor kwaliteitsmaatregelen verschillende opties, zoals gedetecteerde genen (afbeelding 1A), aantal lezen (afbeelding 1B) en Mito (afbeelding 1C), om de respectieve parameters op elke plek in het monstersegment te visualiseren.
  3. Annotatie bij afbeeldingen
    1. Navigeer naar het tabblad Afbeeldingsannotatie om de verschillende regio's van het voorbeeldsegment te identificeren.
    2. Beweeg de muisaanwijzer over het voorbeeldsegment. Annotaties die worden voorspeld door een groot taalmodel (LLM) worden voor delen van het voorbeeldbeeld op een rastergebaseerde manier weergegeven, met informatie over de anatomie en bijbehorende voorwaarde8.
  4. Cluster analyse
    1. Voor een beter begrip van de celtypeclusters in het voorbeeldsegment navigeert u naar het tabblad Clusters . Een 2D-inbedding van de clusters wordt weergegeven, samen met een weergave van kleurgecodeerde clusters over de plekken op het monstersegment (Figuur 1E).
  5. Ruimtelijk variabele genen en routes
    1. Navigeer naar het tabblad Genen en noteer de ruimtelijk variabele genen (SVG; genen waarvan de expressieniveaus verschillen tussen weefsellocaties) in de steekproef 9,10. Deze SVG's worden voorspeld met behulp van de singleCellHaystack-functie, die de Kullback-Leibler-divergentiemaat (D_KL in de tabel) gebruikt om te evalueren hoe verschillend het expressiepatroon van elk gen is van wat willekeurig zou worden verwacht (Figuur 2). Genen met een lage p-waarde (groot negatief log.p.adj in de tabel) worden vermeld als de SVG's.
      OPMERKING: Genexpressiegegevens zijn genormaliseerd met behulp van de standaardparameters die worden gebruikt in het Seurat R (versie 5) pakket11. In de praktijk werden de lezingen voor elk gen op elke plek gedeeld door het totale aantal lezingen op die plek en vermenigvuldigd met de schaalfactor 10.000. Vervolgens werd de natuurlijke logaritme berekend na optelling van 1, om problemen met log(0) te voorkomen. De grafiek die wordt weergegeven op het tabblad Genen toont deze genormaliseerde gegevens.
    2. Klik op enkele van de beste genen in de lijst. Dit genereert een ruimtelijke grafiek voor de genen over de weefselschijf, met vlekken met een kleurcode voor het expressieniveau (Figuur 2). De meest scorende genen hebben duidelijk verschillende ruimtelijke expressiepatronen.
    3. Navigeer verder naar het tabblad Routes om de activiteit van sets genen te inspecteren (bijv. genen die geassocieerd zijn met een gemeenschappelijke biologische route) in plaats van individuele genen. Ruimtelijk variabele routes worden op dezelfde manier weergegeven als de SVG's die hierboven zijn besproken (Figuur 3). Pathway-activiteiten worden geschat op basis van de expressieniveaus van de genen die ermee geassocieerd zijn 7,11.
      OPMERKING: Pathway-activiteiten zijn geschat met behulp van de Seurat R-pakketfunctie addModuleScore11. Kort gezegd neemt deze functie als input een set genen (bijv. een set genen die betrokken zijn bij een gemeenschappelijke route) en retourneert hun gemiddelde expressieniveaus, na verschillende verwerkingsstappen. In de praktijk impliceren positieve waarden een hoger dan gemiddelde activiteit en negatieve waarden een lager dan gemiddelde activiteit. De grafiek die wordt weergegeven op het tabblad Paden toont de scoregegevens van deze module.
    4. Klik op enkele van de bovenste paden in de lijst. Dit genereert een ruimtelijke grafiek voor de paden over de weefselschijf, met vlekken met een kleurcode voor het activiteitsniveau. Verschillende paden hebben verschillende ruimtelijke activiteitspatronen (Figuur 3).
  6. Vergelijking van genexpressie binnen de steekproef
    1. Navigeer naar het tabblad Weefselverkenner en selecteer Handmatige selectie (als dit nog niet is geselecteerd). Gebruik vervolgens de muiscursor om de plekken in het hippocampusgebied van de hersenplak van de muis aan de linkerkant te selecteren. Klik op set 1 en selecteer toevoegen aan set. Hierdoor worden alle geselecteerde plekken op de plak aan de rechterkant gemarkeerd (Figuur 4A).
    2. Klik nu op set 2 en gebruik de muiscursor om de plekken in het hypothalamische gebied van de hersenplak van de muis te selecteren. Klik op toevoegen aan set, waardoor alle geselecteerde plekken op de plak aan de rechterkant worden gemarkeerd (Figuur 4A).
    3. Klik na het voltooien van het spotselectieproces op de knop Genexpressie vergelijken . Dit genereert een tabel met de gemiddelde genexpressiewaarden van de geselecteerde plekken tussen beide regio's, samen met een spreidingsdiagramweergave. Beweeg de cursor over individuele plekken om de gennamen en de gemiddelde expressie van genen in beide regio's te bevestigen.
    4. Identificeer op basis van de vergelijkingsresultaten van genexpressie differentieel tot expressie gebrachte genen en navigeer opnieuw naar het tabblad Genen om hun expressie in het monstersegment te visualiseren (Figuur 4B,C).
      OPMERKING: Door de hierboven beschreven stappen kan DeepSpaceDB worden gebruikt om de kenmerken van een ruimtelijke transcriptomics-steekproef van de hersenen van een muis te onderzoeken.

2. Voorbeeld 2: Identificatie en annotatie van differentieel tot expressie gebrachte genen geassocieerd met immuunactiviteit in gemetastaseerde gebieden van colorectale oorsprong in muizenlevers

OPMERKING: Een vergelijking binnen de steekproef wordt onderzocht in de huidige sectie. Dit wordt geïllustreerd door de identificatie en annotatie van differentieel tot expressie gebrachte genen tussen gemetastaseerde gebieden van colorectale oorsprong en verre gebieden van gezond weefsel binnen een leversectie, op basis van twee verschillende monsters. De ruimtelijke expressie van specifieke ontregelde genen die relevant zijn voor immuunactiviteit wordt verder gevisualiseerd in de weefselcoupes.

  1. Databasenavigatie en monsterselectie
    1. Klik op het tabblad Database en gebruik het filter om het organisme muis, de orgaanlever en de aandoening kanker te selecteren. Selecteer uit de resulterende voorbeelden DSID001005 voorbeeld. Klik op het monster en bevestig de beschrijving waarin staat dat het monster afkomstig is van een muizenlever met metastasen van colorectale kanker.
    2. Navigeer naar het tabblad Weefselverkenner en selecteer Handmatige selectie. Selecteer vervolgens met behulp van de muiscursor de plekken in het tumorgebied (colorectale metastasen) van het levermonster DSID001005, geïdentificeerd op basis van de positieve expressie van de Epcam-marker (Figuur 5A). Klik op set 1 en selecteer toevoegen aan set. Hiermee worden alle geselecteerde plekken op de plak aan de rechterkant gemarkeerd (Figuur 5C).
    3. Klik nu op set 2 en gebruik de muiscursor om de plekken in het verre niet-tumorgebied van het levermonster te selecteren. Klik op toevoegen aan set, waardoor alle geselecteerde plekken op de plak aan de rechterkant worden gemarkeerd (Figuur 5C).
  2. Vergelijking van genexpressie tussen geselecteerde plekken
    1. Klik na het voltooien van het spotselectieproces op de knop Genexpressie vergelijken . Dit genereert een tabel met de gemiddelde genexpressiewaarden van de geselecteerde plekken tussen beide regio's, samen met een spreidingsdiagramweergave. Beweeg de muiscursor over individuele plekken en inspecteer de gennamen en de gemiddelde expressie van genen in beide regio's.
    2. Als u een diepere analyse wilt uitvoeren met de genexpressiegegevens, selecteert u de optie CSV downloaden . Dit genereert een Comma-Separated Values (CSV)-bestand van de genexpressiegegevens voor de twee regio's van het monster.
    3. Herhaal stap 2.1.1-2.1.3 en 2.2.1-2.2.2 voor voorbeeld "DSID001007". Bevestig de beschrijving als een ander plakje uit een muizenlever met metastasen van colorectale kankeroorsprong.
  3. Gegevensanalyse met R-programmering
    1. Controleer of de bovenstaande stappen hebben geleid tot 2 CSV-bestanden, één van voorbeeld DSID001005 en één van voorbeeld DSID001007. Beide bestanden bevatten 2 kolommen die de gemiddelde genexpressie vertegenwoordigen in de 2 selecties (tumorweefsel en niet-tumorweefsel) die in elk monster zijn gemaakt.
    2. Lees de CSV-bestanden in R en voeg ze samen voor verdere downstream-analyse met twee replicaten per aandoening (d.w.z. tumorgebied met colorectale kankermetastasen en gezond weefsel op afstand in de lever). Raadpleeg het R-script en de gegevensbestanden in de aanvullende materialen.
    3. Gebruik het limma-pakket (versie 3.62.2) in R (versie 4.4.2)12 om differentiële expressieanalyse voor de gegevens uit te voeren, waarbij de colorectale metastasengebieden van beide monsters worden gecategoriseerd als kanker en de verre, gezonde regio's van beide monsters als controle. Verkrijg de opgereguleerde genen met een filter van logFC > 0,5 en aangepaste p-waarde < 0,05. Verkrijg op dezelfde manier de gedownreguleerde genen met een filter van logFC < -0,5 en een aangepaste p-waarde < 0,05.
      OPMERKING: Deze sets genen worden gebruikt om biologische routes te identificeren die in de volgende stap door de tumor worden beïnvloed (Figuur 6A,B).
    4. Gebruik het clusterProfiler-pakket (versie 4.14.6) in R13 om de analyse uit te voeren van routes van de Kyoto Encyclopedia of Genes and Genomes (KEGG)14 voor de gedownreguleerde en geupreguleerde genen. Identificeer op basis van een streng filter van q-waarde < 0,05 de significante routes die verband houden met de gedownreguleerde en opgereguleerde genen. Focus op genen die geassocieerd zijn met immunologische routes, immuunactiviteiten of relevante handtekeningen (Figuur 6B).
  4. Gen-specifieke datamining
    1. Zoek vervolgens naar gennamen in de sectie Ruimtelijk variabele genen om de ruimtelijke expressie van de doelgenen te bevestigen. Klik op een gennaam om een ruimtelijke plot voor het gen over de weefselplak te genereren, met vlekken met een kleurcode voor het expressieniveau (Figuur 7).
    2. Identificeer specifieke genen met ruimtelijke expressiepatronen op de plaats van colorectale metastasen, in tegenstelling tot het verre, gezonde leverweefsel. De functionele relevantie van de genen, of hun expressie in andere organen of aandoeningen, kan verder worden onderzocht in de database.
    3. Selecteer het tabblad Zoeken en kies de soort als muis. Klik op de optie Zoeken op gen en typ een gennaam in. Een overzicht van de orgaan- en conditieverdeling van de genen wordt weergegeven en kan verder worden geanalyseerd.
      OPMERKING: Door de hierboven beschreven stappen kan DeepSpaceDB worden gebruikt om genexpressiepatronen tussen gemetastaseerde en niet-gemetastaseerde regio's in ruimtelijke transcriptomics-monsters van muizenlever te onderzoeken.

Results

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

Voorbeeld 1 demonstreerde de analyse van een hersenmonster van muizen, waarbij parameters zoals het aantal gelezen kleuren, ruimtelijk variabele genen en routes en genexpressievariaties tussen de hippocampus en de cortex werden gevalideerd. Eerst werd de kwaliteit van het DSID001557 van het muizenhersenmonster beoordeeld aan de hand van verschillende kwaliteitsmetingen: "Gedetecteerde genen" (Figuur 1A), "Read Count" (Figuur 1B) en "Mito" (het percentage mitochondriale lezingen; Figuur 1C). Dit benadrukte duidelijk een gebied met een lagere kwaliteit aan de linkerkant van het hersenmonster, gebaseerd op het lage aantal gedetecteerde genen en het lage aantal gelezen genen. Om inzicht te krijgen in de relatieve kwaliteit van de steekproef ten opzichte van alle andere steekproeven, werd op het tabblad Relatieve kwaliteit van steekproef in de database geklikt, waardoor een grafiek van het aantal versus het aantal werd weergegeven. van gedetecteerde genen per plek (gemiddelde). Voor het monster dat werd geanalyseerd, werden er tussen de 3500-4000 genen gedetecteerd per plek (Figuur 1D). De anatomische kenmerken van het monster werden verder geanalyseerd met behulp van het tabblad Afbeeldingsannotatie . In het algemeen zijn deze annotaties gegenereerd door weefselbeelden in kleinere delen te knippen en een LLM te vragen de waarneembare kenmerken te beschrijven8. Het zijn ruwe indicaties om de interpretatie van het monster te vergemakkelijken en moeten met zorg worden geïnterpreteerd. Voor een subset van monsters (vooral monsters van borstkanker bij mensen) zijn ook annotaties door een menselijke specialist beschikbaar. Gezien de lagere kwaliteit van Visium H&E-beelden in vergelijking met afbeeldingen die worden gebruikt voor routinediagnose, zijn de verstrekte annotaties echter alleen voor onderzoeksdoeleinden. Beweeg voor DSID001557 voorbeeld de cursor over de plak die wordt weergegeven annotaties van de verschillende delen van de muizenhersenen, zoals het hippocampusgebied, corticale lagen, dichte cellulaire lagen met gliose, enz. Van het begrijpen van de anatomische basiskenmerken van de monsterschijf, werden gedetailleerde kenmerken zoals celtypeclusters en ruimtelijk variabele genen en routes verder onderzocht. Het hersenmonster van de muis had in totaal 15 clusters, die werden weergegeven met kleurcodering over het monstersegment (Figuur 1E). Enkele van de belangrijkste ruimtelijk variabele genen die met de steekproef zijn geassocieerd, zijn Nrgn, Slc17a7, Ly6h en Ddn (Figuur 2). Nrgn vertoonde een hoge expressie in de hippocampus, in overeenstemming met het literaire bewijs dat de rol van het Nrgn-gecodeerde eiwit (neurogranine) aangeeft bij het mediëren van synaptische plasticiteit en ruimtelijk leren15. Slc17a7, een gen dat codeert voor een vesiculaire glutamaattransporter die cruciaal is voor neurotransmissie in glutaminerge neuronen16, en Ddn, een gen dat codeert voor een eiwit dat de structuur van het postsynaptische cytoskelet moduleert17, werden ook sterk tot expressie gebracht in het hippocampusgebied. Daarentegen was de expressie van gen Ly6h gelokaliseerd in het corticale gebied, in overeenstemming met de literatuur die de beperkende synaptische rol van Ly6h in de membranen van corticale cellen aangeeft18. Op een vergelijkbare manier werd de activiteit van routes gevisualiseerd over het steekproefsegment (Figuur 3). Er werd waargenomen dat de ruimtelijk variabele routes werden geactiveerd in overeenstemming met de functionele rollen van de ruimtelijk variabele genen, met regulatie van synaptische plasticiteit en neurotransmitteractiviteit in het hippocampusgebied, en neuropeptidesignalering in het corticale gebied.

Ten slotte werd het tabblad Tissue Explorer gebruikt om differentieel tot expressie gebrachte genen tussen het hippocampusgebied en de hypothalamus van het hersenmonster van de muis te identificeren. Plekken die verband houden met de interessegebieden werden geselecteerd met behulp van de beeldannotatie (Figuur 4A). Uit het gegenereerde spreidingsdiagram bleek dat sommige van de geïdentificeerde differentieel tot expressie gebrachte genen tot de top van ruimtelijk variabele genen behoorden (Nrgn, Slc17a7, Ddn), naast enkele andere, zoals Pmch en Ttr. De expressie van deze genen werd gevisualiseerd in het plakje van het monster. Pmch werd specifiek tot overexpressie gebracht in het laterale hypothalamische gebied (Figuur 4B; vergelijk met het groen geselecteerde gebied in Figuur 4A). Dit gen codeert voor de voorloper van het melanineconcentrerende hormoon en is betrokken bij het behoud van de energiehomeostase19. Daarentegen werd het gen Ttr specifiek tot expressie gebracht in het hippocampusgebied (Figuur 4C; vergelijk met het rode geselecteerde gebied in Figuur 4A), in overeenstemming met zijn functionele rol in leren en ruimtelijk geheugen20. Door met behulp van deze database intra-sample vergelijkingen uit te voeren tussen verschillende hersengebieden van muizen, konden we regiospecifieke functionele kenmerken benadrukken op basis van ruimtelijke genexpressie en pathway-activiteit.

In voorbeeld 2 werd de database gebruikt voor de identificatie van immuunsignaturen geassocieerd met colorectale metastasen in de lever. Er werd een vergelijking binnen de steekproef uitgevoerd tussen het tumorgebied met colorectale metastasen en het verre, gezonde leverweefsel, door middel van de juiste steekproef voor de twee monsters: DSID001005 (Figuur 5A-C) en DSID001007 (Figuur 5D-F). De gegevens werden opnieuw geanalyseerd met twee replicaten per aandoening met behulp van R. Differentiële expressieanalyse uitgevoerd tussen het tumorgebied met colorectale metastase en het gezonde leverweefsel onthulde de downregulatie van 138 genen en de opregulatie van 115 genen, op basis van de geselecteerde parameters (Figuur 6A,B). Analyse van de KEGG-route toonde de verrijking aan van de routes van de gedownreguleerde genen, zoals geneesmiddelmetabolisme en chemische carcinogenese (Figuur 6C), terwijl de opgereguleerde genen signaturen vertoonden die onder andere overeenkomen met trans-endotheliale migratie van leukocyten, focale adhesie en celcyclus (Figuur 6D). Met de nadruk op de relevantie van trans-endotheliale migratie van leukocyten voor immuunactiviteit, werden topgenen gedetecteerd in de categorie en werd hun ruimtelijke expressie waargenomen in DeepSpaceDB. Interessant is dat de genen Cldn7, Cldn4 en Actg1, gedetecteerd onder de categorie van trans-endotheliale migratie van leukocyten, opregulatie vertoonden in het tumorgebied (Epcam+-plaats) van de monsters, en niet in het verre gebied met gezond leverweefsel (Figuur 7). Dit gaf inzicht in de aard van de immuunactiviteit die wordt aangedreven op de tumorplaats van de lever, met de actieve rekrutering van leukocyten. Samenvattend maakt intra-sample analyse met behulp van DeepSpaceDB het mogelijk om diverse biologische inzichten te extraheren. Door ruimtelijke transcriptomische gegevens te vergelijken via interactieve tools en heranalyseworkflows, kunnen onderzoekers hypothesen genereren en valideren met betrekking tot weefselspecifieke genexpressie en functionele heterogeniteit.

figure-results-1
Figuur 1: Kwaliteitsmetingen van de steekproef. (A) Aantal gedetecteerde genen, (B) aantal gelezen genen en (C) percentage mitochondriale metingen per plek. (D) Het gemiddelde aantal gedetecteerde genen per plek in deze steekproef, vergeleken met de verdeling van alle andere steekproeven in de database. (E) Spot clusters over de weefselschijf. Klik hier om een grotere versie van deze figuur te bekijken.

figure-results-2
Figuur 2: Expressie van de belangrijkste ruimtelijk variabele genen. (a) Nrgn, (b) Slc17a7, (c) Ly6h en (D) Ddn. Klik hier om een grotere versie van deze figuur te bekijken.

figure-results-3
Figuur 3: Activiteit van de belangrijkste ruimtelijk variabele routes. (A) Neuropeptide signalering, (B) Regulatie van synaptische plasticiteit, (C) Transport van neurotransmitters. Klik hier om een grotere versie van deze figuur te bekijken.

figure-results-4
Figuur 4: Vergelijking van genexpressiepatronen tussen twee geselecteerde gebieden van de muizenhersenen. (A) Spotselectie in hypothalamische en hippocampale regio's voor vergelijkingen binnen de steekproef. Geselecteerde regio 1 wordt in het rood weergegeven en regio 2 in het groen. Ruimtelijke expressiepatronen van differentieel tot expressie gebrachte genen (B) Pmch en (C) Ttr tussen hypothalamische en hippocampale regio's. Klik hier om een grotere versie van deze figuur te bekijken.

figure-results-5
Figuur 5: Eigenschappen van twee gemetastaseerde muizenlevermonsters. Voor voorbeeld DSID001005: (A) expressie van de Epcam-marker , (B) spotclusters en (C) geselecteerde regio's in kankerachtige en verre regio's voor vergelijkingen binnen de steekproef. Voor voorbeeld DSID001007: (D) expressie van de Epcam-marker , (E) spotclusters en (F) geselecteerde regio's in kankerachtige en verre regio's voor vergelijkingen binnen de steekproef. Voor beide monsters bevinden de tumorvlekken zich in de regio's die in rood worden weergegeven en niet-tumorvlekken in de regio's die in het groen worden weergegeven. Klik hier om een grotere versie van deze figuur te bekijken.

figure-results-6
Figuur 6: Resultaten van de heranalyse. (A) Schematische samenvatting van de workflow die bij de heranalyse is gebruikt. (B) Vulkaandiagram dat de differentieel tot expressie gebrachte genen tussen kankerachtige en verre gebieden weergeeft. Verrijking van de KEGG-route van (C) opgereguleerde genen en (D) gedownreguleerde genen. Klik hier om een grotere versie van deze figuur te bekijken.

figure-results-7
Figuur 7: Ruimtelijke expressie van genen. (A) Cldn7, (B) Cldn4 en (C) Actg1 in weefselplakje DSID001005. Ruimtelijke expressie van genen. (D) Cldn7, (E) Cldn4 en (F) Actg1 in weefselplakje DSID001007. Klik hier om een grotere versie van deze figuur te bekijken.

Aanvullende bestanden 1-4: Gegevensbestanden en R-script voor voorbeeld van levermetastasen. Klik hier om dit bestand te downloaden.

Discussion

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

Hier hebben we twee uitgebreide protocollen geïntroduceerd die de navigatie, het ophalen en de analyse van ruimtelijke transcriptomics-gegevens in DeepSpaceDB beschrijven. Terwijl de meeste ruimtelijke omics-databases zich richten op het verzamelen van gegevens uit een groot aantal monsters, gegenereerd met behulp van verschillende platforms 3,4,5,6, richt DeepSpaceDB zich op de ontwikkeling van interactieve tools waarmee gebruikers ruimtelijke transcriptomische functies diepgaand en efficiënt kunnen verkennen. Om dit niveau van functionaliteit mogelijk te maken, richt de huidige release zich uitsluitend op het Visium-platform. Met de opkomst van platforms met hoge resolutie zijn we van plan DeepSpaceDB dienovereenkomstig uit te breiden en nieuwe strategieën te ontwikkelen voor de verwerking en integratie van dergelijke gegevens op een gebruiksvriendelijke manier.

DeepSpaceDB stelt gebruikers in staat om kwaliteitsstatistieken voor monsters te beoordelen (bijv. gentellingen, leesdiepte) en deze te vergelijken met datasets. De database bevat meerlagige annotaties: niet-gesuperviseerde clustering over de volledige database met toegewezen labels, op LLM gebaseerde detectie van structurele en pathologische kenmerken uit histologische beelden en deskundige histologieannotaties voor een groeiende subset van monsters. Bovendien kunnen gebruikers interactief interessegebieden selecteren binnen of tussen monsters om genexpressie te vergelijken, waardoor studies mogelijk worden van ruimtelijke contrasten tussen regio's zoals tumor versus stroma of zieke versus gezonde regio's. Dergelijke functies ontbreken over het algemeen in andere databases 3,4,5,6. Andere kenmerken, zoals ruimtelijk variabele genen en routes, voorspellingen van celtypen en clusterresultaten, zijn ook beschikbaar. Alles bij elkaar verlaagt deze database de barrières voor het verkennen van ruimtelijke transcriptomics-gegevens aanzienlijk. Monsters uit een breed scala aan weefsels en aandoeningen zijn vrij toegankelijk en gebruikers kunnen er doorheen navigeren door middel van eenvoudige point-and-click-interacties; Geen geavanceerde bio-informatica-expertise vereist. Dat gezegd hebbende, is enige voorkennis van markergenen en weefselarchitectuur waarschijnlijk nodig voor de nauwkeurige interpretatie van expressiepatronen en voor het selecteren van interessegebieden in de Tissue Explorer-tool.

Hoewel het hier niet wordt geïntroduceerd, kunnen gebruikers ook hun eigen voorbeelden uploaden en veel van dezelfde tools toepassen om ze te analyseren. De database ondersteunt ook vergelijkingen tussen monsters tussen 2 verschillende weefselplakjes, waardoor bijvoorbeeld vergelijkingen tussen zieke weefsels en gezonde controleweefsels mogelijk zijn. Ten slotte zijn onbewerkte en verwerkte gegevens, samen met alle afgeleide analyse-outputs, beschikbaar om te downloaden, ter ondersteuning van downstream-workflows en aangepaste analyses. Voor een aantal van deze tools zijn korte instructievideo's beschikbaar op de instructiepagina van de database.

Er zijn nog steeds aspecten van de database die verbetering behoeven. Een daarvan is de nauwkeurige voorspelling van celtypen en celtypesamenstellingen op elke locatie binnen de weefselplakjes. In de huidige versie van DeepSpaceDB (versie 1.0) hebben we de samenstelling van het celtype van elke Visium-plek voorspeld met behulp van een methode die robuuste celtypedecompositie (RCTD)21 wordt genoemd. RCTD presteerde relatief goed in een recente benchmarkstudie22. Voorspellingen van RCTD kunnen ook experimenteel worden gevalideerd in onze recente studie van de levers van kankerdragende muizen23. Er is echter geen uitgebreide evaluatie van de nauwkeurigheid van celtypevoorspellingen uitgevoerd. Een verwant probleem is dat RCTD en andere methoden voor het voorspellen van celtypen een referentiedataset met geannoteerde celtypen vereisen. Over het algemeen worden celtypen (of celtypesamenstellingen) op elke ruimtelijke locatie voorspeld door de vergelijking met genexpressiepatronen in deze referentiedataset. Het selecteren van een geschikte referentie voor elk Visium-monster is echter niet altijd eenvoudig. Referenties kunnen belangrijke celtypen missen, of, omgekeerd, kunnen celtypen bevatten die niet aanwezig zijn in de weefselschijf24. Bovendien kunnen cellen zich binnen één celtype in drastisch verschillende toestanden bevinden, zoals inactieve versus geactiveerde immuuncellen25. De celtoestanden in referentiedatasets komen niet noodzakelijkerwijs overeen met die van ruimtelijke monsters, die vaak worden verkregen uit ziektemodellen van patiënten. Beide problemen zullen waarschijnlijk leiden tot onnauwkeurige voorspellingen. We hopen dit probleem in de toekomst aan te pakken.

Naarmate het gebied van ruimtelijke transcriptomics zich snel blijft ontwikkelen, wordt een groeiend aantal computationele hulpmiddelen ontwikkeld om diverse aspecten van ruimtelijke gegevens te analyseren, waaronder cel-celinteracties, ruimtelijke domeinen en voorspelling van ruimtelijk variabele genen (zie bijvoorbeeld 26,27,28). Hoewel deze proliferatie de dynamiek van het vakgebied weerspiegelt, vormt het ook een uitdaging voor het samenstellen en integreren van tools in deze database. Om ervoor te zorgen dat de meest robuuste en breed toepasbare methoden worden opgenomen, is er dringend behoefte aan systematische benchmarkstudies die de prestaties van tools evalueren in datasets en analysetaken 22,29,30. Dergelijke inspanningen zullen essentieel zijn om een weloverwogen selectie en prioritering van tools voor opname in de database te begeleiden.

Terwijl andere ruimtelijke transcriptomics-databases proberen grote aantallen monsters van veel verschillende platforms te verzamelen, hebben we in DeepSpaceDB besloten om een andere strategie te gebruiken: focus op een paar populaire platforms en implementeer interactieve en intuïtieve tools waarmee de gebruiker de gegevens gemakkelijk in meer detail kan verkennen. Hoewel onze database alleen Visium-samples in de huidige versie 1.0 bevat, zijn we van plan om in een toekomstige update ook samples van andere platforms op te nemen.

Disclosures

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

De auteurs hebben niets te onthullen.

Acknowledgements

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

De auteurs willen Y. Harada bedanken voor de secretariële ondersteuning. Dit werk werd ondersteund door JST NBDC (Grant Number JPMJND2303, A.V.) en AMED (Grant Number JP24gm2010003, A.V.) Dit werk werd ook ondersteund door JSPS KAKENHI (20H03451, 24K02236 en 24KK0147; S.K.), JST FOREST (JPMJFR2062; SK), JST Moonshot (JPMJMS2011-61; S.K). De financiers hadden geen rol in de opzet van het onderzoek, het verzamelen en analyseren van gegevens, de beslissing om te publiceren of de voorbereiding van het manuscript.

Materials

List of materials used in this article
NameCompanyCatalog NumberComments
clusterProfilerR package - version 4.14.6
DeepSpaceDBversion > 1.0A link to the database: www.deepspacedb.com
limmaR package - version 3.62.2
Rversion 4.4.2
RStudioPositversion 2024.12

References

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,
  1. The expanding vistas of spatial transcriptomics. Nat Biotechnol. 41 (6), 773-782 (2023).">Tian, L., Chen, F., Macosko, E. Z. The expanding vistas of spatial transcriptomics. Nat Biotechnol. 41 (6), 773-782 (2023).
  2. Museum of spatial transcriptomics. Nat Methods. 19 (5), 534-546 (2022).">Moses, L., Pachter, L. Museum of spatial transcriptomics. Nat Methods. 19 (5), 534-546 (2022).
  3. SpatialDB: A database for spatially resolved transcriptomes. Nucleic Acids Res. 48 (D1), D233-D237 (2020).">Fan, Z., Chen, R., Chen, X. SpatialDB: A database for spatially resolved transcriptomes. Nucleic Acids Res. 48 (D1), D233-D237 (2020).
  4. SODB facilitates comprehensive exploration of spatial omics data. Nat Methods. 20 (3), 387-399 (2023).">Yuan, Z., et al. SODB facilitates comprehensive exploration of spatial omics data. Nat Methods. 20 (3), 387-399 (2023).
  5. STOmicsDB: A comprehensive database for spatial transcriptomics data sharing, analysis and visualization. Nucleic Acids Res. 52 (D1), 1053-1061 (2024).">Xu, Z., et al. STOmicsDB: A comprehensive database for spatial transcriptomics data sharing, analysis and visualization. Nucleic Acids Res. 52 (D1), 1053-1061 (2024).
  6. SOAR elucidates biological insights and empowers drug discovery through spatial transcriptomics. Sci Adv. 11 (24), 7450(2025).">Li, Y., et al. SOAR elucidates biological insights and empowers drug discovery through spatial transcriptomics. Sci Adv. 11 (24), 7450(2025).
  7. DeepSpaceDB: A spatial transcriptomics atlas for interactive in-depth analysis of tissues and tissue microenvironments. bioRxiv. , (2025).">Honcharuk, V., et al. DeepSpaceDB: A spatial transcriptomics atlas for interactive in-depth analysis of tissues and tissue microenvironments. bioRxiv. , (2025).
  8. arXiv. , OpenAI. http://arxiv.org/abs/2303.08774 (2023).">GPT-4 technical report. arXiv. , OpenAI. http://arxiv.org/abs/2303.08774 (2023).
  9. A clustering-independent method for finding differentially expressed genes in single-cell transcriptome data. Nat Commun. 11 (1), 1-10 (2020).">Vandenbon, A., Diez, D. A clustering-independent method for finding differentially expressed genes in single-cell transcriptome data. Nat Commun. 11 (1), 1-10 (2020).
  10. A universal tool for predicting differentially active features in single-cell and spatial genomics data. Sci Rep. 13 (1), 1-14 (2023).">Vandenbon, A., Diez, D. A universal tool for predicting differentially active features in single-cell and spatial genomics data. Sci Rep. 13 (1), 1-14 (2023).
  11. Dictionary learning for integrative, multimodal, and scalable single-cell analysis. Nat Biotechnol. 42 (2), 293-304 (2024).">Hao, Y., et al. Dictionary learning for integrative, multimodal, and scalable single-cell analysis. Nat Biotechnol. 42 (2), 293-304 (2024).
  12. Limma powers differential expression analyses for RNA-sequencing and microarray studies. Nucleic Acids Res. 43 (7), e47(2015).">Ritchie, M. E., et al. Limma powers differential expression analyses for RNA-sequencing and microarray studies. Nucleic Acids Res. 43 (7), e47(2015).
  13. ClusterProfiler: An R package for comparing biological themes among gene clusters. OMICS. 16 (5), 284-287 (2012).">Yu, G., Wang, L. G., Han, Y., He, Q. Y. ClusterProfiler: An R package for comparing biological themes among gene clusters. OMICS. 16 (5), 284-287 (2012).
  14. KEGG for taxonomy-based analysis of pathways and genomes. Nucleic Acids Res. 51 (D1), D587-D592 (2023).">Kanehisa, M., et al. KEGG for taxonomy-based analysis of pathways and genomes. Nucleic Acids Res. 51 (D1), D587-D592 (2023).
  15. Association between NRGN gene polymorphism and resting-state hippocampal functional connectivity in schizophrenia. BMC Psychiatry. 19 (1), 108(2019).">Zhang, Y., et al. Association between NRGN gene polymorphism and resting-state hippocampal functional connectivity in schizophrenia. BMC Psychiatry. 19 (1), 108(2019).
  16. Glutamate, aspartate and nucleotide transporters in the SLC17 family form four main phylogenetic clusters: evolution and tissue expression. BMC Genomics. 11, 17(2010).">Sreedharan, S., et al. Glutamate, aspartate and nucleotide transporters in the SLC17 family form four main phylogenetic clusters: evolution and tissue expression. BMC Genomics. 11, 17(2010).
  17. Sequencing of hippocampal and cerebellar transcriptomes provides new insights into the complexity of gene regulation in the human brain. Neurosci Lett. 541, 263-268 (2013).">Twine, N. A., Janitz, C., Wilkins, M. R., Janitz, M. Sequencing of hippocampal and cerebellar transcriptomes provides new insights into the complexity of gene regulation in the human brain. Neurosci Lett. 541, 263-268 (2013).
  18. Expression of the Ly-6 family proteins Lynx1 and Ly6H in the rat brain is compartmentalized, cell-type specific, and developmentally regulated. Brain Struct Funct. 219 (6), 1923-1934 (2014).">Thomsen, M. S., et al. Expression of the Ly-6 family proteins Lynx1 and Ly6H in the rat brain is compartmentalized, cell-type specific, and developmentally regulated. Brain Struct Funct. 219 (6), 1923-1934 (2014).
  19. The role of melanin concentrating hormone (MCH) in the central chemoreflex: A knockdown study by siRNA in the lateral hypothalamus in rats. PLoS ONE. 9 (8), e103585(2014).">Li, N., Nattie, E., Li, A. The role of melanin concentrating hormone (MCH) in the central chemoreflex: A knockdown study by siRNA in the lateral hypothalamus in rats. PLoS ONE. 9 (8), e103585(2014).
  20. Transthyretin-a key gene involved in regulating learning and memory in brain, and providing neuroprotection in Alzheimer disease via neuronal synthesis of transthyretin protein. J. Behav. Brain Sci. 8 (2), 77-92 (2018).">Iqbal, J. Transthyretin-a key gene involved in regulating learning and memory in brain, and providing neuroprotection in Alzheimer disease via neuronal synthesis of transthyretin protein. J. Behav. Brain Sci. 8 (2), 77-92 (2018).
  21. Robust decomposition of cell type mixtures in spatial transcriptomics. Nat Biotechnol. 40 (4), 517-526 (2021).">Cable, D. M., et al. Robust decomposition of cell type mixtures in spatial transcriptomics. Nat Biotechnol. 40 (4), 517-526 (2021).
  22. Benchmarking spatial and single-cell transcriptomics integration methods for transcript distribution prediction and cell type deconvolution. Nat Methods. 19 (6), 662-670 (2022).">Li, B., et al. Benchmarking spatial and single-cell transcriptomics integration methods for transcript distribution prediction and cell type deconvolution. Nat Methods. 19 (6), 662-670 (2022).
  23. Murine breast cancers disorganize the liver transcriptome in a zonated manner. Commun Biol. 6 (1), 1-12 (2023).">Vandenbon, A., et al. Murine breast cancers disorganize the liver transcriptome in a zonated manner. Commun Biol. 6 (1), 1-12 (2023).
  24. Missing cell types in single-cell references impact deconvolution of bulk data but are detectable. Genome Biol. 26 (1), 86(2025).">Ivich, A., et al. Missing cell types in single-cell references impact deconvolution of bulk data but are detectable. Genome Biol. 26 (1), 86(2025).
  25. A periodic table of cell types. Development. 146 (12), dev169854(2019).">Xia, B., Yanai, I. A periodic table of cell types. Development. 146 (12), dev169854(2019).
  26. Deciphering spatial domains from spatially resolved transcriptomics with an adaptive graph attention auto-encoder. Nat Commun. 13 (1), 1739(2022).">Dong, K., Zhang, S. Deciphering spatial domains from spatially resolved transcriptomics with an adaptive graph attention auto-encoder. Nat Commun. 13 (1), 1739(2022).
  27. Mapping cellular interactions from spatially resolved transcriptomics data. Nat Methods. 21, 1830-1842 (2024).">Zhu, J., et al. Mapping cellular interactions from spatially resolved transcriptomics data. Nat Methods. 21, 1830-1842 (2024).
  28. Giotto: A toolbox for integrative analysis and visualization of spatial expression data. Genome Biol. 22 (1), 1-31 (2021).">Dries, R., et al. Giotto: A toolbox for integrative analysis and visualization of spatial expression data. Genome Biol. 22 (1), 1-31 (2021).
  29. Benchmarking spatial clustering methods with spatially resolved transcriptomics data. Nat Methods. 21 (4), 712-722 (2024).">Yuan, Z., et al. Benchmarking spatial clustering methods with spatially resolved transcriptomics data. Nat Methods. 21 (4), 712-722 (2024).
  30. Benchmarking algorithms for spatially variable gene identification in spatial transcriptomics. Bioinformatics. 41 (4), btaf131(2025).">Chen, X., et al. Benchmarking algorithms for spatially variable gene identification in spatial transcriptomics. Bioinformatics. 41 (4), btaf131(2025).

Reprints and Permissions

Request permission to reuse the text or figures of this JoVE article

Request Permission

Tags

Spatial TranscriptomicsGene Expression PatternsDeepSpaceDB DatabaseTissue Slice AnalysisSpatially Variable GenesDifferential Gene ExpressionTumor MicroenvironmentMouse Brain SampleColorectal Cancer MetastasisBioinformatics Tools

Related Articles