Estrazione di set di dati di trascrittomica spaziale utilizzando DeepSpaceDB

Nupura Prabhune; Yilin Du; Afeefa Zainab; Satoru Ebihara; Shinji Takeoka; Shinpei Kawaoka; Alexis Vandenbon

doi:10.3791/68892

Method Article

Estrazione di set di dati di trascrittomica spaziale utilizzando DeepSpaceDB

DOI:

10.3791/68892

⸱

September 5th, 2025

Nupura Prabhune¹^,² , Yilin Du¹^,³ , Afeefa Zainab⁴ , Satoru Ebihara³ , Shinji Takeoka² , Shinpei Kawaoka¹^,⁵ , Alexis Vandenbon⁴^,⁶

¹Department of Integrative Bioanalytics, Institute of Development, Aging and Cancer, Tohoku University, ²Department of Life Science and Medical Bioscience, Graduate School of Advanced Science and Engineering, Waseda University, ³Department of Rehabilitation Medicine, Tohoku University Graduate School of Medicine, ⁴Institute for Life and Medical Sciences, Kyoto University, ⁵Inter-Organ Communication Research Team, Institute for Life and Medical Sciences, Kyoto University, ⁶Institute for Liberal Arts and Sciences, Kyoto University

Summary

$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

Questo articolo introduce un protocollo per l'utilizzo di DeepSpaceDB, un database dinamico e interattivo per la trascrittomica spaziale, che offre flussi di lavoro di analisi ed esempi per esplorare l'organizzazione dei tessuti e l'espressione genica correlata alla malattia.

Abstract

$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

La trascrittomica spaziale è una tecnologia in rapida evoluzione che consente l'acquisizione di modelli di espressione genica in campioni di tessuto preservando le informazioni posizionali. Ha un'ampia gamma di applicazioni nella ricerca biologica e nella bioinformatica, consentendo ai ricercatori di studiare e monitorare le variazioni spaziali nell'espressione genica in diversi tessuti, condizioni e malattie. Con l'aumento dell'analisi dei dati di trascrittomica spaziale, il numero di set di dati disponibili pubblicamente è in aumento. Tuttavia, la trascrittomica spaziale rimane una tecnica sperimentale altamente specializzata, con notevoli vincoli tecnici e finanziari. Per facilitare l'accesso ai dati spaziali, abbiamo recentemente sviluppato DeepSpaceDB, un database completo e dinamico per l'esplorazione dei dati di trascrittomica spaziale. Questo articolo presenta flussi di lavoro dettagliati che delineano i componenti del database e la sua navigazione con l'aiuto di alcuni esempi. In primo luogo, viene dimostrata l'analisi di un campione di cervello di topo, esplorando indicatori di qualità, geni e percorsi spazialmente variabili e variazioni di espressione genica tra l'ippocampo e l'ipotalamo. Successivamente, l'identificazione e l'annotazione di geni differenzialmente espressi associati all'attività immunitaria viene ulteriormente esplorata confrontando le regioni metastatiche di origine colorettale con aree distanti di tessuto sano nei fegati murini. DeepSpaceDB, con i suoi strumenti avanzati e le sue funzionalità interattive, rappresenta una risorsa preziosa per la ricerca sulla trascrittomica spaziale, consentendo un'esplorazione più approfondita dell'organizzazione dei tessuti e della biologia delle malattie.

Introduction

$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

La trascrittomica spaziale è una nuova tecnologia che consente ai ricercatori di analizzare l'espressione genica conservando le informazioni spaziali all'interno di una sezione di tessuto, consentendo così lo studio dell'architettura dei tessuti, dell'eterogeneità cellulare e delle influenze microambientali a una risoluzione senza precedenti di ^1,2. Tuttavia, nonostante il potenziale di questa tecnologia, l'accesso e l'analisi rimangono limitati, la trascrittomica spaziale è proibitiva per molti laboratori e l'analisi dei dati richiede competenze bioinformatiche avanzate.

Lo sviluppo di banche dati pubbliche è un modo per ampliare l'accesso a questa modalità sperimentale emergente. Sono stati creati diversi database di trascrittomica spaziale. Il primo è stato SpatialDB, ma contiene solo un numero limitato di campioni e non è stato aggiornato³. I database SODB, SOAR e STOmicsDB includono un gran numero di campioni provenienti da molte piattaforme diverse e svolgono un ruolo importante come archivi di dati ^4,5,6. Tuttavia, gli strumenti di analisi sono limitati e mancano di interattività. Per risolvere questo problema, abbiamo recentemente sviluppato DeepSpaceDB, un database curato e di facile utilizzo di set di dati di trascrittomica spaziale disponibili al pubblico, progettato per ridurre le barriere tecniche ed espandere l'accessibilità⁷. Questo articolo illustra diversi strumenti in questo database, tra cui la ricerca nel database, l'ispezione della qualità dei campioni, gli strumenti di visualizzazione e il confronto di regioni selezionate in modo interattivo all'interno di sezioni di tessuto. Presenta protocolli dettagliati utilizzando due esempi rappresentativi: l'analisi di un campione di cervello di topo e di un fegato murino con metastasi colorettali per dimostrare questi strumenti in contesti pratici. Attraverso questi strumenti, DeepSpaceDB consente a una gamma più ampia di ricercatori di sfruttare la trascrittomica spaziale senza bisogno dei propri dati o di capacità bioinformatiche interne. Una descrizione completa della raccolta dei dati, del controllo di qualità, del flusso di lavoro di elaborazione, nonché dei dati e delle funzionalità incluse in DeepSpaceDB, è fornita in dettaglio da Honcharuk et al⁷.

Protocol

$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

1. Esempio 1: Analisi di un campione di cervello di topo

NOTA: In questa sezione viene illustrata l'analisi di un campione di cervello di topo, navigando tra le diverse funzionalità e grafici disponibili in DeepSpaceDB (un link al database è disponibile nella Tabella dei Materiali).

Selezione del campione
1. Fare clic sulla scheda Database e utilizzare il filtro per selezionare l'organismo topo, l'organo cervello e lo zenodo di origine. Spostatevi tra i campioni risultanti e selezionate DSID001557 campione. In alternativa, utilizzare la casella di ricerca per cercare il termine "DSID001557" nel database e selezionare questo esempio.
2. Fare clic sul campione e confermare la descrizione come 2 × 10⁶ cellule in 100 μL di soluzione salina-NK (iniezione e.v. una volta alla settimana per un totale di 5 volte).
Analisi della qualità
1. Fare clic sulla scheda Qualità per valutare la qualità del campione selezionato. Dal menu a discesa delle misure di qualità , selezionare diverse opzioni come Geni rilevati (Figura 1A), Conteggio letture (Figura 1B) e Mito (Figura 1C), per visualizzare i rispettivi parametri in ciascun punto della fetta di campione.
Annotazione dell'immagine
1. Passare alla scheda Annotazione immagine per identificare le diverse regioni della sezione campione.
2. Spostare il cursore del mouse sulla sezione di campionamento. Le annotazioni previste da un modello linguistico di grandi dimensioni (LLM) vengono visualizzate per parti dell'immagine campione in modo basato su griglia, con informazioni sull'anatomia e sulla condizione associata⁸.
Analisi dei cluster
1. Per una comprensione più approfondita dei cluster di tipi di celle nella sezione di esempio, passare alla scheda Cluster . Verrà visualizzata un'incorporazione 2D dei cluster, insieme a una rappresentazione dei cluster codificati a colori attraverso i punti sulla fetta del campione (Figura 1E).
Geni e vie spazialmente variabili
1. Passare alla scheda Geni e prendere nota dei geni spazialmente variabili (SVG; geni i cui livelli di espressione differiscono tra le posizioni dei tessuti) nel campione ^9,10. Queste SVG sono previste utilizzando la funzione singleCellHaystack, che adotta la misura della divergenza di Kullback-Leibler (D_KL nella tabella) per valutare quanto sia distinto il modello di espressione di ciascun gene da quello che ci si aspetterebbe in modo casuale (Figura 2). I geni con un basso valore p (grande log.p.adj negativo nella tabella) sono elencati come SVG.
  NOTA: I dati sull'espressione genica sono stati normalizzati utilizzando i parametri predefiniti utilizzati nel pacchetto¹¹ di Seurat R (versione 5). In pratica, le letture per ogni gene in ogni punto sono state divise per il conteggio totale delle letture in quel punto e moltiplicate per il fattore di scala 10.000. Successivamente, il logaritmo naturale è stato calcolato dopo l'aggiunta di 1, per evitare problemi con log(0). Il grafico mostrato nella scheda Geni mostra questi dati normalizzati.
2. Fai clic su alcuni dei geni principali nell'elenco. Questo genera un grafico spaziale per i geni in tutta la fetta di tessuto, con macchie codificate a colori per il livello di espressione (Figura 2). I geni con il punteggio più alto hanno modelli di espressione spaziale chiaramente distinti.
3. Passa alla scheda Percorsi per ispezionare l'attività di insiemi di geni (ad esempio, geni associati a un percorso biologico comune) piuttosto che di singoli geni. I percorsi spazialmente variabili sono elencati in modo simile agli SVG discussi sopra (Figura 3). Le attività del pathway sono stimate in base ai livelli di espressione dei geni ad esse associati ^7,11.
  NOTA: Le attività del percorso sono state stimate utilizzando la funzione del pacchetto Seurat R addModuleScore¹¹. In breve, questa funzione prende come input un insieme di geni (ad esempio, un insieme di geni coinvolti in un percorso comune) e restituisce i loro livelli medi di espressione, dopo diversi passaggi di elaborazione. In pratica, i valori positivi implicano un'attività superiore alla media e i valori negativi un'attività inferiore alla media. Il grafico mostrato nella scheda Percorsi mostra i dati del punteggio di questo modulo.
4. Fai clic su alcuni dei percorsi principali nell'elenco. Questo genera un grafico spaziale per i percorsi attraverso la fetta di tessuto, con macchie codificate a colori per il livello di attività. Diversi percorsi hanno modelli spaziali distinti di attività (Figura 3).
Confronto dell'espressione genica intra-campione
1. Passare alla scheda Esplora tessuti e selezionare Selezione manuale (se non è ancora stata selezionata). Quindi, usa il cursore del mouse per selezionare i punti nella regione ippocampale della fetta di cervello del topo, sul lato sinistro. Fare clic sul set 1 e selezionare aggiungi al set. In questo modo verranno evidenziati tutti i punti selezionati sulla fetta sul lato destro (Figura 4A).
2. Ora fai clic sul set 2 e usa il cursore del mouse per selezionare i punti nella regione ipotalamica della fetta di cervello del topo. Fare clic su aggiungi al set, che evidenzierà tutti i punti selezionati sulla fetta sul lato destro (Figura 4A).
3. Dopo aver completato il processo di selezione spot, fare clic sul pulsante Confronta espressione genica . Questo genererà una tabella con i valori medi di espressione genica dei punti selezionati tra le due regioni, insieme a una rappresentazione a dispersione. Sposta il cursore sui singoli punti per confermare i nomi dei geni e l'espressione media dei geni in entrambe le regioni.
4. Sulla base dei risultati del confronto dell'espressione genica, identificare i geni espressi in modo differenziale e passare nuovamente alla scheda Geni per visualizzare la loro espressione in tutta la fetta del campione (Figura 4B, C).
  NOTA: Attraverso i passaggi descritti sopra, DeepSpaceDB può essere utilizzato per studiare le caratteristiche di un campione di trascrittomica spaziale del cervello di topo.

2. Esempio 2: Identificazione e annotazione di geni differenzialmente espressi associati all'attività immunitaria in regioni metastatiche di origine colorettale in fegati di topo

NOTA: Nella sezione corrente viene esplorato un confronto intra-campione. Ciò è illustrato attraverso l'identificazione e l'annotazione di geni differenzialmente espressi tra regioni metastatiche di origine colorettale e regioni distanti di tessuto sano all'interno di una sezione epatica, sulla base di due diversi campioni. L'espressione spaziale di specifici geni disregolati rilevanti per l'attività immunitaria è ulteriormente visualizzata nelle sezioni di tessuto.

Navigazione nel database e selezione dei campioni
1. Fare clic sulla scheda Database e utilizzare il filtro per selezionare il topo dell'organismo, l'organo fegato e la condizione cancro. Dai campioni risultanti, selezionare DSID001005 campione. Clicca sul campione e conferma la descrizione affermando che il campione proviene da un fegato di topo contenente metastasi di origine tumorale del colon-retto.
2. Passare alla scheda Esplora tessuti e selezionare Selezione manuale. Successivamente, utilizzando il cursore del mouse, selezionare le macchie nella regione tumorale (metastasi colorettali) del campione di fegato DSID001005, identificate in base all'espressione positiva del marcatore Epcam (Figura 5A). Fare clic sul set 1 e selezionare aggiungi al set. In questo modo vengono evidenziati tutti i punti selezionati sulla fetta sul lato destro (Figura 5C).
3. Ora fai clic sul set 2 e usa il cursore del mouse per selezionare i punti nella regione non tumorale distante del campione di fegato. Fare clic su aggiungi per impostare, che evidenzierà tutti i punti selezionati sulla fetta sul lato destro (Figura 5C).
Confronto dell'espressione genica tra punti selezionati
1. Dopo aver completato il processo di selezione spot, fare clic sul pulsante Confronta espressione genica . Questo genera una tabella con i valori medi di espressione genica dei punti selezionati tra le due regioni, insieme a una rappresentazione a dispersione. Sposta il cursore del mouse sui singoli punti e ispeziona i nomi dei geni e l'espressione media dei geni in entrambe le regioni.
2. Per condurre un'analisi più approfondita con i dati di espressione genica, selezionare l'opzione Scarica CSV . Questo genera un file CSV (Comma-Separated Values) dei dati di espressione genica per le due regioni del campione.
3. Ripetere i passaggi 2.1.1-2.1.3 e 2.2.1-2.2.2 per il campione "DSID001007". Confermare la sua descrizione come un'altra fetta di fegato di topo contenente metastasi di origine tumorale del colon-retto.
Analisi dei dati con programmazione R
1. Verifica che i passaggi precedenti abbiano prodotto 2 file CSV, uno da DSID001005 di esempio e uno da DSID001007 di esempio. Entrambi i file contengono 2 colonne che rappresentano l'espressione genica media nelle 2 selezioni (tessuto tumorale e tessuto non tumorale) che sono state effettuate in ciascun campione.
2. Leggere i file CSV in R e unirli per ulteriori analisi a valle con due repliche per condizione (ad esempio, regione tumorale con metastasi del cancro del colon-retto e tessuto sano distante nel fegato). Fare riferimento allo script R e ai file di dati nei materiali supplementari.
3. Utilizzare il pacchetto limma (versione 3.62.2) in R (versione 4.4.2)¹² per condurre l'analisi dell'espressione differenziale per i dati, classificando le regioni delle metastasi colorettali di entrambi i campioni come cancro e le regioni sane distanti di entrambi i campioni come controllo. Ottenere i geni sovraregolati con un filtro di logFC > 0,5 e valore p aggiustato < 0,05. Allo stesso modo, ottenere i geni downregolati con un filtro di logFC < -0,5 e valore p aggiustato < 0,05.
  NOTA: Questi set di geni vengono utilizzati per identificare le vie biologiche che sono influenzate dal tumore nella fase successiva (Figura 6A, B).
4. Utilizzare il pacchetto clusterProfiler (versione 4.14.6) in R¹³ per condurre l'analisi dei percorsi dell'Enciclopedia dei geni e dei genomi di Kyoto (KEGG)¹⁴ per i geni sottoregolati e sovraregolati. Sulla base di un filtro rigoroso di valore q < 0,05, identificare i percorsi significativi associati ai geni sottoregolati e sovraregolati. Concentrarsi sui geni associati alle vie immunologiche, alle attività immunitarie o alle firme rilevanti (Figura 6B).
Data mining gene-specific
1. Successivamente, cerca i nomi dei geni nella sezione Geni spazialmente variabili per confermare l'espressione spaziale dei geni bersaglio. Fare clic sul nome di un gene per generare un grafico spaziale per il gene in tutta la fetta di tessuto, con macchie codificate a colori per il livello di espressione (Figura 7).
2. Identificare geni specifici con modelli spaziali di espressione nel sito delle metastasi colorettali, rispetto al tessuto epatico sano e distante. La rilevanza funzionale dei geni, o la loro espressione in altri organi o condizioni, può essere ulteriormente esplorata nel database.
3. Seleziona la scheda Cerca e scegli la specie come mouse. Fare clic sull'opzione di ricerca per gene e digitare il nome di un gene. Verrà visualizzata una panoramica dell'organo e della distribuzione delle condizioni dei geni che potrà essere ulteriormente analizzata.
  NOTA: Attraverso i passaggi descritti sopra, DeepSpaceDB può essere utilizzato per studiare i modelli di espressione genica tra regioni metastatiche e non metastatiche in campioni di trascrittomica spaziale del fegato di topo.

Results

$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

L'esempio 1 ha dimostrato l'analisi di un campione di cervello di topo, convalidando parametri come il conteggio delle letture, i geni e i percorsi spazialmente variabili e le variazioni di espressione genica tra l'ippocampo e la corteccia. In primo luogo, la qualità del campione di cervello di topo DSID001557 è stata valutata rispetto a diverse misure di qualità: "Geni rilevati" (Figura 1A), "Conteggio delle letture" (Figura 1B) e "Mito" (la percentuale di letture mitocondriali; Figura 1C). Ciò ha evidenziato chiaramente una regione con qualità inferiore sul lato sinistro del campione cerebrale, in base al basso numero di geni rilevati e al basso numero di letture. Per comprendere la qualità relativa del campione rispetto a tutti gli altri campioni, è stato fatto clic sulla scheda Qualità relativa del campione nel database, che visualizzava un grafico del conteggio rispetto a No. di geni rilevati per punto (Media). Per il campione analizzato, sono stati rilevati tra i 3500 e i 4000 geni per punto (Figura 1D). Le caratteristiche anatomiche del campione sono state ulteriormente analizzate utilizzando la scheda Annotazione immagine . Come nota generale, queste annotazioni sono state generate tagliando le immagini dei tessuti in parti più piccole e chiedendo a un LLM di descrivere le caratteristiche osservabili⁸. Sono indicazioni approssimative per aiutare l'interpretazione del campione e devono essere interpretate con cura. Per un sottoinsieme di campioni (in particolare campioni di cancro al seno umano), sono disponibili anche annotazioni da parte di uno specialista umano. Tuttavia, considerando la qualità inferiore delle immagini Visium H&E rispetto alle immagini utilizzate per la diagnosi di routine, le annotazioni fornite sono solo a scopo di ricerca. Per DSID001557 campione, spostare il cursore sulle annotazioni visualizzate della sezione delle diverse regioni del cervello del topo, come la regione ippocampale, gli strati corticali, gli strati cellulari densi con gliosi, ecc. Dalla comprensione delle caratteristiche anatomiche di base della fetta del campione, sono state ulteriormente esplorate caratteristiche dettagliate come i cluster di tipi cellulari e i geni e i percorsi spazialmente variabili. Il campione di cervello di topo aveva 15 cluster in totale, che sono stati rappresentati con una codifica a colori su tutta la fetta del campione (Figura 1E). Alcuni dei principali geni spazialmente variabili associati al campione sono Nrgn, Slc17a7, Ly6h e Ddn (Figura 2). Nrgn ha mostrato un'elevata espressione nella regione ippocampale, in accordo con l'evidenza letteraria che indica il ruolo della proteina codificata da Nrgn (neurogranina) nella mediazione della plasticità sinaptica e dell'apprendimento spaziale¹⁵. Slc17a7, un gene che codifica per un trasportatore vescicolare di glutammato cruciale per la neurotrasmissione nei neuroni glutaminergici¹⁶, e Ddn, un gene che codifica per una proteina che modula la struttura del citoscheletro post-sinaptico¹⁷, erano anche altamente espressi nella regione ippocampale. Al contrario, l'espressione del gene Ly6h è stata localizzata nella regione corticale, in accordo con la letteratura che indica il ruolo sinaptico restrittivo di Ly6h nelle membrane delle cellule corticali¹⁸. In modo simile, l'attività dei percorsi è stata visualizzata attraverso la fetta del campione (Figura 3). È stato osservato che le vie spazialmente variabili sono attivate in concordanza con i ruoli funzionali dei geni spazialmente variabili, con la regolazione della plasticità sinaptica e dell'attività dei neurotrasmettitori nella regione ippocampale e la segnalazione dei neuropeptidi nella regione corticale.

Infine, per identificare i geni espressi in modo differenziale tra la regione ippocampale e l'ipotalamo del campione di cervello di topo, è stata utilizzata la scheda Tissue Explorer . I punti associati alle regioni di interesse sono stati selezionati con la guida dell'annotazione dell'immagine (Figura 4A). Dal grafico a dispersione generato, alcuni dei geni differenzialmente espressi identificati erano tra i geni spazialmente variabili (Nrgn, Slc17a7, Ddn), oltre a pochi altri, come Pmch e Ttr. L'espressione di questi geni è stata visualizzata nella fetta del campione. La pmch era specificamente sovraespressa nella regione ipotalamica laterale (Figura 4B; confrontare con l'area selezionata in verde nella Figura 4A). Questo gene codifica per il precursore dell'ormone concentrante la melanina ed è coinvolto nel mantenimento dell'omeostasi energetica¹⁹. Al contrario, il gene Ttr era specificamente espresso nella regione ippocampale (Figura 4C; confrontare con l'area selezionata in rosso nella Figura 4A), in accordo con il suo ruolo funzionale nell'apprendimento e nella memoria spaziale²⁰. Conducendo confronti intra-campione tra diverse regioni del cervello di topo utilizzando questo database, siamo stati in grado di evidenziare le caratteristiche funzionali specifiche della regione in base all'espressione genica spaziale e all'attività del percorso.

Nell'esempio 2, il database è stato utilizzato per l'identificazione delle firme immunitarie associate alle metastasi colorettali nel fegato. Il confronto intra-campione è stato condotto tra la regione tumorale con metastasi colorettali e il tessuto epatico sano distante, attraverso un'appropriata selezione dei punti per i due campioni: DSID001005 (Figura 5A-C) e DSID001007 (Figura 5D-F). I dati sono stati rianalizzati con due repliche per condizione utilizzando R. L'analisi dell'espressione differenziale condotta tra la regione tumorale con metastasi colorettali e il tessuto epatico sano ha rivelato la sottoregolazione di 138 geni e la sovraregolazione di 115 geni, in base ai parametri selezionati (Figura 6A, B). L'analisi della via KEGG ha dimostrato l'arricchimento delle vie dei geni sottoregolati, come il metabolismo dei farmaci e la carcinogenesi chimica (Figura 6C), mentre i geni sovraregolati mostravano firme corrispondenti, tra l'altro, alla migrazione transendoteliale dei leucociti, all'adesione focale e al ciclo cellulare (Figura 6D). Concentrandosi sulla rilevanza della migrazione trans-endoteliale dei leucociti per l'attività immunitaria, sono stati identificati i principali geni rilevati nella categoria e la loro espressione spaziale è stata osservata in DeepSpaceDB. È interessante notare che i geni Cldn7, Cldn4 e Actg1 rilevati nella categoria della migrazione trans-endoteliale dei leucociti, hanno mostrato una sovraregolazione nella regione tumorale (sito Epcam⁺) dei campioni e non nella regione distante con tessuto epatico sano (Figura 7). Ciò ha fornito informazioni sulla natura dell'attività immunitaria guidata nel sito tumorale del fegato, con il reclutamento attivo dei leucociti. In sintesi, l'analisi intra-campione con DeepSpaceDB consente l'estrazione di diverse intuizioni biologiche. Confrontando i dati trascrittomici spaziali attraverso strumenti interattivi e flussi di lavoro di rianalisi, i ricercatori possono generare e convalidare ipotesi riguardanti l'espressione genica tessuto-specifica e l'eterogeneità funzionale.

figure-results-1
Figura 1: Misure di qualità del campione. (A) Numero di geni rilevati, (B) conteggio delle letture e (C) percentuale di letture mitocondriali per punto. (D) Il numero medio di geni rilevati per punto in questo campione, rispetto alla distribuzione di tutti gli altri campioni nel database. (E) Individuare i grappoli sulla fetta di tessuto. Clicca qui per visualizzare una versione più grande di questa figura.

figure-results-2
Figura 2: Espressione dei geni più variabili nello spazio. (a) nrgn, (b) slc17a7, (c) ly6h e (d) ddn. Clicca qui per visualizzare una versione più grande di questa figura.

figure-results-3
Figura 3: Attività delle vie superiori spazialmente variabili. (A) Segnalazione dei neuropeptidi, (B) Regolazione della plasticità sinaptica, (C) Trasporto dei neurotrasmettitori. Clicca qui per visualizzare una versione più grande di questa figura.

figure-results-4
Figura 4: Confronto dei modelli di espressione genica tra due regioni selezionate del cervello del topo. (A) Selezione spot nelle regioni ipotalamiche e ippocampali per confronti intra-campione. La regione 1 selezionata viene visualizzata in rosso e la regione 2 in verde. Modelli di espressione spaziale di geni differenzialmente espressi (B) Pmch e (C) Ttr tra regioni ipotalamiche e ippocampali. Clicca qui per visualizzare una versione più grande di questa figura.

figure-results-5
Figura 5: Proprietà di due campioni metastatici di fegato di topo. Per DSID001005 campione: (A) espressione del marcatore Epcam , (B) cluster spot e (C) regioni selezionate in regioni cancerose e distanti per confronti intra-campione. Per DSID001007 campione: (D) espressione del marcatore Epcam , (E) cluster di punti e (F) regioni selezionate in regioni cancerose e distanti per confronti intra-campione. Per entrambi i campioni, le macchie tumorali si trovano nelle regioni mostrate in rosso e le macchie non tumorali si trovano nelle regioni mostrate in verde. Clicca qui per visualizzare una versione più grande di questa figura.

figure-results-6
Figura 6: Risultati della rianalisi. (A) Riepilogo schematico del flusso di lavoro utilizzato nella rianalisi. (B) Grafico del vulcano che rappresenta i geni differenzialmente espressi tra regioni cancerose e regioni distanti. Arricchimento della via KEGG di (C) geni sovraregolati e (D) geni sottoregolati. Clicca qui per visualizzare una versione più grande di questa figura.

figure-results-7
Figura 7: Espressione spaziale dei geni. (A) Cldn7, (B) Cldn4 e (C) Actg1 in DSID001005 di fetta di tessuto. Espressione spaziale dei geni. (D) Cldn7, (E) Cldn4 e (F) Actg1 in fetta di tessuto DSID001007. Clicca qui per visualizzare una versione più grande di questa figura.

File supplementari 1-4: file di dati e script R per esempio di metastasi epatiche. Clicca qui per scaricare questo file.

Discussion

$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

Qui, abbiamo introdotto due protocolli completi che delineano la navigazione, il recupero e l'analisi dei dati di trascrittomica spaziale in DeepSpaceDB. Mentre la maggior parte dei database di omica spaziale si concentra sulla raccolta di dati da un gran numero di campioni, generati utilizzando varie piattaforme 3,4,5,6, DeepSpaceDB si concentra sullo sviluppo di strumenti interattivi che consentono agli utenti di esplorare in modo approfondito ed efficiente le caratteristiche della trascrittomica spaziale. Per abilitare questo livello di funzionalità, la versione attuale si concentra esclusivamente sulla piattaforma Visium. Con l'emergere di piattaforme ad alta risoluzione, prevediamo di espandere DeepSpaceDB di conseguenza, sviluppando nuove strategie per l'elaborazione e l'integrazione di tali dati in modo user-friendly.

DeepSpaceDB consente agli utenti di valutare le metriche di qualità dei campioni (ad esempio, conta dei geni, profondità di lettura) e di confrontarle tra i set di dati. Il database include annotazioni a più livelli: clustering non supervisionato nell'intero database con etichette assegnate, rilevamento basato su LLM di caratteristiche strutturali e patologiche da immagini istologiche e annotazioni istologiche esperte per un sottoinsieme crescente di campioni. Inoltre, gli utenti possono selezionare in modo interattivo le regioni di interesse all'interno o tra i campioni per confrontare l'espressione genica, consentendo studi sui contrasti spaziali tra regioni come il tumore rispetto allo stroma o le regioni malate rispetto a quelle sane. Tali caratteristiche sono generalmente assenti in altri database 3,4,5,6. Sono disponibili anche altre funzionalità, come geni e percorsi spazialmente variabili, previsioni del tipo di cellula e risultati di clustering. Nel complesso, questo database riduce significativamente le barriere all'esplorazione dei dati di trascrittomica spaziale. I campioni provenienti da un'ampia gamma di tessuti e condizioni sono liberamente accessibili e gli utenti possono navigarli attraverso semplici interazioni point-and-click; Non sono richieste competenze bioinformatiche avanzate. Detto questo, è probabilmente necessaria una certa conoscenza preliminare dei geni marcatori e dell'architettura dei tessuti per l'interpretazione accurata dei modelli di espressione e per la selezione delle regioni di interesse nello strumento Tissue Explorer.

Anche se non viene introdotto qui, gli utenti possono anche caricare i propri campioni e applicare molti degli stessi strumenti per analizzarli. Il database supporta anche confronti tra campioni tra 2 diverse fette di tessuto, consentendo, ad esempio, confronti tra tessuti malati e tessuti sani di controllo. Infine, i dati grezzi ed elaborati, insieme a tutti gli output di analisi derivati, sono disponibili per il download, supportando i flussi di lavoro a valle e le analisi personalizzate. Per molti di questi strumenti, brevi video tutorial sono disponibili nella pagina tutorial del database.

Ci sono ancora aspetti del database che richiedono miglioramenti. Uno è la previsione accurata dei tipi di cellule e delle composizioni dei tipi di cellule in ogni posizione all'interno delle fette di tessuto. Nella versione attuale di DeepSpaceDB (versione 1.0), abbiamo previsto la composizione del tipo di cellula di ogni spot di Visium utilizzando un metodo chiamato decomposizione robusta del tipo di cellula (RCTD)²¹. RCTD ha ottenuto risultati relativamente buoni in un recente studio di benchmark²². Le previsioni fatte da RCTD potrebbero anche essere convalidate sperimentalmente nel nostro recente studio sui fegati di topi portatori di cancro²³. Tuttavia, non è stata condotta una valutazione completa dell'accuratezza delle previsioni del tipo di cellula. Un problema correlato è che l'RCTD e altri metodi di previsione del tipo di cella richiedono un set di dati di riferimento con tipi di cellule annotati. In generale, i tipi di cellule (o le composizioni dei tipi di cellule) in ciascuna posizione spaziale sono previsti attraverso il confronto con i modelli di espressione genica in questo set di dati di riferimento. Tuttavia, la selezione di un riferimento adatto per ogni campione Visium non è sempre semplice. I riferimenti potrebbero mancare di tipi di cellule chiave o, al contrario, potrebbero includere tipi di cellule che non sono presenti nella fetta di tessuto²⁴. Inoltre, all'interno di un tipo di cellula, le cellule possono trovarsi in stati drasticamente diversi, come le cellule immunitarie inattive rispetto a quelle attivate²⁵. Gli stati cellulari presenti nei set di dati di riferimento non corrispondono necessariamente a quelli dei campioni spaziali, che sono spesso ottenuti da modelli di malattia dei pazienti. È probabile che entrambi i problemi portino a previsioni imprecise. Speriamo di affrontare questo problema in futuro.

Poiché il campo della trascrittomica spaziale continua ad evolversi rapidamente, un numero crescente di strumenti computazionali viene sviluppato per analizzare diversi aspetti dei dati spaziali, tra cui le interazioni cellula-cellula, i domini spaziali e la previsione di geni spazialmente variabili (vedi, ad esempio, 26,27,28). Se da un lato questa proliferazione riflette il dinamismo del settore, dall'altro rappresenta una sfida per la cura e l'integrazione degli strumenti in questo database. Per garantire che siano inclusi i metodi più robusti e ampiamente applicabili, vi è un urgente bisogno di studi di benchmark sistematici che valutino le prestazioni degli strumenti attraverso set di dati e attività di analisi 22,29,30. Tali sforzi saranno essenziali per guidare la selezione informata e la definizione delle priorità degli strumenti da includere nel database.

Mentre altri database di trascrittomica spaziale tentano di raccogliere un gran numero di campioni di molte piattaforme diverse, in DeepSpaceDB abbiamo deciso di utilizzare una strategia diversa: concentrarci su poche piattaforme popolari e implementare strumenti interattivi e intuitivi che permettano all'utente di esplorare facilmente i dati in modo più dettagliato. Sebbene il nostro database contenga solo campioni di Visium nella versione corrente 1.0, prevediamo di includere anche campioni di altre piattaforme in un aggiornamento futuro.

Disclosures

$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

Gli autori non hanno nulla da rivelare.

Acknowledgements

$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

Gli autori ringraziano Y. Harada per l'assistenza di segreteria. Questo lavoro è stato sostenuto da JST NBDC (Grant Number JPMJND2303, A.V.) e AMED (Grant Number JP24gm2010003, A.V.) Questo lavoro è stato supportato anche da JSPS KAKENHI (20H03451, 24K02236 e 24KK0147; S.K.), JST FOREST (JPMJFR2062; S.K), JST Moonshot (JPMJMS2011-61; S.K). I finanziatori non hanno avuto alcun ruolo nella progettazione dello studio, nella raccolta e nell'analisi dei dati, nella decisione di pubblicare o nella preparazione del manoscritto.

Materials

List of materials used in this article
Name	Company	Catalog Number	Comments
clusterProfiler		Pacchetto R - versione 4.14.6
DeepSpaceDB		Versione > 1.0	Un link al database: www.deepspacedb.com
limma		Pacchetto R - versione 3.62.2
R		Versione 4.4.2
RStudio	Poni	Versione 2024.12

References

$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

The expanding vistas of spatial transcriptomics. Nat Biotechnol. 41 (6), 773-782 (2023).">Tian, L., Chen, F., Macosko, E. Z. The expanding vistas of spatial transcriptomics. Nat Biotechnol. 41 (6), 773-782 (2023).
Museum of spatial transcriptomics. Nat Methods. 19 (5), 534-546 (2022).">Moses, L., Pachter, L. Museum of spatial transcriptomics. Nat Methods. 19 (5), 534-546 (2022).
SpatialDB: A database for spatially resolved transcriptomes. Nucleic Acids Res. 48 (D1), D233-D237 (2020).">Fan, Z., Chen, R., Chen, X. SpatialDB: A database for spatially resolved transcriptomes. Nucleic Acids Res. 48 (D1), D233-D237 (2020).
SODB facilitates comprehensive exploration of spatial omics data. Nat Methods. 20 (3), 387-399 (2023).">Yuan, Z., et al. SODB facilitates comprehensive exploration of spatial omics data. Nat Methods. 20 (3), 387-399 (2023).
STOmicsDB: A comprehensive database for spatial transcriptomics data sharing, analysis and visualization. Nucleic Acids Res. 52 (D1), 1053-1061 (2024).">Xu, Z., et al. STOmicsDB: A comprehensive database for spatial transcriptomics data sharing, analysis and visualization. Nucleic Acids Res. 52 (D1), 1053-1061 (2024).
SOAR elucidates biological insights and empowers drug discovery through spatial transcriptomics. Sci Adv. 11 (24), 7450(2025).">Li, Y., et al. SOAR elucidates biological insights and empowers drug discovery through spatial transcriptomics. Sci Adv. 11 (24), 7450(2025).
DeepSpaceDB: A spatial transcriptomics atlas for interactive in-depth analysis of tissues and tissue microenvironments. bioRxiv. , (2025).">Honcharuk, V., et al. DeepSpaceDB: A spatial transcriptomics atlas for interactive in-depth analysis of tissues and tissue microenvironments. bioRxiv. , (2025).
arXiv. , OpenAI. http://arxiv.org/abs/2303.08774 (2023).">GPT-4 technical report. arXiv. , OpenAI. http://arxiv.org/abs/2303.08774 (2023).
A clustering-independent method for finding differentially expressed genes in single-cell transcriptome data. Nat Commun. 11 (1), 1-10 (2020).">Vandenbon, A., Diez, D. A clustering-independent method for finding differentially expressed genes in single-cell transcriptome data. Nat Commun. 11 (1), 1-10 (2020).
A universal tool for predicting differentially active features in single-cell and spatial genomics data. Sci Rep. 13 (1), 1-14 (2023).">Vandenbon, A., Diez, D. A universal tool for predicting differentially active features in single-cell and spatial genomics data. Sci Rep. 13 (1), 1-14 (2023).
Dictionary learning for integrative, multimodal, and scalable single-cell analysis. Nat Biotechnol. 42 (2), 293-304 (2024).">Hao, Y., et al. Dictionary learning for integrative, multimodal, and scalable single-cell analysis. Nat Biotechnol. 42 (2), 293-304 (2024).
Limma powers differential expression analyses for RNA-sequencing and microarray studies. Nucleic Acids Res. 43 (7), e47(2015).">Ritchie, M. E., et al. Limma powers differential expression analyses for RNA-sequencing and microarray studies. Nucleic Acids Res. 43 (7), e47(2015).
ClusterProfiler: An R package for comparing biological themes among gene clusters. OMICS. 16 (5), 284-287 (2012).">Yu, G., Wang, L. G., Han, Y., He, Q. Y. ClusterProfiler: An R package for comparing biological themes among gene clusters. OMICS. 16 (5), 284-287 (2012).
KEGG for taxonomy-based analysis of pathways and genomes. Nucleic Acids Res. 51 (D1), D587-D592 (2023).">Kanehisa, M., et al. KEGG for taxonomy-based analysis of pathways and genomes. Nucleic Acids Res. 51 (D1), D587-D592 (2023).
Association between NRGN gene polymorphism and resting-state hippocampal functional connectivity in schizophrenia. BMC Psychiatry. 19 (1), 108(2019).">Zhang, Y., et al. Association between NRGN gene polymorphism and resting-state hippocampal functional connectivity in schizophrenia. BMC Psychiatry. 19 (1), 108(2019).
Glutamate, aspartate and nucleotide transporters in the SLC17 family form four main phylogenetic clusters: evolution and tissue expression. BMC Genomics. 11, 17(2010).">Sreedharan, S., et al. Glutamate, aspartate and nucleotide transporters in the SLC17 family form four main phylogenetic clusters: evolution and tissue expression. BMC Genomics. 11, 17(2010).
Sequencing of hippocampal and cerebellar transcriptomes provides new insights into the complexity of gene regulation in the human brain. Neurosci Lett. 541, 263-268 (2013).">Twine, N. A., Janitz, C., Wilkins, M. R., Janitz, M. Sequencing of hippocampal and cerebellar transcriptomes provides new insights into the complexity of gene regulation in the human brain. Neurosci Lett. 541, 263-268 (2013).
Expression of the Ly-6 family proteins Lynx1 and Ly6H in the rat brain is compartmentalized, cell-type specific, and developmentally regulated. Brain Struct Funct. 219 (6), 1923-1934 (2014).">Thomsen, M. S., et al. Expression of the Ly-6 family proteins Lynx1 and Ly6H in the rat brain is compartmentalized, cell-type specific, and developmentally regulated. Brain Struct Funct. 219 (6), 1923-1934 (2014).
The role of melanin concentrating hormone (MCH) in the central chemoreflex: A knockdown study by siRNA in the lateral hypothalamus in rats. PLoS ONE. 9 (8), e103585(2014).">Li, N., Nattie, E., Li, A. The role of melanin concentrating hormone (MCH) in the central chemoreflex: A knockdown study by siRNA in the lateral hypothalamus in rats. PLoS ONE. 9 (8), e103585(2014).
Transthyretin-a key gene involved in regulating learning and memory in brain, and providing neuroprotection in Alzheimer disease via neuronal synthesis of transthyretin protein. J. Behav. Brain Sci. 8 (2), 77-92 (2018).">Iqbal, J. Transthyretin-a key gene involved in regulating learning and memory in brain, and providing neuroprotection in Alzheimer disease via neuronal synthesis of transthyretin protein. J. Behav. Brain Sci. 8 (2), 77-92 (2018).
Robust decomposition of cell type mixtures in spatial transcriptomics. Nat Biotechnol. 40 (4), 517-526 (2021).">Cable, D. M., et al. Robust decomposition of cell type mixtures in spatial transcriptomics. Nat Biotechnol. 40 (4), 517-526 (2021).
Benchmarking spatial and single-cell transcriptomics integration methods for transcript distribution prediction and cell type deconvolution. Nat Methods. 19 (6), 662-670 (2022).">Li, B., et al. Benchmarking spatial and single-cell transcriptomics integration methods for transcript distribution prediction and cell type deconvolution. Nat Methods. 19 (6), 662-670 (2022).
Murine breast cancers disorganize the liver transcriptome in a zonated manner. Commun Biol. 6 (1), 1-12 (2023).">Vandenbon, A., et al. Murine breast cancers disorganize the liver transcriptome in a zonated manner. Commun Biol. 6 (1), 1-12 (2023).
Missing cell types in single-cell references impact deconvolution of bulk data but are detectable. Genome Biol. 26 (1), 86(2025).">Ivich, A., et al. Missing cell types in single-cell references impact deconvolution of bulk data but are detectable. Genome Biol. 26 (1), 86(2025).
A periodic table of cell types. Development. 146 (12), dev169854(2019).">Xia, B., Yanai, I. A periodic table of cell types. Development. 146 (12), dev169854(2019).
Deciphering spatial domains from spatially resolved transcriptomics with an adaptive graph attention auto-encoder. Nat Commun. 13 (1), 1739(2022).">Dong, K., Zhang, S. Deciphering spatial domains from spatially resolved transcriptomics with an adaptive graph attention auto-encoder. Nat Commun. 13 (1), 1739(2022).
Mapping cellular interactions from spatially resolved transcriptomics data. Nat Methods. 21, 1830-1842 (2024).">Zhu, J., et al. Mapping cellular interactions from spatially resolved transcriptomics data. Nat Methods. 21, 1830-1842 (2024).
Giotto: A toolbox for integrative analysis and visualization of spatial expression data. Genome Biol. 22 (1), 1-31 (2021).">Dries, R., et al. Giotto: A toolbox for integrative analysis and visualization of spatial expression data. Genome Biol. 22 (1), 1-31 (2021).
Benchmarking spatial clustering methods with spatially resolved transcriptomics data. Nat Methods. 21 (4), 712-722 (2024).">Yuan, Z., et al. Benchmarking spatial clustering methods with spatially resolved transcriptomics data. Nat Methods. 21 (4), 712-722 (2024).
Benchmarking algorithms for spatially variable gene identification in spatial transcriptomics. Bioinformatics. 41 (4), btaf131(2025).">Chen, X., et al. Benchmarking algorithms for spatially variable gene identification in spatial transcriptomics. Bioinformatics. 41 (4), btaf131(2025).

Reprints and Permissions

Request permission to reuse the text or figures of this JoVE article

Request Permission

Estrazione di set di dati di trascrittomica spaziale utilizzando DeepSpaceDB

In This Article

Summary

Abstract

Introduction

Protocol

Results

Discussion

Disclosures

Acknowledgements

Materials

References

Reprints and Permissions

Tags

Related Articles