September 5th, 2025
In diesem Artikel wird ein Protokoll für die Verwendung von DeepSpaceDB vorgestellt, einer dynamischen, interaktiven Datenbank für die räumliche Transkriptomik, die Analyse-Workflows und Beispiele zur Untersuchung der Gewebeorganisation und krankheitsbezogenen Genexpression bietet.
Wir erstellen eine räumliche Transkriptomik-Datenbank namens DeepSpaceDB. Ziel ist es, räumliche Transkriptomik-Daten für Biologen und Bioinformatiker leichter zugänglich zu machen. Es wurden mehrere Plattformen für räumliche Transkriptomik entwickelt.
Sie ermöglichen es Forschern, Genexpressionsmuster in Gewebeschnitten zu untersuchen. Aber diese Technologie ist teuer und die Datenanalyse erfordert ein hohes Maß an Bioinformatikkenntnissen. Wir haben den Rhythmus und die Xenium-Raumplattform verwendet, die Our Cancer CEX Research.
Diese Plattform ermöglicht es uns, Tumor, Schwellung und sogar das entfernte Wirtsgewebe innerhalb desselben Organkontextes zu bestimmen. Es kann uns helfen, die Veränderungen in der Expression und der zellulären Berechnung in jedem Kompartiment separat aufzulösen. Eine der größten Herausforderungen für Biologen ist die Datenanalyse.
Es gibt also viele Forscher, denen die notwendigen Programmier- und Rechenfähigkeiten fehlen, um eine immer größere Anzahl von räumlichen Transkriptomik-Datensätzen, die jetzt verfügbar werden, vollständig interpretieren zu können. Durch den leichteren Zugang zu räumlichen Transkriptomik-Datensätzen ermöglicht die Datenbank den Nutzern, neue Hypothesen zu generieren und die zugrunde liegenden Mechanismen hinter verschiedenen Krankheiten zu erforschen. So können wir zum Beispiel die räumlichen Genexpressionsmuster bewerten, die mit der Mikroumgebung des Tumors verbunden sind.
Um zu beginnen, klicken Sie auf die Registerkarte Datenbank und wählen Sie den Organismus als Maus, das Organ als Gehirn und die Quelle als Zenodo aus. Scrollen Sie durch die resultierenden Beispiele, und wählen Sie das Beispiel mit der Bezeichnung DSID001557 aus. Klicken Sie dann auf die ausgewählte Probe und bestätigen Sie, dass die Beschreibung 2 Millionen Zellen in 100 Mikrolitern Kochsalzlösung NK-Zelle anzeigt.
Klicken Sie auf die Registerkarte Qualität, um die Probenqualität zu bewerten. Wählen Sie im Dropdown-Menü für Qualitätsmaßnahmen Optionen wie erkannte Gene, Leseanzahl und mito aus, um die jeweiligen Parameterverteilungen über die Probenscheibe anzuzeigen. Navigieren Sie nun zur Registerkarte Bildanmerkung, um verschiedene Bereiche im Beispiel-Slice zu identifizieren.
Bewegen Sie den Mauszeiger über das Beispiel-Slice, um Anmerkungen anzuzeigen. Zeigen Sie die gitterbasierten Anmerkungen an, die von einem großen Sprachmodell generiert wurden und anatomische Merkmale und zugehörige Bedingungen anzeigen. Navigieren Sie dann zur Registerkarte Cluster, um die Zellentyp-Cluster im Beispielsegment zu untersuchen.
Zeigen Sie die zweidimensionale Einbettung der Cluster und die entsprechende farbcodierte Darstellung über die Punkte auf der Probenscheibe an. Navigieren Sie als Nächstes zur Registerkarte Gene, um die räumlich variablen Gene in der Stichprobe zu untersuchen. Klicken Sie auf einige der Top-Gene in der Liste, um räumliche Diagramme ihrer Expression über den Gewebeschnitt zu erstellen.
Beobachten Sie die farbcodierten Expressionsmuster, die deutlich unterschiedliche räumliche Verteilungen für die Gene mit der höchsten Punktzahl zeigen. Navigieren Sie dann zur Registerkarte "Signalwege", um die Aktivität von Gensätzen zu untersuchen, die mit gängigen biologischen Signalwegen verbunden sind. Sehen Sie sich die Liste der räumlich variablen Signalwege an, deren Signalwegaktivität auf der Grundlage der Expressionsniveaus verwandter Gene geschätzt wird.
Klicken Sie auf einige der oberen Pfade in der Liste, um räumliche Diagramme ihrer Aktivität über den Gewebeschnitt zu erstellen. Beobachten Sie die farbcodierten Muster der Signalwegaktivität in verschiedenen Geweberegionen. Gehen Sie nun zur Registerkarte Tissue Explorer, auf der Benutzer interessante Regionen frei auswählen und Genexpressionsmuster zwischen ihnen vergleichen können.
Stellen Sie sicher, dass die manuelle Auswahl aktiviert ist. Wählen Sie mit dem Mauszeiger die Punkte in der Hippocampusregion auf der linken Seite des Maushirnschnitts aus. Klicken Sie auf Set eins und dann auf Set hinzufügen, um die ausgewählten Stellen auf der rechten Seite hervorzuheben.
Klicken Sie dann auf Set zwei und wählen Sie mit dem Mauszeiger die Punkte in der hypothalamischen Region des Hirnschnitts aus. Klicken Sie auf Hinzufügen, um diese ausgewählten Punkte auf der rechten Seite hervorzuheben. Nachdem Sie die Spot-Auswahl abgeschlossen haben, klicken Sie auf die Schaltfläche Genexpression vergleichen.
Dadurch wird eine Tabelle generiert, in der die durchschnittlichen Genexpressionswerte für jede ausgewählte Region zusammen mit einer Streudiagrammdarstellung angezeigt werden. Bewegen Sie den Mauszeiger über einzelne Punkte im Streudiagramm, um die Gennamen und die durchschnittlichen Expressionswerte in beiden Regionen zu bestätigen. Identifizieren Sie auf der Grundlage der Vergleichsergebnisse differentiell exprimierte Gene.
Navigieren Sie zurück zur Registerkarte Gene und visualisieren Sie die Expression dieser Gene auf dem Gewebeschnitt. Klicken Sie auf die Registerkarte Datenbank und wählen Sie über den Filter den Organismus als Maus, das Organ als Leber und die Erkrankung als Krebs aus. Wählen Sie in der resultierenden Beispielliste Beispiel-DSID001005 aus.
Klicken Sie auf die ausgewählte Probe und bestätigen Sie, dass die Beschreibung darauf hinweist, dass es sich um eine Mausleber handelt, die Metastasen Darmkrebs enthält. Navigieren Sie dann zum Tab Tissue Explorer und aktivieren Sie den manuellen Auswahlmodus. Wählen Sie mit dem Mauszeiger die Spots aus, die der Tumorregion entsprechen, die durch positive Expression des EpCAM-Markers in der Probe DSID001005 identifiziert wurde.
Klicken Sie auf Set eins. Wählen Sie dann Hinzufügen zum Festlegen, um die ausgewählten Tumorflecken auf der rechten Seite hervorzuheben. Klicken Sie nun auf Set zwei und wählen Sie mit dem Cursor die Flecken in der entfernten Nicht-Tumorregion der Leberprobe aus.
Klicken Sie auf Hinzufügen, um die ausgewählten Nicht-Tumorpunkte auf der rechten Seite des Displays hervorzuheben. Um eine weitere Analyse der Genexpressionsdaten durchzuführen, klicken Sie auf die Option CSV herunterladen und generieren Sie eine Datei mit kommagetrennten Werten der Genexpressionsdaten für die beiden Regionen der Probe. Nachdem Sie die Navigationsschritte der Datenbank für DSID001007 wiederholt haben, vergewissern Sie sich, dass es sich in der Beschreibung um einen weiteren Schnitt aus einer Mausleber handelt, der Metastasen Darmkrebs enthält.
Vergewissern Sie sich anschließend, dass zwei CSV-Dateien generiert wurden, jeweils eine aus Proben DSID001005 und DSID001007, die zwei Spalten enthalten, die die durchschnittliche Genexpression in Tumor- und Nicht-Tumorregionen darstellen. Laden Sie beide CSV-Dateien in die R-Programmierumgebung. Führen Sie die Datensätze zusammen, um eine Downstream-Analyse mit zwei Replikaten pro Bedingung durchzuführen.
Verwenden Sie in R das limma-Paket, um eine differentielle Genexpressionsanalyse für das Mergedataset durchzuführen. Ordnen Sie die kolorektalen Metastasenregionen aus beiden Proben der Krebsgruppe und die entfernten gesunden Regionen der Kontrollgruppe zu. Filtern Sie die Ergebnisse, um hochregulierte Gene mit einer logarithmischen Faltungsänderung von mehr als 0,5 und einem angepassten P-Wert von weniger als 0,05 zu identifizieren.
In ähnlicher Weise extrahieren Sie herunterregulierte Gene mit einer logarithmischen Faltungsänderung von weniger als minus 0,5 und einem angepassten P-Wert von weniger als 0,05. Auf der linken Seite der Maushirnprobe wurde eine ausgeprägte Region von geringer Qualität beobachtet, die durch eine reduzierte Anzahl detektierter Gene und eine niedrigere Lesezahl gekennzeichnet war. Die Probe zeigte einen Durchschnitt von etwa 4.000 Genen, die pro Spot nachgewiesen wurden, was gut mit der Verteilung anderer Proben in der Datenbank übereinstimmt.
In der Maushirnprobe wurden 15 räumliche Cluster mit deutlichen Grenzen identifiziert, die anatomische Unterschiede darstellen. Die Gene NRGN, SLC17A7 und DDN zeigten eine starke Expression im Hippocampus. Im Gegensatz dazu war die LY6H-Expression in den kortikalen Regionen lokalisiert, insbesondere an den unteren linken und rechten Außenrändern des Schnitts.
Die Aktivität der Neuropeptid-Signalgebung war in den unteren kortikalen Regionen des Probenschnitts deutlich erhöht. Die Regulation der synaptischen Plastizität wurde in der gesamten Hippocampusregion aktiviert, insbesondere in den oberen mittleren Zonen. Die Aktivität des Neurotransmittertransports war im mittleren und oberen rechten Abschnitt des Hippocampus erhöht.
Die Gene CLDN7, CLDN4 und ACTG1 zeigten eine deutliche Hochregulation in der Tumorregion mit kolorektaler Metastasierung in der Leberprobe DSID 001005. Im Gegensatz dazu war die Expression von CLDN7, CLDN4 und ACTG1 im entfernten gesunden Lebergewebe der Probe DSID001007 deutlich geringer.
Dieser Artikel beschreibt DeepSpaceDB, eine interaktive Datenbank, die entwickelt wurde, um den Zugang zu räumlichen Transkriptomik-Daten zu verbessern. Sie bietet Analyse-Workflows für Forscher, um die Gewebeorganisation und die Genexpression im Zusammenhang mit verschiedenen Krankheiten zu untersuchen.