September 5th, 2025
Cet article présente un protocole d’utilisation de DeepSpaceDB, une base de données dynamique et interactive pour la transcriptomique spatiale, proposant des flux de travail d’analyse et des exemples pour explorer l’organisation des tissus et l’expression des gènes liés à la maladie.
Nous sommes en train de créer une base de données de transcriptomique spatiale appelée DeepSpaceDB. L’appel est de rendre les données de transcriptomique spatiale plus facilement accessibles aux biologistes et aux bioinformaticiens. Plusieurs plateformes de transcriptomique spatiale ont été développées.
Ils permettent aux chercheurs d’étudier les modèles d’expression génique dans les coupes de tissus. Mais cette technologie est coûteuse et l’analyse des données nécessite des compétences en bioinformatique de haut niveau. Nous avons utilisé le rythme et la plate-forme spatiale Xenium, la recherche Our Cancer CEX.
Cette plateforme nous permet de décider de la tumeur, de l’enflure et même du tissu hôte distant dans le même contexte organique. Cela peut nous aider à résoudre les changements dans l’expression et le calcul cellulaire dans chaque compartiment séparément. L’un des principaux défis pour les biologistes est d’analyser les données.
Il y a donc beaucoup de chercheurs qui n’ont pas les compétences nécessaires en programmation et en calcul pour être en mesure d’interpréter pleinement un nombre de plus en plus grand d’ensembles de données de transcriptomique spatiale qui deviennent maintenant disponibles. En rendant les ensembles de données de transcriptomique spatiale plus facilement accessibles, la base de données permet aux utilisateurs de générer de nouvelles hypothèses, en explorant les mécanismes sous-jacents à différentes maladies. Ainsi, par exemple, nous pouvons évaluer les modèles d’expression génique spatiale associés au microenvironnement tumoral.
Pour commencer, cliquez sur l’onglet de la base de données et sélectionnez l’organisme comme souris, l’organe comme cerveau et la source comme Zenodo. Faites défiler les échantillons résultants et sélectionnez l’échantillon étiqueté DSID001557. Cliquez ensuite sur l’échantillon sélectionné et confirmez que la description indique 2 millions de cellules dans une cellule NK saline de 100 microlitres.
Cliquez sur l’onglet qualité pour évaluer la qualité de l’échantillon. Dans le menu déroulant des mesures de qualité, sélectionnez des options telles que les gènes détectés, le nombre de lectures et mito pour afficher les distributions de paramètres respectives dans la tranche d’échantillon. Maintenant, accédez à l’onglet d’annotation d’image pour identifier les différentes régions de la tranche d’échantillon.
Déplacez le curseur de la souris sur la tranche d’échantillon pour afficher les annotations. Affichez les annotations basées sur une grille générées par un grand modèle de langage qui montrent les caractéristiques anatomiques et les conditions associées. Accédez ensuite à l’onglet Clusters pour examiner les clusters de type cellule dans la tranche d’échantillon.
Visualisez l’incorporation bidimensionnelle des grappes et la représentation codée par couleur correspondante à tous les points de la tranche d’échantillon. Ensuite, accédez à l’onglet gènes pour examiner les gènes spatialement variables de l’échantillon. Cliquez sur certains des principaux gènes de la liste pour générer des graphiques spatiaux de leur expression à travers la tranche de tissu.
Observez les modèles d’expression codés par couleur, qui montrent clairement des distributions spatiales distinctes pour les gènes les mieux notés. Accédez ensuite à l’onglet Voies pour examiner l’activité des ensembles de gènes associés à des voies biologiques communes. Consultez la liste des voies spatialement variables avec l’activité des voies estimée en fonction des niveaux d’expression des gènes apparentés.
Cliquez sur certaines des principales voies de la liste pour générer des graphiques spatiaux de leur activité sur la tranche de tissu. Observez les modèles codés en couleur de l’activité des voies dans différentes régions tissulaires. Maintenant, allez dans l’onglet de l’explorateur de tissus, qui permet aux utilisateurs de sélectionner librement les régions d’intérêt et de comparer les modèles d’expression génique entre elles.
Assurez-vous que la sélection manuelle est activée. À l’aide du curseur de la souris, sélectionnez les points de la région de l’hippocampe sur le côté gauche de la tranche de cerveau de la souris. Cliquez sur le premier ensemble, puis sur l’ajouter à l’ensemble pour mettre en surbrillance les endroits sélectionnés dans le panneau de droite.
Cliquez ensuite sur l’ensemble deux et utilisez le curseur de la souris pour sélectionner les points dans la région hypothalamique de la tranche de cerveau. Cliquez sur ajouter à l’ensemble pour mettre en évidence ces endroits sélectionnés sur le côté droit. Après avoir terminé la sélection des points, cliquez sur le bouton Comparer l’expression des gènes.
Cela génère un tableau, affichant les valeurs moyennes d’expression génique pour chaque région sélectionnée ainsi qu’une représentation de nuage de points. Déplacez le curseur sur des points individuels sur le nuage de points pour confirmer les noms des gènes et les valeurs d’expression moyennes dans les deux régions. D’après les résultats de la comparaison, identifier les gènes exprimés de manière différentielle.
Revenez à l’onglet gènes et visualisez l’expression de ces gènes à travers la tranche de tissu. Cliquez sur l’onglet de la base de données et utilisez le filtre pour sélectionner l’organisme comme souris, l’organe comme le foie et la maladie comme cancer. Dans la liste d’exemples qui s’affiche, sélectionnez DSID001005 exemple.
Cliquez sur l’échantillon sélectionné et confirmez que la description indique que l’échantillon provient d’un foie de souris, contenant des métastases d’origine cancer colorectal. Accédez ensuite à l’onglet Explorateur de tissus et activez le mode de sélection manuelle. À l’aide du curseur de la souris, sélectionnez les points correspondant à la région tumorale identifiée par l’expression positive du marqueur EpCAM dans l’échantillon DSID001005.
Cliquez sur le premier ensemble. Sélectionnez ensuite ajouter à l’ensemble pour mettre en surbrillance les taches tumorales sélectionnées sur le côté droit. Maintenant, cliquez sur l’ensemble deux et utilisez le curseur pour sélectionner les points dans la région non tumorale éloignée de l’échantillon de foie.
Cliquez sur ajouter à l’ensemble pour mettre en évidence les points non tumoraux sélectionnés sur le côté droit de l’écran. Pour effectuer une analyse plus approfondie des données d’expression génique, cliquez sur l’option de téléchargement CSV, générant un fichier de valeurs séparées par des virgules des données d’expression génique pour les deux régions de l’échantillon. Après avoir répété les étapes de navigation dans la base de données pour DSID001007, confirmez que la description indique qu’il s’agit d’une autre tranche du foie d’une souris contenant des métastases d’origine du cancer colorectal.
Ensuite, confirmez que deux fichiers CSV ont été générés, un à partir d’échantillons DSID001005 et un DSID001007, contenant deux colonnes représentant l’expression génique moyenne dans les régions tumorales et non tumorales. Chargez les deux fichiers CSV dans l’environnement de programmation R. Fusionnez les ensembles de données pour effectuer une analyse en aval à l’aide de deux réplicats par condition.
Dans R, utilisez le package limma pour effectuer une analyse différentielle de l’expression génique sur l’ensemble de données de fusion. Attribuez les régions des métastases colorectales des deux échantillons au groupe cancer et les régions saines éloignées au groupe témoin. Filtrez les résultats pour identifier les gènes régulés à la hausse avec un changement de pliage logarithmique supérieur à 0,5 et une valeur P ajustée inférieure à 0,05.
De même, extrayez les gènes régulés à la baisse avec une variation de pliage logarithmique inférieure à moins 0,5 et une valeur P ajustée inférieure à 0,05. Une région distincte de faible qualité a été observée sur le côté gauche de l’échantillon de cerveau de souris, caractérisée par un nombre réduit de gènes détectés et un nombre de lectures plus faible. L’échantillon a montré une moyenne d’environ 4 000 gènes détectés par point, ce qui correspond bien à la distribution des autres échantillons de la base de données.
15 grappes spatiales ont été identifiées dans l’échantillon de cerveau de souris avec des limites distinctes représentant des différences anatomiques. Les gènes NRGN, SLC17A7 et DDN ont montré une forte expression dans la région de l’hippocampe. En revanche, l’expression de LY6H était localisée dans les régions corticales, en particulier les bords extérieurs inférieurs gauche et droit de la tranche.
L’activité de signalisation des neuropeptides a été considérablement augmentée dans les régions corticales inférieures de la tranche d’échantillon. La régulation de la plasticité synaptique a été activée dans toute la région de l’hippocampe, en particulier dans les zones moyennes supérieures. L’activité de transport des neurotransmetteurs était élevée dans les sections médiane et supérieure droite de l’hippocampe.
Les gènes CLDN7, CLDN4 et ACTG1 ont montré une régulation positive claire au niveau de la région tumorale avec métastases colorectales dans l’échantillon de foie DSID 001005. En revanche, l’expression de CLDN7, CLDN4 et ACTG1 était nettement plus faible dans le tissu hépatique sain éloigné de l’échantillon DSID001007.
Cet article décrit DeepSpaceDB, une base de données interactive conçue pour améliorer l'accessibilité aux données de transcriptomique spatiale. Elle fournit des flux de travail d'analyse permettant aux chercheurs d'étudier l'organisation tissulaire et l'expression des gènes liée à diverses maladies.