RESEARCH
Peer reviewed scientific video journal
Video encyclopedia of advanced research methods
Visualizing science through experiment videos
EDUCATION
Video textbooks for undergraduate courses
Visual demonstrations of key scientific experiments
BUSINESS
Video textbooks for business education
OTHERS
Interactive video based quizzes for formative assessments
Products
RESEARCH
JoVE Journal
Peer reviewed scientific video journal
JoVE Encyclopedia of Experiments
Video encyclopedia of advanced research methods
EDUCATION
JoVE Core
Video textbooks for undergraduates
JoVE Science Education
Visual demonstrations of key scientific experiments
JoVE Lab Manual
Videos of experiments for undergraduate lab courses
BUSINESS
JoVE Business
Video textbooks for business education
Solutions
Language
French
Menu
Menu
Menu
Menu
DOI: 10.3791/67266-v
Please note that some of the translations on this page are AI generated. Click here for the English version.
Ici, nous présentons un flux de travail visuel étape par étape pour l’analyse d’un ensemble de données transcriptomiques de cicatrisation de la peau de souris à l’aide de R. Le protocole comprend un pipeline standard pour le téléchargement d’ensembles de données, le contrôle qualité, les visualisations et les annotations de type de cellule à l’aide de Seurat, ainsi que l’analyse de l’interaction cellule-cellule à l’aide de CellChat.
Dans notre laboratoire, nous utilisons des outils émergents tels que la transcriptomique unicellulaire et spatiale avec des approches de biologie des systèmes et de bioinformatique pour étudier la dynamique cellulaire spatio-temporelle des résultats de guérison différentiels. Au cours des dernières années, nous avons assisté à une adoption rapide de la transcriptomique unicellulaire pour l’étude de la cicatrisation des plaies chez l’homme et chez les organismes modèles, tels que les souris. L’analyse complète d’ensembles de données unicellulaires est prohibitive pour les scientifiques de laboratoire ayant peu ou pas d’expérience en bio-informatique. Cela signifie que trop souvent, les ensembles de données unicellulaires sont sous-utilisés par les scientifiques dans le domaine de la cicatrisation des plaies. Il s’agit du premier protocole complet qui ne suppose aucune expérience préalable en bioinformatique, qui emmène l’utilisateur tout au long du processus, du téléchargement de l’ensemble de données à la sortie d’analyses pertinentes dans le contexte de la recherche sur la cicatrisation des plaies. Notre protocole devrait servir de modèle aux chercheurs en cicatrisation des plaies pour analyser plus en profondeur leurs propres ensembles de données unicellulaires et être en mesure d’extraire de nouvelles informations à partir d’ensembles de données accessibles au public.
[Shalyn] Pour commencer, accédez aux fichiers de l’ensemble de données à partir du référentiel omnibus d’expression génique à l’aide du numéro d’acquisition GSE204777. Cliquez sur le premier ensemble de données intitulé GSM6190913. Faites défiler la page jusqu’au bas de la page GSM6190913 et téléchargez les trois fichiers répertoriés à l’aide des liens FTP ou HTML. À l’aide de l’explorateur de fichiers de l’ordinateur, déplacez les fichiers téléchargés dans un répertoire nommé b1, en vous assurant qu’ils se trouvent dans le répertoire de travail. Récupérez les informations de chemin d’accès au répertoire pour les fichiers de séquençage à cellule unique qui ont été téléchargés. Maintenant, chargez les fichiers de séquençage à cellule unique dans l’environnement de travail. Ensuite, séparez les données d’expression génique et de multiplexage HTO de l’ensemble de données de travail. Créez un objet Seurat à l’aide des données d’expression génique tout en filtrant les gènes détectés dans moins de cinq cellules et les cellules de moins de 200 gènes. Pour les ensembles de données sans données HTO, créez l’objet Seurat avec les mêmes paramètres de filtrage et passez au test d’expression génique. Calculez le pourcentage de gènes mitochondriaux dans chaque cellule et attribuez cette valeur en tant que variable de métadonnées. Visualisez la distribution du nombre de gènes, de l’ARN total et du pourcentage de gènes mitochondriaux dans toutes les cellules. Supprimez les cellules dont le contenu mitochondrial dépasse 25 % à l’aide d’un seuil et visualisez les distributions mises à jour après avoir filtré ces cellules de mauvaise qualité. Détectez les doublets probables à l’aide de la méthode de recherche de doublets SC. Exécutez le pipeline de recherche de doublet SC à l’aide des commandes et attribuez les scores de doublet résultants en tant que nouvelle variable de métadonnées. Maintenant, visualisez la distribution des scores des doublets dans toutes les cellules. Supprimez toutes les cellules dont les scores de doublet sont supérieurs à 0,25 et enregistrez l’objet Seurat nettoyé en tant que fichier RDS dans le répertoire de travail. Effectuez la normalisation des données, la mise à l’échelle et l’analyse des composants principaux. Visualisez la contribution de la variance entre les 50 premières composantes principales. Regroupez les cellules à l’aide des 13 premiers composants principaux et d’une résolution de clustering de 0,1. Effectuez une approximation et une projection uniformes de la variété, ou une réduction UMAP dans l’analyse de voisinage, à l’aide des 13 premiers composants principaux et définissez le nombre de valeurs initiales sur 123. Maintenant, visualisez le regroupement de cellules sur un graphique UMAP, suivi des annotations de temps et d’espace sur un graphique AMAP. Ensuite, générez une table associant des groupes de cellules avec des annotations de temps et d’espace de blessure. Déterminez les identités des principaux types de cellules après avoir calculé les gènes exprimés différentiellement entre tous les groupes et attribuez les listes DEG résultantes à une variable avant de les enregistrer sous forme de fichier texte délimité dans le répertoire de travail. Maintenant, ouvrez le fichier de marqueurs de cluster de jeux de données dans une application de tableur. Utilisez l’Assistant Importation de texte pour définir la virgule comme délimiteur et formater les colonnes de nom de gène comme texte afin d’empêcher la conversion automatique des noms de gène en dates. Dans une feuille de calcul, classez la colonne FC log two moyenne de la plus grande à la plus petite pour ordonner les lignes en décroissant les valeurs de variation du log double, puis de la colonne cluster de la plus petite à la plus grande. Pour classer les lignes en fonction du nombre croissant de clusters Serat, filtrez la colonne FC log two moyenne pour n’inclure que les valeurs supérieures ou égales à 2,5, puis filtrez la colonne PCT 1 pour inclure les valeurs supérieures ou égales à 0,4. Ensuite, filtrez la colonne PCT 2 pour inclure les valeurs inférieures ou égales à 0,2. Enfin, filtrez la colonne Valeur P ajustée pour inclure les valeurs inférieures ou égales à 0,01. Ouvrez maintenant l’outil d’analyse d’enrichissement basé sur le Web Enichr. Pour chaque cluster, copiez la liste des gènes exprimés de manière différentielle dans une fenêtre Enrichr distincte et cliquez sur Analyser. Ensuite, cliquez sur l’onglet Types de cellules au-dessus de la sortie de l’analyse et concentrez-vous sur les cinq principaux enrichissements dans les trois bases de données de marqueurs de cellules organisées. En fonction des enrichissements les plus élevés de l’analyse d’Enrichr, attribuez des identités probables aux huit grappes. Combinez les groupes deux et six en une seule annotation appelée fibroblastes, et attribuez ces annotations en tant que nouvelle variable de métadonnées nommée types de cellules. Ensuite, visualisez les types de cellules annotés sur un graphique UMAP et affichez la localisation des gènes marqueurs de cluster supérieurs en gras sur une série de graphiques UMAP. Visualisez les gènes marqueurs de cluster supérieurs exprimés de manière différentielle sur un graphique à points regroupés par numéros de cluster d’origine, puis les gènes marqueurs supérieurs à nouveau dans un graphique à points, cette fois regroupés par types de cellules annotés. Pour préparer l’analyse de séries chronologiques, supprimez les annotations spatiales et simplifiez le jeu de données. Réattribuez les métadonnées de temps et d’espace de la blessure dans une nouvelle variable appelée DPW pour Days Post Wounding. Visualisez les nouveaux regroupements de parcours temporels DPW sur un graphique UMAP et générez des tableaux indiquant le nombre de cellules de chaque type au sein de chaque groupe DPW. Ensuite, convertissez le nombre de cellules en proportions pour évaluer les changements relatifs dans la composition du type de cellule pendant la guérison et visualisez la proportion de chaque catégorie DPW dans chaque type de cellule. Enfin, visualisez la proportion de chaque type de cellule dans chaque groupe DPW et enregistrez l’objet Seurat final contenant toutes les annotations et filtres sous forme de fichier RDS dans le répertoire de travail. Toutes les cellules de l’ensemble de données ont été regroupées distinctement en principaux types de cellules codés par couleur sur le graphique UMAP, confirmant ainsi l’annotation réussie basée sur des signatures de type de cellule enrichies. L’expression élevée des gènes marqueurs de l’amas supérieur a été localisée dans leurs amas de types cellulaires respectifs sur les parcelles UMAP. La visualisation du graphique à points a confirmé que les niveaux d’expression les plus élevés des gènes marqueurs de cluster étaient limités à leurs principaux types de cellules annotés. Le graphique à barres empilées a révélé que les neutrophiles et les macrophages étaient dominants le premier jour après la blessure, tandis que les fibroblastes, les cellules épithéliales et endothéliales sont devenus plus prévalents à des moments ultérieurs, reflétant la cascade cellulaire connue de la cicatrisation des plaies.
Related Videos
10:09
Related Videos
14.2K Views
06:53
Related Videos
13K Views
10:12
Related Videos
19.1K Views
09:34
Related Videos
14.3K Views
09:06
Related Videos
10K Views
06:36
Related Videos
14.2K Views
04:21
Related Videos
3.6K Views
04:03
Related Videos
1.4K Views
11:24
Related Videos
736 Views
09:48
Related Videos
828 Views