Journal
/
/
Sélection assistée de biomarqueurs par taille d’effet d’analyse discriminante linéaire (LEfSe) dans les données du microbiome
Assisted Selection of Biomarkers by Linear Discriminant Analysis Effect Size (LEfSe) in Microbiome Data
Journal JoVE
Génétique
Un abonnement à JoVE est nécessaire pour voir ce contenu.  Connectez-vous ou commencez votre essai gratuit.
Journal JoVE Génétique
Assisted Selection of Biomarkers by Linear Discriminant Analysis Effect Size (LEfSe) in Microbiome Data

Sélection assistée de biomarqueurs par taille d’effet d’analyse discriminante linéaire (LEfSe) dans les données du microbiome

Please note that all translations are automatically generated. Click here for the English version.

15,923 Views

04:57 min

May 16, 2022

DOI:

04:57 min
May 16, 2022

15861 Views

Transcription

Automatically generated

L’application de la taille de l’effet de l’analyse discriminante linéaire peut résoudre le problème de la recherche de bons biomarqueurs avec des différences statistiques entre les groupes biologiques. La taille de l’effet de l’analyse discriminante linéaire fournit une méthode pratique pour identifier les biomarqueurs génomiques afin de caractériser les différences statistiques entre les groupes biologiques. Assurez-vous de faire attention à chaque étape de la procédure, car le résultat de chaque étape précédente peut affecter l’étape suivante.

Après avoir généré un fichier d’entrée de taille d’effet d’analyse discriminante linéaire, exécutez les commandes comme indiqué pour exclure la possibilité de conflit de dépendances et créer un environnement conda pour la taille de l’effet d’analyse discriminante linéaire. Utilisez les commandes indiquées pour activer l’environnement créé et installer la taille de l’effet d’analyse discriminante linéaire avec le canal bioBakery. Pour mettre en forme les données pour la taille de l’effet d’analyse discriminante linéaire, exécutez la commande pour mettre en forme le fichier d’origine au format interne de taille d’effet d’analyse discriminante linéaire interne.

Pour calculer la taille de l’effet d’analyse discriminante linéaire, exécutez la commande pour effectuer une analyse discriminante linéaire et générer le fichier de données résultant. Après l’analyse, utilisez les commandes indiquées pour tracer l’ampleur de l’effet des biomarqueurs dans un fichier PDF et pour dessiner l’arbre des espèces afin d’afficher les biomarqueurs dans un cladogramme. Pour tracer les différences d’un seul biomarqueur entre différents groupes, utilisez la commande comme indiqué.

Toutes les caractéristiques peuvent également être dessinées à l’aide de la commande si vous le souhaitez. Pour l’analyse LEfSe en ligne à l’aide du serveur Galaxy, accédez au serveur. Pour télécharger les fichiers appropriés, cliquez dessus et choisissez le fichier local pour sélectionner les fichiers.

Ensuite, sélectionnez le format tabulaire et cliquez sur Démarrer. Pour mettre en forme les données pour la taille de l’effet d’analyse discriminante linéaire, cliquez sur LEfSe et Format des données pour LEfSe, sélectionnez les lignes spécifiques pour la classe, puis cliquez sur Exécuter. Pour calculer la taille de l’effet d’analyse discriminante linéaire, cliquez sur Taille de l’effet LEfSe et LDA.

Sélectionnez les valeurs des paramètres en fonction des exigences d’analyse, puis cliquez sur Exécuter. Pour tracer les résultats de la taille de l’effet d’analyse discriminante linéaire, cliquez sur LEfSe et Tracer les résultats LEfSe, puis cliquez sur Exécuter. Pour tracer le cladogramme, sélectionnez les valeurs de paramètre appropriées et cliquez sur Tracer le cladogramme et Exécuter.

Pour tracer une fonction, sélectionnez les valeurs de paramètre appropriées et cliquez sur Tracer une fonction et Exécuter. Pour tracer des fonctions différentielles, sélectionnez les valeurs de paramètre appropriées et cliquez sur le bouton Tracer les fonctions différentielles et Exécuter. Ici, les scores d’analyse de discrimination linéaire des communautés microbiennes avec des différences significatives dans chaque groupe, déterminés en analysant les 16 séquences de gènes d’ARN S-ribosomique de trois échantillons, sont montrés.

Dans cette figure, les biomarqueurs avec des différences significatives dans les arbres d’espèces entre les différents niveaux de classification peuvent être observés. Les cercles rayonnant de l’intérieur vers l’extérieur représentent les niveaux de classification du phylum au genre, le diamètre de chaque cercle d’espèce représentant le niveau d’abondance de chaque classification. Les espèces sans différences significatives apparaissent en jaune, et les biomarqueurs d’espèces significativement différents sont colorés pour correspondre aux groupes correspondants.

Les noms d’espèces correspondants des biomarqueurs présentés dans le graphique sont énumérés ici. Ici, un diagramme représentatif de la barre d’abondance pour un biomarqueur qui montre les différences entre les différents groupes en fonction des résultats de l’analyse discriminante linéaire de la taille de l’effet est montré. La ligne continue représente l’abondance relative moyenne, la ligne pointillée représente l’abondance relative médiane et chaque colonne représente l’abondance relative de chaque échantillon dans différents groupes.

L’analyse en composantes principales peut également être effectuée, car l’enseignement de la dimensionnalité est directement lié à la dimension des données et le système de coordonnées projeté est orthogonal. À mesure que la demande d’analyse de données de haute dimension augmente, cette méthode aidera à explorer les caractéristiques des biomarqueurs d’intérêt.

Summary

Automatically generated

LEfSe (LDA Effect Size) est un outil d’exploration de biomarqueurs de haute dimension pour identifier les caractéristiques génomiques (telles que les gènes, les voies et les taxonomies) qui caractérisent de manière significative deux groupes ou plus dans les données du microbiome.

Vidéos Connexes

Read Article