Waiting
Login processing...

Trial ends in Request Full Access Tell Your Colleague About Jove
Click here for the English version

Biochemistry

Un flux de travail intégré d’identification et de quantification sur le métabolome non ciblé basé sur le contrôle FDR

Published: September 20, 2022 doi: 10.3791/63625
* These authors contributed equally

Summary

Nous avons construit un flux de travail métabolomique non ciblé qui intégrait XY-Meta et metaX ensemble. Dans ce protocole, nous avons montré comment utiliser XY-Meta pour générer une bibliothèque spectrale de leurre à partir de références de spectres en libre accès, puis effectué un contrôle FDR et utilisé le metaX pour quantifier les métabolites après avoir identifié les spectres métabolomiques.

Abstract

Les techniques métabolomiques non ciblées sont largement utilisées ces dernières années. Cependant, l’augmentation rapide du débit et du nombre d’échantillons crée une énorme quantité de spectres, ce qui pose des défis pour le contrôle de la qualité des spectres de spectrométrie de masse. Pour réduire les faux positifs, un contrôle de la qualité du taux de fausse découverte (FDR) est nécessaire. Récemment, nous avons développé un logiciel pour le contrôle FDR de l’identification du métabolome non ciblé qui est basé sur une stratégie Target-Decoy nommée XY-Meta. Ici, nous avons démontré un pipeline d’analyse complet qui intègre XY-Meta et metaX ensemble. Ce protocole montre comment utiliser XY-meta pour générer une base de données de leurres à partir d’une base de données de référence existante et effectuer un contrôle FDR à l’aide de la stratégie Target-Decoy pour l’identification du métabolome à grande échelle sur un ensemble de données en libre accès. L’analyse différentielle et l’annotation des métabolites ont été effectuées après l’exécution de metaX pour la détection et la quantification des pics de métabolites. Afin d’aider davantage de chercheurs, nous avons également développé une plate-forme d’analyse conviviale basée sur le cloud pour ces analyses, sans avoir besoin de compétences en bioinformatique ou de langage informatique.

Introduction

Les métabolites jouent un rôle important dans les processus biologiques. Les métabolites sont souvent des régulateurs de divers processus tels que le transfert d’énergie, les régulations hormonales, la régulation des neurotransmetteurs, les communications cellulaires et les modifications post-traductionnelles des protéines, etc. 1,2,3,4. La métabolomique non ciblée fournit une vue globale de nombreux métabolites 5,6. Avec les progrès de la spectrométrie de masse et des technologies de chromatographie, le débit des spectres MS/MS du métabolome augmente rapidement ces dernières années 7,8,9,10,11. Pour identifier les métabolites de ces énormes ensembles de données, divers logiciels d’annotation ont été développés11, tels que MZmine12, MS-FINDER13, CFM-ID14, MetFrag15 et SLAW16. Cependant, ces identifications contiennent souvent de nombreux faux positifs. Les raisons incluent: (1) Les spectres MS / MS contiennent un bruit aléatoire, ce qui peut induire en erreur l’appariement des pics. (2) Les isomères et les différences d’énergies de fragmentation provoquent de multiples empreintes spectrales et augmentent ainsi le volume de la bibliothèque de référence. (3) La qualité des bibliothèques de référence varie. Une norme appropriée pour construire une bonne bibliothèque spectrale de référence est nécessaire. Par conséquent, un contrôle systématique du taux de fausse découverte (FDR) pour la métabolomique non ciblée est essentiel pour la recherche sur le métabolome fonctionnel 7,8,9,17.

L’approche empirique de Bayes et la stratégie Target-Decoy se sont toutes deux attaquées au problème du contrôle FDR en général. Kerstin Scheubert et al. ont montré que la stratégie Target-Decoy sur la base de données de leurres générée à partir de la méthode basée sur l’arbre de fragmentation est la meilleure méthode pour le contrôle FDR9. Xusheng Wang et al. ont conçu une méthode de génération de leurres basée sur la règle de l’octet en chimie et ont amélioré la précision de l’estimation FDR17. La bibliothèque spectrale pour la génération d’une base de données de leurres a été démontrée pour de meilleures performances18. Ici, nous avons amélioré la méthode basée sur la bibliothèque spectrale et développé un logiciel appelé XY-Meta19 qui peut encore améliorer la précision de l’estimation FDR. Il utilise la bibliothèque spectrale de référence existante pour générer une bibliothèque de leurres pour le contrôle FDR dans le cadre du schéma Target-Decoy. XY-Meta prend en charge ses propres algorithmes de correspondance spectrale et de similitude de cosinus. Il permet des modes de recherche conventionnels et de recherche itérative. Dans l’étape de l’évaluation FDR, il prend en charge le mode concaténé cible-leurre et le mode séparé. Pour une meilleure flexibilité, XY-Meta accepte les bibliothèques de leurres externes.

La détection et la quantification des pics de métabolites constituent également une étape importante de l’analyse du métabolome non ciblé. La détection des pics est la principale méthode d’identification du métabolome. En général, la précision de la détection des pics de métabolites a été affectée par de multiples facteurs, tels que les signaux sonores de spectrométrie de masse, la faible abondance de métabolites, les contaminants et les produits de dégradation des métabolites20. Lorsque le nombre d’échantillons de est trop grand ou que la colonne de chromatographie liquide a été remplacée dans des expériences de métabolome non ciblé, des effets de lot remarquables peuvent apparaître, ce qui constitue un défi majeur pour la quantification du métabolome 21,22,23. Actuellement, des logiciels comme XCMS24, Workflow4Metabolomic25, iMet-Q26 et metaX19 peuvent effectuer la détection de pointe et la quantification du métabolome non ciblé, mais nous suggérons que le pipeline de metaX est plus complet et plus facile à utiliser. Ici, nous démontrons le processus d’identification et de contrôle FDR pour un ensemble de données accessible au public msv000084112 à l’aide de XY-Meta, ainsi que la détection et la quantification des pics de métabolites à l’aide de metaX. Ce flux de travail ne nécessite que deux groupes et chaque groupe a besoin d’au moins deux exemples. Les données spectrales MS/MS sont nécessaires, indépendamment de la plate-forme du spectromètre de masse, du mode d’ionisation, du mode de charge et du type d’échantillon, et peuvent prendre en charge la normalisation basée sur l’échantillon et la normalisation basée sur les pics. En suivant cet exemple, les chercheurs peuvent effectuer l’identification et la quantification métabolomiques d’une manière facile à manipuler. L’utilisation de ce pipeline nécessite une capacité de programmation R. Pour aider le chercheur sans aucune connaissance en programmation, nous avons également développé une plate-forme d’analyse cloud pour l’analyse métabolomique. Nous avons fait la démonstration de cette plate-forme d’analyse cloud dans le document supplémentaire 5.

Subscription Required. Please recommend JoVE to your librarian.

Protocol

1. Préparer des ensembles de données métabolomiques pour l’analyse

REMARQUE: Dans cette démonstration, nous utilisons des ensembles de données métabolomiques sans échantillon QC. Des données pour les cas et les groupes témoins sont nécessaires. À des fins de démonstration, nous utilisons un ensemble de données publiques dans la base de données GNPS27.

  1. Accédez à la page Web https://gnps.ucsd.edu/ProteoSAFe/static/gnps-splash.jsp. Cliquez sur Parcourir les jeux de données.
  2. Recherchez le mot-clé « msv000084112 » dans la colonne Titre . Cliquez sur le numéro d’IDENTIFICATION du jeu de données pour plus de détails et téléchargez le jeu de données à l’aide de FTP.
  3. Placez les données brutes dans le dossier /msv000084112.
    REMARQUE: Cet ensemble de données a été acquis à l’aide de C18 RP-UHPLC sur la plate-forme Q Exactive en mode positif. Il représente une cohorte avec une maladie non caractérisée du métabolisme des données d’échantillons d’urine, y compris 33 échantillons de personnes en bonne santé, 12 échantillons vierges, deux échantillons de mélange et 82 échantillons de patients28 (matériel supplémentaire 8). Pour démontrer le flux de travail, nous avons choisi au hasard six échantillons de personnes en bonne santé (NH) comme groupe témoin et six échantillons avec la maladie (NT) comme groupe de cas pour effectuer le flux de travail.

2. Conversion du format de données

REMARQUE : Si le jeu de données est constitué des données brutes générées directement à partir du spectromètre de masse, il est généralement au format .raw, .wiff ou .cdf. Ils doivent être convertis aux formats mzXML et mgf. Ici, nous utilisons l’outil msconvert dans le package ProteoWizard29 pour effectuer la conversion de format.

  1. Téléchargez le ProteoWizard à partir de https://proteowizard.sourceforge.io/download.html et installez-le.
  2. Convertissez le format de données à l’aide de msconvert.exe sous le chemin d’installation de ProteoWizard.
    1. Convertissez les données brutes au format mzXML et stockez-les dans le dossier /mzXML:/msconvert.exe /raw/*.raw -o /raw/mzXML/ --filter « peakPicking true [1,2] » --filter « zeroSamples removeExtra » --mzML --zlib --mz64 --filter « msLevel 1-2 » --filter « titleMaker ...  »
    2. Convertissez les données brutes/mzXML au format mgf et stockez-les dans le dossier /mgf:/msconvert.exe /msv000084112/*.raw -o /msv000084112/mgf/ --filter « peakPicking true [1,2] » --filter « zeroSamples removeExtra » --mgf --mz64 --filter « msLevel 1-2 » --filter « titleMaker ...  »

3. Préparer la bibliothèque spectrale de référence pour les métabolites

REMARQUE : XY-meta prend en charge les bibliothèques spectrales de référence uniquement au format mgf.

  1. Accédez à la page Web https://gnps.ucsd.edu/ProteoSAFe/libraries.jsp. Recherchez le mot-clé « NIST » pour trouver l’élément. Cliquez sur Afficher pour plus de détails et téléchargez la bibliothèque.
    REMARQUE: Les bibliothèques spectrales publiques GNPS ont rassemblé de nombreuses bibliothèques de métabolites, classées par type, origine, espèce et modes de collecte. Bien que seule une petite fraction de ces bibliothèques soit générée à l’aide de documents standard, elles sont généralement suffisantes pour la plupart des recherches fondamentales.
  2. Placez la bibliothèque téléchargée GNPS-NIST14-MATCHES.mgf dans le dossier /database.

4. Identification des métabolites et contrôle des FDR

  1. Téléchargez la méta XY (version Windows). Recherchez le fichier de configuration des paramètres parameter.default dans le dossier /XY-Meta-Win/config/. Modifier son contenu en fonction du matériel supplémentaire 1.
    REMARQUE: En solution, les métabolites forment souvent des adduits avec des anions ou des cations, ce qui conduit à un déplacement de masse des ions parents. Par conséquent, il est nécessaire de définir les types d’adduits. Nous avons fourni des listes d’adduits pour la colonne d’échange d’ions et les colonnes d’analyse inverse en mode de charge positive et en mode de charge négative dans le dossier /adduct. Les utilisateurs peuvent également modifier leur propre liste d’annonces en fonction de leur projet de recherche. La liste d’annonces doit être dans le même format que la liste fournie.
  2. Effectuez l’identification des métabolites et le contrôle FDR à l’aide de XY-Meta:XY-Meta.exe -S /XY-Meta-Win/config/parameter.default -D /msv000084112/ pos_wt-1_a.mgf -R /database/GNPS-NIST14-MATCHES.mgf.
    REMARQUE : XY-Meta ne prend pas en charge les caractères génériques dans les paramètres. Par conséquent, une seule commande doit être utilisée pour traiter chaque fichier mgf. Pour un grand nombre de fichiers, un fichier batch est recommandé.

5. Analyse différentielle

REMARQUE: metaX est un paquet R open-source. Veuillez l’installer conformément au guide à https://github.com/wenbostar/metaX. 8 Go de RAM sont nécessaires pour cette analyse.

  1. Modifiez un fichier sampleList.txt pour spécifier l’exemple et ses données MS correspondantes. Veuillez vous reporter au document supplémentaire 2.
    REMARQUE: metaX prend en charge l’analyse quantitative pour les ensembles de données avec des échantillons qc. Lorsque vous utilisez des échantillons QC, modifiez la propriété de classe en NA pour les échantillons QC.
  2. Créez le dossier /output pour stocker les résultats de l’analyse quantitative. Utilisez R pour exécuter le script dans Supplementary Material 3 pour utiliser metaX pour quantifier les groupes MOCK et WT.
    Remarque : Avant d’exécuter le script dans le matériau supplémentaire 3, modifiez les chemins d’accès dans le script aux chemins locaux réels.

6. Intégration des résultats qualitatifs et quantitatifs

  1. Exécutez le script R dans le matériel supplémentaire 4 pour annoter les pics dans l’analyse qualitative et quantitative à l’aide d’identifications de métabolites.
    REMARQUE : Avant d’exécuter le script dans le matériel supplémentaire 4, veuillez modifier les chemins d’accès dans le script en fonction de vos chemins locaux réels.

Subscription Required. Please recommend JoVE to your librarian.

Representative Results

Les données brutes de msv000084112 ont été converties par msconvert.exe et généré des fichiers mgf (Supplementary Material S6).

XY-Meta a généré le fichier GNPS-NIST14-MATCHES_Decoy.mgf sous le dossier /database. Il s’agit de la bibliothèque de leurres générée à partir de la bibliothèque spectrale de référence d’origine GNPS-NIST14-MATCHES.mgf. Cette bibliothèque de leurres peut être réutilisée. Lors de la réutilisation de cette bibliothèque de leurres, l’utilisateur doit définir la decoy_pattern sur 1 dans le fichier parameter.default et définir l’entrée de leurre comme chemin absolu de la bibliothèque de leurres. Les résultats d’identification ont été générés sous le dossier /mgf (avec le suffixe .meta), qui comprend les scores d’appariement des spectres, le FDR, m/z des métabolites, le temps de rétention et le nom des métabolites (Matériau supplémentaire 7).

L’analyse quantitative par metaX se trouvait dans le dossier /output. La distribution quantitative générale du NH et du NT est similaire, avec une faible fluctuation des valeurs moyennes (figure 1A). Il n’y avait qu’une petite fraction des valeurs manquantes : seulement 3,39 % des métabolites ont plus de 30 % des valeurs manquantes (Figure 1B). metaX a remarquablement augmenté la proportion de métabolites avec CV ≤ 0,3 (Figure 1C). Les tracés de boîtes ont été stockés dans le dossier /metaX_box. Les profils d’élution ont été stockés dans le dossier /metaX_eic. Les pics de métabolites ont été enregistrés dans metaX-feature.txt. Les valeurs quantitatives des métabolites qui ont été identifiés dans les deux groupes et les résultats de l’analyse différentielle ont été stockés dans metaX_peaks.txt (Figure 1D). Application du seuil de | LogFC| ≥ 1 et la valeur de p < 0,05, 342 métabolites ont été détectés différemment, dont 206 régulés à la hausse et 136 à la baisse (matériau supplémentaire 9).

Nous avons annoté les pics détectés par metaX à l’aide des identifications FDR < 0,01. Si un pic peut être annoté par plusieurs métabolites, nous avons pris celui avec le score de correspondance de spectre le plus élevé comme annotation finale. À l’aide de ces critères, nous avons annoté six pics différentiels de métabolites (figure 2).

Figure 1
Graphique 1. Analyse quantitative par metaX. (A) Diagramme en boîte des métabolites quantifiés de tous les échantillons. (B) Histogramme de la distribution des valeurs manquantes. (C) Diagramme PCA de deux échantillons de groupe. (D) Diagramme de Venn des métabolites détectés différentiellement à partir de trois méthodes d’essai statistiques. Veuillez cliquer ici pour voir une version agrandie de cette figure.

Figure 2
Graphique 2. Temps de rétention (RT) et distribution m/z de tous les métabolites annotés. Les points rouges représentent les métabolites significatifs et détectés différemment. Veuillez cliquer ici pour voir une version agrandie de cette figure.

Matériel supplémentaire 1 : Fichier de paramètres de XY-Meta. Veuillez cliquer ici pour télécharger ce fichier.

Matériel supplémentaire 2 : Fiche d’information de regroupement d’échantillons pour metaX. Veuillez cliquer ici pour télécharger ce fichier.

Matériel supplémentaire 3 : Le script d’intégration du workflow de XY-Meta et metaX. Veuillez cliquer ici pour télécharger ce fichier.

Matériel supplémentaire 4 : Script d’annotation des pics à l’aide d’identifications de métabolomes. Veuillez cliquer ici pour télécharger ce fichier.

Matériel supplémentaire 5 : Un flux de travail complet pour l’analyse du métabolome à l’aide de la plate-forme cloud. Veuillez cliquer ici pour télécharger ce fichier.

Matériel supplémentaire 6 : Un fichier mgf converti à partir de msconvert pour un exemple de données de msv000084112. Veuillez cliquer ici pour télécharger ce fichier.

Matériel supplémentaire 7 : Une table de résultats d’identification de XY-Meta pour un échantillon de données de msv000084112. Veuillez cliquer ici pour télécharger ce fichier.

Matériel supplémentaire 8 : La fiche d’information clinique de la cohorte de msv000084112. Veuillez cliquer ici pour télécharger ce fichier.

Matériel supplémentaire 9 : Liste d’identification de tous les métabolites et résultats d’analyse différentielle de tous les pics de métabolites. Veuillez cliquer ici pour télécharger ce fichier.

Subscription Required. Please recommend JoVE to your librarian.

Discussion

Le contrôle FDR des métabolites non ciblés a été un grand défi. Ici, nous avons démontré un pipeline complet d’analyse métabolomique non ciblée à grande échelle (qualitative et quantitative) avec contrôle FDR. Cela réduit efficacement les faux positifs, qui sont très fréquents dans l’analyse de la SEP.

La préparation d’une bibliothèque spectrale de référence appropriée pour votre étude est un point clé. Une identification MS/MS réussie et sensible nécessite non seulement des algorithmes de correspondance appropriés, mais également des bibliothèques spectrales de référence appropriées. L’applicabilité des bibliothèques spectrales publiques est limitée pour les raisons suivantes : (1) de nombreuses bibliothèques spectrales publiques n’incluent pas de listes complètes de métabolites. (2) Les spectres des bibliothèques spectrales publiques proviennent de divers instruments ems et/ou de diverses conditionsde fragmentation 30,31. Par conséquent, nous vous suggérons de collecter des spectres dans le même instrument et les mêmes conditions de fragmentation en utilisant des métabolites standard pour construire une bibliothèque spectrale « exclusive ». En outre, ces conditions doivent être maintenues pendant les mesures réelles. De plus, lors de la modification du fichier de paramètres, la tolérance des ions précurseurs et des ions fragments doit coïncider avec les paramètres de l’instrument. Normalement, la plage de tolérance aux précurseurs doit être comprise entre 10 ppm et 20 ppm, et la tolérance aux fragments doit être comprise entre 0,01 Da et 0,5 Da. Pour cet ensemble de données, les paramètres de l’instrument sont inconnus, mais la tolérance de fragment de 0,05 Da est un choix prudent pour que ce flux de travail fonctionne normalement.

Les utilisateurs peuvent toujours recevoir divers messages d’erreur lorsqu’ils exécutent ce pipeline. Les erreurs courantes incluent un chemin d’accès au fichier d’entrée erroné, un fichier de paramètres manquant et un conflit d’accès au fichier (par exemple, un accès refusé par le système d’exploitation et un accès simultané au même fichier).

À noter, ce flux de travail n’est actuellement applicable qu’à l’analyse métabolomique ciblée et non ciblée de petites molécules inférieures à 1 000 Da, et ne peut pas être utilisé pour analyser les métabolomes de macromolécules telles que les chaînes de glycanes ou les chaînes lipidiques. En outre, les données d’acquisition indépendante des données (DIA) et les données de mobilité ionique ne conviennent pas à l’analyse avec ce flux de travail. Ce flux de travail ne prend pas en charge l’utilisation de m/z et le temps de rétention des métabolites pour annoter les résultats de détection de pointe et ne prend en charge que l’analyse différentielle de deux groupes de données avec plus de deux échantillons.

Pendant longtemps, les résultats d’identification du métabolome non ciblé dominé par la technologie de détection des pics ont eu tendance à contenir beaucoup de faux positifs, principalement en raison du grand nombre d’isomères de métabolites et de différentes formes d’adduits ioniques. La comparaison des spectres MS/MS des métabolites avec les spectres de référence des métabolites connus peut résoudre la structure des métabolites pour distinguer les isomères32. Toutefois, un métabolite ne peut être identifié si le spectre de référence d’un métabolite n’est pas accessible au public ou dans le commerce7. Par conséquent, la construction d’une bibliothèque fiable de spectres de référence de métabolites est un grand défi. Des spectres de référence de faible qualité et de structure similaire conduisent à une correspondance aléatoire des spectres expérimentaux. Par conséquent, le contrôle FDR des résultats d’identification est nécessaire pour garantir des identifications fiables. Les utilisateurs peuvent utiliser ce pipeline pour identifier automatiquement le métabolome avec le contrôle FDR, ainsi que la quantification et l’analyse différentielle, en fournissant les données d’entrée nécessaires selon le protocole requis. C’est pratique et économique pour de nombreux chercheurs, en particulier pour les débutants.

Subscription Required. Please recommend JoVE to your librarian.

Disclosures

Pas de conflits d’intérêts.

Acknowledgments

Ce travail est soutenu par le National Key Research and Development Program (2018YFC0910200/2017YFA0505001) et le Guangdong Key R&D Program (2019B020226001).

Materials

Name Company Catalog Number Comments
GNPS open source n/a https://gnps.ucsd.edu/ProteoSAFe/static/gnps-splash.jsp
XY-Meta open source n/a https://github.com/DLI-ShenZhen/XY-Meta
metaX open source n/a https://github.com/wenbostar/metaX
ProteoWizard Free Download 3.0.22116.18c918b-x86_64 https://proteowizard.sourceforge.io/download.html
CHI.Client Free Download ndp48-x86-x64-allos-enu http://www.chi-biotech.com/technology.html?ty=ypt

DOWNLOAD MATERIALS LIST

References

  1. Misra, B. B., Fahrmann, J. F., Grapov, D. Review of emerging metabolomic tools and resources: 2015-2016. Electrophoresis. 38 (18), 2257-2274 (2017).
  2. Idle, J. R., Gonzalez, F. J. Metabolomics. Cell Metabolism. 6 (5), 348-351 (2007).
  3. Fiehn, O. Metabolomics — the link between genotypes and phenotypes. Functional Genomics. Town, C. , Springer. Netherlands. Dordrecht. 155-171 (2002).
  4. Functional Genomics. Town, C. , Springer. Netherlands. Dordrecht. (2002).
  5. Dettmer, K., Aronov, P. A., Hammock, B. D. Mass spectrometry-based metabolomics. Mass Spectrometry Reviews. 26 (1), 51-78 (2007).
  6. Vinayavekhin, N., Saghatelian, A. Untargeted metabolomics. Current Protocols in Molecular Biology. , Chapter 30, Unit 30.1 1-24 (2010).
  7. Chaleckis, R., Meister, I., Zhang, P., Wheelock, C. E. Challenges, progress and promises of metabolite annotation for LC-MS-based metabolomics. Current Opinion in Biotechnology. 55, 44-50 (2019).
  8. Palmer, A., et al. FDR-controlled metabolite annotation for high-resolution imaging mass spectrometry. Nature Methods. 14 (1), 57-60 (2017).
  9. Scheubert, K., et al. Significance estimation for large scale metabolomics annotations by spectral matching. Nature Communications. 8 (1), 1494 (2017).
  10. Schrimpe-Rutledge, A. C., Codreanu, S. G., Sherrod, S. D., McLean, J. A. Untargeted metabolomics strategies-challenges and emerging directions. Journal of the American Society for Mass Spectrometry. 27 (12), 1897-1905 (2016).
  11. Blaženović, I., Kind, T., Ji, J., Fiehn, O. Software tools and approaches for compound identification of LC-MS/MS data in metabolomics. Metabolites. 8 (2), (2018).
  12. Katajamaa, M., Miettinen, J., Oresic, M. MZmine: toolbox for processing and visualization of mass spectrometry based molecular profile data. Bioinformatics. 22 (5), Oxford, England. 634-636 (2006).
  13. Tsugawa, H., et al. Hydrogen rearrangement rules: computational MS/MS fragmentation and structure elucidation using MS-FINDER software. Analytical chemistry. 88 (16), 7946-7958 (2016).
  14. Wang, F., et al. CFM-ID 4.0: More accurate ESI-MS/MS spectral prediction and compound identification. Analytical Chemistry. 93 (34), 11692-11700 (2021).
  15. Ruttkies, C., Schymanski, E. L., Wolf, S., Hollender, J., Neumann, S. MetFrag relaunched: incorporating strategies beyond in silico fragmentation. Journal of Cheminformatics. 8, 3 (2016).
  16. Delabriere, A., Warmer, P., Brennsteiner, V., Zamboni, N. SLAW: A scalable and self-optimizing processing workflow for untargeted LC-MS. Analytical chemistry. 93 (45), 15024-15032 (2021).
  17. Wang, X., et al. Target-decoy-based false discovery rate estimation for large-scale metabolite identification. Journal of Proteome Research. 17 (7), 2328-2334 (2018).
  18. Li, D., et al. XY-Meta: a high-efficiency search engine for large-scale metabolome annotation with accurate FDR estimation. Analytical Chemistry. 92 (8), 5701-5707 (2020).
  19. Wen, B., Mei, Z., Zeng, C., Liu, S. metaX: a flexible and comprehensive software for processing metabolomics data. BMC Bioinformatics. 18 (1), 183 (2017).
  20. Aberg, K. M., Torgrip, R. J. O., Kolmert, J., Schuppe-Koistinen, I., Lindberg, J. Feature detection and alignment of hyphenated chromatographic-mass spectrometric data. Extraction of pure ion chromatograms using Kalman tracking. Journal of Chromatography. A. 1192 (1), 139-146 (2008).
  21. Liu, Q., et al. Addressing the batch effect issue for LC/MS metabolomics data in data preprocessing. Scientific Reports. 10 (1), 13856 (2020).
  22. Han, W., Li, L. Evaluating and minimizing batch effects in metabolomics. Mass Spectrometry Reviews. 41 (3), 421-442 (2022).
  23. Fei, F., Bowdish, D. M. E., McCarry, B. E. Comprehensive and simultaneous coverage of lipid and polar metabolites for endogenous cellular metabolomics using HILIC-TOF-MS. Analytical and Bioanalytical Chemistry. 406 (15), 3723-3733 (2014).
  24. Smith, C. A., Want, E. J., O'Maille, G., Abagyan, R., Siuzdak, G. XCMS: processing mass spectrometry data for metabolite profiling using nonlinear peak alignment, matching, and identification. Analytical Chemistry. 78 (3), 779-787 (2006).
  25. Giacomoni, F., et al. Workflow4Metabolomics: a collaborative research infrastructure for computational metabolomics. Bioinformatics. 31 (9), Oxford, England. 1493-1495 (2015).
  26. Chang, H. -Y., et al. iMet-Q: A user-friendly tool for label-free metabolomics quantitation using dynamic peak-width determination. PloS One. 11 (1), 0146112 (2016).
  27. Wang, M., et al. Sharing and community curation of mass spectrometry data with Global Natural Products Social Molecular Networking. Nature Biotechnology. 34 (8), 828-837 (2016).
  28. Schmid, R., et al. Ion identity molecular networking for mass spectrometry-based metabolomics in the GNPS environment. Nature Communications. 12 (1), 3832 (2021).
  29. Kessner, D., Chambers, M., Burke, R., Agus, D., Mallick, P. ProteoWizard: open source software for rapid proteomics tools development. Bioinformatics. 24 (21), Oxford, England. 2534-2536 (2008).
  30. Johnson, S. R., Lange, B. M. Open-access metabolomics databases for natural product research: present capabilities and future potential. Frontiers in Bioengineering and Biotechnology. 3, 22 (2015).
  31. Horai, H., et al. MassBank: a public repository for sharing mass spectral data for life sciences. Journal of Mass Spectrometry: JMS. 45 (7), 703-714 (2010).
  32. Rawlinson, C., et al. Hierarchical clustering of MS/MS spectra from the firefly metabolome identifies new lucibufagin compounds. Scientific Reports. 10 (1), 6043 (2020).

Tags

Biochimie numéro 187
Un flux de travail intégré d’identification et de quantification sur le métabolome non ciblé basé sur le contrôle FDR
Play Video
PDF DOI DOWNLOAD MATERIALS LIST

Cite this Article

Li, D., Liang, J., Zhang, Y., Zhang, More

Li, D., Liang, J., Zhang, Y., Zhang, G. An Integrated Workflow of Identification and Quantification on FDR Control-Based Untargeted Metabolome. J. Vis. Exp. (187), e63625, doi:10.3791/63625 (2022).

Less
Copy Citation Download Citation Reprints and Permissions
View Video

Get cutting-edge science videos from JoVE sent straight to your inbox every month.

Waiting X
Simple Hit Counter