Waiting
登录处理中...

Trial ends in Request Full Access Tell Your Colleague About Jove
Click here for the English version

Biochemistry

FDR 제어 기반 비표적 메타볼로임에 대한 식별 및 정량화의 통합 워크플로우

Published: September 20, 2022 doi: 10.3791/63625
* These authors contributed equally

Summary

우리는 XY-Meta와 metaX를 함께 통합하는 표적화되지 않은 대사 산물 워크 플로우를 구축했습니다. 이 프로토콜에서는 XY-Meta를 사용하여 오픈 액세스 스펙트럼 참조에서 데코이 스펙트럼 라이브러리를 생성하는 방법을 표시 한 다음 FDR 제어를 수행하고 대사체 스펙트럼을 확인한 후 metaX를 사용하여 대사 산물을 정량화했습니다.

Abstract

표적화되지 않은 대사체학 기술은 최근 몇 년 동안 널리 사용되고 있다. 그러나 빠르게 증가하는 처리량과 샘플 수는 엄청난 양의 스펙트럼을 생성하므로 질량 분광법 스펙트럼의 품질 관리에 대한 문제가 발생합니다. 거짓 긍정을 줄이려면 FDR(거짓 발견률) 품질 관리가 필요합니다. 최근에, 우리는 XY-Meta라는 Target-Decoy 전략을 기반으로 하는 비표적 대사체 식별의 FDR 제어를 위한 소프트웨어를 개발했습니다. 여기서는 XY-Meta와 metaX를 함께 통합하는 완벽한 분석 파이프라인을 시연했습니다. 이 프로토콜은 XY-meta를 사용하여 기존 참조 데이터베이스에서 데코이 데이터베이스를 생성하고 오픈 액세스 데이터 세트에서 대규모 대사체 식별을 위해 Target-Decoy 전략을 사용하여 FDR 제어를 수행하는 방법을 보여줍니다. 차등 분석 및 대사산물 주석은 대사산물 피크 검출 및 정량을 위해 metaX를 실행한 후에 수행되었다. 더 많은 연구자를 돕기 위해 우리는 생물 정보학 기술이나 컴퓨터 언어가 필요없이 이러한 분석을위한 사용자 친화적 인 클라우드 기반 분석 플랫폼을 개발했습니다.

Introduction

대사 산물은 생물학적 과정에서 중요한 역할을합니다. 대사 산물은 종종 에너지 전달, 호르몬 조절, 신경 전달 물질의 조절, 세포 통신 및 단백질 번역 후 변형 등 1,2,3,4와 같은 다양한 과정의 조절자입니다. 표적화되지 않은 대사체학은 수많은 대사 산물 5,6에 대한 세계적인 시각을 제공합니다. 질량 분광법 및 크로마토그래피 기술의 발전으로 대사체 MS/MS 스펙트럼의 처리량 은 최근 몇 년 동안 7,8,9,10,11 급속히 증가하고 있습니다. 이러한 거대한 데이터 세트에서 대사 산물을 식별하기 위해 MZmine 12, MS-FINDER 13, CFM-ID 14, MetFrag15 및 SLAW 16과 같은 다양한 주석 소프트웨어 11이 개발되었습니다. 그러나 이러한 식별에는 종종 많은 가양성이 포함되어 있습니다. 그 이유는 다음과 같습니다 : (1) MS / MS 스펙트럼에는 피크 정합을 오도 할 수있는 임의의 잡음이 포함되어 있습니다. (2) 이성질체와 단편화 에너지의 차이는 다중 스펙트럼 지문을 유발하여 참조 라이브러리의 볼륨을 증가시킵니다. (3) 참조 라이브러리의 품질은 다양합니다. 좋은 참조 스펙트럼 라이브러리를 구축하기위한 적절한 표준이 필요합니다. 따라서, 비표적 대사체학에 대한 체계적인 허위 발견률(FDR) 조절은 기능적 대사체 연구 7,8,9,17에 필수적이다.

경험적 베이즈 접근법과 Target-Decoy 전략은 FDR 통제 문제를 일반적으로 다루었습니다. Kerstin Scheubert et al.은 단편화 트리 기반 방법으로부터 생성된 디코이 데이터베이스에 대한 Target-Decoy 전략이 FDR 제어9를 위한 최선의 방법임을 보여주었다. Xusheng Wang et al. 화학에서 옥텟 규칙에 기초한 디코이 생성 방법을 설계하고 FDR 추정17의 정밀도를 개선했습니다. decoy 데이터베이스를 생성하기 위한 스펙트럼 라이브러리는 더 나은 성능(18)을 위해 입증되었다. 여기에서는 스펙트럼 라이브러리 기반 방법을 개선하고 FDR 추정의 정밀도를 더욱 향상시킬 수있는 XY-Meta19 라는 소프트웨어를 개발했습니다. 기존 참조 스펙트럼 라이브러리를 사용하여 Target-Decoy 체계 하에서 FDR 제어를위한 디코이 라이브러리를 생성합니다. XY-Meta는 자체 스펙트럼 매칭 및 코사인 유사성 알고리즘을 지원합니다. 그것은 전통적인 검색 및 반복 검색 모드를 허용합니다. FDR 평가 단계에서는 Target-Decoy 연결 모드와 분리 모드를 지원합니다. 유연성을 높이기 위해 XY-Meta는 외부 디코이 라이브러리를 수용합니다.

대사 산물의 피크 검출 및 정량화는 또한 표적화되지 않은 대사체 분석의 중요한 단계입니다. 피크 검출은 대사체 식별을위한 주요 방법입니다. 일반적으로, 대사산물의 피크 검출의 정확도는 질량 분광분석법의 잡음 신호, 대사산물의 낮은 풍부도, 오염물 및 대사산물(20)의 분해 생성물과 같은 다수의 인자에 의해 영향을 받았다. 샘플의 수가 너무 많거나 액체 크로마토그래피 컬럼이 표적화되지 않은 대사체의 실험에서 대체되었을 때, 현저한 배치 효과가 나타날 수 있으며, 이는 대사체 정량화에 대한 주요 과제21,22,23이다. 현재 XCMS 24, Workflow4Metabolomic25, iMet-Q26 및 metaX19와 같은 소프트웨어는 표적화되지 않은 대사체의 피크 검출 및 정량을 수행 할 수 있지만 metaX의 파이프 라인이보다 완전하고 사용하기 쉽다는 것이 좋습니다. 여기에서는 XY-Meta를 사용하여 공개적으로 이용 가능한 데이터 세트 msv000084112에 대한 식별 및 FDR 제어 과정과 metaX를 사용한 대사 산물의 피크 검출 및 정량화를 시연합니다. 이 워크플로에는 두 개의 그룹만 필요하며 각 그룹에는 두 개 이상의 샘플이 필요합니다. MS/MS 스펙트럼 데이터는 질량 분광계 플랫폼, 이온화 모드, 전하 모드 및 샘플 유형에 관계없이 필요하며 샘플 기반 정규화 및 피크 기반 정규화를 지원할 수 있습니다. 이 예에 따라 연구자들은 다루기 쉬운 방법으로 대사체학 식별 및 정량화를 수행 할 수 있습니다. 이 파이프라인을 사용하려면 R 프로그래밍 기능이 필요합니다. 프로그래밍 지식없이 연구원을 돕기 위해 우리는 대사체 분석을위한 클라우드 분석 플랫폼도 개발했습니다. 우리는 보충 자료 5에서이 클라우드 분석 플랫폼을 시연했습니다.

Subscription Required. Please recommend JoVE to your librarian.

Protocol

1. 분석을 위해 대사체학 데이터 세트 준비

참고: 이 데모에서는 QC 샘플 없이 대사체학 데이터 세트를 사용합니다. 케이스 및 제어 그룹에 대한 데이터가 필요합니다. 데모를 위해 GNPS 데이터베이스27에서 공용 데이터 세트를 사용합니다.

  1. 웹 페이지로 이동하 https://gnps.ucsd.edu/ProteoSAFe/static/gnps-splash.jsp. 데이터 집합 찾아보기를 클릭합니다.
  2. 제목 열에서 키워드 "msv000084112"를 검색합니다. 자세한 내용은 데이터 집합 ID 번호를 클릭하고 FTP를 사용하여 데이터 집합을 다운로드합니다.
  3. 원시 데이터를 /msv000084112 폴더에 넣습니다.
    참고: 이 데이터 세트는 Q Exactive 플랫폼의 C18 RP-UHPLC를 사용하여 포지티브 모드에서 획득했습니다. 소변 샘플의 대사에 특징이 없는 질병을 가진 코호트 데이터를 나타내며, 건강한 사람의 샘플 33개, 빈 샘플 12개, 환자 28명의 혼합 샘플 및 82개의 샘플을포함한다(보충 자료 8). 워크플로를 입증하기 위해 우리는 대조군으로 건강한 사람(NH)의 여섯 샘플을, 질병(NT)을 가진 여섯 개의 샘플을 사례 그룹으로 무작위로 선택하여 워크플로를 수행했습니다.

2. 데이터 형식 변환

참고: 데이터 세트가 질량 분광계에서 직접 생성된 원시 데이터인 경우 일반적으로 .raw, .wiff 또는 .cdf 형식입니다. mzXML 및 mgf 형식으로 변환해야합니다. 여기서는 ProteoWizard29 패키지의 msconvert 도구를 사용하여 형식 변환을 수행합니다.

  1. https://proteowizard.sourceforge.io/download.html 에서 ProteoWizard를 다운로드하여 설치하십시오.
  2. ProteoWizard 설치 경로에서 msconvert.exe를 사용하여 데이터 형식을 변환합니다.
    1. 원시 데이터를 mzXML 형식으로 변환하여 /mzXML 폴더에 저장합니다:/msconvert.exe /raw/*.raw -o /raw/mzXML/ --filter "peakPicking true [1,2]" --filter "zeroSamples removeExtra" --mzML --zlib --mz64 --filter "msLevel 1-2" --filter "titleMaker ... <차지 스테이트>".
    2. 원시 / mzXML 데이터를 mgf 형식으로 변환하고 /mgf 폴더에 저장하십시오 : / msconvert.exe /msv000084112 / *.raw -o /msv000084112 / mgf / --필터 "peakPicking true [1,2]"--filter "zeroSamples removeExtra"--mgf --mz64 --filter "msLevel 1-2"--filter "msLevel 1-2"--filter "titleMaker ... <차지 스테이트>".

3. 대사 산물에 대한 참조 스펙트럼 라이브러리 준비

참고: XY-meta는 참조 스펙트럼 라이브러리를 mgf 형식으로만 지원합니다.

  1. 웹 페이지 https://gnps.ucsd.edu/ProteoSAFe/libraries.jsp 로 이동합니다. 키워드 "NIST"를 검색하여 항목을 찾습니다. 보기를 클릭하여 자세한 내용을 확인하고 라이브러리를 다운로드합니다.
    참고: GNPS 공공 스펙트럼 라이브러리는 유형, 기원, 종 및 수집 모드로 배열된 많은 대사산물 라이브러리를 수집했습니다. 이러한 라이브러리의 일부만이 표준 재료를 사용하여 생성되지만 일반적으로 대부분의 기본 연구에 충분합니다.
  2. 다운로드한 라이브러리 GNPS-NIST14-MATCHES.mgf를 /database 폴더에 넣습니다.

4. 대사산물 확인 및 FDR 조절

  1. XY 메타(Windows 버전)를 다운로드합니다. /XY-Meta-Win/config/ 폴더 아래에서 매개 변수 구성 파일 parameter.default를 찾습니다. 보충 자료 1에 따라 내용을 변경하십시오.
    참고 : 해결책에서 대사 산물은 종종 음이온 또는 양이온으로 부가물을 형성하여 모 이온의 대량 이동을 유도합니다. 따라서 부가물의 유형을 설정해야합니다. 우리는 /adduct 폴더에서 양전하 모드 및 음전하 모드에서 이온 교환 컬럼 및 역방향 분석 컬럼에 대한 부가물 목록을 제공했습니다. 사용자는 또한 자신의 연구 프로젝트에 따라 자신의 부가물 목록을 편집 할 수 있습니다. 추가 목록은 제공된 목록과 동일한 형식이어야 합니다.
  2. XY-Meta:XY-Meta.exe -S /XY-Meta-Win/config/parameter.default -D /msv000084112/ pos_wt-1_a.mgf -R /database/GNPS-NIST14-MATCHES.mgf를 사용하여 대사산물 식별 및 FDR 제어를 수행합니다.
    참고: XY-Meta는 매개 변수에서 와일드카드를 지원하지 않습니다. 따라서 단일 명령을 사용하여 각 mgf 파일을 처리해야 합니다. 많은 수의 파일의 경우 배치 파일을 사용하는 것이 좋습니다.

5. 차등 분석

참고: metaX는 오픈 소스 R 패키지입니다. https://github.com/wenbostar/metaX 의 가이드에 따라 설치하십시오. 이 분석에는 8GB RAM이 필요합니다.

  1. sampleList.txt 파일을 편집하여 샘플 및 해당 MS 데이터를 지정합니다. 보충 자료 2를 참조하십시오.
    참고: metaX는 QC 샘플이 있는 데이터 세트에 대한 정량적 분석을 지원합니다. QC 샘플을 사용할 때 QC 샘플에 대한 클래스 속성을 NA로 수정하십시오.
  2. /output 폴더를 만들어 정량 분석 결과를 저장합니다. R을 사용하여 보충 자료 3 에서 스크립트를 실행하여 metaX를 사용하여 MOCK 및 WT 그룹을 정량화합니다.
    참고: 보충 자료 3에서 스크립트를 실행하기 전에 스크립트의 경로를 실제 로컬 경로로 수정하십시오.

6. 질적 및 양적 결과의 통합

  1. 보충 자료 4에서 R 스크립트를 실행하여 대사 산물 식별을 사용하여 정성 및 정량 분석에서 피크에 주석을 달으십시오.
    참고: 보충 자료 4에서 스크립트를 실행하기 전에 스크립트의 경로를 실제 로컬 경로로 수정하십시오.

Subscription Required. Please recommend JoVE to your librarian.

Representative Results

msv000084112의 원시 데이터는 msconvert에 의해 변환되고.exe mgf 파일을 생성하였다(보충 자료 S6).

XY-메타는 /database 폴더 아래에 GNPS-NIST14-MATCHES_Decoy.mgf 파일을 생성했습니다. 이것은 원래의 참조 스펙트럼 라이브러리 GNPS-NIST14-MATCHES.mgf에서 생성 된 데코이 라이브러리입니다. 이 디코이 라이브러리는 재사용할 수 있습니다. 이 decoy 라이브러리를 다시 사용할 때 사용자는 parameter.default 파일에서 decoy_pattern을 1로 설정하고 decoyinput 을 decoy 라이브러리의 절대 경로로 설정해야 합니다. 식별 결과는 /mgf 폴더 (접미사 .meta 포함) 아래에 생성되었으며, 여기에는 스펙트럼 일치 점수, FDR, 대사 산물의 m / z, 체류 시간 및 대사 산물의 이름 (보충 자료 7)이 포함됩니다.

metaX에 의한 정량 분석은 /output 폴더에 있었습니다. NH와 NT의 일반적인 정량적 분포는 유사하며 평균값의 변동이 낮다(그림 1A). 누락 된 값의 작은 부분 만 있었다 : 대사 산물의 3.39 %만이 누락 된 값의 30 % 이상을 가지고 있습니다 (그림 1B). metaX는 CV를 갖는 대사산물의 비율을 0.3으로 현저하게 증가≤켰다(도 1C). 상자 플롯은 /metaX_box 폴더에 저장되었습니다. 용출 프로파일은 /metaX_eic 폴더에 저장되었습니다. 대사산물 피크는 metaX-feature.txt로 기록되었다. 두 그룹 모두에서 확인되었던 대사산물의 정량적 값과 차등 분석 결과를 metaX_peaks.txt에 저장하였다(도 1D). |의 임계값 적용 로그FC| 1과 p-값이 0.05≥ <, 342개의 대사산물이 차등적으로 검출되었으며, 206개는 상향조절되고 136개는 하향조절되었다(보충물질 9).

우리는 0.01 식별을 < FDR을 사용하여 metaX 검출 피크에 주석을 달았습니다. 피크가 여러 대사 산물에 의해 주석 처리 될 수 있다면, 우리는 스펙트럼 일치 점수가 가장 높은 것을 최종 주석으로 사용했습니다. 이러한 기준을 사용하여 여섯 개의 차등 대사산물 피크에 주석을 달았습니다(그림 2).

Figure 1
그림 1. 메타X에 의한 정량적 분석. (A) 모든 샘플의 정량화된 대사산물의 박스 플롯. (B) 누락 값 분포의 히스토그램. (c) 두 그룹 샘플의 PCA 플롯. (d) 세 가지 통계적 시험 방법으로부터 차등적으로 검출된 대사산물의 벤 다이어그램. 이 그림의 더 큰 버전을 보려면 여기를 클릭하십시오.

Figure 2
그림 2. 주석이 달린 모든 대사산물의 체류 시간(RT) 및 m/z 분포. 빨간 점은 유의하고 차등적으로 검출 된 대사 산물을 나타냅니다. 이 그림의 더 큰 버전을 보려면 여기를 클릭하십시오.

보충 자료 1 : XY-메타의 매개변수 파일입니다. 이 파일을 다운로드하려면 여기를 클릭하십시오.

보충 자료 2 : metaX에 대한 샘플의 그룹화 정보 시트. 이 파일을 다운로드하려면 여기를 클릭하십시오.

보충 자료 3 : XY-Meta 및 metaX의 워크플로를 통합하기 위한 스크립트입니다. 이 파일을 다운로드하려면 여기를 클릭하십시오.

보충 자료 4 : 대사체 식별을 사용하여 피크에 주석을 추가하는 스크립트입니다. 이 파일을 다운로드하려면 여기를 클릭하십시오.

보충 자료 5 : 클라우드 플랫폼을 사용한 대사체 분석을 위한 완벽한 워크플로우입니다. 이 파일을 다운로드하려면 여기를 클릭하십시오.

보충 자료 6 : msv000084112의 샘플 데이터에 대해 msconvert에서 변환된 mgf 파일입니다. 이 파일을 다운로드하려면 여기를 클릭하십시오.

보충 자료 7 : msv000084112의 샘플 데이터에 대한 XY-Meta의 식별 결과 테이블입니다. 이 파일을 다운로드하려면 여기를 클릭하십시오.

보충 자료 8 : msv000084112의 코호트 임상 정보 시트. 이 파일을 다운로드하려면 여기를 클릭하십시오.

보충 자료 9 : 모든 대사산물의 동정 목록 및 모든 대사산물 피크의 차등 분석 결과. 이 파일을 다운로드하려면 여기를 클릭하십시오.

Subscription Required. Please recommend JoVE to your librarian.

Discussion

표적화되지 않은 대사 산물의 FDR 제어는 큰 도전이었습니다. 여기에서, 우리는 FDR 통제를 통한 대규모 비표적 대사체학 분석 (질적 및 양적)의 완전한 파이프 라인을 시연했습니다. 이것은 MS 분석에서 매우 일반적인 오탐을 효과적으로 줄입니다.

연구에 적합한 참조 스펙트럼 라이브러리를 준비하는 것이 핵심 포인트입니다. 성공적이고 민감한 MS/MS 식별을 위해서는 적절한 매칭 알고리즘뿐만 아니라 적절한 기준 스펙트럼 라이브러리도 필요합니다. 공공 스펙트럼 라이브러리의 적용 가능성은 다음과 같은 이유로 인해 제한됩니다 : (1) 많은 공공 스펙트럼 라이브러리는 완전한 대사 산물 목록을 포함하지 않습니다. (2) 공공 스펙트럼 라이브러리의 스펙트럼은 다양한 MS 기기 및/또는 다양한 단편화 조건(30,31)으로부터 기원하였다. 따라서 표준 대사 산물을 사용하여 동일한 계측기 및 동일한 단편화 조건에서 스펙트럼을 수집하여 "배타적"스펙트럼 라이브러리를 구성하는 것이 좋습니다. 또한 이러한 조건은 실제 측정 중에 유지되어야합니다. 또한 매개 변수 파일을 수정할 때 전구체 이온과 조각 이온의 공차는 계측기의 매개 변수와 일치해야합니다. 일반적으로 전구체 허용 오차 범위는 10ppm에서 20ppm 사이여야 하며 단편 허용 오차는 0.01Da에서 0.5Da 사이로 설정해야 합니다. 이 데이터 세트의 경우 계측기의 매개 변수는 알 수 없지만 0.05Da 의 조각 허용 오차는 이 워크플로우가 정상적으로 수행되기 위한 보수적인 선택입니다.

사용자는 이 파이프라인을 실행할 때 여전히 다양한 오류 메시지가 나타날 수 있습니다. 일반적인 실수에는 잘못된 입력 파일 경로, 누락 된 매개 변수 파일 및 파일 액세스 충돌 (예 : 운영 체제에 의해 액세스 거부 및 동일한 파일의 동시 액세스)이 포함됩니다.

참고로, 이 워크플로우는 현재 1,000 Da 미만의 소분자의 표적 및 비표적 대사체 분석에만 적용되며, 글리칸 사슬 또는 지질 사슬과 같은 거대분자의 대사체를 분석하는 데 사용할 수 없습니다. 또한 데이터 독립 획득(DIA) 데이터와 이온 이동성 데이터 모두 이 워크플로를 통한 분석에 적합하지 않습니다. 이 워크플로는 피크 검출 결과에 주석을 달기 위해 m/z 및 대사산물의 보유 시간을 사용하는 것을 지원하지 않으며 두 개 이상의 샘플이 있는 두 데이터 그룹의 차등 분석만 지원합니다.

오랜 시간 동안, 피크 검출 기술에 의해 지배되는 비표적 대사체의 동정 결과는 주로 많은 수의 대사산물 이성질체 및 상이한 이온성 부가물 형태로 인해 많은 위양성을 포함하는 경향이 있었다. 대사산물의 MS/MS 스펙트럼을 공지된 대사산물의 기준 스펙트럼과 비교하면 이성질체(32)를 구별하기 위해 대사산물의 구조를 해결할 수 있다. 그러나, 대사산물의 기준 스펙트럼이 공개적으로 또는 상업적으로 입수가능하지 않은 경우에는 대사산물을 동정할 수 없다7. 따라서 대사 산물 참조 스펙트럼의 신뢰할 수있는 라이브러리를 구축하는 것은 큰 도전입니다. 낮은 품질과 유사한 구조의 기준 스펙트럼은 실험 스펙트럼의 무작위 일치로 이어집니다. 따라서 확실한 식별을 보장하기 위해 식별 결과에 대한 FDR 제어가 필요합니다. 사용자는 이 파이프라인을 사용하여 필요한 입력 데이터를 필요한 프로토콜로 제공하여 FDR 제어뿐만 아니라 정량 및 차등 분석을 통해 대사체를 자동으로 식별할 수 있습니다. 그것은 특히 초보자를위한 많은 연구자들에게 편리하고 경제적입니다.

Subscription Required. Please recommend JoVE to your librarian.

Disclosures

이해 상충이 없습니다.

Acknowledgments

이 작업은 국가 핵심 연구 개발 프로그램 (2018YFC0910200 / 2017YFA0505001)과 광동 키 R & D 프로그램 (2019B020226001)의 지원을 받습니다.

Materials

Name Company Catalog Number Comments
GNPS open source n/a https://gnps.ucsd.edu/ProteoSAFe/static/gnps-splash.jsp
XY-Meta open source n/a https://github.com/DLI-ShenZhen/XY-Meta
metaX open source n/a https://github.com/wenbostar/metaX
ProteoWizard Free Download 3.0.22116.18c918b-x86_64 https://proteowizard.sourceforge.io/download.html
CHI.Client Free Download ndp48-x86-x64-allos-enu http://www.chi-biotech.com/technology.html?ty=ypt

DOWNLOAD MATERIALS LIST

References

  1. Misra, B. B., Fahrmann, J. F., Grapov, D. Review of emerging metabolomic tools and resources: 2015-2016. Electrophoresis. 38 (18), 2257-2274 (2017).
  2. Idle, J. R., Gonzalez, F. J. Metabolomics. Cell Metabolism. 6 (5), 348-351 (2007).
  3. Fiehn, O. Metabolomics — the link between genotypes and phenotypes. Functional Genomics. Town, C. , Springer. Netherlands. Dordrecht. 155-171 (2002).
  4. Functional Genomics. Town, C. , Springer. Netherlands. Dordrecht. (2002).
  5. Dettmer, K., Aronov, P. A., Hammock, B. D. Mass spectrometry-based metabolomics. Mass Spectrometry Reviews. 26 (1), 51-78 (2007).
  6. Vinayavekhin, N., Saghatelian, A. Untargeted metabolomics. Current Protocols in Molecular Biology. , Chapter 30, Unit 30.1 1-24 (2010).
  7. Chaleckis, R., Meister, I., Zhang, P., Wheelock, C. E. Challenges, progress and promises of metabolite annotation for LC-MS-based metabolomics. Current Opinion in Biotechnology. 55, 44-50 (2019).
  8. Palmer, A., et al. FDR-controlled metabolite annotation for high-resolution imaging mass spectrometry. Nature Methods. 14 (1), 57-60 (2017).
  9. Scheubert, K., et al. Significance estimation for large scale metabolomics annotations by spectral matching. Nature Communications. 8 (1), 1494 (2017).
  10. Schrimpe-Rutledge, A. C., Codreanu, S. G., Sherrod, S. D., McLean, J. A. Untargeted metabolomics strategies-challenges and emerging directions. Journal of the American Society for Mass Spectrometry. 27 (12), 1897-1905 (2016).
  11. Blaženović, I., Kind, T., Ji, J., Fiehn, O. Software tools and approaches for compound identification of LC-MS/MS data in metabolomics. Metabolites. 8 (2), (2018).
  12. Katajamaa, M., Miettinen, J., Oresic, M. MZmine: toolbox for processing and visualization of mass spectrometry based molecular profile data. Bioinformatics. 22 (5), Oxford, England. 634-636 (2006).
  13. Tsugawa, H., et al. Hydrogen rearrangement rules: computational MS/MS fragmentation and structure elucidation using MS-FINDER software. Analytical chemistry. 88 (16), 7946-7958 (2016).
  14. Wang, F., et al. CFM-ID 4.0: More accurate ESI-MS/MS spectral prediction and compound identification. Analytical Chemistry. 93 (34), 11692-11700 (2021).
  15. Ruttkies, C., Schymanski, E. L., Wolf, S., Hollender, J., Neumann, S. MetFrag relaunched: incorporating strategies beyond in silico fragmentation. Journal of Cheminformatics. 8, 3 (2016).
  16. Delabriere, A., Warmer, P., Brennsteiner, V., Zamboni, N. SLAW: A scalable and self-optimizing processing workflow for untargeted LC-MS. Analytical chemistry. 93 (45), 15024-15032 (2021).
  17. Wang, X., et al. Target-decoy-based false discovery rate estimation for large-scale metabolite identification. Journal of Proteome Research. 17 (7), 2328-2334 (2018).
  18. Li, D., et al. XY-Meta: a high-efficiency search engine for large-scale metabolome annotation with accurate FDR estimation. Analytical Chemistry. 92 (8), 5701-5707 (2020).
  19. Wen, B., Mei, Z., Zeng, C., Liu, S. metaX: a flexible and comprehensive software for processing metabolomics data. BMC Bioinformatics. 18 (1), 183 (2017).
  20. Aberg, K. M., Torgrip, R. J. O., Kolmert, J., Schuppe-Koistinen, I., Lindberg, J. Feature detection and alignment of hyphenated chromatographic-mass spectrometric data. Extraction of pure ion chromatograms using Kalman tracking. Journal of Chromatography. A. 1192 (1), 139-146 (2008).
  21. Liu, Q., et al. Addressing the batch effect issue for LC/MS metabolomics data in data preprocessing. Scientific Reports. 10 (1), 13856 (2020).
  22. Han, W., Li, L. Evaluating and minimizing batch effects in metabolomics. Mass Spectrometry Reviews. 41 (3), 421-442 (2022).
  23. Fei, F., Bowdish, D. M. E., McCarry, B. E. Comprehensive and simultaneous coverage of lipid and polar metabolites for endogenous cellular metabolomics using HILIC-TOF-MS. Analytical and Bioanalytical Chemistry. 406 (15), 3723-3733 (2014).
  24. Smith, C. A., Want, E. J., O'Maille, G., Abagyan, R., Siuzdak, G. XCMS: processing mass spectrometry data for metabolite profiling using nonlinear peak alignment, matching, and identification. Analytical Chemistry. 78 (3), 779-787 (2006).
  25. Giacomoni, F., et al. Workflow4Metabolomics: a collaborative research infrastructure for computational metabolomics. Bioinformatics. 31 (9), Oxford, England. 1493-1495 (2015).
  26. Chang, H. -Y., et al. iMet-Q: A user-friendly tool for label-free metabolomics quantitation using dynamic peak-width determination. PloS One. 11 (1), 0146112 (2016).
  27. Wang, M., et al. Sharing and community curation of mass spectrometry data with Global Natural Products Social Molecular Networking. Nature Biotechnology. 34 (8), 828-837 (2016).
  28. Schmid, R., et al. Ion identity molecular networking for mass spectrometry-based metabolomics in the GNPS environment. Nature Communications. 12 (1), 3832 (2021).
  29. Kessner, D., Chambers, M., Burke, R., Agus, D., Mallick, P. ProteoWizard: open source software for rapid proteomics tools development. Bioinformatics. 24 (21), Oxford, England. 2534-2536 (2008).
  30. Johnson, S. R., Lange, B. M. Open-access metabolomics databases for natural product research: present capabilities and future potential. Frontiers in Bioengineering and Biotechnology. 3, 22 (2015).
  31. Horai, H., et al. MassBank: a public repository for sharing mass spectral data for life sciences. Journal of Mass Spectrometry: JMS. 45 (7), 703-714 (2010).
  32. Rawlinson, C., et al. Hierarchical clustering of MS/MS spectra from the firefly metabolome identifies new lucibufagin compounds. Scientific Reports. 10 (1), 6043 (2020).

Tags

생화학 문제 187
FDR 제어 기반 비표적 메타볼로임에 대한 식별 및 정량화의 통합 워크플로우
Play Video
PDF DOI DOWNLOAD MATERIALS LIST

Cite this Article

Li, D., Liang, J., Zhang, Y., Zhang, More

Li, D., Liang, J., Zhang, Y., Zhang, G. An Integrated Workflow of Identification and Quantification on FDR Control-Based Untargeted Metabolome. J. Vis. Exp. (187), e63625, doi:10.3791/63625 (2022).

Less
Copy Citation Download Citation Reprints and Permissions
View Video

Get cutting-edge science videos from JoVE sent straight to your inbox every month.

Waiting X
Simple Hit Counter