Summary
XY-MetaとmetaXを統合した非標的メタボロミクスワークフローを構築しました。このプロトコルでは、XY-Metaを使用してオープンアクセススペクトルリファレンスからデコイスペクトルライブラリを生成する方法を示し、FDR制御を行い、メタボロミクススペクトルを同定した後、metaXを使用して代謝産物を定量しました。
Abstract
非標的メタボロミクス技術は、近年広く使用されている。しかし、スループットとサンプル数の急速な増加は膨大な量のスペクトルを生成し、質量分析スペクトルの品質管理に課題を課しています。誤検知を減らすには、誤検出率(FDR)の品質管理が必要です。最近、我々はXY-Metaという名前のターゲット - デコイ戦略に基づく非標的メタボローム同定のFDR制御のためのソフトウェアを開発しました。ここでは、XY-Meta と metaX を統合する完全な分析パイプラインを示しました。このプロトコルは、XY-metaを使用して既存の参照データベースからおとりデータベースを生成し、オープンアクセスデータセットで大規模なメタボローム同定のためのTarget-Decoy戦略を使用してFDR制御を実行する方法を示しています。示差分析および代謝産物注釈は、代謝産物ピーク検出および定量についてmetaXを実行した後に実施した。より多くの研究者を支援するために、バイオインフォマティクスのスキルやコンピュータ言語を必要とせずに、これらの分析のためのユーザーフレンドリーなクラウドベースの分析プラットフォームも開発しました。
Introduction
代謝産物は、生物学的プロセスにおいて重要な役割を果たしている。代謝産物は、多くの場合、エネルギー移動、ホルモン調節、神経伝達物質の調節、細胞通信、およびタンパク質の翻訳後修飾などの様々なプロセスの調節因子である1,2,3,4。非標的メタボロミクスは、多数の代謝産物5,6のグローバルビューを提供する。質量分析およびクロマトグラフィー技術の進歩に伴い、メタボロームMS/MSスペクトルのスループットは近年急速に増加しています7、8、9、10、11。これらの巨大なデータセットから代謝産物を同定するために、MZmine 12、MS-FINDER 13、CFM-ID 14、MetFrag15、SLAW16など、さまざまな注釈ソフトウェア11が開発されました。ただし、これらの ID には多くの場合、多くの誤検知が含まれています。その理由としては、(1)MS/MSスペクトルにはランダムノイズが含まれており、ピークマッチングを誤解させる可能性があります。(2)異性体および断片化エネルギーの違いは、複数のスペクトルフィンガープリントを引き起こし、したがって参照ライブラリの体積を増加させる。(3) 参照ライブラリの品質はさまざまです。優れたリファレンススペクトルライブラリを構築するための適切な標準が必要です。したがって、非標的メタボロミクスのための系統的偽発見率(FDR)制御は、機能的メタボローム研究に不可欠である7、8、9、17。
経験的ベイズアプローチとターゲット・デコイ戦略はどちらも、FDR制御問題全般に取り組んだ。Kerstin Scheubertらは、フラグメンテーションツリーベースの方法から生成されたおとりデータベース上のターゲット-デコイ戦略がFDR制御9のための最良の方法であることを示した。Xusheng Wangらは、化学におけるオクテット則に基づくおとり生成の方法を設計し、FDR推定の精度を向上させた17。デコイデータベースを生成するためのスペクトルライブラリは、より良いパフォーマンスのために実証されました18。ここでは、スペクトルライブラリベースの手法を改良し、FDR推定の精度をさらに向上させることができるXY-Meta19 というソフトウェアを開発しました。既存の参照スペクトルライブラリを使用して、ターゲット-デコイスキームの下でFDR制御用のデコイライブラリを生成します。XY-Metaは、独自のスペクトルマッチングアルゴリズムとコサイン類似性アルゴリズムをサポートしています。従来の検索モードと反復検索モードが可能です。FDR評価のステップでは、ターゲット - デコイ連結モードと分離モードをサポートしています。柔軟性を高めるために、XY-Meta は外部のおとりライブラリを受け入れます。
代謝産物のピーク検出および定量は、非標的メタボローム分析の重要なステップでもある。ピーク検出は、メタボローム同定の主な方法です。一般に、代謝産物のピーク検出の精度は、質量分析のノイズ信号、代謝産物の存在量の低さ、汚染物質、代謝産物の分解産物などの複数の要因によって影響を受けました20。非標的メタボロームの実験において液体クロマトグラフィーカラムを交換したか又は液体クロマトグラフィーカラムのサンプル数が多すぎると、顕著なバッチ効果が現れることがあり、これはメタボローム定量にとって大きな課題である21、22、23。現在、XCMS 24、Workflow4Metabolomic25、iMet-Q26、metaX19などのソフトウェアは、標的化されていないメタボロームのピーク検出と定量を実行できますが、metaXのパイプラインはより完全で使いやすいことを示唆しています。ここでは、XY-Metaを用いた公開データセットmsv000084112の同定とFDR制御のプロセス、およびmetaXを用いた代謝産物のピーク検出と定量を実演する。このワークフローに必要なのは 2 つのグループのみで、各グループには少なくとも 2 つのサンプルが必要です。質量分析計のプラットフォーム、イオン化モード、充電モード、サンプルタイプに関係なく、MS/MSスペクトルデータが必要であり、サンプルベースの正規化とピークベースの正規化をサポートできます。この例に続いて、研究者は扱いやすい方法でメタボロミクスの同定と定量を行うことができます。このパイプラインを使用するには、R プログラミング機能が必要です。プログラミングの知識のない研究者を支援するために、メタボロミクス分析用のクラウド分析プラットフォームも開発しました。このクラウド分析プラットフォームについては、「補足資料 5」で説明しました。
Subscription Required. Please recommend JoVE to your librarian.
Protocol
1. メタボロミクスデータセットを解析用に準備する
注:このデモでは、QCサンプルなしでメタボロミクスデータセットを使用します。ケース・グループおよび制御グループのデータが必要です。デモンストレーションのために、GNPSデータベース27のパブリックデータセットを使用します。
- Web ページの https://gnps.ucsd.edu/ProteoSAFe/static/gnps-splash.jsp に移動します。[データセットの参照] をクリックします。
- [タイトル] 列でキーワード "msv000084112" を検索します。詳細についてはデータセットID番号をクリックし、FTPを使用してデータセットをダウンロードします。
- 生データをフォルダー /msv000084112 に配置します。
注: このデータセットは、ポジティブ モードで Q Exactive プラットフォーム上の C18 RP-UHPLC を使用して取得されました。尿の代謝の特徴のない疾患を有するコホートを表す試料データは、健常人の33試料、12個のブランク試料、2個の混合試料、および患者28 の82個の試料を含む(補足資料8)。ワークフローを実証するために、対照群として健常者(NH)の6つのサンプルを無作為に選択し、症例群として疾患(NT)を含む6つのサンプルを無作為に選択してワークフローを実行しました。
2. データ形式変換
注: データセットが質量分析計から直接生成された生データである場合、通常は .raw、.wiff、または .cdf 形式です。これらは mzXML および mgf 形式に変換する必要があります。ここでは、ProteoWizard29 パッケージのmsconvertツールを使用してフォーマット変換を行います。
- https://proteowizard.sourceforge.io/download.html からプロテオウィザードをダウンロードし、インストールします。
- ProteoWizard のインストールパスの下にある msconvert.exe を使用してデータ形式を変換します。
- 生データを mzXML 形式に変換して /mzXML フォルダに格納します:/msconvert.exe /raw/*.raw -o /raw/mzXML/ --filter "peakPicking true [1,2]" --filter "zeroSamples removeExtra" --mzML --zlib --mz64 --filter "msLevel 1-2" --filter "titleMaker
. . <充電状態>". - raw/mzXML データを mgf 形式に変換して /mgf フォルダに格納します:/msconvert.exe /msv000084112/*.raw -o /msv000084112/mgf/ --filter "peakPicking true [1,2]" --filter "zeroSamples removeExtra" --mgf --mz64 --filter "msLevel 1-2" --filter "titleMaker
. . .<充電状態>".
- 生データを mzXML 形式に変換して /mzXML フォルダに格納します:/msconvert.exe /raw/*.raw -o /raw/mzXML/ --filter "peakPicking true [1,2]" --filter "zeroSamples removeExtra" --mzML --zlib --mz64 --filter "msLevel 1-2" --filter "titleMaker
3. 代謝産物の参照スペクトルライブラリを準備する
メモ: XY-meta は、mgf 形式のリファレンススペクトルライブラリのみをサポートします。
- Web ページ https://gnps.ucsd.edu/ProteoSAFe/libraries.jsp に移動します。キーワード "NIST" を検索してアイテムを見つけます。[表示 ] をクリックして詳細を確認し、ライブラリをダウンロードします。
注:GNPSパブリックスペクトルライブラリは、タイプ、起源、種、および収集モードに配置された多くの代謝産物ライブラリを収集しました。これらのライブラリのほんの一部だけが標準的な資料を使用して生成されていますが、通常、ほとんどの基礎研究には十分です。 - ダウンロードしたライブラリ GNPS-NIST14-MATCHES.mgf を /database フォルダに入れます。
4. 代謝産物の同定とFDR制御
- XY-meta (Windows 版) をダウンロードします。/XY-Meta-Win/config/ フォルダーの下にあるパラメーター構成ファイル parameter.default を見つけます。 補足資料1に従って内容を変更してください。
注:溶液中では、代謝産物はしばしば陰イオンまたは陽イオンとの付加物を形成し、これは親イオンの質量シフトをもたらす。そのため、付加体の種類を設定する必要がある。イオン交換カラムおよび逆分析カラムの付加物リストを正電荷モードおよび負電荷モードで/adductフォルダに提供しました。ユーザーは、自分の研究プロジェクトに応じて自分の付加物リストを編集することもできます。付加物リストは、指定されたリストと同じ形式にする必要があります。 - XY-Meta:XY-Meta.exe -S /XY-Meta-Win/config/parameter.default -D /msv000084112/ pos_wt-1_a.mgf -R /database/GNPS-NIST14-MATCHES.mgfを使用して、代謝産物の同定とFDR制御を実行します。
メモ: XY-Meta はパラメータのワイルドカードをサポートしていません。したがって、各 mgf ファイルの処理には 1 つのコマンドを使用する必要があります。ファイル数が多い場合は、バッチ ファイルをお勧めします。
5. 微分解析
注: metaX はオープンソースの R パッケージです。https://github.com/wenbostar/metaX のガイドに従ってインストールしてください。この分析には8GBのRAMが必要です。
- sampleList.txt ファイルを編集して、サンプルとそれに対応する MS データを指定します。 補足資料2をご参照ください。
注: metaX は、QC サンプルを含むデータセットの定量分析をサポートしています。QC サンプルを使用する場合は、QC サンプルのクラス プロパティを NA に変更してください。 - 定量分析の結果を格納するための/outputフォルダを作成します。R を使用して 補足資料 3 のスクリプトを実行し、metaX を使用して MOCK グループと WT グループを定量化します。
メモ: 補足資料 3 でスクリプトを実行する前に、スクリプト内のパスを実際のローカル パスに変更してください。
6. 定性的結果と定量的結果の統合
- 補足資料 4 の R スクリプトを実行して、代謝産物の同定を使用した定性的および定量的分析でピークに注釈を付けます。
注: 補足資料 4 のスクリプトを実行する前に、スクリプト内のパスを実際のローカル パスに変更してください。
Subscription Required. Please recommend JoVE to your librarian.
Representative Results
msv000084112の生データは、msconvert.exeによって変換され、mgfファイルが生成されました(補足資料S6)。
XY-Meta は GNPS-NIST14-MATCHES_Decoy.mgf ファイルを /database フォルダの下に生成しました。これは、元の参照スペクトルライブラリGNPS-NIST14-MATCHES.mgfから生成されたデコイライブラリです。このおとりライブラリは再利用できます。このおとりライブラリを再利用するときは、parameter.default ファイルでdecoy_patternを 1 に設定し、decoyinput を decoyy ライブラリの絶対パスとして設定する必要があります。同定結果は、スペクトルマッチングスコア、FDR、代謝産物のm/z、保持時間、および代謝産物の名前を含む/mgfフォルダ(接尾辞.meta付き)の下に生成されました(補足資料7)。
metaXによる定量分析は/outputフォルダにあった。NHとNTの一般的な量的分布は類似しており、平均値の変動は低い(図1A)。欠損値のわずかな部分しかなく、代謝産物の3.39%のみが欠損値の30%以上を有する(図1B)。metaXは、CVが0.3≤代謝産物の割合を著しく増加させた(図1C)。箱ひげ図は /metaX_box フォルダに保存されました。溶出プロファイルは/metaX_eicフォルダに保存されました。代謝産物ピークをmetaX-feature.txtに記録した。両群で同定された代謝産物の定量値および示差分析結果をmetaX_peaks.txtで保存した(図1D)。|のしきい値の適用ログFC|≥1およびp値が0.05<、342の代謝産物が差次的に検出され、206がアップレギュレートされ、136がダウンレギュレートされた(補足資料9)。
我々は、FDR<0.01識別を使用してmetaX検出ピークに注釈を付けた。ピークに複数の代謝産物によって注釈を付けることができる場合、スペクトルマッチングスコアが最も高いものを最終的な注釈として取りました。これらの基準を用いて、我々は6つの示差代謝産物ピークに注釈を付けた(図2)。
図1.メタックスによる定量分析。 (a)全試料の定量化代謝産物の箱ひげ図。(B)欠損値分布のヒストグラム。(C)2つのグループサンプルのPCAプロット。(d)3つの統計的試験方法から差次的に検出された代謝産物のベン図。 この図の拡大版を表示するには、ここをクリックしてください。
図2.すべての注釈付き代謝産物の保持時間(RT)およびm / z分布。 赤い点は、有意かつ差次的に検出された代謝産物を表す。 この図の拡大版を表示するには、ここをクリックしてください。
補足資料1: XY-メタのパラメータファイル。 このファイルをダウンロードするには、ここをクリックしてください。
補足資料2: metaXのサンプルの情報シートをグループ化します。 このファイルをダウンロードするには、ここをクリックしてください。
補足資料3: XY-Meta と metaX のワークフローを統合するためのスクリプト。 このファイルをダウンロードするには、ここをクリックしてください。
補足資料4: メタボローム同定を使用してピークに注釈を付けるためのスクリプト。 このファイルをダウンロードするには、ここをクリックしてください。
補足資料5: クラウドプラットフォームを使用したメタボローム分析のための完全なワークフロー。 このファイルをダウンロードするには、ここをクリックしてください。
補足資料6: msv000084112 のサンプル データ用に msconvert から変換された mgf ファイル。 このファイルをダウンロードするには、ここをクリックしてください。
補足資料7: msv000084112 のサンプル・データに対する XY-Meta からの識別結果表。 このファイルをダウンロードするには、ここをクリックしてください。
補足資料8: msv000084112のコホート臨床情報シート。 このファイルをダウンロードするには、ここをクリックしてください。
補足資料9: 全代謝産物の同定リストおよび全代謝産物ピークの示差分析結果。 このファイルをダウンロードするには、ここをクリックしてください。
Subscription Required. Please recommend JoVE to your librarian.
Discussion
標的とならない代謝産物のFDR制御は大きな課題でした。ここでは、FDRコントロールによる大規模な非標的メタボロミクス分析(定性的および定量的)の完全なパイプラインを実証しました。これにより、MS分析で非常に一般的な誤検知が効果的に減少します。
研究に適したリファレンススペクトルライブラリを準備することは重要なポイントです。MS/MSの識別を成功させるには、適切なマッチングアルゴリズムだけでなく、適切なリファレンススペクトルライブラリも必要です。パブリックスペクトルライブラリの適用可能性は、以下の理由により制限されています:(1)多くのパブリックスペクトルライブラリには完全な代謝産物リストが含まれていません。(2)公共のスペクトルライブラリのスペクトルは、様々なMS機器および/または様々なフラグメンテーション条件に由来する30,31。したがって、標準代謝産物を使用して同じ機器と同じ断片化条件でスペクトルを収集し、「排他的な」スペクトルライブラリを構築することをお勧めします。また、これらの条件は、実際の測定中に維持する必要があります。さらに、パラメータファイルを変更する場合、前駆体イオンとフラグメントイオンの許容誤差は、機器のパラメータと一致する必要があります。通常、前駆体耐性の範囲は 10 ppm ~ 20 ppm で、フラグメント耐性は 0.01 Da ~ 0.5 Daに設定する必要があります。このデータセットでは、計測器のパラメータは不明ですが、0.05Daのフラグメント許容誤差は、このワークフローが正常に実行するための控えめな選択です。
ユーザーがこのパイプラインを実行するときに、さまざまなエラー メッセージが表示されることがあります。よくある間違いには、誤った入力ファイルパス、パラメータファイルの欠落、ファイルアクセスの競合(オペレーティングシステムによるアクセス拒否と同一ファイルの同時アクセスなど)が含まれます。
なお、このワークフローは現在、1,000Da未満の低分子の標的化メタボローム解析および非標的メタボローム解析にのみ適用でき、グリカン鎖や脂質鎖などの高分子のメタボローム解析には使用できません。さらに、データ独立取得(DIA)データとイオンモビリティデータの両方が、このワークフローでの分析には適していません。このワークフローは、ピーク検出結果に注釈を付けるための代謝産物のm/zおよび保持時間の使用をサポートせず、3つ以上のサンプルを含む2つのデータグループの差分分析のみをサポートします。
長い間、ピーク検出技術によって支配される標的化されていないメタボロームの同定結果は、主に多数の代謝異性体および異なるイオン性付加体形態のために、多くの偽陽性を含む傾向があった。代謝産物のMS/MSスペクトルを既知の代謝産物の基準スペクトルと比較すると、代謝産物の構造を分解して異性体を区別することができます32。しかし、代謝産物の参照スペクトルが公にまたは商業的に入手できない場合、代謝産物は同定できない7。したがって、代謝産物参照スペクトルの信頼できるライブラリを構築することは大きな課題です。低品質で類似の構造を持つ基準スペクトルは、実験スペクトルのランダムマッチングをもたらす。したがって、識別結果のFDR制御は、確実な識別を確実にするために必要です。ユーザーはこのパイプラインを使用して、必要な入力データを必要なプロトコルとして提供することにより、FDR制御、定量および差動分析でメタボロームを自動的に識別できます。これは、多くの研究者、特に初心者にとって便利で経済的です。
Subscription Required. Please recommend JoVE to your librarian.
Disclosures
利益相反の禁止。
Acknowledgments
この研究は、国家キー研究開発プログラム(2018YFC0910200/2017YFA0505001)と広東キーR&Dプログラム(2019B020226001)によってサポートされています。
Materials
Name | Company | Catalog Number | Comments |
GNPS | open source | n/a | https://gnps.ucsd.edu/ProteoSAFe/static/gnps-splash.jsp |
XY-Meta | open source | n/a | https://github.com/DLI-ShenZhen/XY-Meta |
metaX | open source | n/a | https://github.com/wenbostar/metaX |
ProteoWizard | Free Download | 3.0.22116.18c918b-x86_64 | https://proteowizard.sourceforge.io/download.html |
CHI.Client | Free Download | ndp48-x86-x64-allos-enu | http://www.chi-biotech.com/technology.html?ty=ypt |
References
- Misra, B. B., Fahrmann, J. F., Grapov, D. Review of emerging metabolomic tools and resources: 2015-2016. Electrophoresis. 38 (18), 2257-2274 (2017).
- Idle, J. R., Gonzalez, F. J. Metabolomics. Cell Metabolism. 6 (5), 348-351 (2007).
- Fiehn, O. Metabolomics — the link between genotypes and phenotypes. Functional Genomics. Town, C. , Springer. Netherlands. Dordrecht. 155-171 (2002).
- Functional Genomics. Town, C. , Springer. Netherlands. Dordrecht. (2002).
- Dettmer, K., Aronov, P. A., Hammock, B. D. Mass spectrometry-based metabolomics. Mass Spectrometry Reviews. 26 (1), 51-78 (2007).
- Vinayavekhin, N., Saghatelian, A. Untargeted metabolomics. Current Protocols in Molecular Biology. , Chapter 30, Unit 30.1 1-24 (2010).
- Chaleckis, R., Meister, I., Zhang, P., Wheelock, C. E. Challenges, progress and promises of metabolite annotation for LC-MS-based metabolomics. Current Opinion in Biotechnology. 55, 44-50 (2019).
- Palmer, A., et al. FDR-controlled metabolite annotation for high-resolution imaging mass spectrometry. Nature Methods. 14 (1), 57-60 (2017).
- Scheubert, K., et al. Significance estimation for large scale metabolomics annotations by spectral matching. Nature Communications. 8 (1), 1494 (2017).
- Schrimpe-Rutledge, A. C., Codreanu, S. G., Sherrod, S. D., McLean, J. A. Untargeted metabolomics strategies-challenges and emerging directions. Journal of the American Society for Mass Spectrometry. 27 (12), 1897-1905 (2016).
- Blaženović, I., Kind, T., Ji, J., Fiehn, O. Software tools and approaches for compound identification of LC-MS/MS data in metabolomics. Metabolites. 8 (2), (2018).
- Katajamaa, M., Miettinen, J., Oresic, M. MZmine: toolbox for processing and visualization of mass spectrometry based molecular profile data. Bioinformatics. 22 (5), Oxford, England. 634-636 (2006).
- Tsugawa, H., et al. Hydrogen rearrangement rules: computational MS/MS fragmentation and structure elucidation using MS-FINDER software. Analytical chemistry. 88 (16), 7946-7958 (2016).
- Wang, F., et al. CFM-ID 4.0: More accurate ESI-MS/MS spectral prediction and compound identification. Analytical Chemistry. 93 (34), 11692-11700 (2021).
- Ruttkies, C., Schymanski, E. L., Wolf, S., Hollender, J., Neumann, S. MetFrag relaunched: incorporating strategies beyond in silico fragmentation. Journal of Cheminformatics. 8, 3 (2016).
- Delabriere, A., Warmer, P., Brennsteiner, V., Zamboni, N. SLAW: A scalable and self-optimizing processing workflow for untargeted LC-MS. Analytical chemistry. 93 (45), 15024-15032 (2021).
- Wang, X., et al. Target-decoy-based false discovery rate estimation for large-scale metabolite identification. Journal of Proteome Research. 17 (7), 2328-2334 (2018).
- Li, D., et al. XY-Meta: a high-efficiency search engine for large-scale metabolome annotation with accurate FDR estimation. Analytical Chemistry. 92 (8), 5701-5707 (2020).
- Wen, B., Mei, Z., Zeng, C., Liu, S. metaX: a flexible and comprehensive software for processing metabolomics data. BMC Bioinformatics. 18 (1), 183 (2017).
- Aberg, K. M., Torgrip, R. J. O., Kolmert, J., Schuppe-Koistinen, I., Lindberg, J. Feature detection and alignment of hyphenated chromatographic-mass spectrometric data. Extraction of pure ion chromatograms using Kalman tracking. Journal of Chromatography. A. 1192 (1), 139-146 (2008).
- Liu, Q., et al. Addressing the batch effect issue for LC/MS metabolomics data in data preprocessing. Scientific Reports. 10 (1), 13856 (2020).
- Han, W., Li, L. Evaluating and minimizing batch effects in metabolomics. Mass Spectrometry Reviews. 41 (3), 421-442 (2022).
- Fei, F., Bowdish, D. M. E., McCarry, B. E. Comprehensive and simultaneous coverage of lipid and polar metabolites for endogenous cellular metabolomics using HILIC-TOF-MS. Analytical and Bioanalytical Chemistry. 406 (15), 3723-3733 (2014).
- Smith, C. A., Want, E. J., O'Maille, G., Abagyan, R., Siuzdak, G. XCMS: processing mass spectrometry data for metabolite profiling using nonlinear peak alignment, matching, and identification. Analytical Chemistry. 78 (3), 779-787 (2006).
- Giacomoni, F., et al. Workflow4Metabolomics: a collaborative research infrastructure for computational metabolomics. Bioinformatics. 31 (9), Oxford, England. 1493-1495 (2015).
- Chang, H. -Y., et al. iMet-Q: A user-friendly tool for label-free metabolomics quantitation using dynamic peak-width determination. PloS One. 11 (1), 0146112 (2016).
- Wang, M., et al. Sharing and community curation of mass spectrometry data with Global Natural Products Social Molecular Networking. Nature Biotechnology. 34 (8), 828-837 (2016).
- Schmid, R., et al. Ion identity molecular networking for mass spectrometry-based metabolomics in the GNPS environment. Nature Communications. 12 (1), 3832 (2021).
- Kessner, D., Chambers, M., Burke, R., Agus, D., Mallick, P. ProteoWizard: open source software for rapid proteomics tools development. Bioinformatics. 24 (21), Oxford, England. 2534-2536 (2008).
- Johnson, S. R., Lange, B. M. Open-access metabolomics databases for natural product research: present capabilities and future potential. Frontiers in Bioengineering and Biotechnology. 3, 22 (2015).
- Horai, H., et al. MassBank: a public repository for sharing mass spectral data for life sciences. Journal of Mass Spectrometry: JMS. 45 (7), 703-714 (2010).
- Rawlinson, C., et al. Hierarchical clustering of MS/MS spectra from the firefly metabolome identifies new lucibufagin compounds. Scientific Reports. 10 (1), 6043 (2020).