Summary
このプロトコルは、指紋を取り入れ、質量分析に結合した包括的な2次元ガスクロマトグラフィーによって収集された多次元データを探索するアプローチを提示する。専用のパターン認識アルゴリズム(テンプレートマッチング)を適用して、エキストラバージンオリーブオイル揮発性分画(すなわち、volatilome)で暗号化された化学情報を探索します。
Abstract
データ処理と評価は、特に質量分析に結合した場合の包括的な2次元ガスクロマトグラフィー(GCxGC)の重要なステップです。データ内で暗号化された情報が豊富な場合、価値は高いが、効率的にアクセスすることは困難です。データ密度と複雑さは、長い精緻化時間を招き、面倒なアナリストに依存する手順を必要とします。したがって、効果的でありながらアクセス可能なデータ処理ツールは、この高度な多次元技術を実験室で日常的に使用するための普及と受け入れを可能にする鍵となります。この研究で提示されるデータ分析プロトコルは、クロマトグラフィーフィンガープリントとテンプレートマッチングを使用して、複雑な2次元クロマトグラムを個々の化学的特徴に高度に自動化して分解し、個々のクロマトグラム内およびクロマトグラムのセット全体にわたる有益なパターンを高度に認識することを達成します。このプロトコルは、ほとんど介入を行う必要なく、高い一貫性と信頼性を提供します。同時に、アナリストの監督は、さまざまなニーズや目標に適応する柔軟性と能力を提供するようにカスタマイズできるさまざまな設定や制約機能で可能です。テンプレートマッチングは、エキストラバージンオリーブオイルボラティロームを探索するための強力なアプローチであることをここに示しています。ピークのクロスアライメントは、既知のターゲットだけでなく、ターゲットを絞らない化合物についても行われ、幅広いアプリケーションの特性評価能力が大幅に向上します。サンプルは、同様の条件下で分析されたサンプルセットからのクロマトグラフィーパターンの分類と比較の性能を証明するために提示される。
Introduction
飛行時間質量分析検出(GC×GC-TOF MS)と組み合わせた包括的な2次元ガスクロマトグラフィーは、今日では、複雑なサンプル1、2、3、4、5の化学特性評価のための最も有益な分析アプローチである。GC×GCでは、列は直列に接続され、第2次元(2D)列に再注入する前に第1次元(1D)カラムから溶出する成分をトラップする変調器(例えば、熱またはバルブベースの焦点合わせインタフェース)によってインターフェースされます。この操作は、一般的に 0.5 ~ 8 s の範囲の固定変調期間(PM)内で行われます。熱変調によって、プロセスは全体的な分離力のためのいくつかの利点を伴う溶出バンドのクライオトラップおよび焦点を含む。
GC×GCは二次元分離技術ですが、このプロセスはシーケンシャルなデータ値を生成します。検出器アナログデジタル(A/D)コンバータは、特定の周波数でクロマトグラフィー信号出力を取得します。その後、データは、デジタル化されたデータだけでなく、関連するメタデータ(データに関する情報)も含む特定の独自の形式で保存されます。GC×GCシステムで採用されているA/Dコンバータは、2つの分析次元における時間の関数として、クロマトグラフィー信号の強度をデジタル番号(DN)にマッピングするのに役立ちます。単一チャネル検出器(例えば、火炎イオン化検出器(FID)、電子捕捉検出器(ECD)、硫黄化学発光検出器(SCDなど)はサンプリング時間ごとに単一値を生成し、多チャンネル検出器(例えば、質量分析検出器(MS))は、サンプリング時間に沿って複数の値(通常はスペクトル範囲を超える)を生成する。
2D データを視覚化するには、単一の変調周期 (またはサイクル) データ値をピクセルの列 (検出器イベントに対応するピクチャエレメント) のラスタライズから始めます。縦座標(Y軸、下から上)に沿って、2D分離時間が可視化されます。ピクセル列は、横(X軸、左から右)が1D分離時間を報告するように順次処理されます。この順序付けでは、2Dデータが右手のデカルト座標系で表され、配列の最初のインデックスとして1D 保持序数が示されます。
2Dクロマトグラムのデータ処理は、生データよりも高いレベルの情報にアクセスし、2Dピーク検出、ピーク識別、定量分析のための応答データの抽出、およびクロス比較分析を可能にします。
2Dのピークパターンは、サンプルのユニークな指紋として扱い、効果的なクロス比較分析のためのminutiae特徴として検出された化合物として扱うことができます。テンプレートベースのフィンガープリント6,7と呼ばれるこのアプローチは、生体認証フィンガープリント6に触発されました。自動生体認証指紋検証システムは、実際には、固有の指先特性に依存しています:尾根分岐と結末、インクされた印象や詳細な画像から局所的かつ抽出。minutiae 機能と呼ばれるこれらの特性は、使用可能な保存されたテンプレート8,9と相互一致します。
前述のように、すべてのGC×GC分離パターンは、2次元平面上に合理的に分布する 2Dピークから構成される。各ピークは単一の分析対象に対応し、その有益な可能性を有し、比較パターン分析のための単一の特徴として扱うことができる。
ここでは、タンデムイオン化を特徴とするGC×GC-TOF MSによる化学フィンガープリントの有効なアプローチを提示する。目標は、クロマトグラムのセットから包括的かつ定量的に機能をカタログ化することです。
既存の商用ソフトウェアや社内ルーチン10,11と比較して、ピーク機能アプローチを採用し、テンプレートベースのフィンガープリントは、高い特異性、効率、および限られた計算時間によって特徴付けられます。また、異なる計装によって獲得されたものとして、または長いフレーム研究12、13、14で、重度の不整列なクロマトグラム間のminutia特徴(すなわち、2Dピーク)の交差整列を可能にする本質的な柔軟性を有する。
提案された方法の基本的な操作は、 読者が2Dパターンの複雑さと情報パワーをよく理解するように導くために簡単に説明されています。次に、機器出力データマトリックスを探索することにより、化学同定が行われ、二次元空間上に位置する既知の標的検体が行われる。その後、目標とするピークのテンプレートが構築され、同じ分析バッチ内で取得された一連のクロマトグラムに適用されます。保持時間、スペクトルシグネチャ、応答(絶対および相対)に関連するメタデータは、ターゲットピークの再整列パターンから抽出され、サンプルセットの組成の違いを明らかにするために採用されます。
プロセスの追加のユニークなステップとして、ターゲットを絞らずに標的を絞った(UT)フィンガープリントを事前に標的化したクロマトグラムに対しても行い、フィンガープリントの可能性を既知の検体と未知のアナライトの両方に拡張します。このプロセスは、大部分が自動化できる真に包括的な比較分析のためのUTテンプレートを作成します。
最後のステップとして、この方法は、高電子イオン化エネルギー(70および12 eV)で生成された2つの並列検出器信号で特徴の交差配向を行う。
このプロトコルは、単一のクロマトグラムまたはクロマトグラムのセットの解析をサポートし、可変クロマトグラフィーおよび/または複数検出器を使用する場合に非常に柔軟です。ここでは、このプロトコルは、市販の GC×GC ソフトウェア スイート (資料表を参照) を MS ライブラリと検索ソフトウェアに組み合わせて示します (資料表を参照)。必要なツールのいくつかは、他のソフトウェアで利用可能であり、同様のツールは、ライヒェンバッハと同僚による文献の説明から独立して実装することができます15,16,17,18,19.デモンストレーションのための生データは、著者の研究室14で行われたエキストラバージンオリーブ(EVO)油に関する研究研究から得られる。特に、イタリアEVOオイルの揮発性分画(すなわち、揮発分)はヘッドスペース固相微小抽出(HS-SPME)によってサンプリングされ、GC×GC-TOF MSによって分析され、サンプルの品質および感覚的資格の診断指紋を捕捉する。サンプル、サンプリング条件、および分析セットアップの詳細については、資料表を参照してください。
ステップ 1 から 6 では、クロマトグラムの前処理について説明します。ステップ7~9では、個々のクロマトグラムの処理と分析について説明します。ステップ 10 から 12 では、クロスサンプル分析の基礎となるテンプレートの作成とマッチングについて説明します。ステップ 13 から 16 では、UT 分析のためのステップ 14 ~ 16 で、一連のクロマトグラムにプロトコルを適用する方法について説明します。
Protocol
1. 生データのインポート
注: これにより、視覚化と処理のための 2 次元ラスター配列が作成されます。
- イメージソフトウェアを起動します。
- ファイル|の選択インポート;に移動し、GC×GC-TOF MS システムによって取得された生データファイルを選択します"ヴァイオリン 101.lsc" (補足ファイル 1);をクリックし、[開く] をクリックします。クロマトグラムは、このソフトウェアで開きます。
メモ:生データファイルの形式は、機器メーカーによって異なります。ソフトウェアは、ユーザーズガイドに記載されているさまざまなファイル形式をインポートします。 - [インポート]ダイアログで、変調周期(PM)を3.5 sに設定します。をクリックし、[OK]をクリックします。
注: 一部の取得ソフトウェアでは、変調期間が記録されない場合があります。 - ファイル|の選択画像を名前で保存します。目的のフォルダに移動します。名前を入力してください "油 1 RAW.gci" (補足ファイル 2);をクリックし、[保存] をクリックします。
2. 変調フェーズのシフト
注:これは、次の変調期間20のボイド時間に変調期間の終わりの周りにラップピークを含む、同じ画像列に各変調サイクルのすべてのピークを置きます。
- 処理|の選択シフトフェーズ。
- [ シフトフェーズ ]ダイアログで、[ シフト量 ]を-0.8 sに設定します。をクリックし 、[OK]をクリックします。
3. ベースライン補正21
- グラフィック|の選択四角形を描画します。
- クリック アンド ドラッグを使用して、ピークが検出されないイメージに四角形を描画します。
- ツール |の選択データの視覚化検出器信号の平均と標準偏差に注意してください, ここで, 21.850 ± 1.455 SDユニットレスデジタル番号 (DN);次に、ツールを閉じます。
- 処理|の選択ベースラインの修正:
4. 値マップとカラーマップを使用したクロマトグラフィー画像のカラーリング20
- [表示] |の選択色付け。
- [ 色分け ]ダイアログで、[ インポート/エクスポート ]タブを選択します。補足資料として提供される #AAAA (補足ファイル 3) カスタム カラー マップを選択します。をクリックし、[ インポート] をクリックします。
- [値マッピング]コントロールで、値の範囲を最小値と最大値に設定します。をクリックし、[OK]をクリックします。
5. 2D ピーク (すなわち、ブロブ) 検出18
- 処理|の選択既定の設定で BLOBを検出します。次に、いくつかのピークが分割され、スプリアス検出があることを観察してください。
- [ 構成|の選択設定|ブロブ検出;次に、最初のディメンションに スムージング を 0.1 に設定し、2 番目のディメンションに 2.0 を設定し、 最小体積 (つまり、合計値のしきい値) を 1.00 E6 に設定します。をクリックし 、[OK]をクリックします。
- 処理|の選択新しい設定で BLOB を検出します。その後、改善を観察します。
6. 2Dピークろ過
注: これは 、1D に沿った列のブリードと 2D に沿ったストライクまたはテーリングによる無意味な検出を自動的に除去するために行われます。
- 処理|の選択対話型 BLOB 検出:
- BLOB 検出設定に注意してください。次に、[ 検出] をクリックします。
- 詳細フィルタビルダで、[追加] をクリックします。次に、[新しい制約] ダイアログで [保持 II]を選択します。をクリックし、[OK]をクリックします。
- 制約スライダーで、フィルターの最小および最大2D 保持時間を設定して、真のピークを失うことなく偽のピークの数を減らします。
- [ 適用] をクリックします。次に、[ はい ] をクリックして、新しいフィルターで検出設定に保存します。
注:イオンピーク検出や共溶出19のデコンボリューションなど、特定の検出の問題に対処するために、より高度なツールが必要になる場合があります。
7. リニア保持インデックスのキャリブレーション
注: このステップ22 (IT) を、一連の保持インデックス (RI) 標準 (通常 は n-アルカン) のセット間で特定の保持時間を実行します。
- [構成|の選択RI テーブル |保持インデックス (Col I)
- [RIテーブルの設定]ダイアログで、[インポート] をクリックします。次に、RI キャリブレーション ファイル (名前、保持期間、および保存インデックスを含む CSV 形式).csv を選択します。
- ファイル|の選択イメージ Aを保存します。目的のフォルダに移動します。名前を入力してください "オイル 1 LRI CALIBRATED.gci" (補足ファイル 5);をクリックし、[保存] をクリックします。
8. NIST17 MSライブラリ23でピークスペクトルを検索する
- [ 構成|の選択設定|検索ライブラリ.
- [検索ライブラリ]ダイアログで、[スペクトルの種類]を[ピーク MS]、[強度しきい値]を100、NIST検索タイプをシンプル(類似度)、NIST RIカラムタイプを標準極値に、NIST RI許容値を10に設定します。をクリックし、[OK]をクリックします。NIST MS Search では、デフォルト設定に設定されているその他の多くの設定が用意されています。
- 処理|の選択すべての BLOB のライブラリを検索します。
9. 検合物の識別を確認し、修正する
- ツール パレットで、カーソル モードを [BLOB |[BLOB]を選択します。
- イメージビューで、目的のピークを右クリックします。
- [BLOB プロパティ] ダイアログ ボックスで、BLOB プロパティを調べます。次に、[ ヒット リスト] をクリックします。
- ヒット リストを調べます。その後、ID が正しくない場合は、正しい ID の横にあるチェックマークを選択します。
- [BLOB プロパティ] ダイアログで、[ グループ名] に化学クラスおよびその他の必要なメタデータを指定します。をクリックし 、[OK]をクリックします。
- ファイル|の選択画像を名前で保存します。目的のフォルダに移動します。名前を入力してください "テンプレート建設.gciのための油1 COLOR化"(補足ファイル6);をクリックし、[保存] をクリックします。
注: このファイルは、手順 10 で開くことができる補足アーカイブに含まれています。
10. 目標とするピーク15のテンプレートを作成する
- イメージ ビュー (手順 9.1 から BLOB の選択 モード) で、最初のピークをクリックして目的のピークを選択し、追加のピークを Ctrl + クリックします 。
- ツール パレットで、[ テンプレートに追加 ] ボタンをクリックします。
- テンプレートが完成したら、[ ファイル] |テンプレートの保存フォルダとファイル名を指定します。をクリックし、[ 保存] をクリックします。
- ファイル|の選択イメージを閉じます。
注: この時点で、これらの手順は、目的のターゲットピークを含むように作成されたテンプレートに続き、「ターゲット tamplate.bt」(補足ファイル 7)として利用できます。
11. テンプレートを一致して適用する
注: マッチングは、検出されたピークのテンプレートパターンを新しいクロマトグラムと認識します。マッチングセットをテンプレートから新しいクロマトグラムに適用します。
- ファイル|の選択画像を開く;に移動し、選択して"油 2 COLORIZED.gci" (補足ファイル 8)クロマトグラム ファイル (前処理されています)。をクリックし、[開く] をクリックします。
- ツール パレットで、カーソル モードを [テンプレート] |に設定します。[ オブジェクト ] を選択します。
- テンプレート |の選択テンプレートを読み込む。
- [ テンプレートの読み込み ] ダイアログで、[ 参照] をクリックします。をクリックして、対象となるピーク テンプレート "対象 template.bt" (補助ファイル 7) を選択します。をクリックし、[ 開く] をクリックします。
- [ テンプレートの読み込み ] ダイアログで、[ ロード] をクリックし、[ 閉じる] をクリックします。
- イメージ ビューで、テンプレートのピークを右クリックします。次に、qCLIC および参照 MS を含むオブジェクトプロパティを検査します。
- テンプレート |の選択インタラクティブ一致と変換テンプレート。
- [インタラクティブマッチ]インタフェースで、[すべて一致]をクリックします。次に、各テンプレートのピークが塗りつぶされていない円でマークされているテーブルとイメージの両方で一致する結果を確認し、一致した場合は検出されたピークの塗りつぶされた円へのリンクがあります。
- 必要に応じて一致を編集します。満足したら、[ 適用 ] をクリックして、メタデータをテンプレートからクロマトグラムに転送します。
注: qCLIC などのマッチング制約は、新しいクロマトグラムの検出されたピークの中で正しいパターンを照合するのに役立ちます。制約パラメーターには、テンプレート参照として使用される MS シグネチャの種類 (ピーク MSまたはBLOB MS)と、スペクトル類似性 (直接一致係数 (DMF) と逆一致係数 (RMF) のしきい値) が含まれます。ここでは、パラメータは、偽陰性の一致を制限する以前の研究13、14に基づいて設定されます:ピークMSとDMFおよびRMF類似性しきい値700。
12. テンプレートを大幅に異なるクロマトグラフィーに変換する
注: このステップは、クロマトグラフィーの条件が大きく変化し、テンプレートが新しいクロマトグラムとずれている場合を除き、必要ではありません。このような場合、テンプレートは、クロマトグラム12、13に適合するようにクロマトグラフィー保持時間平面内で幾何学的に変換することができます。この例では、テンプレートとクロマトグラムのピークパターンは似ていますが、保持時間のジオメトリは異なりますが、異なるクロマトグラフィー条件で見られるような形状が異なります。
- [ 対象テンプレート] 2.bt (補足ファイル 9) に移動、選択、読み込む以外は、手順 11.2 ~ 11.5 を繰り返します。
- テンプレート |の選択インタラクティブマッチテンプレート;をクリックし、[変換の編集] をクリックします。
- 変換テンプレートインターフェイスで、検出されたピークにテンプレートを適切に揃えるために、1D および2D のスケール、変換、およびせん断を変更します。をクリックし、[変換テンプレート] をクリックします。
- 変換されたテンプレートで、[ 一致の編集] をクリックします。その後、ステップ 11.8 ~ 11.9 を繰り返します。
13. 一連のクロマトグラム全体で、対象のない分析とターゲット分析を組み合わせて実行する
注: 対象と対象化されていない (UT) テンプレートを組み合わせたもので、フィーチャテンプレート24,25とも呼ばれ、クロマトグラムのセットと一致すると、ターゲットを絞った対象のアナライトとターゲット化されたアナリテとの間の対応関係が確立され、パターン認識のために一貫したクロスサンプルフィーチャが抽出されます。
- セット内のすべてのクロマトグラム(すなわち、 油の2Dクロマトグラム)に対して、前処理(ステップ1〜6)とUTテンプレートマッチング(ステップ11.1-11.9)を実行します。または、ここで説明しないプロジェクト ソフトウェアまたは類似のソフトウェアを使用してこの手順を自動化します。
- 調査ソフトウェアを起動します。
- ファイル|の選択オープン分析;次に、選択して「フィーチャー・ジョーヴ・ス70 eV.gca」(補足ファイル10)を開きます。
- [OK] をクリックして結果を開いて確認します。
- [ 化合物 ]タブをクリックして、特定の分析対象(すなわち、関連する化学名を持つ標的検体)またはすべてのクロマトグラムに整列した(#)識別子を持つ対象化されていない分析体のメトリック値と統計を確認し、次の手順を実行します。
- [ 属性 ] タブをクリックして、クロマトグラム全体の特定のメトリックの値と統計情報を確認します。
- [ 概要 ]タブをクリックして、コンパウンドとフィーチャの両方の統計情報の概要を確認します。イタリアの2つの異なる地域で収穫されたオリーブから生産されたオイルのように、クロマトグラムが異なるクラスのものである場合、[ 概要] タブにはフィッシャー比統計(FおよびFDR)がリストされ、クラス間を識別するための特徴に関する洞察が得られます。
- すべてのタブでさまざまなグラフを表示し、必要に応じて [属性] タブで主成分分析(PCA)を実行します。
14. 並列 MS 分析用の UT テンプレートを変更する
注:分析は、70 eVと12 eV(すなわち、高低)電子イオン化エネルギー26、27で行った。
- 12 eV クロマトグラムの 1 つを開き、たとえば、「油 1 12 eV RAW.gci」(補足ファイル 11)、前処理を実行し (ステップ 1 ~ 6)、UT テンプレート "UT テンプレート 70 relaxed.bt" ( 補足ファイル 12 ) をロードします (補足ファイル 12) 手順 11.1 - 11.6 に記載されています。ファイルは補足資料として提供されます。
- 必要に応じて、ステップ12で説明したように、検出された12 eVピークに合うようにテンプレートを調整します。タンデム信号が多重化されるため、ここで重要な位置合わせはありません。ただし、異なるイオン化設定では異なるフラグメンテーションが生成されるため、DMF と RMF スペクトルの類似性に関する qCLIC 制約の制約を緩和する必要があります (ここでは示されていません)。
- ファイル|の選択テンプレートの保存フォルダとファイル名を指定します(例えば、「UTテンプレート 12.bt」(補足ファイル13))。をクリックし、[保存] をクリックします。
15. 12 eVクロマトグラムで、対象のない分析とターゲット分析を組み合わせて実行
- ファイル|の選択オープン分析;次に、「フィーチャーJove su 12 eV.gca」を選択して開きます -補足ファイル14ファイルが提供されます。
- [OK] をクリックして結果を開いて確認します。
- [ 化合物 ] タブをクリックして、メトリック値を確認し、特定の分析対象の 12 eV 応答と統計 (つまり、関連する化学名を持つ標的検体) またはすべてのクロマトグラムに整列した (#) 識別子を持つ対象化されていない分析対象の分析体を参照し、次の手順を実行します。
- [ 属性 ] タブをクリックして、クロマトグラム全体の特定のメトリックの値と統計情報を確認します。
- [ 概要 ]タブをクリックして、12 eV のコンパウンドとフィーチャの両方の要約統計量を確認します。イタリアの2つの異なる地域で収穫されたオリーブから生産されたオイルのように、クロマトグラムが異なるクラスのものである場合、[概要]タブにはフィッシャー比統計(FおよびFDR)がリストされ、クラス間を識別するための特徴に関する洞察が得られます。
- すべてのタブで使用可能なさまざまなグラフを表示し、必要に応じて[属性]タブで主成分分析(PCA)を実行します。
Representative Results
GC×GC-TOF MS パターンの高品質エキストラバージンオリーブオイル揮発は、信号対雑音比(SNR)しきい値100を上回る約500 2Dピークを示す。このような閾値は、食品揮発性物質14,27に関する以前の調査によって、閾値を超える最小相対信号として定義され、クロス比較分析のための信頼できるスペクトルを得た。成分は、2つのクロマトグラフィー次元における相対的な保持に応じてクロマトグラフィー空間に分散され、特に1Dの揮発性/極性と2Dの揮発性に基づいています。ここで、カラムの組み合わせは、極×半極(すなわち、カーボロウ20M×OV1701)である。
2Dパターンは、高度な順序を示します。相同系列およびクラスの相対的な保持パターンは、線形飽和炭化水素(黒)、不飽和炭化水素(黄)、線形飽和アルデヒド(青)、一価不飽和アルデヒド(赤)、多価不飽和アルデヒド(サーモン)、一次アルコール(緑)、および短鎖脂肪酸(cyano)の注釈(ピークのグループと気泡のグラフィックス)を持つ図1Aに示されています。
検出 された2Dピークは 、2Dピーク全体(ブロブ スペクトル)または最大スペクトル(頂点 スペクトル)から抽出された平均MSスペクトルを比較することによって識別できます。 図2 は、ブロブ5の 頂点 スペクトル検索の出力を示し 、(E)-2-ヘキセナルの高い類似性の一致(最初の10ヒット)を返します。探索されるデータベースは、メソッドのステップ 8 でアナリストによって事前に選択されたデータベースです。
この ID は、アクティブな保持インデックスによって検証されます。実験IT値は2Dピークについて計算され、この段階ではライブラリ検索が集計I Tのコヒーレント値を持つ結果に優先順位を付ける。許容範囲ウィンドウは、アナリストの経験、定常フェーズに従った参照データベース値の信頼性、および適用される分析条件に基づいてカスタマイズできます。n-アルカンを用いた実験的較正を伴わない線形保持指数のスマートキャリブレーションのための新しいツールが、最近、ライヒェンバッハらの研究で開発され議論されている。
同定された 2Dピーク(すなわち、目標とするピーク)のコレクションは、すべてのサンプルクロマトグラムにわたって同じ化合物間の信頼できる対応を迅速に確立するために、目標とするピークのテンプレートを構築するために採用することができる。ターゲットテンプレートのピークのコレクションを 図 1Bに視覚化します。赤い円は、接続線を持つテンプレートピークにリンクされた2つの内部標準(IS)を含む196のターゲット化合物に対応しています。IS は応答の正規化に使用され、接続線は、含まれている IS のどれが採用され、各 2D ピーク/ブロブ応答を正規化するかを視覚化するのに役立ちます。
図 1Bでは、塗りつぶされた円はテンプレートのピークと実際のパターンの間で正の一致を示し、空の円は対応が検証されなかったテンプレートピークを表します。偽陰性の一致は、しきい値パラメータ、基準スペクトルおよび制約関数13、14、18、19の適切な選択によって制限することができます。複数の共溶出を伴う複雑なパターンの場合、スペクトルデオンボルションに基づくイオンピーク検出関数は推奨され、有効なオプションである可能性があります 19.テンプレートピークメタデータは図1Bの拡大パネル(E)-2-ヘキセナルに示されています。
テンプレートマッチングの特異性は、アルゴリズムの検索ウィンドウ内に収まるMSスペクトル類似性が一定のしきい値を超える候補ピークに対して正の対応を制限する制約関数を適用する可能性に依存します。この場合、ステップ11では、偽陰性一致を制限する最適なパラメータを定義することを目的とした以前の実験に従って類似性閾値23を700に設定した。図 1Bのテンプレートピークプロパティの強調表示された領域は、参照 MS スペクトラム文字列と qCLIC 制約関数 (つまり、(match(
セットのすべてのクロマトグラムにテンプレートを適用することで、パターンの部分的なずれの場合のように困難な状況に遭遇する可能性があります。これは、オーブン温度の不一致、キャリアガスの流れ/圧力不安定性、またはカラム置換またはモジュレーターループキャピラリー置換14、28の場合のようにシステムに手動で介入したためである可能性があります。図3は、対象テンプレートと実際のクロマトグラムとの間の部分的なずれの状況を示しています。最小限のミスアライメントの場合、インタラクティブテンプレート変換 (図 3、コントロール パネル) は、テンプレートのピークを再配置して、より適切に適合させることができます。再配置されると、テンプレートを照合して対応を確立できます。この例では、テンプレート (図 3、ステップ 12) のピークが、実際の2D パターンと正しく一致しています。ここで説明しない重大なミスアライメントの場合、マッチ変換-更新アクションの繰り返しは、テンプレートのピーク位置を実際のピークパターン12、13、14に反復的に適応させることができる。
ここで、標的ピーク(すなわち、既知の検体)は、クロマトグラフィー結果の約40%を提供する(196は平均して約500個の検出可能なピークのピークを対象とする)。化合物の他の60%は、それらが持って来る情報と一緒に、標的分析では考慮されません。調査を真に包括的なものにするためには、対象のない 2Dピークの一貫したクロスアライメントも確立する必要があります。テンプレートマッチングがすべての検出可能な検体に拡張された最初のアプリケーションは、焙煎コーヒー7の複雑な揮発を扱った。このプロセスは、手順 14 ~ 15 で示すソフトウェア (例: 調査担当者) を使用して自動化されます。
このプロセスでは、研究対象のサンプルセットに属する事前ターゲット画像(20サンプル)を用いて、全ての画像パターン29のクロスマッチングにより信頼できるピークを定義する。続いて、コンポジットクロマトグラムが構築され、UT信頼性の高いピークとピーク領域(すなわち 、2Dピークフットプリント)をいわゆる機能テンプレート17で識別できる。
70 eVで取得した解析では、144個の信頼性の高いピークが決定され、信頼性は29、76が目標のピークリストに属します。これらの144の信頼できるピークに基づいて、プロセスは信頼できるピークの平均保持時間と一貫してすべてのクロマトグラムを整列させ、それらを結合して複合クロマトグラムを作成する。 図 4 は、油の生産地域 (左) と各サンプルの信頼性の高いピーク/ブロブボリュームのリスト (右) に従ってラベル付けされたすべてのサンプルのリストを示しています。
対象なしのフィーチャ テンプレートは、図 5Aに示す複合クロマトグラムで検出された検体から検出された2D ピークで構成され、信頼できるピーク テンプレート (n = 168 – ターゲットピークの場合は赤い円、ターゲットを絞ったピークの場合は緑の円) が一致します。複合ピークの質量スペクトルは、それらの保持時間と同様に、拡大領域の(Z)-3-ヘキセノールアセテートに示すように、フィーチャーテンプレートに記録されます。図 5B は、図5Bに赤い色のグラフィックスとしてピーク領域を示しています。これらは、複合クロマトグラムで検出されたすべての2Dピークの輪郭(n = 3578)によって定義されます。
主成分分析による教師なしパターン認識が20の分析されたサンプル内の標的ピーク分布に適用される場合、シチリアとトスカーナの油団団は別々に、ペド気候条件とテロアが揮発性物質の相対的な有病率に影響を与えることを示唆している。結果は 図6A に示されており、信頼性の高いピーク分布からのPCA結果は 図6Bに示されています。2つのアプローチは、異なる地理的領域からの油が異なっていることをクロス検証し、ターゲット化合物またはターゲットでない化合物、またはその両方に関わらず、一貫した化学的シグネチャがマッピングされます。
最後に、ソフトウェアは、並列検出チャネル間でパターンの迅速かつ効果的な再調整を可能にします。本アプリケーションでは、タンデムイオン化信号に対する再配向が提案される。MSの多重化のイオン源は、チャネルあたり50Hz/チャネル30の取得周波数での2つのイオン化エネルギー(すなわち、70および12eV)の間にある。得られた2つのクロマトグラフィーパターンは、スペクトルデータ(すなわち、スペクトルシグネチャおよび応答)が応答26,27の異なる動的範囲を有する相補的な情報をもたらす間に密接に整列される。整列パターンは、単一の ID (すなわち、ターゲットのピークの化学名とターゲットのないピークとピーク領域の一意の番号付け #) を持つ抽出機能(2D ピークとピーク領域) を可能にします。
テンプレートマッチングは効果的なクロスアライメントを可能にします。このような状況では、あまりずれはありませんが、MS 制約を緩和して UT ピークの一致を許可する必要があります。一方、MS 制約のない機能を備えた UT ピーク リージョンは、偽陰性の一致なしですぐに一致します。 図5C は、70 eVデータから構築された機能テンプレートが一致する12eVクロマトグラムの拡大領域を示しています。信頼性の高い UT ピークは、qCLIC 制約が低下するため(たとえば、DMF しきい値が 600 で)正に一致します。なお、12eVでは、低イオン化エネルギーによって誘導される断片化が限定されるため、検出ピークが少なくなる。
図 1: 二次元コンター プロットと対象テンプレート(A)トスカーナ産のエキストラバージンオリーブオイルの揮発性分率の輪郭図。ホモログシリーズとクラスの順序付きパターンは、異なる色と線で強調されています:線形飽和炭化水素(黒線と 2D輪郭)不飽和炭化水素(黄色)、線形飽和アルデヒド(青)モノ不飽和アルデヒド(赤)、多価不飽和アルデヒド(サーモン)、一次アルコール(緑)および短鎖脂肪酸(シアノ)。(B) 内部標準(IS)を結ぶ接続線を持つ既知の検数(赤い色の円)のターゲットテンプレートをオーバーキャインする。パネルには 、2D ピーク/ブロブ プロパティ メタデータ (デカナル) またはテンプレートピーク プロパティが表示されます。 この図の大きなバージョンを表示するには、ここをクリックしてください。
図 2: Apex MS 検索BLOB 5 の頂点 MS 検索の出力。最も類似性の一致が最も高いデータベース エントリのリストと、ライブラリから利用可能な関連メタデータ。 この図の大きなバージョンを表示するには、ここをクリックしてください。
図 3: テンプレートの再調整変換によってテンプレートを再調整する手順を示すワークフロー。 この図の大きなバージョンを表示するには、ここをクリックしてください。
図 4: GC 調査インターフェイス油の生産地域(左)と各サンプルの信頼性の高いピーク/ブロブボリュームのリスト(右)に従ってラベル付けされたすべての選択画像を持つ調査パネル。 この図の大きなバージョンを表示するには、ここをクリックしてください。
図 5: 対象と UT テンプレート(A) ステップ 11 の自動処理による信頼性の高いピーク。赤い円は既知の検地に対応し、緑の円は未知数です。重ね合わせパネルでは、テンプレートオブジェクトのプロパティが(Z)-3-ヘキセナラルに表示されます。(B)UTのピーク(赤と緑の円)とUTテンプレートのピーク領域(赤いグラフィックス)を示す拡大領域は、70 eVイオン化エネルギーで取得したサンプルオイルに一致した。(C)UTテンプレートは、12 eVイオン化エネルギーで取得したサンプルオイルにマッチした。 この図の大きなバージョンを表示するには、ここをクリックしてください。
図6:PCAローディングプロットそれらは(A)標的ピーク分布または(B)UTのピーク分布によって生じるサンプル(トスカーナおよびシチリアからの油)の自然な立体構造を示す。 この図の大きなバージョンを表示するには、ここをクリックしてください。
Discussion
GC×GC-TOF MSデータの可視化は、包括的な二次元分離によって達成された結果を適切に理解するための基本的なステップである。カスタマイズされた着色を使用した画像プロットにより、アナリストは検出器の応答の違い、サンプル成分の差動分布を理解することができます。この視覚的アプローチは、クロマトグラムの解釈と精緻化に関するアナリストの見方を完全に変えます。クロマトグラファーが理解し、自信を持って使用したこの最初のステップは、さらなる処理における新しい視点を開きます。
データ処理のもう 1 つの基本的な側面は、すべてのサンプル ポイントの完全なデータ行列 (MS スペクトル データと応答) へのアクセス性であり、それぞれが単一の検出イベントに対応します。この点で2Dピーク集積は、単一の検体に対応する探知器イベントの収集が重要なステップを表すことをとしている。現在のプロトコルにおいて、2Dピーク検出は、部分的な共溶出化合物の場合の検出感度を改善するために含まれるいくつかの適応を有する流域アルゴリズム18に基づいている。このプロセスをより具体的にするためには、デコンボリューションを行い、より洗練された手順を採用する必要があります。これは、MSデータのイオンピーク検出を実行することで可能です。アルゴリズムはデータ配列を処理し、スペクトルプロファイル19,31に基づいて単一の分析対象から応答を隔離する。
プロトコルの重要でありながら重要なステップであり、GC×GC-MSデータ解釈プロセスの重要なステップは、分析物の同定に関連する。この手順は、手順 8 および 9 で提案され、本物の基準を持つ確認分析がない場合、アナリストが慎重に実行する必要があります。自動化されたアクションは、商用ソフトウェアで使用できます。収集した基準スペクトル(すなわち、スペクトルライブラリ)に対するMSスペクトルシグネチャ類似度評価と、限定/量指定子イオン間の特性比の評価が含まれる。しかし、異性体の識別を明確にするためには、追加の確認基準が必要です。このプロトコルは、候補者のリストに優先順位を付けるために線形保持インデックスの採用を提案しています。ここでの制限は、保持データの可用性と整合性に関連しています。
このアプローチをユニークにする主な特性は、テンプレートマッチング12、13、15、29です。テンプレートマッチングは、非常に効果的で、特定の、直感的な方法で2 Dパターン認識を可能にします。感度と特異性の観点から、カスタマイズされたしきい値や制約関数を適用し、アナリストは変換関数パラメータと対話してプロシージャを監視できます。このプロセスの特異性は、均一なバッチのサンプル間だけでなく、中から重度のミスアライメントにもかかわらず同じ名目条件で取得したサンプル間のターゲットおよびターゲットなしのピーク情報をクロスアライメントする可能性に依存しています。この操作の利点は、アナリストにとって時間のかかる作業であるすべての対象分析対象の分析対象の識別情報、および以前の詳細セッションの対象となるピークと対象なしのピークに対して保存されたすべてのメタデータを保持する可能性に関連しています。
テンプレートマッチングも計算時間の点で非常に効果的です。低解像度の MS データ ファイルは、1 回の分析実行ごとに 10 ~ 15 Gb に達する可能性がある一方、約 1 ~ 2 Gb のパック データで構成されます。テンプレートマッチングは毎回完全なデータ行列を処理しませんが、最初はテンプレートピークを使用してクロマトグラム間の保持時間のアライメントを実行し、検索ウィンドウ内で候補ピークを処理して、テンプレート内の参照との類似性の一致を処理します。深刻な位置合わせの場合、最も困難な状況では、グローバルな二次多項式変換は、計算時間を短縮しながら、ローカルメソッドよりも優れたパフォーマンスを発揮しました13.
GC×GC技術が学術研究機関や研究機関を超えて広く普及するためには、データ処理ツールは可視化とクロマトグラム検査のための基本的な操作を容易にする必要があります。検合物の同定は、標準化されたアルゴリズムと手順(例えば、NIST検索アルゴリズムと IT キャリブレーション)を採用する可能性を提供する必要があります。そして、クロス比較分析は、直感的で効果的で、インタラクティブなツールによってサポートされている必要があります。提案されたアプローチは、これらのニーズに対応しながら、分析物の共溶化、複数の分析物のキャリブレーション、グループタイプ分析、並列検出アライメントなどの複雑な状況に対処するための高度なオプションとツールを提供します。
参考文献は、GC×GC、より一般的には包括的な2次元クロマトグラフィーが、1回の実行分析では達成できないユニークなソリューションと信頼性の高い結果を提供する多くの可能なシナリオをカバーしています。5、32、33 GC×GCは分離容量と感度を高める最も強力なツールですが、分離力、感度、およびその他の全身能力には常に制限があります。これらの系統的限界に近づくと、データ分析は次第に困難になります。したがって、研究開発は、当社の自由に分析ツールを改善し続ける必要があります。
Disclosures
スティーブン・E・ライヒェンバッハ教授と清清桃博士は、GCイメージLLCに財政的利益を持っています。ダニエラ・ペロン博士は、イタリアとフランスのGCイメージのディストリビューターであるSRAインスツルメンツの従業員です。フェデリコ・スティロ博士、キアラ・コルデロ教授、カルロ・ビッキ教授は利益相反はないと宣言しています。
Acknowledgments
研究は、プロゲット・アガー - フォンダツィオーニ・パー・ラ・リセルカ・アグロアリメンタレレによって支えられた。プロジェクト頭字語ヴァイオリン - 革新的な分析ツール(https://olivoeolio.progettoager.it/index.php/i-progetti-olio-e-olivo/violin-valorization-of-italian-olive-products-through-innovative-analytical-tools/violin-il-progetto)を通じてイタリアのオリーブ製品の評価。GC画像ソフトウェアは、プロトコルを実証し、テストしたい読者のための無料トライアルのために利用可能です。
Materials
Name | Company | Catalog Number | Comments |
1D SolGel-Wax column (100% polyethylene glycol; 30 m × 0.25 mm dc × 0.25 μm df). Carrier gas helium at a constant nominal flow of 1.3 mL/min. | Trajan SGE Analytical Science, Ringwood, Australia | PN 054796 | Carrier gas helium at a constant nominal flow of 1.3 mL/min. Oven temperature programming set as follows: 40°C (2 min) to 240°C (10 min) at 3.5°C/min. |
2D OV1701 column (86% polydimethylsiloxane, 7% phenyl, 7% cyanopropyl; 1 m × 0.1 mm dc × 0.10 μm df) from . | Mega, Legnano, Milan, Italy | PN MEGA-1701 | |
Automated system for sample preparation: SPR Autosampler for GC | SepSolve-Analytical, Llantrisant, UK | ||
Extra Virgin Olive oils: Sicily and Tuscany, Italy | Project VIOLIN (Ager - Fondazioni in rete per la ricerca agroalimentare) | Samples (n=10) were collected during the production year 2018 within the "Violin" project sampling campaign. Oils were submitted to HS-SPME to sample volatiles according to a reference protocol validated in a previous study of Stilo et al.14 | |
Gas chromatograph: Model 7890B GC | Agilent Technologies Wilmington DE, USA | ||
GC Image GC×GC edition V 2.9 | GC Image LLC, Lincoln, Nebraska | https://www.gcimage.com/gcxgc/trial.html | |
Image processing software | GC Image LLC, Lincoln, Nebraska | https://www.gcimage.com/gcxgc/trial.html | |
Mass spectrometer: BenchTOF-Select | Markes International Llantrisant, UK | ||
Methyl-2-octynoate (CAS 111-12-6) | Merck-Millipore/Supelco | PN: 68982 | |
Modulator controller: Optimode v2.0 | SRA Intruments, Cernusco sul Naviglio, Milan, Italy | ||
Modulator: KT 2004 loop type | Zoex Corporation Houston, TX, USA | ||
MS library and search software: NIST Library V 2017, Software V 2.3 | National Institute of Standards and Technology (NIST), Gaithersburg MD | https://www.nist.gov/srd/nist-standard-reference-database-1a-v17 | |
n-alkanes C8-C40 for retention indexing | Merck-Millipore/Supelco | PN: 40147-U | |
n-hexane (CAS 110-54-3) gas chromatography MS SupraSolv | Merck-Millipore/Supelco | PN: 100795 | |
Solid Phase Microextraction fiber | Merck-Millipore/Supelco | PN 57914-U | |
α- /β-thujone (CAS 546-80-5) | Merck-Millipore/Sigma Aldrich | PN: 04314 |
References
- Tranchida, P. Q., et al. Potential of comprehensive chromatography in food analysis. Trends in Analytical Chemistry. 52, 186-205 (2013).
- Cordero, C., Kiefl, J., Reichenbach, S. E., Bicchi, C. Characterization of odorant patterns by comprehensive two-dimensional gas chromatography: A challenge in omic studies. Trends in Analytical Chemistry. 113, 364-378 (2019).
- Cordero, C., Kiefl, J., Schieberle, P., Reichenbach, S. E., Bicchi, C. Comprehensive two-dimensional gas chromatography and food sensory properties: potential and challenges. Analytical and Bioanalytical Chemistry. 407, 169-191 (2015).
- Adahchour, M., Beens, J., Vreuls, R. J. J., Brinkman, U. A. T. Recent developments in comprehensive two-dimensional gas chromatography (GC × GC) - Introduction and instrumental set-up. Trends in Analytical Chemistry. 25 (5), 438-454 (2006).
- Prebihalo, S. E., et al. Multidimensional gas chromatography: Advances in instrumentation, chemometrics, and applications. Analytical Chemistry. 90 (1), 505-532 (2018).
- Cordero, C., et al. Profiling food volatiles by comprehensive two-dimensional gas chromatography coupled with mass spectrometry: advanced fingerprinting approaches for comparative analysis of the volatile fraction of roasted hazelnuts (Corylus Avellana L.) from different origins. Journal of Chromatography A. 1217, 5848-5858 (2010).
- Cordero, C., et al. Targeted and non-targeted approaches for complex natural sample profiling by GC×GC-QMS. Journal of Chromatography Sciences. 48 (4), 251-261 (2010).
- Maio, D., Maltoni, D. Direct gray-scale minutiae detection in fingerprints. IEEE Transactions on Pattern Analysis and Machine Intelligence. 19 (1), 27-40 (1997).
- Jain, A. K., Hong, L., Pankanti, S., Bolle, R. An identity-authentication system using fingerprints. Proceedings of IEEE. 85 (9), 1365-1388 (1997).
- Parsons, B. A., et al. Tile-based fisher ratio analysis of comprehensive two-dimensional gas chromatography time-of-flight mass spectrometry (GC × GC-TOFMS) data using a null distribution approach. Analytical Chemistry. 87 (7), 3812-3819 (2015).
- Pierce, K. M., Kehimkar, B., Marney, L. C., Hoggard, J. C., Synovec, R. E. Review of chemometric analysis techniques for comprehensive two dimensional separations data. Journal of Chromatography A. 1255, 3-11 (2012).
- Reichenbach, S. E., et al. Alignment for comprehensive two-dimensional gas chromatography with dual secondary columns and detectors. Analytical Chemistry. 87 (19), 10056-10063 (2015).
- Rempe, D. W., et al. Effectiveness of global, low-degree polynomial transformations for GCxGC data alignment. Analytical Chemistry. 88 (20), 10028-10035 (2016).
- Stilo, F., et al. Untargeted and targeted fingerprinting of extra virgin olive oil volatiles by comprehensive two-dimensional gas chromatography with mass spectrometry: challenges in long-term studies. Journal of Agricultural and Food Chemistry. 67 (18), 5289-5302 (2019).
- Reichenbach, S. E., Carr, P. W., Stoll, D. R., Tao, Q. Smart templates for peak pattern matching with comprehensive two-dimensional liquid chromatography. Journal of Chromatography A. 1216 (16), 3458-3466 (2009).
- Reichenbach, S. E., et al. Informatics for cross-sample analysis with comprehensive two-dimensional gas chromatography and high-resolution mass spectrometry (GCxGC-HRMS). Talanta. 83 (4), 1279-1288 (2011).
- Reichenbach, S. E., Tian, X., Cordero, C., Tao, Q. Features for non-targeted cross-sample analysis with comprehensive two-dimensional chromatography. Journal of Chromatography A. 1226, 140-148 (2012).
- Latha, I., Reichenbach, S. E., Tao, Q. Comparative analysis of peak-detection techniques for comprehensive two-dimensional chromatography. Journal of Chromatography A. 1218 (38), 6792-6798 (2011).
- Reichenbach, S. E., Tao, Q., Cordero, C., Bicchi, C. A data-challenge case study of analyte detection and identification with comprehensive two-dimensional gas chromatography with mass spectrometry (GC×GC-MS). Separations. 6 (3), 38 (2019).
- Reichenbach, S. E. Chapter 4 Data Acquisition, Visualization, and Analysis. Comprehensive Analytical Chemistry. , 77-106 (2009).
- Reichenbach, S. E., Ni, M., Zhang, D., Ledford, E. B. Image background removal in comprehensive two-dimensional gas chromatography. Journal of Chromatography A. 985 (1-2), 47-56 (2003).
- Kratz, P. A Generalization of the retention index system including linear temperature programmed gas-liquid partition chromatography. Journal of Chromatography A. 11, 463-471 (1963).
- NIST Mass Spectrometry Data Center. NIST Standard Reference Database 1A: NIST/EPA/NIH Mass Spectral Library (NIST 08) and NIST Mass Spectral Search Program (Version 2.0f). National Institute of Standards and Technology (NIST). , Gaithersburg MD. (2005).
- Magagna, F., et al. Combined untargeted and targeted fingerprinting with comprehensive two-dimensional chromatography for volatiles and ripening indicators in olive oil. Analytica Chimica Acta. 936, 245-258 (2016).
- Reichenbach, S. E., et al. Benchmarking machine learning methods for comprehensive chemical fingerprinting and pattern recognition. Journal of Chromatography A. 1595, 158-167 (2019).
- Cialiè Rosso, M., et al. Adding extra-dimensions to hazelnuts primary metabolome fingerprinting by comprehensive two-dimensional gas chromatography combined with time-of-flight mass spectrometry featuring tandem ionization: insights on the aroma potential. Journal of Chromatography A. 1614 (460739), 1-11 (2020).
- Cordero, C., et al. Comprehensive two-dimensional gas chromatography coupled with time of flight mass spectrometry featuring tandem ionization: challenges and opportunities for accurate fingerprinting studies. Journal of Chromatography A. 1597, 132-141 (2019).
- Ni, M., Reichenbach, S. E., Visvanathan, A., TerMaat, J., Ledford, E. B. Peak pattern variations related to comprehensive two-dimensional gas chromatography acquisition. Journal of Chromatography A. 1086, 165-170 (2005).
- Reichenbach, S. E., et al. Reliable peak selection for multisample analysis with comprehensive two-dimensional chromatography. Analytical Chemistry. 85 (10), 4974-4981 (2013).
- Markes International. Select-EV: The next Generation of Ion Source Technology. Technical Note. , (2016).
- Tao, Q., Reichenbach, S. E., Heble, C., Wu, Z. New investigator tools for finding unique and common components in multiple samples with comprehensive two-dimensional chromatography. Chromatography Today. , February-March (2018).
- Seeley, J. V., Seeley, S. K. Multidimensional gas chromatography: fundamental advances and new applications. Analytical Chemistry. 85 (2), 557-578 (2013).
- Tranchida, P. Q., Aloisi, I., Giocastro, B., Mondello, L. Current state of comprehensive two-dimensional gas chromatography-mass spectrometry with focus on processes of ionization. Trends in Analytical Chemistry. 105, 360-366 (2018).