Summary
ExCYT は、MATLAB ベース グラフィカル ユーザー インターフェイス (GUI) を介して流れ cytometry データをよく分析できる採用法 t SNE、さまざまな自動および手動による次元圧縮を含む高次元データの解析技術クラスタ リングの方法、ヒートマップなど、および新規高次元フローがプロットされます。
Abstract
流れの cytometers パラメーター数の増加を測定することができるの出現により、科学者たちは、表現型、細胞のサンプルの特性の解明に大きなパネルを開発続けます。しかし、これらの技術の進歩はますます伝統的なゲーティング マニュアル ベースのプログラム内で客観的に分析が困難になっている高次元のデータ セットを得られます。良い分析し、データを表示、するために科学者は流れ cytometry データを解析する高次元データの分析に専門知識を持つ多くのパートナーします。一方、これらのメソッドは、フローサイトメトリーの勉強に非常に貴重なことに示されている、彼らはまだ計算やプログラミングに関する専門知識を欠いている科学者のための簡単で使いやすいパッケージに組み込まれるあります。この必要性に対処するため、MATLAB ベース グラフィカル ユーザー インターフェイス (GUI) 高次元データなどの一般的に使用される分析手法を実装することによって高次元の流れの cytometry のデータの解析を効率化する ExCYT を開発しました。t SNE による次元圧縮、様々 な自動と手動のクラスタ リング方法、ヒートマップなど、新規高次元フローがプロットされます。さらに、ExCYT はさらに t SNE と t SNE プロットに直接ゲートに適用する能力と同様に、分析をクラスタ リングのための興味の選択集団の伝統的なゲート オプションを提供します。ソフトウェアは、いずれかの補償での作業の付加的な利点または非補償 FCS ファイルを提供します。買収後の補償が必要な場合に、汚れの単一のディレクトリと無染色のサンプル プログラムを提供するユーザーを選択できます。プログラムはすべてのチャネルで肯定的なイベントを検出し、このデータの選択を使用してより客観的に補償行列を計算します。要約すると、ExCYT は、FCS ファイルの形で流れ cytometry のデータを取り出して計算トレーニング、そのデータを理解することで最新のアルゴリズムのアプローチを使用するに関係なく、任意の個人を許可する包括的な解析パイプラインを提供します。
Introduction
臨床医と科学者を迅速に特定し、表現型の解像度、大きなを作成する新しいレベルの生物学的および臨床的に興味深いサンプルを特徴付ける質量フローサイトメトリーの出現と同様、フローサイトメトリーの進歩を許可しています。情報豊富な1,2,3は、高次元のデータ設定します。このアプローチは、生成に失敗すること手動ゲートなど流れの cytometry データを分析するための従来の方法は、簡単かつわかりやすくいくつかマーカーがあるこれらのマーカーは、視覚的に認識できる人口を持って実験されているが、高次元データ セットまたはスペクトルに染色マーカーとのそれらを分析する際の再現性のある結果。たとえば、多施設共同研究では、細胞内染色 (ICS) アッセイされて行った特に良い厚生精度、分析、にもかかわらず、抗原特異的 T 細胞応答を量的に表わすの再現性を評価するためにゲート、変動4の重要な源を導入しました。さらに、手動で非常に主観的であることに加え、興味の人口をゲーティングのプロセスは非常に時間のかかる、労働集約的です。ただし、堅牢で効率的、かつタイムリーな方法で高次元のデータ セットを分析の問題は科学研究に新しいものではありません。遺伝子発現研究は多くの場合マニュアル形式の分析を単に実現するだろう (何百もの遺伝子の) 順序よく非常に高次元のデータ セットを生成します。これらのデータ セットの解析に取り組む、遺伝子表現データ5を解析する bioinformatic ツールの開発に多くの仕事がずっとあります。これらのアルゴリズム的な採用しているされて最近フローサイトメトリー データの解析パラメーターの数が増加するいるし、これらの高次元データの6、7の分析で非常に貴重であると証明。
生成アルゴリズムとその流れの cytometry データにこれらの高次元の bioinformatic のアプローチを適用する研究者を許可するソフトウェア パッケージの様々 なアプリケーションにもかかわらず、これらの分析技術まだ主として未使用のまま。さまざまな要因フローサイトメトリー データ8のこれらの手法の普及が限られているかもしれませんが、大きな障害の疑いがある我々 科学者によってこれらの方法を使用して、計算知識の欠如です。実際には、これらのソフトウェア パッケージ (すなわちflowCore、flowMeans、および OpenCyto) の多くはまだ実質的なプログラミング知識を必要とする R など言語をプログラミングで実装に書き込まれます。FlowJo などのソフトウェア パッケージは、PC のオペレーティング システムとの互換性と同様に使用および 'プラグアンド プレイ' 自然のシンプルさのための科学者間の好意を発見しました。ExCYT の最新技術の多くを引っ張る PC/Mac に簡単にインストールできるグラフィカル ユーザー インターフェイス (GUI) を開発した科学者の不慣れなプログラミングに受け入れられ、貴重な分析技術のさまざまなを提供するためにクラスタ リング アルゴリズム ヒートマップなどと小説の高次元フロー/ボックス プロットと直感的な可視化、これらの出力を探索する斬新な機能に沿って、文献で引用されたクラスタ リング手法の様々 な次元圧縮を含みます。
ExCYT は MATLAB に建てられたグラフィカル ユーザー インターフェイスしたがっていずれか MATLAB 内で直接実行または任意の PC/mac にソフトウェアをインストールする使用できるインストーラーはソフトウェアは、https://github.com/sidhomj/ExCYT でご利用いただけます。データをインポート、前処理、t SNE 次元削減、クラスター データ、並べ替えを行うし、ユーザー設定、およびヒートマップなどと小説による関心のクラスターに関する情報を表示に基づくクラスターにフィルターを適用する方法の詳細なプロトコルを提案します。高次元の流れ/ボックス プロット(図 1)。T SNE プロットの軸は任意、任意の単位で、ユーザーの便宜上数字で常に示すように、このようなインタ フェースします。「T SNE ヒートマップなど」内のデータ ポイントの色は青から黄色示されたマーカーの信号に基づいていますです。クラスタ リング ソリューションでは、データ ポイントの色はクラスター数に任意基づきます。ワークフローのすべての部分は、GUI (図 2の単一のパネルで行うことが& テーブル 1)。最後に、以前発行したデータも同様の方法で分析した文献で腎細胞癌の免疫の風景を探索で ExCYT の使用を示します。我々 は本稿で以下のプロトコルとともに、図形を作成する使用されるサンプル データセットは、アカウントを登録する時に、https://premium.cytobank.org/cytobank/projects/875 で見つけることが。
Subscription Required. Please recommend JoVE to your librarian.
Protocol
1. 収集およびフローサイトメトリー データの準備
- 単一のすべての汚れに配置フォルダー自体およびラベルによってチャネル名で (ないマーカーの fluorophore)。
2. データ輸入・前処理
- 一時停止またはこの解析パイプライン全体を保存、作業状態の保存] をクリックしてプログラムの左下でとしてワークスペースを保存する '。マット ' 後負荷ワークスペースボタン経由で読み込むことができるファイルです。プログラムの複数のインスタンスを同時に実行されません。したがって、新しいワークスペースをロードするを実行する ExCYT の他のインスタンスがないことを確認してください。
- 解析パイプラインを開始、まずフローサイトメトリー (フローサイトメトリーまたは質量フローサイトメトリー-CYTOF)、(この例では、「2,000」を使用します) ファイルからサンプルするイベント数を選択するファイル選択パラメーター下タイプを選択します。データが正常にインポートされたら、データが正常にインポートされたことをユーザーに通知するダイアログ ボックスがポップアップ表示されます。
- バグウェル & アダムス9によって行われます、オプションの自動補正ステップを実施する自動補正ボタンを押します。単一の汚れを含むディレクトリを選択します。ユーザー インターフェイスの対話内で無染色のサンプルを選択します。
- 補償行列を計算するイベントの選択に使用するこのディレクトリのサンプルのいずれかを前方・側方散乱ゲートを配置します。無染色のサンプルを使用して、この目的のためにそれをお勧めします。この時点で、それぞれ補償行列を計算する単一の汚れの肯定的なイベントの定義に無染色のサンプルの 99 パーセンタイルで一貫性のあるしきい値を設定するアルゴリズムを実装されています。これが完了したら、ダイアログ ボックスを補償が実行されていることユーザーに通知されます。
- 次に、ゲートの人口を押し、フローサイトメトリー解析フローのコンベンションは、興味のセルの人口を選択します。セルの人口を選択すると、(この 10,000 のイベント) のイベント下流解析のパーセンテージの数値を入力します。
- 次に、処理前のボックスの右端の listbox の解析に使用する番号のチャンネルを選択 (例に示す特定のチャネルを使用して)。
3. t SNE 解析
- プログラムを開始を開始するt SNEボタンを押して t SNE ボタンの下のウィンドウの可視化のための減らされた次元データ セットを計算します。T SNE のイメージを保存するには、恒常的な画像を保存を押します。8 コンピューター @ 10,000 イベント、50,000 イベントの 10 分、20 分 100,000 イベントの約 2 分を取る必要がありますこの手順 8 GM の RAM と 3.4 GHz CPU。
- 'T SNE ヒートマップを作成する'マーカー固有 t SNEポップアップ メニューからオプションをいくつか CYTOF の出版物10,11, 選択に見られるように、(の例で示すように、特定のマーカー CD64 または CD3 を使用)。図図生成のため保存することができます t SNE プロットのヒートマップ形式を示すポップアップ表示されます。
- ゲート t SNEボタンを使用してさらに下流解析のユーザーによって t SNE プロットで関心のある分野を選択します。
4. クラスター分析
- クラスタ リング解析するには、(この例の対話 5 の距離係数を DBSCAN ボックス、リスト ボックスの右側に私たち) でクラスタ リング手法のリスト ボックスで選択します。クラスターのボタンを押します。
- '自動クラスタ リング パラメーター' パネルにある自動クラスタ リング アルゴリズムの次のオプションのいずれかを使用します。
- (T SNE) にハード KMEANS: k-means 減らされた 2次元 t SNE データ クラスタ リングを適用し、アルゴリズム12に提供するクラスターの数が必要です。
- (HD データ) にハード KMEANS: k-means t SNE アルゴリズムに与えられた元の高次元データのクラスタ リングを適用します。もう一度、クラスター数をアルゴリズムに提供する必要があります。
- DBSCAN:クラスタ リングのクラスタ リング手法を適用したノイズ13減少 2 次元 t SNE データをクラスター、無次元距離係数の一般的なサイズを決定する必要がありますアプリケーションの密度に基づく空間的クラスタ リングと呼ばれる、クラスター。この種類のクラスタ リング アルゴリズムは、減らされた t SNE 表現で存在が多い非球状クラスターすることがクラスター t SNE 低減に適して。また、それが 2次元のデータで動作するという事実のために、それは高速クラスタ リング アルゴリズムの 1 つです。
- 階層的クラスタ リング:従来の階層型クラスタ リング手法を高次元データのクラスターのサイズを設定します距離係数アルゴリズムを提供する前にすべてのイベントの間全体のユークリッド距離の行列を計算する場合に適用されます。
- ネットワークのグラフ-ベース: ユーザーが11,14を検出するまれな集団があるとき流れ cytometry データの分析に最も最近導入されているクラスタ リング手法を適用します。このメソッドは、最初にすべてのイベント、データの間の接続を決定するグラフを作成するのに依存します。この手順は、k 最近傍の数は、グラフを作成する最初のパラメーターを提供することで構成されています。このパラメーターには、クラスターのサイズ一般に支配します。この時点で、別のダイアログ ボックスは、グラフに適用されている 5 クラスタ リング アルゴリズムのいずれかを使用するユーザーを尋ねるポップアップします。グラフ、ダン法、スペクトル クラスタ リング アルゴリズム14,15,16,17,18のモジュール性を最大化する 3 つのオプションが含まれます。1 つは、一般的に高速クラスタ リング ソリューションを望んでいる、スペクトラル クラスタ リングまたは高速貪欲なモジュール性最大化をお勧めします。ダン メソッドと一緒にモジュール最大化方法は、クラスターの最適な数を決定する、プログラムに指定するクラスターの数が必要ですスペクトラル クラスタ リングします。
- 自己組織化マップ:高次元のデータをクラスター化する人工ニューラル ネットワークを採用してください。
- GMM-期待値最大化: 高次元のデータをクラスター化する予想最大化 (EM) を用いたガウス混合物モデルを作成します。19クラスタ リング手法のこのタイプはまた、クラスターの番号を入力するユーザーを必要があります。
- 混合ガウス分布モデルの変分ベイズ推定: ガウス混合物モデルを作成が、EM とは異なりそれ自動的に決定できる混合物のコンポーネント ・ k ・20数、プログラムは与えられるクラスター数を必要とする (より大きい、クラスター数を期待されて) アルゴリズムは独自の最適な数を決定します。
- T SNE プロットの特定の領域を研究するには、クラスターのユーザー定義のセットを描画するクラスターを手動で選択ボタンを押します。注記のうち、クラスター メンバー (すなわち、各イベントは、1 クラスターにしか所属できませんが) を共有できません。
5. クラスターろ過
- クラスターのセットいずれかを手動で識別されるまたは上記自動メソッドのいずれかを介してを介して次のようにフィルターすることができます。
- 実験で測定したマーカのいずれかで並べ替えるとクラスター (クラスター フィルタパネル) で、 [並べ替え] ポップアップ メニューからオプションを選択します。順序は昇順または降順かどうかを設定するには、並べ替えポップアップ メニューの右に昇順/降順ボタンを押します。これは 'クラスター (ろ過)' リスト ボックスのクラスターの一覧を更新し、そのマーカーの中央クラスター式の降順に並べ替えます。'クラスター (ろ過)' リスト ボックス内に示された割合は、このクラスターを表す人口の割合を示します。
- 特定のクラスターの最小しきい値を設定すると、特定のチャネルを渡って、するしきい値] ポップアップ メニューからオプションを選択 (この例では私たちマーカー CD65 とセット 0.75 しきい値)。グラフの下の数値ボックスに値を入力または、スライド バーを使用して、しきい値を設定します。しきい値を設定すると、しきい値の方向を指定する上記のしきい値の追加またはしきい値以下の追加を押します。このしきい値を設定すると、一度、ユーザーはどのしきい値が適用されている現在の認識にマーカー、しきい値、および方向が表示されるフィルター ' クラスター パネルの横のしきい値ボックスで表示されます。最後に、ろ過の要件を満たしていないクラスターをぼかしで t SNE プロットが更新され、'クラスター (ろ過)' リスト ボックスは、ろ過の必要条件を満たすクラスターを表示する更新されます。
- クラスターの周波数の最小しきい値を設定するには、クラスターの頻度のしきい値 (%)で数値のカットオフを入力します。(この例の使用 1%) でクラスター フィルタ パネルのボックスです。
6. クラスター解析と可視化
- さらに分析と可視化のためのクラスターを選択するには、クラスター (ろ過)リスト ボックスのクラスターを選択してクラスター分析リスト ボックスに移動するアラカルトの選択ボタンを押してください。
- ヒートマップなどのクラスターを作成するには、クラスター分析リスト ボックスで目的のクラスターを選択し、クラスターのヒートマップボタンを押します。このボタンが押されたとき、図がデンドロ グラム クラスターおよびパラメーター軸上に沿って熱マップを含むポップアップ表示されます。垂直軸のデンドロは水平にデンドロ グラム中は密接に関連するクラスターをグループ化軸は共同に関連付けられたマーカーをグループ化します。ヒートマップを保存するには、ファイルを押します |設定をエクスポート |エクスポートします。
- '高次元ボックス プロット' または '高次元流プロット' を作成するには、クラスター分析リスト ボックスで目的のクラスターを選択し、高次元ボックス プロットボタンまたは高次元の流れ印刷ボタンを押します。これらのプロットの分布を視覚的に評価するために使用できるすべてのディメンションに様々 なクラスターのチャンネルを与えられました。
- 伝統的な二次元流れのプロットにクラスターを表示する変換 (線形、log10、arcsinh) を選択し、従来流プロットパネルとプレスのチャネル従来流プロットします。
Subscription Required. Please recommend JoVE to your librarian.
Representative Results
ExCYT の使いやすさをテストするために行った Chevrierらタイトルの 'の免疫アトラスの明確な腎癌' グループが 73 から採取した腫瘍サンプルの豊富な免疫パネルと CyTOF 分析を実施によって公開された精選されたデータ セット患者11。2 つの独立したパネル、骨髄性とリンパ性のパネルは、腫瘍微小環境を特徴付ける表現型に使用されました。本研究の目的に彼らの t SNE の結果を要約し、クラスター分析、ExCYT が同じ結論に来るだけでなく、可視化とクラスター分析の別の方法が表示される可能性がありますを示すだった。
元の原稿では、グループは、22 T 細胞リンパ球のパネルによって識別される 17 細胞クラスターと骨髄性パネルによって識別されるを記述しました。図 3 ・図 4の文書のグループ表示、クラスターのヒートマップなど t SNE が色分けされたクラスタ リング ソリューションと A、B、および C. サブパネルで t SNE ヒートマップなどプロット分析を実行するために私たちは、各ファイルから 2,000 イベントをサンプリングするや未満 2,000 イベントを持っていた場合次の原稿に示す解析パイプライン ファイル全体を取った Cytobank から手動でゲートのデータを得られます。この時点で私たちの後ゲートのサブサンプリング パラメーターを介して 100,000 イベントの合計をサンプリング、t SNE 解析を行いさまざまな方法でデータを探索するさまざまなクラスタ リング手法を使用します。
まず、t SNE 分析を完了し様々 なマーカー (図 3 a) のヒートマップなどを作成する元の原稿と同じ解析パイプラインを次によって骨髄性のパネルを調べた。元の原稿は、各マーカーの 99 パーセンタイルに t SNE ヒートマップなどを正規化しながら ExCYT は、ヒートマップなどの正規化のこのタイプを実行しません。ただし、マーカーの共同表現の分布が観察された原稿で説明されています。100 k 近い隣人とグラフの作成とグラフを ExCYT、19 の場所の内で高速貪欲な実装を使用してグラフのモジュールを最適化を介してクラスタ リングによるデータをクラスタ リングのネットワーク グラフ ベースの手法を適用し、細胞 (図 3 b) のサブ集団。元の原稿で発行される heatmap で ExCYT によって作成されたこれらのクラスターのヒートマップを比較すると、我々 は骨髄系細胞 (図 3) の同じようなクラスターを識別することができたことを指摘しました。注記のうち、元の原稿は識別され、HLA-DRintCD68intCD64intCD36 によって定義されている我々 の分析で特定した骨髄系の細胞の 2 つのサブ集団は対照的+CD11b+ (クラスター 13) および HLA-DR+CD4+CD68+CD64+CD36 CD11b-- (クラスター 18)。これら 2 つの集団の高次元ボックス プロットによる可視化では、有意差 (マン ・ ホイットニー) 記載されている六つのマーカー (図 1) を明らかにしました。
次に、リンパ ・ パネルより慣習的でより速く階層的クラスタ リングのアプローチを行った。このアプローチには、t SNE ヒートマップなど (図 4 a) 経由で同じようなマーカーの分布が得られました。さらに、階層を介してデータのクラスタ リング リンパ様細胞 (図 4) の類似するクラスターを示した (図 4 b) をクラスタ リングします。注記のうち、私たちはまた CD4 として定義されている元の原稿からユニークな制御性 T 細胞の人口を識別+CD25+Foxp3+ctla の条項 4+CD127- (クラスター 17) を介して我々 の高次元の流れのプロット (図 4)。
最後に、私たちは迅速かつ定量的評価マーカー間の共同の関連付けに ExCYT 内のメソッドを採用したかったです。我々 は二次元 t SNE データ (図 4E) 上の 5,000 のクラスターを置くハード k-means クラスタ リング アルゴリズムを使用して、始めた。これらのすべてのクラスターのすべてのマーカーの中央値式を使用してこれらのクラスター (図 4 階) からヒートマップを作成します。以来、これらのヒートマップなどクラスターの行として列のようなクラスターの細かいメッシュを適用し、ヒートマップを作成データを抽象化することのこの方法で共同の関連付けを簡単にピックアップ、ティム-3 共同協会など PD-1、CD38、できると4-1 BB。
図 1: ExCYT パイプライン & 機能。(A) ExCYT 生 FCS データをインポートする、オプションの補正を適用し、ゲート、下流解析の前にランダムなサブサンプリングを開始。これにより、すべてのイベントが分析対象、分析実験に関連します。t SNE 次元削減はすべてのイベントを表示する実行され、表現型の分布を視覚化する t SNE ヒートマップなどを生成できます。最後に、さまざまなクラスタ リング アルゴリズムは、t SNE 変換または高次元の生データに適用できます。(B)新規の並べ替えとしきい値機能により、すばやく目的のものを見つけるにクラスター数百をソートするユーザーです。(C)クラスターのヒートマップなどは、どのように複数のクラスターが共同するマーカーを関連付けるだけでなく、互いに比較検討する作成できます。(D)背部ゲートのフォームはデータの高次元の自然を鑑賞しながら元のデータのクラスターとしては、新規高次元フロー/ボックス プロットを生成できます。この図の拡大版を表示するのにはここをクリックしてください。
図 2: ExCYT グラフィカル ユーザー インターフェイス:グラフィカル ユーザー インターフェイスを合理化作業フローどおり左からパネルの右側にユーザーのデータをインポート、ExCYT t SNE 次元削減、クラスタ リング、および最終的なクラスター分析と可視化を行っています。この図の拡大版を表示するのにはここをクリックしてください。
図 3: 反復 Chevrierらから骨髄のサブ集団の(A) (D)比較高ネットワーク グラフ クラスタ リング アルゴリズム(C)骨髄性パネル クラスタ リング ソリューションによって識別されるクラスターのヒートマップで符号化された骨髄性パネル色の骨髄性パネル(B) t SNE プロットのトークン t SNE ヒートマップなど比較元の原稿で参照される骨髄性集団 (クラスター 13 & 18) を対照的な三次元のボックス プロットこの図の拡大版を表示するのにはここをクリックしてください。
図 4: 反復 Chevrierらからリンパのサブ集団の(A) (C)ヒートマップ リンパ パネル(D)高次元流れのクラスタ リング ソリューションによって識別されるクラスターの階層的クラスタ リング アルゴリズムで符号化されたリンパのパネルの色のリンパ パネル(B) t SNE プロットのトークン t SNE ヒートマップなど5,000 クラスター ハードの原稿(E)クラスタ リング ソリューションの識別された T 細胞人口 (クラスター 17) のプロット k 平均 t SNE データ リンパに k-平均クラスタ リング ソリューションによって識別されるクラスターの(F)ヒートマップ解析パネル表示マーカーの共同団体。この図の拡大版を表示するのにはここをクリックしてください。
違います。 | 説明 | (GUI) の名前 | |
1 | フローサイトメトリーのタイプを選択します。 | NA | |
2 | Raw データのランダムなサブサンプリング | NA | |
3 | 分析用のファイルを選択します。 | ファイルを選択します。 | |
4 | ソフトウェアに提供される単一の汚れのディレクトリに基づく生データの自動補正 | 自動補正 | |
5 | ゲート t SNE とクラスタ リング解析のためのイベントを選択するには | ゲートの人口 | |
6 | データ (絶対数) をゲートのランダムなサブサンプリング | NA | |
7 | データ (ゲートの人口の %) をゲートのランダムなサブサンプリング | NA | |
8 | 分析のためのチャンネルを選択します。 | NA | |
9 | T SNE 次元削減を実行します。 | t SNE | |
10 | t SNE ウィンドウ | NA | |
11 | ワークスペースを保存します。 | ワークスペースを保存します。 | |
12 | ワークスペースをロードします。 | ワークスペースをロードします。 | |
13 | 選択マーカーを t SNE ヒートマップを作成します。 | NA | |
14 | T SNE をゲートに再選択人口 t SNE 分析を行う | ゲート t SNE | |
15 | T SNE ウィンドウを画像として保存します。 | 恒常的な画像を保存します。 | |
16 | クラスタ リング アルゴリズムを選択します。 | クラスタ リング手法 | |
17 | 指定されたクラスタ リング パラメーターの入力アルゴリズム | NA | |
18 | クラスター分析 | クラスター | |
19 | クラスターを手動で描画します。 | クラスターを手動で選択します。 | |
20 | 明確なすべてのクラスター クラスター分析をやり直すには | クラスターをクリアします。 | |
21 | 現在のフィルター条件の下のクラスターを表示します。 | クラスター (ろ過) | |
22 | クラスター分析のリスト ボックスから [クラスターを削除します。 | 削除 <-- | |
23 | クラスター クラスター分析リスト ボックスを追加します。 | 選択します。 | |
24 | 分析ですべてのイベントの従来のヒートマップを作成します。 | イベントのヒートマップ | |
25 | 並べ替えクラスター マーカーを選択します。 | 並べ替え | |
26 | 選択マーカーでの閾値を設定 | しきい値 | |
27 | クラスター分析のリスト ボックスから [クラスターの従来のヒートマップを作成します。 | クラスターのヒートマップ | |
28 | 並べ替えの順序を反転します。 | 昇順/降順 | |
29 | すべてのしきい値をクリアします。 | すべてのしきい値をクリアします。 | |
30 | クラスターの設定頻度のしきい値 | クラスターの頻度のしきい値 (%) | |
31 | 'のクラスター (ろ過) listbox 上でアクティブな現在のしきい値の一覧 | しきい値 | |
32 | 高次元の箱ひげ図 | 高次元の箱ひげ図 | |
33 | 高次元流れのプロット | 高次元流れのプロット | |
34 | 従来の流れのプロットのための水平軸パラメーター | NA | |
35 | 従来の流れのプロットのための垂直軸パラメーター | NA | |
36 | 水平軸上の従来の流れプロットのためのデータ変換 | NA | |
37 | 垂直軸上の従来の流れプロットのためのデータ変換 | NA | |
38 | 従来のフロー ・ グラフを作成します。 | 従来の流れのプロット | |
39 | 解析のためのクラスターを表示します。 | NA |
表 1: すべての概要機能 ExCYT GUI 内に存在
ソフトウェア ・ パッケージの名前 | ExCYT | チトクローム | FCS エクスプレス | flowCore | openCyto | FlowMeans |
プログラムの種類 | Matlab | Matlab | スタンドアロンのアプリケーション | R | R | R |
ユーザー価格 | 無料 | 無料 | $ 1,000 | 無料 | 無料 | 無料 |
グラフィカル ユーザー インターフェイス | うん | うん | うん | 違います | 違います | 違います |
次元削減手法 | t SNE | t-SNE、PCA | t-SNE、PCA、スペード | どれも | どれも | どれも |
クラスタ リング アルゴリズム | K 手段 DBSCAN 階層的クラスタ リング 自己組織化マップ 複数ネットワーク グラフに基づく法 GMM - EM GMM - 変分ベイズ法 |
K 手段 GMM - EM 単一ネットワーク グラフに基づく法 (Phenograph) |
K 手段 | どれも | 手動ゲート ワークフローの自動化 | K 手段 |
並べ替え/フィルター クラスター機能 | うん | 違います | 違います | 違います | 違います | 違います |
高次元流れのプロット | うん | 違います | 違います | 違います | 違います | 違います |
表 2: ソフトウェア支援フロー フローサイトメトリー解析ソリューションの概要
Subscription Required. Please recommend JoVE to your librarian.
Discussion
ここで提案する高次元データの最新情報を実装するプログラミングの背景を持つ個人を許可する ExCYT、高次元フローサイトメトリー データの分析を合理化するための MATLAB ベースのアルゴリズムを実行する新しいグラフィカル ユーザー インターフェイス解析アルゴリズム。広範な科学コミュニティにこのソフトウェアの可用性は、直感的で簡単なワークフローでは、流れ cytometry データを探検する科学者になります。T SNE 次元削減を実施、クラスタ リング手法を適用すること、できることをして並べ替え/フィルターこれらのクラスターを介して迅速に、柔軟でカスタマイズできるヒートマップなど、高次元の流れ/ボックス プロット、科学者できるようになりますだけでなく、彼らのサンプルで一意に定義された集団を理解するが、直感的で同僚によって理解しやすい視覚エフェクトを作成することができます。
プログラムは、さまざまなデータ型 (従来フローサイトメトリー vs 質量フローサイトメトリー) を処理する柔軟ですが、プログラムの最適なユーティリティのいくつかの考慮事項があります。これらの最初は、流れの cytometry データの具体的には、データの品質についてです。適切な補償と発光スペクトルの重複の解決が最も重要です。不十分な補償のデータ誤ってマーカーの虚偽の共同団体および、真の生物学的意義のないクラスターの形成をもたらします。したがって、入力データは t SNE 解析しさらに下流の分析を進める前に音質のことを強くお勧めです。さらに、ExCYT で実装された自動補正アルゴリズムの使用は、補正パラメーターを正確に計算するためにすべてのチャネルに対する明確な単一汚れを必要です。
ExCYT の使用のもう一つの重要な考慮事項 (本稿で示す) のように 1 つの解析に複数の FCS ファイルを連結するとき、彼らはすべてのチャネルに匹敵する必要があります。まず、これは同じパネルがすべてサンプルとすべてのチャネルにわたってサンプル間のドリフトがない全体で使用する必要があることを意味します。たとえば、1 つは別の日に 2 つのサンプルを読むことが、少し移動した CD8 人口に終って 1 つの日に異なる日が、cytometer の電圧の FITC でステンド グラス CD8 が設定された場合、false クラスターを下流における生成 1 つでした。、このシフトは、楽器の変化と生物学的意義によらない関数として生成されたようです。ExCYT の将来のバージョンは、その単一の汚れにサンプルを正規化できるかもしれないが、この時点では、慎重に検討しなければならないは FCS ファイルは ExCYT にそれらをインポートする前に互いに比較できること。
最後に、クラスタ リングのプロセスは、絶対/剛は 1 つではありません。別のクラスタ リング アルゴリズムとパラメーターは、さまざまなクラスタ リング ソリューションを生成できます。アルゴリズムのソリューションが適切かどうかは、ユーザー クラスタ リング ソリューションと生物学の理解を合成によって決定します。たとえば、腫瘍の免疫環境を理解するとき 1 つ可能性がありますに興味がある巨視的クラスター (すなわち、 T 細胞対 B 対骨髄性細胞) 別は巨視的なクラスターの母集団に興味がある可能性があります。クラスターの解像度は、したがって、1 つは、ユーザーによって決定されます '正しい' はクラスタ リング ソリューションこれは、ExCYT で利用できる高次元流れのプロットを使用しての主な利点の 1 つです。すべてのチャネルにわたって特定のクラスターの分布を視覚化する能力は、彼らの方法が、実験で科学的な質問に関連する方法だけでなく、生物学的関連でクラスター化したかどうかを決定するユーザーを助けることができます。私たちの目標は、クラスタ リングの別の方法を提供しながら高次元流れ cytometry のクラスター データに文献で使用される方法の茄多を提供するためには、お勧めします経由でデータを迅速に探索する k 手段や DBSCAN などのメソッドを使用してクラスター数とサイズ、およびネットワーク グラフとより堅牢なより時間のかかるアプローチのためのガウス混合モデル アプローチに向けた動きの反復。
これらの考慮事項を考えると、ExCYT はまだ高次元フローサイトメトリー データ探索用の非常に柔軟で貴重なツールとその他の利用可能なパッケージのこのタイプの分析(表 2) を実施する利用可能なより/を区別するユニークな機能を提供.まず、ExCYT はほとんど流れフローサイトメトリー解析アプローチ次元削減を活用し、スクリプティング/プログラミング知識がなくても使用することによってクラスタ リング アルゴリズムを自体を区別します。また、文献で引用されて多くのクラスタ リング アルゴリズムを集約することによって我々 はクラスタ リング データのほとんどのオプションを提供すると考えます。最後に、クラスターろ過と新規高次元流プロットを介してディスプレイと一緒に並べ替えの私たちのユニークな機能によりユーザーが迅速かつ効率的に、そのクラスターの特性を探検するまれな「発見」プロセスを作るシンプルで効率的な集団。
Subscription Required. Please recommend JoVE to your librarian.
Disclosures
著者が明らかに何もありません。
Acknowledgments
著者の謝辞があります。
Materials
Name | Company | Catalog Number | Comments |
Desktop | SuperMicro | Custom Build | Computer used to run analysis |
MATLAB | Mathworks | N/A | Software used to develop ExCYT |
References
- Benoist, C., Hacohen, N. Flow cytometry, amped up. Science. 332 (6030), 677-678 (2011).
- Ornatsky, O., et al. Highly multiparametric analysis by mass cytometry. Journal of immunological methods. 361 (1), 1-20 (2010).
- Tanner, S. D., et al. Flow cytometer with mass spectrometer detection for massively multiplexed single-cell biomarker assay. Pure and Applied Chemistry. 80 (12), 2627-2641 (2008).
- Maecker, H. T., et al. Standardization of cytokine flow cytometry assays. BMC immunology. 6 (1), 13 (2005).
- Brazma, A., Vilo, J. Gene expression data analysis. FEBS letters. 480 (1), 17-24 (2000).
- Pyne, S., et al. Automated high-dimensional flow cytometric data analysis. Proceedings of the National Academy of Sciences. 106 (21), 8519-8524 (2009).
- Ge, Y., Sealfon, S. C. flowPeaks: a fast unsupervised clustering for flow cytometry data via K-means and density peak finding. Bioinformatics. 28 (15), 2052-2058 (2012).
- Venkatesh, V. Determinants of perceived ease of use: Integrating control, intrinsic motivation, and emotion into the technology acceptance model. Information systems research. 11 (4), 342-365 (2000).
- Bagwell, C. B., Adams, E. G. Fluorescence spectral overlap compensation for any number of flow cytometry parameters. Annals of the New York Academy of Sciences. 677 (1), 167-184 (1993).
- Lavin, Y., et al. Innate immune landscape in early lung adenocarcinoma by paired single-cell analyses. Cell. 169 (4), 750-765 (2017).
- Chevrier, S., et al. An immune atlas of clear cell renal cell carcinoma. Cell. 169 (4), 736-749 (2017).
- Hartigan, J. A., Wong, M. A. Algorithm AS 136: A k-means clustering algorithm. Journal of the Royal Statistical Society. Series C (Applied Statistics). 28 (1), 100-108 (1979).
- Ester, M., Kriegel, H. P., Sander, J., Xu, X. Density-based spatial clustering of applications with noise. International Conference Knowledge Discovery and Data Mining. 240, (1996).
- Levine, J. H., et al. Data-driven phenotypic dissection of AML reveals progenitor-like cells that correlate with prognosis. Cell. 162 (1), 184-197 (2015).
- Blondel, V. D., Guillaume, J. L., Lambiotte, R., Lefebvre, E. Fast unfolding of communities in large networks. Journal of statistical mechanics: theory and experiment. 2008 (10), P10008 (2008).
- Le Martelot, E., Hankin, C. Fast multi-scale detection of relevant communities in large-scale networks. The Computer Journal. 56 (9), 1136-1150 (2013).
- Newman, M. E. Fast algorithm for detecting community structure in networks. Physical review E. 69 (6), 066133 (2004).
- Hespanha, J. P. An efficient matlab algorithm for graph partitioning. , University of California. 1-8 (2004).
- Moon, T. K. The expectation-maximization algorithm. IEEE Signal processing. 13 (6), 47-60 (1996).
- Bishop, C. M. Pattern recognition and machine learning. , Springer. (2006).