Immunology and Infection

ExCYT: 高次元フローサイトメトリーデータの分析を合理化するためのグラフィカルユーザーインターフェイス

Published: January 16, 2019 doi: 10.3791/57473

John-William Sidhom^1,2,3, Debebe Theodros^1,2,4, Benjamin Murter^1,2, Jelani C. Zarif^1,2, Sudipto Ganguly^1,2, Drew M. Pardoll^1,2, Alexander Baras^1,2,5

¹The Bloomberg~Kimmel Institute for Cancer Immunotherapy, Johns Hopkins University School of Medicine, ²The Sidney Kimmel Comprehensive Cancer Center, Johns Hopkins University School of Medicine, ³Department of Biomedical Engineering, Johns Hopkins University School of Medicine, ⁴Department of Immunology, Johns Hopkins University School of Medicine, ⁵Department of Pathology, Johns Hopkins University School of Medicine

Summary

ExCYT は、MATLAB ベースグラフィカルユーザーインターフェイス (GUI) を介して流れ cytometry データをよく分析できる採用法 t SNE、さまざまな自動および手動による次元圧縮を含む高次元データの解析技術クラスタリングの方法、ヒートマップなど、および新規高次元フローがプロットされます。

Abstract

流れの cytometers パラメーター数の増加を測定することができるの出現により、科学者たちは、表現型、細胞のサンプルの特性の解明に大きなパネルを開発続けます。しかし、これらの技術の進歩はますます伝統的なゲーティングマニュアルベースのプログラム内で客観的に分析が困難になっている高次元のデータセットを得られます。良い分析し、データを表示、するために科学者は流れ cytometry データを解析する高次元データの分析に専門知識を持つ多くのパートナーします。一方、これらのメソッドは、フローサイトメトリーの勉強に非常に貴重なことに示されている、彼らはまだ計算やプログラミングに関する専門知識を欠いている科学者のための簡単で使いやすいパッケージに組み込まれるあります。この必要性に対処するため、MATLAB ベースグラフィカルユーザーインターフェイス (GUI) 高次元データなどの一般的に使用される分析手法を実装することによって高次元の流れの cytometry のデータの解析を効率化する ExCYT を開発しました。t SNE による次元圧縮、様々な自動と手動のクラスタリング方法、ヒートマップなど、新規高次元フローがプロットされます。さらに、ExCYT はさらに t SNE と t SNE プロットに直接ゲートに適用する能力と同様に、分析をクラスタリングのための興味の選択集団の伝統的なゲートオプションを提供します。ソフトウェアは、いずれかの補償での作業の付加的な利点または非補償 FCS ファイルを提供します。買収後の補償が必要な場合に、汚れの単一のディレクトリと無染色のサンプルプログラムを提供するユーザーを選択できます。プログラムはすべてのチャネルで肯定的なイベントを検出し、このデータの選択を使用してより客観的に補償行列を計算します。要約すると、ExCYT は、FCS ファイルの形で流れ cytometry のデータを取り出して計算トレーニング、そのデータを理解することで最新のアルゴリズムのアプローチを使用するに関係なく、任意の個人を許可する包括的な解析パイプラインを提供します。

Introduction

臨床医と科学者を迅速に特定し、表現型の解像度、大きなを作成する新しいレベルの生物学的および臨床的に興味深いサンプルを特徴付ける質量フローサイトメトリーの出現と同様、フローサイトメトリーの進歩を許可しています。情報豊富な¹^,²^,³は、高次元のデータ設定します。このアプローチは、生成に失敗すること手動ゲートなど流れの cytometry データを分析するための従来の方法は、簡単かつわかりやすくいくつかマーカーがあるこれらのマーカーは、視覚的に認識できる人口を持って実験されているが、高次元データセットまたはスペクトルに染色マーカーとのそれらを分析する際の再現性のある結果。たとえば、多施設共同研究では、細胞内染色 (ICS) アッセイされて行った特に良い厚生精度、分析、にもかかわらず、抗原特異的 T 細胞応答を量的に表わすの再現性を評価するためにゲート、変動⁴の重要な源を導入しました。さらに、手動で非常に主観的であることに加え、興味の人口をゲーティングのプロセスは非常に時間のかかる、労働集約的です。ただし、堅牢で効率的、かつタイムリーな方法で高次元のデータセットを分析の問題は科学研究に新しいものではありません。遺伝子発現研究は多くの場合マニュアル形式の分析を単に実現するだろう (何百もの遺伝子の) 順序よく非常に高次元のデータセットを生成します。これらのデータセットの解析に取り組む、遺伝子表現データ⁵を解析する bioinformatic ツールの開発に多くの仕事がずっとあります。これらのアルゴリズム的な採用しているされて最近フローサイトメトリーデータの解析パラメーターの数が増加するいるし、これらの高次元データの⁶^、⁷の分析で非常に貴重であると証明。

生成アルゴリズムとその流れの cytometry データにこれらの高次元の bioinformatic のアプローチを適用する研究者を許可するソフトウェアパッケージの様々なアプリケーションにもかかわらず、これらの分析技術まだ主として未使用のまま。さまざまな要因フローサイトメトリーデータ⁸のこれらの手法の普及が限られているかもしれませんが、大きな障害の疑いがある我々科学者によってこれらの方法を使用して、計算知識の欠如です。実際には、これらのソフトウェアパッケージ (すなわちflowCore、flowMeans、および OpenCyto) の多くはまだ実質的なプログラミング知識を必要とする R など言語をプログラミングで実装に書き込まれます。FlowJo などのソフトウェアパッケージは、PC のオペレーティングシステムとの互換性と同様に使用および 'プラグアンドプレイ' 自然のシンプルさのための科学者間の好意を発見しました。ExCYT の最新技術の多くを引っ張る PC/Mac に簡単にインストールできるグラフィカルユーザーインターフェイス (GUI) を開発した科学者の不慣れなプログラミングに受け入れられ、貴重な分析技術のさまざまなを提供するためにクラスタリングアルゴリズムヒートマップなどと小説の高次元フロー/ボックスプロットと直感的な可視化、これらの出力を探索する斬新な機能に沿って、文献で引用されたクラスタリング手法の様々な次元圧縮を含みます。

ExCYT は MATLAB に建てられたグラフィカルユーザーインターフェイスしたがっていずれか MATLAB 内で直接実行または任意の PC/mac にソフトウェアをインストールする使用できるインストーラーはソフトウェアは、https://github.com/sidhomj/ExCYT でご利用いただけます。データをインポート、前処理、t SNE 次元削減、クラスターデータ、並べ替えを行うし、ユーザー設定、およびヒートマップなどと小説による関心のクラスターに関する情報を表示に基づくクラスターにフィルターを適用する方法の詳細なプロトコルを提案します。高次元の流れ/ボックスプロット(図 1)。T SNE プロットの軸は任意、任意の単位で、ユーザーの便宜上数字で常に示すように、このようなインタフェースします。「T SNE ヒートマップなど」内のデータポイントの色は青から黄色示されたマーカーの信号に基づいていますです。クラスタリングソリューションでは、データポイントの色はクラスター数に任意基づきます。ワークフローのすべての部分は、GUI (図 2の単一のパネルで行うことが& テーブル 1)。最後に、以前発行したデータも同様の方法で分析した文献で腎細胞癌の免疫の風景を探索で ExCYT の使用を示します。我々は本稿で以下のプロトコルとともに、図形を作成する使用されるサンプルデータセットは、アカウントを登録する時に、https://premium.cytobank.org/cytobank/projects/875 で見つけることが。

Subscription Required. Please recommend JoVE to your librarian.

Protocol

1. 収集およびフローサイトメトリーデータの準備

単一のすべての汚れに配置フォルダー自体およびラベルによってチャネル名で (ないマーカーの fluorophore)。

2. データ輸入・前処理

一時停止またはこの解析パイプライン全体を保存、作業状態の保存] をクリックしてプログラムの左下でとしてワークスペースを保存する '。マット ' 後負荷ワークスペースボタン経由で読み込むことができるファイルです。プログラムの複数のインスタンスを同時に実行されません。したがって、新しいワークスペースをロードするを実行する ExCYT の他のインスタンスがないことを確認してください。
解析パイプラインを開始、まずフローサイトメトリー (フローサイトメトリーまたは質量フローサイトメトリー-CYTOF)、(この例では、「2,000」を使用します) ファイルからサンプルするイベント数を選択するファイル選択パラメーター下タイプを選択します。データが正常にインポートされたら、データが正常にインポートされたことをユーザーに通知するダイアログボックスがポップアップ表示されます。
バグウェル & アダムス⁹によって行われます、オプションの自動補正ステップを実施する自動補正ボタンを押します。単一の汚れを含むディレクトリを選択します。ユーザーインターフェイスの対話内で無染色のサンプルを選択します。
1. 補償行列を計算するイベントの選択に使用するこのディレクトリのサンプルのいずれかを前方・側方散乱ゲートを配置します。無染色のサンプルを使用して、この目的のためにそれをお勧めします。この時点で、^{それぞれ補償行列を計算する単一の汚れの肯定的なイベントの定義に無染色のサンプルの 99 パーセンタイル}で一貫性のあるしきい値を設定するアルゴリズムを実装されています。これが完了したら、ダイアログボックスを補償が実行されていることユーザーに通知されます。
次に、ゲートの人口を押し、フローサイトメトリー解析フローのコンベンションは、興味のセルの人口を選択します。セルの人口を選択すると、(この 10,000 のイベント) のイベント下流解析のパーセンテージの数値を入力します。
次に、処理前のボックスの右端の listbox の解析に使用する番号のチャンネルを選択 (例に示す特定のチャネルを使用して)。

3. t SNE 解析

プログラムを開始を開始するt SNEボタンを押して t SNE ボタンの下のウィンドウの可視化のための減らされた次元データセットを計算します。T SNE のイメージを保存するには、恒常的な画像を保存を押します。8 コンピューター @ 10,000 イベント、50,000 イベントの 10 分、20 分 100,000 イベントの約 2 分を取る必要がありますこの手順 8 GM の RAM と 3.4 GHz CPU。
'T SNE ヒートマップを作成する'マーカー固有 t SNEポップアップメニューからオプションをいくつか CYTOF の出版物¹⁰^,¹¹, 選択に見られるように、(の例で示すように、特定のマーカー CD64 または CD3 を使用)。図図生成のため保存することができます t SNE プロットのヒートマップ形式を示すポップアップ表示されます。
ゲート t SNEボタンを使用してさらに下流解析のユーザーによって t SNE プロットで関心のある分野を選択します。

4. クラスター分析

クラスタリング解析するには、(この例の対話 5 の距離係数を DBSCAN ボックス、リストボックスの右側に私たち) でクラスタリング手法のリストボックスで選択します。クラスターのボタンを押します。
'自動クラスタリングパラメーター' パネルにある自動クラスタリングアルゴリズムの次のオプションのいずれかを使用します。
1. (T SNE) にハード KMEANS: k-means 減らされた 2次元 t SNE データクラスタリングを適用し、アルゴリズム¹²に提供するクラスターの数が必要です。
2. (HD データ) にハード KMEANS: k-means t SNE アルゴリズムに与えられた元の高次元データのクラスタリングを適用します。もう一度、クラスター数をアルゴリズムに提供する必要があります。
3. DBSCAN:クラスタリングのクラスタリング手法を適用したノイズ¹³減少 2 次元 t SNE データをクラスター、無次元距離係数の一般的なサイズを決定する必要がありますアプリケーションの密度に基づく空間的クラスタリングと呼ばれる、クラスター。この種類のクラスタリングアルゴリズムは、減らされた t SNE 表現で存在が多い非球状クラスターすることがクラスター t SNE 低減に適して。また、それが 2次元のデータで動作するという事実のために、それは高速クラスタリングアルゴリズムの 1 つです。
4. 階層的クラスタリング:従来の階層型クラスタリング手法を高次元データのクラスターのサイズを設定します距離係数アルゴリズムを提供する前にすべてのイベントの間全体のユークリッド距離の行列を計算する場合に適用されます。
5. ネットワークのグラフ-ベース: ユーザーが¹¹^,¹⁴を検出するまれな集団があるとき流れ cytometry データの分析に最も最近導入されているクラスタリング手法を適用します。このメソッドは、最初にすべてのイベント、データの間の接続を決定するグラフを作成するのに依存します。この手順は、k 最近傍の数は、グラフを作成する最初のパラメーターを提供することで構成されています。このパラメーターには、クラスターのサイズ一般に支配します。この時点で、別のダイアログボックスは、グラフに適用されている 5 クラスタリングアルゴリズムのいずれかを使用するユーザーを尋ねるポップアップします。グラフ、ダン法、スペクトルクラスタリングアルゴリズム¹⁴^,¹⁵^,¹⁶^,¹⁷^,¹⁸のモジュール性を最大化する 3 つのオプションが含まれます。1 つは、一般的に高速クラスタリングソリューションを望んでいる、スペクトラルクラスタリングまたは高速貪欲なモジュール性最大化をお勧めします。ダンメソッドと一緒にモジュール最大化方法は、クラスターの最適な数を決定する、プログラムに指定するクラスターの数が必要ですスペクトラルクラスタリングします。
6. 自己組織化マップ:高次元のデータをクラスター化する人工ニューラルネットワークを採用してください。
7. GMM-期待値最大化: 高次元のデータをクラスター化する予想最大化 (EM) を用いたガウス混合物モデルを作成します。¹⁹クラスタリング手法のこのタイプはまた、クラスターの番号を入力するユーザーを必要があります。
8. 混合ガウス分布モデルの変分ベイズ推定: ガウス混合物モデルを作成が、EM とは異なりそれ自動的に決定できる混合物のコンポーネント・ k ・²⁰数、プログラムは与えられるクラスター数を必要とする (より大きい、クラスター数を期待されて) アルゴリズムは独自の最適な数を決定します。
T SNE プロットの特定の領域を研究するには、クラスターのユーザー定義のセットを描画するクラスターを手動で選択ボタンを押します。注記のうち、クラスターメンバー (すなわち、各イベントは、1 クラスターにしか所属できませんが) を共有できません。

5. クラスターろ過

クラスターのセットいずれかを手動で識別されるまたは上記自動メソッドのいずれかを介してを介して次のようにフィルターすることができます。
1. 実験で測定したマーカのいずれかで並べ替えるとクラスター (クラスターフィルタパネル) で、 [並べ替え] ポップアップメニューからオプションを選択します。順序は昇順または降順かどうかを設定するには、並べ替えポップアップメニューの右に昇順/降順ボタンを押します。これは 'クラスター (ろ過)' リストボックスのクラスターの一覧を更新し、そのマーカーの中央クラスター式の降順に並べ替えます。'クラスター (ろ過)' リストボックス内に示された割合は、このクラスターを表す人口の割合を示します。
2. 特定のクラスターの最小しきい値を設定すると、特定のチャネルを渡って、するしきい値] ポップアップメニューからオプションを選択 (この例では私たちマーカー CD65 とセット 0.75 しきい値)。グラフの下の数値ボックスに値を入力または、スライドバーを使用して、しきい値を設定します。しきい値を設定すると、しきい値の方向を指定する上記のしきい値の追加またはしきい値以下の追加を押します。このしきい値を設定すると、一度、ユーザーはどのしきい値が適用されている現在の認識にマーカー、しきい値、および方向が表示されるフィルター ' クラスターパネルの横のしきい値ボックスで表示されます。最後に、ろ過の要件を満たしていないクラスターをぼかしで t SNE プロットが更新され、'クラスター (ろ過)' リストボックスは、ろ過の必要条件を満たすクラスターを表示する更新されます。
3. クラスターの周波数の最小しきい値を設定するには、クラスターの頻度のしきい値 (%)で数値のカットオフを入力します。(この例の使用 1%) でクラスターフィルタパネルのボックスです。

6. クラスター解析と可視化

さらに分析と可視化のためのクラスターを選択するには、クラスター (ろ過)リストボックスのクラスターを選択してクラスター分析リストボックスに移動するアラカルトの選択ボタンを押してください。
ヒートマップなどのクラスターを作成するには、クラスター分析リストボックスで目的のクラスターを選択し、クラスターのヒートマップボタンを押します。このボタンが押されたとき、図がデンドログラムクラスターおよびパラメーター軸上に沿って熱マップを含むポップアップ表示されます。垂直軸のデンドロは水平にデンドログラム中は密接に関連するクラスターをグループ化軸は共同に関連付けられたマーカーをグループ化します。ヒートマップを保存するには、ファイルを押します |設定をエクスポート |エクスポートします。
'高次元ボックスプロット' または '高次元流プロット' を作成するには、クラスター分析リストボックスで目的のクラスターを選択し、高次元ボックスプロットボタンまたは高次元の流れ印刷ボタンを押します。これらのプロットの分布を視覚的に評価するために使用できるすべてのディメンションに様々なクラスターのチャンネルを与えられました。
伝統的な二次元流れのプロットにクラスターを表示する変換 (線形、log10、arcsinh) を選択し、従来流プロットパネルとプレスのチャネル従来流プロットします。

Subscription Required. Please recommend JoVE to your librarian.

Representative Results

ExCYT の使いやすさをテストするために行った Chevrierらタイトルの 'の免疫アトラスの明確な腎癌' グループが 73 から採取した腫瘍サンプルの豊富な免疫パネルと CyTOF 分析を実施によって公開された精選されたデータセット患者¹¹。2 つの独立したパネル、骨髄性とリンパ性のパネルは、腫瘍微小環境を特徴付ける表現型に使用されました。本研究の目的に彼らの t SNE の結果を要約し、クラスター分析、ExCYT が同じ結論に来るだけでなく、可視化とクラスター分析の別の方法が表示される可能性がありますを示すだった。

元の原稿では、グループは、22 T 細胞リンパ球のパネルによって識別される 17 細胞クラスターと骨髄性パネルによって識別されるを記述しました。図 3 ・図 4の文書のグループ表示、クラスターのヒートマップなど t SNE が色分けされたクラスタリングソリューションと A、B、および C. サブパネルで t SNE ヒートマップなどプロット分析を実行するために私たちは、各ファイルから 2,000 イベントをサンプリングするや未満 2,000 イベントを持っていた場合次の原稿に示す解析パイプラインファイル全体を取った Cytobank から手動でゲートのデータを得られます。この時点で私たちの後ゲートのサブサンプリングパラメーターを介して 100,000 イベントの合計をサンプリング、t SNE 解析を行いさまざまな方法でデータを探索するさまざまなクラスタリング手法を使用します。

まず、t SNE 分析を完了し様々なマーカー (図 3 a) のヒートマップなどを作成する元の原稿と同じ解析パイプラインを次によって骨髄性のパネルを調べた。元の原稿は、^{各マーカーの 99 パーセンタイル}に t SNE ヒートマップなどを正規化しながら ExCYT は、ヒートマップなどの正規化のこのタイプを実行しません。ただし、マーカーの共同表現の分布が観察された原稿で説明されています。100 k 近い隣人とグラフの作成とグラフを ExCYT、19 の場所の内で高速貪欲な実装を使用してグラフのモジュールを最適化を介してクラスタリングによるデータをクラスタリングのネットワークグラフベースの手法を適用し、細胞 (図 3 b) のサブ集団。元の原稿で発行される heatmap で ExCYT によって作成されたこれらのクラスターのヒートマップを比較すると、我々は骨髄系細胞 (図 3) の同じようなクラスターを識別することができたことを指摘しました。注記のうち、元の原稿は識別され、HLA-DR^intCD68^intCD64^intCD36 によって定義されている我々の分析で特定した骨髄系の細胞の 2 つのサブ集団は対照的⁺CD11b⁺ (クラスター 13) および HLA-DR⁺CD4⁺CD68⁺CD64⁺CD36 CD11b^-^- (クラスター 18)。これら 2 つの集団の高次元ボックスプロットによる可視化では、有意差 (マン・ホイットニー) 記載されている六つのマーカー (図 1) を明らかにしました。

次に、リンパ・パネルより慣習的でより速く階層的クラスタリングのアプローチを行った。このアプローチには、t SNE ヒートマップなど (図 4 a) 経由で同じようなマーカーの分布が得られました。さらに、階層を介してデータのクラスタリングリンパ様細胞 (図 4) の類似するクラスターを示した (図 4 b) をクラスタリングします。注記のうち、私たちはまた CD4 として定義されている元の原稿からユニークな制御性 T 細胞の人口を識別⁺CD25⁺Foxp3⁺ctla の条項 4⁺CD127^- (クラスター 17) を介して我々の高次元の流れのプロット (図 4)。

最後に、私たちは迅速かつ定量的評価マーカー間の共同の関連付けに ExCYT 内のメソッドを採用したかったです。我々は二次元 t SNE データ (図 4E) 上の 5,000 のクラスターを置くハード k-means クラスタリングアルゴリズムを使用して、始めた。これらのすべてのクラスターのすべてのマーカーの中央値式を使用してこれらのクラスター (図 4 階) からヒートマップを作成します。以来、これらのヒートマップなどクラスターの行として列のようなクラスターの細かいメッシュを適用し、ヒートマップを作成データを抽象化することのこの方法で共同の関連付けを簡単にピックアップ、ティム-3 共同協会など PD-1、CD38、できると4-1 BB。

図 1: ExCYT パイプライン & 機能。(A) ExCYT 生 FCS データをインポートする、オプションの補正を適用し、ゲート、下流解析の前にランダムなサブサンプリングを開始。これにより、すべてのイベントが分析対象、分析実験に関連します。t SNE 次元削減はすべてのイベントを表示する実行され、表現型の分布を視覚化する t SNE ヒートマップなどを生成できます。最後に、さまざまなクラスタリングアルゴリズムは、t SNE 変換または高次元の生データに適用できます。(B)新規の並べ替えとしきい値機能により、すばやく目的のものを見つけるにクラスター数百をソートするユーザーです。(C)クラスターのヒートマップなどは、どのように複数のクラスターが共同するマーカーを関連付けるだけでなく、互いに比較検討する作成できます。(D)背部ゲートのフォームはデータの高次元の自然を鑑賞しながら元のデータのクラスターとしては、新規高次元フロー/ボックスプロットを生成できます。この図の拡大版を表示するのにはここをクリックしてください。

図 2: ExCYT グラフィカルユーザーインターフェイス:グラフィカルユーザーインターフェイスを合理化作業フローどおり左からパネルの右側にユーザーのデータをインポート、ExCYT t SNE 次元削減、クラスタリング、および最終的なクラスター分析と可視化を行っています。この図の拡大版を表示するのにはここをクリックしてください。

図 3: 反復 Chevrierらから骨髄のサブ集団の(A) (D)比較高ネットワークグラフクラスタリングアルゴリズム(C)骨髄性パネルクラスタリングソリューションによって識別されるクラスターのヒートマップで符号化された骨髄性パネル色の骨髄性パネル(B) t SNE プロットのトークン t SNE ヒートマップなど比較元の原稿で参照される骨髄性集団 (クラスター 13 & 18) を対照的な三次元のボックスプロットこの図の拡大版を表示するのにはここをクリックしてください。

図 4: 反復 Chevrierらからリンパのサブ集団の(A) (C)ヒートマップリンパパネル(D)高次元流れのクラスタリングソリューションによって識別されるクラスターの階層的クラスタリングアルゴリズムで符号化されたリンパのパネルの色のリンパパネル(B) t SNE プロットのトークン t SNE ヒートマップなど5,000 クラスターハードの原稿(E)クラスタリングソリューションの識別された T 細胞人口 (クラスター 17) のプロット k 平均 t SNE データリンパに k-平均クラスタリングソリューションによって識別されるクラスターの(F)ヒートマップ解析パネル表示マーカーの共同団体。この図の拡大版を表示するのにはここをクリックしてください。

違います。	説明	(GUI) の名前
1	フローサイトメトリーのタイプを選択します。	NA
2	Raw データのランダムなサブサンプリング	NA
3	分析用のファイルを選択します。	ファイルを選択します。
4	ソフトウェアに提供される単一の汚れのディレクトリに基づく生データの自動補正	自動補正
5	ゲート t SNE とクラスタリング解析のためのイベントを選択するには	ゲートの人口
6	データ (絶対数) をゲートのランダムなサブサンプリング	NA
7	データ (ゲートの人口の %) をゲートのランダムなサブサンプリング	NA
8	分析のためのチャンネルを選択します。	NA
9	T SNE 次元削減を実行します。	t SNE
10	t SNE ウィンドウ	NA
11	ワークスペースを保存します。	ワークスペースを保存します。
12	ワークスペースをロードします。	ワークスペースをロードします。
13	選択マーカーを t SNE ヒートマップを作成します。	NA
14	T SNE をゲートに再選択人口 t SNE 分析を行う	ゲート t SNE
15	T SNE ウィンドウを画像として保存します。	恒常的な画像を保存します。
16	クラスタリングアルゴリズムを選択します。	クラスタリング手法
17	指定されたクラスタリングパラメーターの入力アルゴリズム	NA
18	クラスター分析	クラスター
19	クラスターを手動で描画します。	クラスターを手動で選択します。
20	明確なすべてのクラスタークラスター分析をやり直すには	クラスターをクリアします。
21	現在のフィルター条件の下のクラスターを表示します。	クラスター (ろ過)
22	クラスター分析のリストボックスから [クラスターを削除します。	削除 <--
23	クラスタークラスター分析リストボックスを追加します。	選択します。
24	分析ですべてのイベントの従来のヒートマップを作成します。	イベントのヒートマップ
25	並べ替えクラスターマーカーを選択します。	並べ替え
26	選択マーカーでの閾値を設定	しきい値
27	クラスター分析のリストボックスから [クラスターの従来のヒートマップを作成します。	クラスターのヒートマップ
28	並べ替えの順序を反転します。	昇順/降順
29	すべてのしきい値をクリアします。	すべてのしきい値をクリアします。
30	クラスターの設定頻度のしきい値	クラスターの頻度のしきい値 (%)
31	'のクラスター (ろ過) listbox 上でアクティブな現在のしきい値の一覧	しきい値
32	高次元の箱ひげ図	高次元の箱ひげ図
33	高次元流れのプロット	高次元流れのプロット
34	従来の流れのプロットのための水平軸パラメーター	NA
35	従来の流れのプロットのための垂直軸パラメーター	NA
36	水平軸上の従来の流れプロットのためのデータ変換	NA
37	垂直軸上の従来の流れプロットのためのデータ変換	NA
38	従来のフロー・グラフを作成します。	従来の流れのプロット
39	解析のためのクラスターを表示します。	NA

表 1: すべての概要機能 ExCYT GUI 内に存在

ソフトウェア・パッケージの名前	ExCYT	チトクローム	FCS エクスプレス	flowCore	openCyto	FlowMeans
プログラムの種類	Matlab	Matlab	スタンドアロンのアプリケーション	R	R	R
ユーザー価格	無料	無料	$ 1,000	無料	無料	無料
グラフィカルユーザーインターフェイス	うん	うん	うん	違います	違います	違います
次元削減手法	t SNE	t-SNE、PCA	t-SNE、PCA、スペード	どれも	どれも	どれも
クラスタリングアルゴリズム	K 手段 DBSCAN 階層的クラスタリング自己組織化マップ複数ネットワークグラフに基づく法 GMM - EM GMM - 変分ベイズ法	K 手段 GMM - EM 単一ネットワークグラフに基づく法 (Phenograph)	K 手段	どれも	手動ゲートワークフローの自動化	K 手段
並べ替え/フィルタークラスター機能	うん	違います	違います	違います	違います	違います
高次元流れのプロット	うん	違います	違います	違います	違います	違います

表 2: ソフトウェア支援フローフローサイトメトリー解析ソリューションの概要

Subscription Required. Please recommend JoVE to your librarian.

Discussion

ここで提案する高次元データの最新情報を実装するプログラミングの背景を持つ個人を許可する ExCYT、高次元フローサイトメトリーデータの分析を合理化するための MATLAB ベースのアルゴリズムを実行する新しいグラフィカルユーザーインターフェイス解析アルゴリズム。広範な科学コミュニティにこのソフトウェアの可用性は、直感的で簡単なワークフローでは、流れ cytometry データを探検する科学者になります。T SNE 次元削減を実施、クラスタリング手法を適用すること、できることをして並べ替え/フィルターこれらのクラスターを介して迅速に、柔軟でカスタマイズできるヒートマップなど、高次元の流れ/ボックスプロット、科学者できるようになりますだけでなく、彼らのサンプルで一意に定義された集団を理解するが、直感的で同僚によって理解しやすい視覚エフェクトを作成することができます。

プログラムは、さまざまなデータ型 (従来フローサイトメトリー vs 質量フローサイトメトリー) を処理する柔軟ですが、プログラムの最適なユーティリティのいくつかの考慮事項があります。これらの最初は、流れの cytometry データの具体的には、データの品質についてです。適切な補償と発光スペクトルの重複の解決が最も重要です。不十分な補償のデータ誤ってマーカーの虚偽の共同団体および、真の生物学的意義のないクラスターの形成をもたらします。したがって、入力データは t SNE 解析しさらに下流の分析を進める前に音質のことを強くお勧めです。さらに、ExCYT で実装された自動補正アルゴリズムの使用は、補正パラメーターを正確に計算するためにすべてのチャネルに対する明確な単一汚れを必要です。

ExCYT の使用のもう一つの重要な考慮事項 (本稿で示す) のように 1 つの解析に複数の FCS ファイルを連結するとき、彼らはすべてのチャネルに匹敵する必要があります。まず、これは同じパネルがすべてサンプルとすべてのチャネルにわたってサンプル間のドリフトがない全体で使用する必要があることを意味します。たとえば、1 つは別の日に 2 つのサンプルを読むことが、少し移動した CD8 人口に終って 1 つの日に異なる日が、cytometer の電圧の FITC でステンドグラス CD8 が設定された場合、false クラスターを下流における生成 1 つでした。、このシフトは、楽器の変化と生物学的意義によらない関数として生成されたようです。ExCYT の将来のバージョンは、その単一の汚れにサンプルを正規化できるかもしれないが、この時点では、慎重に検討しなければならないは FCS ファイルは ExCYT にそれらをインポートする前に互いに比較できること。

最後に、クラスタリングのプロセスは、絶対/剛は 1 つではありません。別のクラスタリングアルゴリズムとパラメーターは、さまざまなクラスタリングソリューションを生成できます。アルゴリズムのソリューションが適切かどうかは、ユーザークラスタリングソリューションと生物学の理解を合成によって決定します。たとえば、腫瘍の免疫環境を理解するとき 1 つ可能性がありますに興味がある巨視的クラスター (すなわち、 T 細胞対 B 対骨髄性細胞) 別は巨視的なクラスターの母集団に興味がある可能性があります。クラスターの解像度は、したがって、1 つは、ユーザーによって決定されます '正しい' はクラスタリングソリューションこれは、ExCYT で利用できる高次元流れのプロットを使用しての主な利点の 1 つです。すべてのチャネルにわたって特定のクラスターの分布を視覚化する能力は、彼らの方法が、実験で科学的な質問に関連する方法だけでなく、生物学的関連でクラスター化したかどうかを決定するユーザーを助けることができます。私たちの目標は、クラスタリングの別の方法を提供しながら高次元流れ cytometry のクラスターデータに文献で使用される方法の茄多を提供するためには、お勧めします経由でデータを迅速に探索する k 手段や DBSCAN などのメソッドを使用してクラスター数とサイズ、およびネットワークグラフとより堅牢なより時間のかかるアプローチのためのガウス混合モデルアプローチに向けた動きの反復。

これらの考慮事項を考えると、ExCYT はまだ高次元フローサイトメトリーデータ探索用の非常に柔軟で貴重なツールとその他の利用可能なパッケージのこのタイプの分析(表 2) を実施する利用可能なより/を区別するユニークな機能を提供.まず、ExCYT はほとんど流れフローサイトメトリー解析アプローチ次元削減を活用し、スクリプティング/プログラミング知識がなくても使用することによってクラスタリングアルゴリズムを自体を区別します。また、文献で引用されて多くのクラスタリングアルゴリズムを集約することによって我々はクラスタリングデータのほとんどのオプションを提供すると考えます。最後に、クラスターろ過と新規高次元流プロットを介してディスプレイと一緒に並べ替えの私たちのユニークな機能によりユーザーが迅速かつ効率的に、そのクラスターの特性を探検するまれな「発見」プロセスを作るシンプルで効率的な集団。

Subscription Required. Please recommend JoVE to your librarian.

Disclosures

著者が明らかに何もありません。

Acknowledgments

著者の謝辞があります。

Materials

Name	Company	Catalog Number	Comments
Desktop	SuperMicro	Custom Build	Computer used to run analysis
MATLAB	Mathworks	N/A	Software used to develop ExCYT

DOWNLOAD MATERIALS LIST

References

Benoist, C., Hacohen, N. Flow cytometry, amped up. Science. 332 (6030), 677-678 (2011).
Ornatsky, O., et al. Highly multiparametric analysis by mass cytometry. Journal of immunological methods. 361 (1), 1-20 (2010).
Tanner, S. D., et al. Flow cytometer with mass spectrometer detection for massively multiplexed single-cell biomarker assay. Pure and Applied Chemistry. 80 (12), 2627-2641 (2008).
Maecker, H. T., et al. Standardization of cytokine flow cytometry assays. BMC immunology. 6 (1), 13 (2005).
Brazma, A., Vilo, J. Gene expression data analysis. FEBS letters. 480 (1), 17-24 (2000).
Pyne, S., et al. Automated high-dimensional flow cytometric data analysis. Proceedings of the National Academy of Sciences. 106 (21), 8519-8524 (2009).
Ge, Y., Sealfon, S. C. flowPeaks: a fast unsupervised clustering for flow cytometry data via K-means and density peak finding. Bioinformatics. 28 (15), 2052-2058 (2012).
Venkatesh, V. Determinants of perceived ease of use: Integrating control, intrinsic motivation, and emotion into the technology acceptance model. Information systems research. 11 (4), 342-365 (2000).
Bagwell, C. B., Adams, E. G. Fluorescence spectral overlap compensation for any number of flow cytometry parameters. Annals of the New York Academy of Sciences. 677 (1), 167-184 (1993).
Lavin, Y., et al. Innate immune landscape in early lung adenocarcinoma by paired single-cell analyses. Cell. 169 (4), 750-765 (2017).
Chevrier, S., et al. An immune atlas of clear cell renal cell carcinoma. Cell. 169 (4), 736-749 (2017).
Hartigan, J. A., Wong, M. A. Algorithm AS 136: A k-means clustering algorithm. Journal of the Royal Statistical Society. Series C (Applied Statistics). 28 (1), 100-108 (1979).
Ester, M., Kriegel, H. P., Sander, J., Xu, X. Density-based spatial clustering of applications with noise. International Conference Knowledge Discovery and Data Mining. 240, (1996).
Levine, J. H., et al. Data-driven phenotypic dissection of AML reveals progenitor-like cells that correlate with prognosis. Cell. 162 (1), 184-197 (2015).
Blondel, V. D., Guillaume, J. L., Lambiotte, R., Lefebvre, E. Fast unfolding of communities in large networks. Journal of statistical mechanics: theory and experiment. 2008 (10), P10008 (2008).
Le Martelot, E., Hankin, C. Fast multi-scale detection of relevant communities in large-scale networks. The Computer Journal. 56 (9), 1136-1150 (2013).
Newman, M. E. Fast algorithm for detecting community structure in networks. Physical review E. 69 (6), 066133 (2004).
Hespanha, J. P. An efficient matlab algorithm for graph partitioning. , University of California. 1-8 (2004).
Moon, T. K. The expectation-maximization algorithm. IEEE Signal processing. 13 (6), 47-60 (1996).
Bishop, C. M. Pattern recognition and machine learning. , Springer. (2006).

Immunology and Infection

ExCYT: 高次元フローサイトメトリーデータの分析を合理化するためのグラフィカルユーザーインターフェイス

Summary

Abstract

Introduction

Protocol

Representative Results

Discussion

Disclosures

Acknowledgments

Materials

References

Tags

Cite this Article

Summary

Abstract

Introduction

Protocol

Representative Results

Discussion

Disclosures

Acknowledgments

Materials

References

Tags

Cite this Article

Get cutting-edge science videos from JoVE sent straight to your inbox every month.