Summary
このプロトコルは、早期転移性疾患を検出し、マクロ転移へのその後の進行を予測するために、乳癌骨転移のラットモデルにおける磁気共鳴画像(MRI)および陽電子放出断層撮影/コンピュータ断層撮影(PET/CT)に由来する画像化パラメータを組み合わせて使用する機械学習アルゴリズムを訓練するように設計された。
Abstract
機械学習 (ML) アルゴリズムを使用すると、さまざまな機能をモデルに統合して、その構成要素を超える精度で分類または回帰タスクを実行できます。このプロトコルは、標準的なイメージング法で異常が観察される前に、ラットモデルにおける乳癌骨マクロメタスターゼの成長を予測するMLアルゴリズムの開発を記述する。このようなアルゴリズムは、ステージング検査中に定期的に見逃される早期転移性疾患(すなわち微小転移)の検出を容易にすることができる。
適用された転移モデルは部位特異的であり、ラットは右後ろ足だけで転移を発症することを意味する。モデルの腫瘍取り率は60%~80%で、マクロメタスターゼは誘導の30日後に動物のサブセット中の磁気共鳴画像(MRI)および陽電子放出断層撮影(PET/CT)で見えるようになり、動物の第2サブセットは腫瘍増殖を示さない。
このプロトコルは、早期に取得した画像検査から始まり、MRIによって検出された組織血管化、PET/CTによるグルコース代謝、およびマクロ転移性疾患の予測に最も関連する特徴のその後の決定を示す特徴の抽出を記述する。これらの特徴は、モデル平均ニューラルネットワーク(avNNet)に供給され、動物を転移を発症するグループと腫瘍を発症しない2つのグループのいずれかに分類します。このプロトコルは、全体的な精度、感度、特異性、負/正の予測値、尤度比、および受信機動作特性の開発など、標準の診断パラメータの計算についても説明します。提案されたプロトコルの利点は、機能の無制限の調整可能な組み合わせで異なるMLアルゴリズムの多くを訓練するために容易に適応することができるので、その柔軟性です。さらに、腫瘍学、感染、炎症の異なる問題を分析するために使用することができます。
Introduction
このプロトコルの目的は、MRIおよびPET/CTの複数の機能的イメージングパラメータをモデル平均ニューラルネットワーク(avNNet)MLアルゴリズムに統合することです。このアルゴリズムは、骨内の巨視的変化がまだ見えない早期の時点で乳癌骨転移のラットモデルにおけるマクロ転移の成長を予測する。
マクロメタスターゼの増殖に先立ち、骨髄浸潤性腫瘍細胞の浸潤が起こり、一般に微小転移性疾患11,22と呼ばれる。この初期の侵入は転移性疾患の初期段階と考えられるが、通常は従来の段階試験33,44の間に見逃される。現在利用可能な撮像様式では単独で使用した場合に骨髄微小浸潤を検出することはできないが、血管化と代謝活性に関する情報を得る画像化パラメータの組み合わせが、より良い5を行うことが示されている。この補完的な利点は、異なるイメージングパラメータをMLアルゴリズムであるavNNetに組み合わせることによって達成されます。このようなavNNetは、目に見える転移が存在する前に、骨マクロメタスターゼ形成の信頼性の高い予測を可能にする。したがって、イメージングバイオマーカーをavNNetに統合することは、骨髄微小浸潤および早期転移性疾患の代理パラメータとして役立つ可能性がある。
プロトコルを開発するために、ヌードラットにおける乳癌骨転移の以前に説明したモデルを66、7、87,8を使用した。このモデルの利点は、その部位特異性であり、動物が右後肢だけで骨転移を発症することを意味する。しかし、このアプローチの腫瘍取り率は60%~80%であるため、かなりの数の動物が研究中に転移を起こすわけではありません。MRIやPET/CTなどの画像化モダリティを用いて、30日目からインジェクション後に転移の存在が検出可能である。初期の時点(例えば、10PI)イメージングでは、転移性疾患を発症する動物とそうでない動物を区別しない(図1)。
10日目に取得した機能的イメージングパラメータについて訓練されたavNNetは、以下のプロトコルに記載されているように、マクロメタスターゼの増殖を以下の〜〜3週間以内に確実に予測または除外する。ニューラルネットワークは、異なる層内の人工的なノードを組み合わせます。研究プロトコルにおいて、骨髄血液供給および代謝活性のための機能的イメージングパラメータは最下層を表し、悪性腫瘍の予測は最上層を表す。追加の中間層には、上部レイヤーと下部レイヤーの両方に接続されている非表示ノードが含まれます。異なるノード間の接続の強度は、高精度9でそれぞれの分類タスクを実行するために、ネットワークのトレーニング中に更新されます。このようなニューラルネットワークの精度は、複数のモデルの出力を平均化することによってさらに向上することができ、その結果、avNNet10.
Subscription Required. Please recommend JoVE to your librarian.
Protocol
すべてのケアおよび実験手順は、動物保護に関する国内および地域の法律に従って行われ、すべての動物の手順は、ドイツのフランコニア州政府によって承認されました(参照番号55.2 DMS-2532-2-228)。
1. 裸ラットの右後ろ足における乳癌骨転移の誘導
注:ヌードラットにおける乳癌骨転移の誘導の詳細な説明は、他の6,88を出版しています。最も関連する手順を以下に示します。
- 培養MDA-MB-231ヒト乳癌細胞をRPMI-1640において、10%の胎児子牛血清(FCS)を補った。細胞を標準条件(37°C、5%CO2)2で保管し、週に2~3回通過します。
- リン酸緩衝生理食塩分(PBS)で2 mM EDTAで近コンフルエントMDA-MB-231細胞を洗浄し、0.25%トリプシンで細胞を取り外します。ノイバウアーのチャンバで細胞濃度を決定し、1.5 x 105 細胞/200 μLの濃度でRPMI-1640の200 μLで再中断します。
- 6-8週齢のヌードラットを使用し、病原体を含まない制御条件下(21°C±2 °C室温、湿度60%、明暗リズム12時間)オートクレーブ飼料と水のアドリビタムを提供しています。
- 手術を行う前に、鎮痛薬(例えば、カルプロフェン4mg/kg)を皮下注射する。ラットをイオブルラン(1~1.5 vol)/酸素混合物を流速2 L/minで麻酔します。
- 手術には、16倍の倍率の手術用顕微鏡を使用してください。
- ラットの右のイングイナル領域で2〜3cmの切り傷を行います。大腿動脈(FA)、表在性上頭動脈(SEA)、下降性分膜動脈(DGA)、大窩動脈(PA)、および伏陰動脈(SA)を含む右のりぐるい領域のすべての動脈を解剖する。FA に 2 つのリムーバブル クリップを配置します: 1 つは SEA の先頭に近く、もう 1 つは DGA の先頭に直接近位です。
- SEA の遠位部分をリゲートします。SEAの壁の切断を実行し、海に直径0.3ミリメートルの針を挿入します。ステップ1.2から細胞懸濁液を含む注射器を針に接続します。FAから遠位クリップを取り外し、代わりにSAをクリップします。
- ステップ1.2(1.5 x 105 細胞/200 μL)からMDA-MB-231細胞懸濁液をゆっくりとSEAに注入します。針を取り外し、SEAをリゲートし、動脈クリップを取り外します。外科用クリップを使用して傷口を閉じ、麻酔を終了します。動物を毎日監視して、腫瘍の大きさと痛みの証拠を評価します。
2. 磁気共鳴画像法(MRI)
注:MRI手順の詳細については、Bäuerleら11を参照してください。
- 専用の実験用スキャナー( 材料表を参照)または適切な動物コイルを備えたヒトMRシステムを使用して、MRI 10日間PIを実行します。
- 上述のようにイオブルラン(1~1.5 vol.%)/酸素混合物でラットを麻酔します。ラットの尾静脈にカテーテルを置き、尾部にテープを貼ります。造影剤を含む注射器(約0.5 mLの0.1 mmol/kg Gd-DTPA)を接続します。
- 麻酔ラットをMRシステムに配置します。解剖学的シーケンス(例えば、T2加重ターボスピンエコーシーケンス)で右後肢の遠位大腿骨および近位脛骨を見つける。TR = 8,654 ミリ秒;TE = 37 ミリ秒。行列320 x 272;FOV = 65 mm x 55 mm;スライスの厚み = 1 mm;スキャン時間 11:24 分)。
- 右後ろ足の遠位大腿骨と近位脛骨を覆うスライスを決定し、DCE-MRIシーケンス(例えば、高速低角度ショットシーケンス)を開始します。TR = 3.9 ミリ秒TE = 0.88 ミリ秒。行列 = 256 x 216;FOV = 65 x 54 mm2;スライスの厚み = 1 mm;8スライス。100のタイムポイント。スキャン時間 = 8:25分)。30sの後、10sの期間にわたって造影剤を注入し始める。
注:MRI検査の所要時間は、動物1匹につき約20分です。
3. ポジトロン放射断層撮影/コンピュータ断層撮影(PET/CT)
注:PETの手順の詳細については、Al.12のChengを参照してください。
- 専用の実験用スキャナを使用して、PET/CTイメージングを10日間PIで行います( 資料表を参照)。
- 画像撮影の前に動物を断食してください。ステップ2.2に記載されているようにラットを麻酔し、上述のように尾静脈にカテーテルを挿入する。
- 18 F-フル18オロデオキシグルコース(18F-FDG)の6 MBqを尾静脈に注入し、トレーサーが適切に分配できるように〜30分待ちます。
- CT取得(チューブ電圧= 80 kV、チューブ電流= 500 μA、等方性分解能= 48.9 μm、持続時間= 10分)を実行します。
- 静的 PET 取得を実行します (下/上の判別レベル = 350/650 keV;タイミング ウィンドウ = 3.438 ns;期間 = 15 分)。
4. 代替画像戦略
- 後ろ足のMDA-MB-231細胞の早期評価のために、 インオキュレート1.5 x 10 5 標識細胞/200 μLの生物発光 (すなわち、ルシフェリンを発現する細胞、 MDA-MB-231-LUC13)または蛍光イメージング (すなわち、緑色または赤色の蛍光タンパク質を発現する細胞、 MDA-MB-231-GFP/RFP13)。腫瘍細胞接種後のMDA-MB-231細胞を検出するための前臨床光学イメージング用システムを使用する。
- マイクロバブルの静脈内注入後に専用スキャナーを用いて実験超音波を行い、MRI7に匹敵する血管形成の形態学的および機能的パラメータを導出する。
5. MRI分析
- DCEプラグイン16でDICOMビューア15を使用し、トップメニューの「インポート」ボタンをクリックし、ステップ2.4からMR画像を含むDICOMフォルダを選択し、トップメニューの「4Dビューア」をクリックして、DCEシーケンスを4Dモードでロードします。
- 目標サイズが1.5mm2の円形の2次元領域(ROI)を配置し、2右後脚の脛骨近軸の骨髄に、これらの中心画像がより安定した結果を提供するので、8つの画像からなるシーケンスから画像番号4または5を使用するのが好ましい。
- 上部メニューからDCEプラグインを起動し、「プロットタイプ」フィールドで「相対エンハンスメント」を選択し、それぞれのフィールドにこれらの数字を入力して、時間ポイント1から5までのベースライン範囲を定義します。分析をそれぞれのボタンを使用して .txt ファイルとしてエクスポートし、ファイル名として "DCEraw.txt" を選択します。
- RStudio17 を開き、提供されている DCE-Script.R ファイルを読み込む場合は、[ファイル] メニューの [ファイルを開く] を選択します。[コード]、次に [実行領域]、および [すべて実行] を選択して、スクリプト全体を実行します。出力を "ImagingFeatures.xlsx" という名前のテンプレート ファイルにコピーします (図 2)。
- DICOM ビューアで、動物の背筋内に 2 番目の ROI を配置し、ステップ 5.2 ~ 5.4 を繰り返して、正規化のために筋肉 DCE 測定を取得します。スプレッドシート「ImagingFeatures.xlsx」内では、それぞれの骨の測定値は正規化のためにそれぞれの筋肉の測定値で自動的に分割されます。
- すべての動物に対してステップ 5.1 ~ 5.5 を繰り返し、スプレッドシートを完成させます。
6. ペット/CT分析
- PET/CT解析ソフトウェアを開き、手順3で取得したデータをインポートするには、「ファイル」をクリックし、続いて「手動インポート」をクリックします。ct.img.hd ファイルと pet.img.hdr ファイルをマークします。[開く] をクリックし、[すべてインポート] を選択します。
- データセットを開くには、 "一般分析" を選択し、続いて " OK " を選択します。
- "ROI 定量" を選択し、続いて "作成" を選択し、 "テンプレートから ROI を作成する " を選択します。右後ろ足の近位脛骨シャフトの骨髄に約4mm x 6mmの2次元ROIを入れる。
- 「ROI (ターゲット 1 オーバーレイ)」を選択し、平均値、最小値、最大値を Bq/mL に書き留めます。
- 最大標準化された取り込み値(SUVMax)を計算する: 最大値(Bq/mL)を注入されたアクティビティで割り、グラム単位で動物の重量で結果を乗算します。結果をスプレッドシートに入力します (図 2)。
7. 腫瘍取り込み率の決定
- 右後ろ足の腫瘍の成長を診断するには、上記のように30日目PIに対してMRおよびPET/CTイメージングを繰り返す。
注:腫瘍は30日目PIではっきりと見え、PET/ CTで明らかに高いSUVマックス と共に、MRIでT2w過敏性病変と明確なコントラスト強化を特徴とします。これまでの実験によれば、動物の60~80%が右後足に転移を起用する。 - 追加の「腫瘍」列を追加してスプレッドシートを完成させ、転移を示すすべての動物に「1」、目に見える腫瘍負担のないすべての動物に「0」と入力します(図2)。スプレッドシートをダウンロード フォルダー内に "ImagingFeatures.xlsx" として保存します。
8. 機能の選択
- 今後の腫瘍の成長予測に最も関連性の高い機能を決定するには、オープンソースのデータビジュアライゼーション、機械学習、およびデータマイニングツールキット18にスプレッドシートをインポートします。
- [データ] メニューの [ファイル] サブルーチンを右側のワークスペースに描画し、ダブルクリックします。[フォルダ] アイコンをクリックし、ファイル "ImagingFeatures.xlsx" を選択して、スプレッドシートを読み込みます。[エクスポート] ワークシートを選択し、ターゲット属性を変数 "腫瘍" に割り当てます。動物番号に "スキップ" 機能を割り当てます (図 3)。
- [データ] メニューの [ランク] サブルーチンをワークスペースに描画し、"ファイル" および "ランク" サブルーチンを接続します。
- アイコンをダブルクリックして "ランク" サブルーチンを開き、 "情報取得" アルゴリズム19を選択します。
- 取得した 5 つのパラメーターから、上位 3 つの値を使用して、さらに分析を行います (SUVの最大値、PE、および AUC)。
注: これらのパラメーターは代謝活性 (SUV最大) および組織血管化 (PE および AUC) を反映します。
9. ML分析
- RStudio 3.4.117 を開き、提供された TrainModel.R-Script を 「ファイル」メニューから読み込みます。
- 必要なライブラリをインストールする (これは一度だけ行う必要があります) を入力します。
- 必要なライブラリをロードし、ダウンロード フォルダを作業ディレクトリとして設定するには、TrainModel.R スクリプト内の 3 ~ 5 行目を選択します。
- 選択したコードを実行するには、メニューの [コード] をクリックし、[選択した行を実行]をクリックします。
10. avNNet ML アルゴリズムのトレーニング
- avNNet アルゴリズムをトレーニングするには、TrainModel.R-スクリプトから 8 ~ 39 行目を選択します (ステップ 9.1 を参照)。
- 選択したコードを実行するには、メニューの [コード] をクリックし、[選択した行を実行]をクリックします。
11. ML アルゴリズムの結果の分析
- 診断精度 (感度、特異性、正と負の予測値、および尤度比) の標準パラメーターを評価するには、TrainModel.R-Script から 41 ~ 50 の線を選択します。
- 選択したコードを実行するには、メニューの [コード] をクリックし、[選択した行を実行]をクリックします。
12. 最終モデルのレシーバ動作特性(ROC)曲線とその構成パラメータのROC曲線との比較
- DeLong のテストを実行して、モデルの ROC カーブとその構成パラメータの ROC カーブを比較するには、TrainModel.R-Script から 52 – 62 のラインを選択します (ステップ 9.1 を参照)。
- 選択したコードを実行するには、メニューの [コード] をクリックし、[選択した行を実行]をクリックします。
Subscription Required. Please recommend JoVE to your librarian.
Representative Results
ラットはMDA-MB-231乳癌細胞の手術および注射から素早く回復し、その後、10日目および30日目にMR-およびPET/CTイメージングを行った(図1)。ラットの右近位脛種の代表的なDCE分析を 図2Aに示す。DCE の未加工の測定値は、[エクスポート] ボタンを選択し、ファイル名として [DCEraw.txt] を選択して保存されました。
動的パラメータ、AUC、PE、およびウォッシュアウトの後続の計算は、RStudio でそれぞれのスクリプトを使用して実行されました。DCE 測定値の出力は、図 2Bに示すように、データ テーブルを提供する追加の構成なしでスクリプトを直接実行できるように、"ダウンロード" フォルダー内に "DCEraw.txt" として保存する必要があります。これらのデータは、提供されたスプレッドシートにコピーされました (図 2C)。同様に、筋肉組織のDCEパラメータを決定し、スプレッドシートに転送した(図2D、E)。Eこれらの値は、筋肉の測定値で骨の測定値を除いて正規化されました;これはスプレッドシート内で自動的に実行されました。PET/CTから、計算されたSUVの最大値は、その後テーブルに転送されました(図2F)。
30日目に、全ての動物が転移を発症したかどうかを判定するために評価し、表はスプレッドシートの右端列内で陽性腫瘍の負担を「1」、健康な動物を「0」として符号化して完成した(図2C)。
スプレッドシートはオープンソースのデータビジュアライゼーション、機械学習、データマイニングツールキットにインポートされ、特徴ランキングにより、転移性疾患の予測のトップ3の機能としてSUVの最大、PE、およびAUCが明らかにされました(図3)。これらのパラメータは、代謝活性(SUVMax)および組織血管化(PEおよびAUC)を反映しています。
TrainModel.R スクリプトを実行すると、スプレッドシートが自動的にインポートされ、avNNet が計算されました。最適なハイパーパラメーターの組み合わせを決定しました (図 4A) と最終モデルを最適なハイパーパラメーターの組み合わせを使用して計算しました (図 4B)。続いて、一連の標準診断パラメータを計算し(図4C)、モデルのROC曲線をプロットした(図4D)。
正の結果を図 4B–Dに示します。モデルのROC曲線と3つの構成成分(AUC、PE、およびSUVmax)のROC曲線を比較した結果、モデルは3つの構成要素(AUCの場合はp = 0.01、PEの場合はp = 0.003、最大の場合はp = 0.007 SUV)よりも大幅に優れたパフォーマンスを発揮することが明らかになった。avNNetに対して選択された3つのパラメータの組み合わせは、より敏感であり、全体の精度85.7%(95%信頼区間= 67.3%〜96.0%)の巨視的疾患の予測を可能にしました。これらの結果は、28サンプルの分析から得られた。信頼区間は、動物の数を増やすことでさらに狭めることができる。
否定的な結果は、ここで説明したように得ることができる。精度の測定は、特定の種類の機械学習アルゴリズムとデータ前処理のステップに対して非常に敏感でした。特にニューラルネットワークは、入力データが正規化されると、より良いパフォーマンスを発揮する傾向がありました。これは、プロトコルのセクション10の「BoxCox」機能(提供されたTrainModel.R-Script内の22行目と36行)によって達成されました。正規化を控え、異なるアルゴリズム(例えば、平均化されていないニューラルネットワーク)を使用して、メソッドを「nnet」(提供されたTrainModel.R-Script内の21行と35行)に変更することで、ROC曲線下の0.594の領域を生じた(補足図1)。このようなモデルは、その3つの構成要素を大幅に上回ることができませんでした(すべてp > 0.15)。
スクリプトは RStudio 3.4.1 およびキャレット パッケージ バージョン 6.0-84 用に最適化されているため、異なるソフトウェア バージョンを使用すると、異なる結果が得られる可能性があります。この原稿で使用されているソフトウェアバージョンで提供されたスクリプトを実行すると、同様の結果が得られます。ただし、読者がスクリプトの変更、追加の変数の追加、ドキュメントフォルダーまたはファイル名の変更、機械学習アルゴリズムの変更を詳細に行う場合は、コードの調整が必要になります。これらの場合、キャレットパッケージのマニュアルは、詳細な説明を提供しています20.
図1:代表的なMRおよびPET/CT画像 研究の過程で転移を発症しなかった動物の右後肢(10日目と30日目PIの画像を含む2つの左の列)と、10日目から30日目のPI(2つの右列、矢印でマークされた転移)の間に転移を発症した動物のMRおよびPET/CT画像。T2w画像(上段)における転移の高い信号強度、曲線下の増加した領域(AUC;2行目)によって示されるコントラスト強化、およびPET/CTにおける最大標準化取り込み値の増加(SUV最大;3行目)に注意してください。なお、30日目のPIで転移を起こした動物と骨転移を発症しなかった動物との間に、10日目のPI(第1列と第3列)で取得した画像には目に見える違いはないことに注意してください。この図はエルマンら5.から変更された。 この図の大きなバージョンを表示するには、ここをクリックしてください。
図 2: イメージング機能の評価と、スプレッドシートへのコンパイル(A) 近位脛骨の骨髄の動的コントラスト強化をDCEプラグイン16を用いてフリーウェアDICOMビューア15で分析した。それぞれの測定値を保存し、 (B) RStudio17で提供された DCE-Script.R-ファイルでさらに分析します。(C) 出力がスプレッドシートにコピーされました (テンプレートの補足資料を参照)。(D) 同様に、隣接する筋肉組織に対してDCE測定を行い、RStudio(E)を用いて分析し、スプレッドシートにコピーした。Eデータは、筋肉測定の結果(C;サケシェーディング細胞)で骨測定の結果を除いて正規化した。(F) PET/CT 測定は、ベンダーのソフトウェアで行われた。最大標準化取り込み値は、それぞれの測定値を注入された活性で割り、それを動物の体重で乗算することによって計算した。結果は、その後スプレッドシートにコピーされました。この図の大きなバージョンを表示するには、ここをクリックしてください。
図3:機能ランキング 取得したイメージング機能のランキングは、オープンソースのデータ可視化、機械学習、データマイニングツールキット18 内で、"File"-サブルーチンを介してスプレッドシートをインポートし、「Rank」-サブルーチンを介して分析することによって行われた。 この図の大きなバージョンを表示するには、ここをクリックしてください。
図 4: 代表的な RStudio 出力 機械学習アルゴリズムは、提供された TrainModel.R-Script ファイルを使用して RStudio17 を使用して開発されました。(A) モデル平均ニューラルネットワークの異なるハイパーパラメーターの組み合わせのグリッド検索で、3つのニューロンのサイズと0.0005の減衰が最適である事が明らかになった。(B) このハイパーパラメーターの組み合わせを使用して、完全なネットワークがトレーニングされ、クロス検証され、全体の精度は 85.7% に達しました。(C)感度、特異性、正と負の予測値、尤度比を含む診断精度の標準パラメータを、混同行列から計算した。(D) 交差検証モデルの代表的な ROC プロットで、曲線(AUC)の下の面積が0.917である事が明らかになった。 この図の大きなバージョンを表示するには、ここをクリックしてください。
補助図1:負の結果。 ML アルゴリズムをニューラル ネットワークに変更した場合、入力パラメータの平均化や正規化を控えずに、ROC 曲線の曲線下の領域が 0.917 (図 4D)から 0.594 に低下しました。 このファイルをダウンロードするには、ここをクリックしてください。
補助図 2: 代替機能のランキング図 3に示す標準的な方法とは対照的に、ランダム変数も導入され(「ランダム」、青で強調表示)、その重要性がランキングに含まれています。このアプローチは、変数SUVの最大、PE、およびAUCの適用された選択を確認した。このファイルをダウンロードするには、ここをクリックしてください。
Subscription Required. Please recommend JoVE to your librarian.
Discussion
ML アルゴリズムは、複数の予測機能を組み合わせたモデルに統合し、単独で使用した場合に個別の構成要素を超える精度を得るために使用される強力なツールです。それにもかかわらず、実際の結果はいくつかの重要なステップに依存します。まず、使用される ML アルゴリズムは、異なる ML アルゴリズムによって異なる結果が得られるため、重要な要素です。このプロトコルで使用されるアルゴリズムは avNNet ですが、他の有望なアルゴリズムには、エクストリーム グラデーションブースト21 またはランダム フォレストが含まれます。RStudio 用のキャレット パッケージ20 は、さまざまなアルゴリズム (現在 >175) を多数提供し、提案されたプロトコルは、単一行のコード (メソッド = "avNNet" をメソッド ="rf" に変更する) を変更し、TunedGrid 設定をそれぞれの ML アルゴリズムに適応させるだけで、アルゴリズム間の切り替えという点で非常に柔軟です。詳細については、キャレット github リポジトリ22を参照してください。異なるアルゴリズムの優れた概要と異なる分類の問題に関するそれらの性能はフェルナンデス・デルガドらら23 によって出版され、他の実験の出発点として役立つ可能性がある。
もう 1 つの重要な要素は、ML アルゴリズムに含める関連機能の選択です。このプロトコルは、フィルタメソッド「情報ゲイン」19を使用して、利用可能な機能を降順にランク付けし、最も関連性の高いものを使用してavNNetを訓練することを提案します。フィルターメソッドは、予測する変数との相関などの一般的な仮定のみに基づいているため、研究者は24,,25を使用する分類子とは無関係に機能を事前に選択する必要があります。このような方法は、計算時間に特に有効であり、オーバーフィットに対して堅牢です。ただし、関連する機能と無関係な機能を分離するカットオフはユーザーによって定義されるため、多少任意です。提案されたプロトコルでは、SUVの最大、PE、およびAUCに対応して、上位75%の情報ゲインを持つ機能が使用されました。しかし、この選択は、ターゲットとの関係を持たないランダム変数を含め、その情報ゲインを計算し、それを実際の特徴の情報ゲインと比較することによって体系的に強化することができる(補足図2)。このやや洗練されたアプローチは、さらに、上記の3つの機能の選択が最も関連性が高いものとして確認しました。しかし、いくつかの異なるフィルタメソッドが存在し、特徴抽出やラッパーメソッドなど、特定の分類子アルゴリズムに関して機能を選択する他のアプローチも存在します。異なる機能選択方法では、結果が異なる場合があります。
ML アルゴリズムの一般化を確実にし、オーバーフィットを防ぐために、提案されたプロトコルは、リーブアウトクロス検証(LOOCV)を適用します。ただし、最善の方法は、データセット全体からサブセットをランダムに削除し、テスト セットとして扱う方法です。ML アルゴリズムは、その後テスト セットの結果を予測するデータの残りの部分 (つまり、トレーニング セット) でトレーニングされます。ただし、この方法では、十分に大きなデータ セットが必要です。より小さいサンプルサイズの場合、LOOCVの適用は、モデルの真の一般化能力26のほぼ公平な推定値を提供するので、一般的である。LOOCVでは、最初のデータ・ポイントがデータ・セットから削除され、avNNet は保持データを使用してトレーニングされます。次に、以前の源泉徴収されたデータ ポイントの結果が予測され、保存されます。このプロセスはすべてのデータ ポイントに対して繰り返されるため、最終的に各結果はアルゴリズムのトレーニングに使用されなかったデータで予測されます。その他の検証方法には、X 折り曲げクロス検証 (最も一般的には 10 倍) が含まれ、コード内の各 trainControl パラメーターを method="CV" に変更することで簡単に適用できます。
定量的観点から、医療画像は、典型的には、非常に基本的な方法で評価され、主に疑わしい病変または領域27、28,28の大きさおよび形状の測定に依存する。しかし、医学におけるデジタルイメージングと通信(DICOM)規格の利点は、ラジオミクスと呼ばれる多くの特徴の抽出を可能にすることです。「ラジオミクス」という用語は、当初は大量の画像特徴29のハイスループット抽出として定義されたが、その後、画像の高次元データ30への変換を含むように拡張された。しかし、より高い次元データは主に原因30ではなく相関を識別するために使用される。このプロトコルで説明されている特徴は、血管化と代謝活性の一般的に受け入れられているパラメータに似ているため、サイズや形状などの古典的な放射線機能とラジオミクスの間にあります。これは、播種された腫瘍細胞の微小浸潤に関する潜在的な因果関係を提供する。ユーザーが望む場合は、ラジオの特徴の抽出は、異なるソフトウェアパッケージ31で行うことができます。
提供されるプロトコルは、有限数の機能に限定されません。したがって、大きなラジオミクスデータセットで使用できます。しかし、上記の機能選択の問題は、データ セットの増加に伴ってますます重要になります。提示されたプロトコルはまた、腫瘍学、感染、または炎症32の分野から、異なる研究設定に移すことができる。
Subscription Required. Please recommend JoVE to your librarian.
Disclosures
著者らは利益相反を宣言しない。資金提供者は研究の設計に何の役割も持っていなかった。データの収集、分析、または解釈に含まれる。原稿の執筆、または結果を公表する決定に含まれる。
Acknowledgments
この研究はドイツ研究財団(DFG、共同研究センターCRC 1181、サブプロジェクトZ02;とZ02;)優先プログラムμBoneは、スキャンデバイス(INST 410/77-1 FUGGおよびINST 410/93-1 FUGG)、フリードリヒ・アレクサンダー大学アーランゲン・ニュルンベルクの新興フィールドイニシアチブ(EFI)「ビッグテラ」による追加サポートを含むBA 4027/10-1とBO 3811をプロジェクトします。
Materials
Name | Company | Catalog Number | Comments |
Binocular Operating Microscope | Leica | NA | |
ClinScan MR System | Bruker | NA | |
DICOM Viewer | Horos | NA | www.horosproject.org |
Excel: Spreadsheet | Microsoft | NA | |
FCS | Sigma | F2442-500ML | |
Gadovist | Bayer-Schering | NA | |
Inveon PET/CT | Siemens | NA | |
Inveon Research Workplace Software | Siemens Healthcare GmbH | NA | |
IVIS Spectrum | PerkinElmer | NA | |
MDA-MB-231 human breast cancer cells | American Type Culture Collection | N/A | |
Open-source data visualization, machine learning and data mining toolkit. | Orange3, University of Ljubljana | NA | https://orange.biolab.si/ |
RPMI-1640 | Invitrogen/ThermoFisher | 11875093 | |
Trypsin | Sigma | 9002-07-7 | |
Vevo 3100 | VisualSonics | NA |
References
- D'Oronzo, S., Brown, J., Coleman, R. The role of biomarkers in the management of bone-homing malignancies. Journal of Bone Oncology. 9, 1-9 (2017).
- Ellmann, S., Beck, M., Kuwert, T., Uder, M., Bäuerle, T. Multimodal imaging of bone metastases: From preclinical to clinical applications. Journal of Orthopaedic Translation. 3 (4), 166-177 (2015).
- Braun, S., Pantel, K. Clinical significance of occult metastatic cells in bone marrow of breast cancer patients. The Oncologist. 6 (2), 125-132 (2001).
- Braun, S., Rosenberg, R., Thorban, S., Harbeck, N. Implications of occult metastatic cells for systemic cancer treatment in patients with breast or gastrointestinal cancer. Seminars in surgical oncology. 20 (4), 334-346 (2001).
- Ellmann, S., et al. Prediction of early metastatic disease in experimental breast cancer bone metastasis by combining PET/CT and MRI parameters to a Model-Averaged Neural Network. Bone. 120, 254-261 (2018).
- Bäuerle, T., Komljenovic, D., Berger, M. R., Semmler, W. Multi-modal imaging of angiogenesis in a nude rat model of breast cancer bone metastasis using magnetic resonance imaging, volumetric computed tomography and ultrasound. Journal of Visualized Experiments. (66), e4178 (2012).
- Merz, M., Komljenovic, D., Semmler, W., Bäuerle, T. Quantitative contrast-enhanced ultrasound for imaging antiangiogenic treatment response in experimental osteolytic breast cancer bone metastases. Investigative Radiology. 47 (7), 422-429 (2012).
- Bäuerle, T., et al. Characterization of a rat model with site-specific bone metastasis induced by MDA-MB-231 breast cancer cells and its application to the effects of an antibody against bone sialoprotein. International Journal of Cancer. 115 (2), 177-186 (2005).
- Patel, J., Goyal, R. Applications of Artificial Neural Networks in Medical Science. Current Clinical Pharmacology. 2 (3), 217-226 (2008).
- Naftaly, U., Intrator, N., Horn, D. Optimal ensemble averaging of neural networks. Network: Computation in Neural Systems. 8 (3), 283-296 (1997).
- Bäuerle, T., Merz, M., Komljenovic, D., Zwick, S., Semmler, W. Drug-induced vessel remodeling in bone metastases as assessed by dynamic contrast enhanced magnetic resonance imaging and vessel size imaging: A longitudinal in vivo study. Clinical Cancer Research. 16 (12), 3215-3225 (2010).
- Cheng, C., et al. Evaluation of treatment response of cilengitide in an experimental model of breast cancer bone metastasis using dynamic PET with 18F-FDG. Hellenic Journal of Nuclear Medicine. 14 (1), 15-20 (2011).
- Marturano-Kruik, A., et al. Human bone perivascular niche-on-a-chip for studying metastatic colonization. Proceedings of the National Academy of Sciences of the United States of America. 115 (6), 1256-1261 (2018).
- Sonntag, E., et al. In vivo proof-of-concept for two experimental antiviral drugs, both directed to cellular targets, using a murine cytomegalovirus model. Antiviral Research. 161, 63-69 (2019).
- Horos - Free DICOM Medical Image Viewer | Open-Source. , Available from: https://www.horosproject.org/ (2015).
- DCE Tool Plugin. , Available from: http://kyungs.bol.ucla.edu/software/DCE_tool/DCE_tool.html (2020).
- RStudio Team RStudio: Inteegrated Development for R. , Available from: https://rstudio.com (2015).
- Demšar, J., et al. Orange: Data Mining Toolbox in Python. Journal of Machine Learning Research. 14, 2349-2353 (2013).
- Saeys, Y., Inza, I., Larrañaga, P. A review of feature selection techniques in bioinformatics. Bioinformatics. 23 (19), 2507-2517 (2007).
- Kuhn, M. CRAN - Package caret. , Available from: https://cran.r-project.org/web/packages/caret/index.html (2016).
- Chen, T., et al. CRAN: Package xgboost - Extreme Gradient Boosting. , Available from: https://cran.r-project.org/web/packages/xgboost/ (2019).
- Available Models | The caret Package. , Available from: http://topepo.github.io/caret/available-models.html (2020).
- Fernández-Delgado, M., Cernadas, E., Barro, S., Amorim, D., Fernández-Delgado, A. Do we Need Hundreds of Classifiers to Solve Real World Classification Problems. Journal of Machine Learning Research. 15, 3133-3181 (2014).
- Hira, Z. M., Gillies, D. F. A Review of Feature Selection and Feature Extraction Methods Applied on Microarray Data. Advances in Bioinformatics. 2015, 198363 (2015).
- Sánchez-Maroño, N., Alonso-Betanzos, A., Tombilla-Sanromán, M. Filter methods for feature selection - A comparative study. Lecture Notes in Computer Science (including subseries Lecture Notes in Artificial Intelligence and Lecture Notes in Bioinformatics). 4881, 178-187 (2007).
- Cawley, G. C., Talbot, N. L. C. C. Fast exact leave-one-out cross-validation of sparse least-squares support vector machines. Neural Network. 17 (10), 1467-1475 (2004).
- Forghani, R., et al. Radiomics and Artificial Intelligence for Biomarker and Prediction Model Development in Oncology. Computational and Structural Biotechnology Journal. 17, 995-1008 (2019).
- Jaffe, C. C. Measures of response: RECIST, WHO, and new alternatives. Journal of Clinical Oncology Official Journal of the American Society of Clinical Oncology. 24 (20), 3245-3251 (2006).
- Lambin, P., et al. Radiomics: Extracting more information from medical images using advanced feature analysis. European Journal of Cancer. 48 (4), 441-446 (2012).
- Gillies, R. J., Kinahan, P. E., Hricak, H. Radiomics: Images are more than pictures, they are data. Radiology. 278 (2), 563-577 (2016).
- Nioche, C., et al. Lifex: A freeware for radiomic feature calculation in multimodality imaging to accelerate advances in the characterization of tumor heterogeneity. Cancer Research. 78 (16), 4786-4789 (2018).
- Ellmann, S., et al. Application of machine learning algorithms for multiparametric MRI-based evaluation of murine colitis. PLOS ONE. 13 (10), 0206576 (2018).