MIMEベースの機械学習フレームワークを用いたモデルの構築と可視化

Hongwei Liu; Wei Zhang; Yihao Zhang; Xuejun Li; Siyi Wanggou

doi:10.3791/68553

Method Article

MIMEベースの機械学習フレームワークを用いたモデルの構築と可視化

DOI:

10.3791/68553

⸱

July 22nd, 2025

Hongwei Liu*¹^,²^,³^,⁴ , Wei Zhang*¹^,²^,³^,⁴ , Yihao Zhang*¹^,²^,³^,⁴ , Xuejun Li¹^,²^,³^,⁴ , Siyi Wanggou¹^,²^,³^,⁴

¹Department of Neurosurgery, Xiangya Hospital, Central South University, ²National Clinical Research Center for Geriatric Disorders, Xiangya Hospital, Central South University, ³Hunan International Scientific and Technological Cooperation Base of Brain Tumor Research, Xiangya Hospital, Central South University, ⁴Furong Laboratory

Summary

$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

Mime は、機械学習ベースの統合モデルをエレガントなパフォーマンスで構築するための柔軟な計算フレームワークです。ここでは、複雑なデータセットを活用して、疾患の進行、患者の転帰、治療反応に関連する重要な遺伝子を特定し、高精度の予測モデルを開発するための詳細なステップバイステップの手順を提供します。

Abstract

$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

広く普及したハイスループットシーケンシング技術により、生物学とがんの不均一性に関する理解が大幅に向上しました。転写データに対する機械学習アルゴリズムは、患者の予後と臨床反応を予測するために不可欠になっています。機械学習アルゴリズムの進歩にもかかわらず、文字起こしデータに最も洗練された機械学習アルゴリズムを組み込んだオープンソースのプラットフォームは、まだ存在していません。このギャップに対処するために、私たちは、臨床的特徴と遺伝子シグネチャーの予測モデルの構築と視覚化を強化するための汎用性の高い機械学習フレームワークであるMimeを開発しました。Mime は、多様なデータセットを統合し、最先端の特徴選択技術を採用することで、臨床予測における重要な課題に対処します。モデルの構築、特徴の選択、データの視覚化など、3つの主要な機能を提供します。モデル構築には、決定木、サポートベクターマシン、アンサンブル法など、さまざまな機械学習アルゴリズムが含まれており、研究者は特定の分析に最適なアプローチを選択できます。特徴選択では、再帰的特徴消去やLASSO回帰などの高度なアルゴリズムを利用して、データセットを合理化し、最も有益な特徴に焦点を当てます。このフレームワークは、クロスバリデーション手法によるカスタマイズ可能なパラメーター調整をサポートし、モデルのパフォーマンスを最適化しながら、オーバーフィットのリスクを軽減します。Mimeに統合された可視化ツールにより、研究者はモデルの結果を効率的に解釈し、特徴の重要度と予測パフォーマンスメトリクスをグラフィカルに表現することができます。この原稿では、この汎用性の高い機械学習フレームワークの段階的な手順に関する詳細なチュートリアルを提供します。

Introduction

$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

ハイスループットシーケンシング技術の広範な採用は、生物学とがんの不^均一性1に対する私たちの理解に大きな影響を与えています。このバイオテクノロジーの画期的な進歩は、私たちの科学的知識を深めただけでなく、医学研究の分野にも革命をもたらしました。科学者が大量の遺伝物質のシーケンシングを迅速かつ正確に行えるようになったことで、ハイスループットシーケンシングは新しい遺伝子、突然変異、生物学的経路の発見を加速させました。シーケンシングデータ^2,3,4から、疾患の進行、患者の予後、および治療反応性に関連する特定の分子シグネチャーが明らかになる研究が増えています。これらの特異的なシグネチャーは、腫瘍の起源、分化、遊走、^{治療抵抗性}など、腫瘍生物学の根底にある転写制御ネットワークを理解するための包括的な展望を提供します5。これらの特徴は、多くの場合、多様で多様であり、単一の展示に限定されるのではなく、複数の側面を包含しています。これにより、疾患に強く関連する特定の遺伝子をスクリーニングして特定することが困難になります。したがって、疾患に関与する重要な遺伝子をスクリーニングするための賢明な計算戦略が緊急に必....

Access restricted. Please log in or start a trial to view this content.

Protocol

$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

注:このスタディのチュートリアルはすべて、Rソフトウェアを使用してLinuxプラットフォームで実行されます。このプロトコルで使用される R パッケージのバージョンは、 資料の表に記載されています。解析に必要な各ステップを以下に示し、詳細なプロトコールはGitHub(https://github.com/l-magnificence/Mime)でも入手できます。Mime で問題が発生した場合は、GitHub の問題ページ (https://github.com/l-magnificence/Mime/issues) にアクセスしてフィードバックを提供できます。

1. MIMEとサンプルデータセットの準備

以下のコードを使用して、GitHubからMimeの開発バージョンをインストールします。
devtools::install_github("l-magnificence/Mime")
生存率または治療に対する臨床的反応に関する情報を含む転写シーケンシングデータを含む複数のコホートを準備します。ここでは、2つのサンプルデータ(Example.cohortとExample.ici)をMimeの実行に使用しました。Example.cohort には 2 ....

Access restricted. Please log in or start a trial to view this content.

Results

$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

genelistとExample.cohort(1つのトレーニングコホートと1つの検証コホートを含む)を使用して、Mimeに10の機械学習アルゴリズムを統合して予後モデルを構築しました。Mimeが構築した117の予後モデルのうち、StepCox[forward] + plsRcox combined model(SPCOM)は、全コホートの中で最も高いC指数を示し、優れた性能を示しました(図1A)。患者はさらに、SPCOMによって計算されたリスクスコアの中央値に従って、高リスクグループと低リスクグループに分けられました。興味深いことに、高リスクスコアの患者は、すべてのコホートで転帰が有意に悪かった(図1B)。注目すべきは、SPCOMが予測した1年間のAUCが、すべてのコホートでAUCの平均が最も高い1位にランクされたことです(図1C、D)。これらの結果から、MIMEベースの機械学習フレームワークにより、提供された遺伝子セットと.......

Access restricted. Please log in or start a trial to view this content.

Discussion

$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

この研究では、Mime パッケージを使用して、トランスクリプトームデータの堅牢で強力な機械学習予測モデルを開発する方法について詳しく説明します。以前の研究では、研究者は、シーケンシングデータの特定の特性に基づいて適切な予測モデルアルゴリズムを選択するのに苦労することがよくありました^13,14。さらに、コンピュータサイエンスのバックグラウンドを持たない研究者にとって、機械学習環境を安定させ、適切なパラメータを選択し、モデルを同時にデプロイすることはある程度の困難があります¹⁵。この問題に対処するために、10 個の機械学習予後モデルアルゴリズム、7 個のバイナリ応答機械学習アルゴリズム、および予後に関連する 8 個のコア特徴選択アルゴリズムを MIME パッケージに統合しました。同じ学習セットで異なる機械学習アルゴリズムの予測パフォーマンスを包括的に比較することで、研究者は最もパフォーマンスの高いモデルを選.......

Access restricted. Please log in or start a trial to view this content.

Disclosures

$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

利益相反は宣言されていません。

Acknowledgements

$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

データ作成に携わったすべての参加者と研究者に感謝します。

....

Access restricted. Please log in or start a trial to view this content.

Materials

List of materials used in this article
Name	Company	Catalog Number
パッケージ名	バージョン	ソフトウェア
アプロット	0.1.10	Rスタジオ
バート	2.9.4	Rスタジオ
ボルタ	8.0.0	Rスタジオ
がんクラス	1.38.0	Rスタジオ
キャレット	6.0-89	Rスタジオ
Ckmeans.1d.dp	4.3.5	Rスタジオ
比較C	1.3.2	Rスタジオ
コンプレックスヒートマップ	2.15.1	Rスタジオ
組成	2.0-4	Rスタジオ
データ.テーブル	1.14.0	Rスタジオ
doパラレル	1.0.16	Rスタジオ
dplyr	1.1.3	Rスタジオ
1071年末	1.7-7	Rスタジオ
フォレストプロータ	1.1.0	Rスタジオ
未来	1.21.0	Rスタジオ
GBMの	2.1.8.1	Rスタジオ
グブレイク	0.1.1	Rスタジオ
ggplot2	3.4.1	Rスタジオ
ggpubr	0.4.0	Rスタジオ
ggsci	2.9	Rスタジオ
GLMNET	4.1-2	Rスタジオ
グリッド	4.1.3	Rスタジオ
グリッドエクストラ	2.3	Rスタジオ
GSEAベーゼ	1.54.0	Rスタジオ
GSVAの	1.40.1	Rスタジオ
ヒミスク	5.1-1	Rスタジオ
kknn	1.3.1	Rスタジオ
ニットル	1.42	Rスタジオ
マグリットル	2.7.2	Rスタジオ
行列	1.5-4	Rスタジオ
メタ	5.2-0	Rスタジオ
その他のツール	0.6-28	Rスタジオ
ミックスオミクス	6.18.1	Rスタジオ
ミックスツール	1.2.0	Rスタジオ
pbapply	1.4-3	Rスタジオ
plsRcox	1.7.7	Rスタジオ
pROCの	1.18.0	Rスタジオ
R	4.1.3	Rスタジオ
ランダムフォレストSRC	4.6-14	Rスタジオ
リーダー	1.4.0	Rスタジオ
レシピ	0.1.17	Rスタジオ
形状変更2	1.4.4	Rスタジオ
rマークダウン	2.8	Rスタジオ
ROCit	2.1.1	Rスタジオ
ROCRの	1.0-11	Rスタジオ
秤	1.2.1	Rスタジオ
雀	1.0.3	Rスタジオ
ストリンガー	1.5.0	Rスタジオ
スーパーPC	1.12	Rスタジオ
生存	3.3-1	Rスタジオ
生存ROC	1.0.3	Rスタジオ
サバイバルSVM	0.0.5	Rスタジオ
SVA	3.40.0	Rスタジオ
testを	3.1.0	Rスタジオ
ティブル	3.2.1	Rスタジオ
ティディル	1.3.0	Rスタジオ
ティディバース	1.3.1	Rスタジオ
アップセットR	1.4.0	Rスタジオ
ビリディス	0.6.1	Rスタジオ

References

$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

Reuter, J. A., Spacek, D. V., Snyder, M. P. High-throughput sequencing technologies. Mol Cell. 58 (4), 586-597 (2015).
Adam, G., et al. Machine learning approaches to drug response prediction: challenges and recent progress. NPJ Precision Oncol. 4....

Access restricted. Please log in or start a trial to view this content.

Reprints and Permissions

Request permission to reuse the text or figures of this JoVE article

Request Permission

MIMEベースの機械学習フレームワークを用いたモデルの構築と可視化

In This Article

Summary

Abstract

Introduction

Protocol

Results

Discussion

Disclosures

Acknowledgements

Materials

References

Reprints and Permissions

Tags

Related Articles