April 18th, 2025
この研究では、機械学習モデルと競合するリスク分析を使用して、結腸直腸記号リング細胞癌患者の予後システムを評価します。これは、pN病期分類と比較して優れた予測因子として陽性リンパ節の対数オッズを特定し、強力な予測パフォーマンスを示し、堅牢な生存予測ツールを通じて臨床上の意思決定を支援します。
- 私たちの研究では、機械学習と競合するリスクモデルを使用して、結腸直腸印環細胞癌の 3 つのリンパ節病期分類システムを評価し、予後の精度と生存予測を最適化します。
機械学習などのインフォマティクス手法により、リスクモデルの比較とカプラン・マイヤー生存推定を使用して、生存予測とリンパ節分類の精度を高めます。
追跡期間を延長しながら、多様な集団で年代測定を行い、予後ノモグラムを改良し、結腸直腸印章環細胞癌の分子形質を調査して、臨床上の意思決定ツールを強化します。
[ナレーター]まず、SEERをダウンロードしてインストールします。次に、SEERデータベースWebサイトから統計8.4.3ソフトウェアを入手します。ソフトウェアにログインし、ケース リスト セッションをクリックし、続いてデータをクリックし、インシデント SEER リサーチ プラス データ、17 レジストリ、2022 年 11 月、サブ 2000 年から 2020 年のデータベースを選択します。次に、選択をクリックし、続いて編集をクリックして、2004年から2015年に等しい人種、性別、診断年を選択します。次に、サイト recode ICD-0-3 WHO 2008 を選択します。テーブルをクリックし、利用可能な変数インターフェイスで、必要なすべての診断の詳細を選択します。次に、出力をクリックします。データに名前を付け、[実行]をクリックしてデータを出力して保存します。次に、X-Tileソフトウェアを開き、ファイルをクリックして[開く]を選択します。データファイルを選択してソフトウェアにインポートします。データがロードされたら、生存状態に対応する変数センサー、マーカー 1 の生存時間を分析する変数としてマッピングし、データが正しく一致していることを確認します。次に、[do]をクリックし、次にKaplan-Meierとマーカー1をクリックして、Kaplan-Meier生存分析を実行し、生存曲線を生成します。次に、SRCC を含む合計 2,409 件の適格な患者データを、トレーニング コホート番号 1,686 と検証コホート番号 723 に 7 対 3 の比率でランダムに割り当てます。ランダム分割には、提供されたコードを使用します。必要なバージョンの RStudio および R ソフトウェアをダウンロードしてインストールします。[新しいファイル] をクリックし、[R スクリプト] を選択して、新しい R プログラミング インターフェイスを作成します。次に、コードエディタに関連するコードを入力し、[実行]をクリックしてコードを実行します。提供されたコードを使用して、Cox 回帰分析によって機械学習モデルに含まれる変数をスクリーニングします。さらに、SRCC 患者のがん特異的生存に対する LODDS、LNR、および PN 病期分類の影響を調査します。このコードを使用して、トレーニング、検証、および外部検証コホートにわたる 3 つのリンパ節システム、LODDS、LNR、および PN 病期分類の予後予測能力を比較します。次に、コードを使用して XGBoost モデルを構築し、変数の相対的な重要度を表す棒グラフを生成します。レシーバーの動作特性曲線と検量線を生成して、3つのリンパ節システムの性能を評価します。次に、コードを使用してランダムフォレストモデルを構築し、変数の相対的な重要度の棒グラフを生成します。同様に、レシーバ動作特性曲線と検量線を生成して、3つのリンパ節システムを評価および比較します。適切なコードを使用して、ニューラル ネットワーク モデルを構築し、変数の相対的な重要度の棒グラフを作成します。レシーバの動作特性と検量線を生成して、3つのリンパ節システムの予測性能を比較します。次に、単変量解析を実行し、data.csv ファイルを使用して累積インシデント関数曲線をプロットします。サイトを他の因子に置き換えて、各因子に対して単変量解析を実行します。多変量解析の場合は、コードを適用し、data1.csvで視覚化します。最後に、ノモグラム、受信機動作特性曲線、および検量線をプロットします。トレーニング コホートのデータを使用してモデルをトレーニングし、検証コホート データと外部検証コホート データを使用してモデルを検証します。多変量 Cox 回帰分析に基づいて、LNR、LODDS、および PN 病期分類はすべて、SRCC 患者のがん特異的生存率と有意に関連していました。LNRはRFモデルとXGBoostモデルで最も重要であり、LODDSはNNモデルで最も予測能力が高く、LODDSが全体的に最も信頼性の高いLNシステムであることを示唆しています。XGBoost、RF、およびNNモデルは、0.777〜0.851の範囲のAUC値と、45度の線と密接に一致する検量線で高い予測精度を達成し、モデルの信頼性を確認しました。競合するリスクモデル分析により、独立した予後因子として、T病期分類、N病期分類、M病期分類、LODDS分類、および原発腫瘍の位置が特定されました。 競合するリスクノモグラムは、AUCが0.75を超えるよく整列されたキャリブレーション曲線とROC曲線によって裏付けられ、正確な1年、3年、および5年のがん特異的生存予測を示しました。
View the full transcript and gain access to thousands of scientific videos
この研究は、機械学習モデルと競合リスク分析を使用して、大腸直腸のサインリング細胞癌患者の予後システムを評価します。正のリンパ節の対数オッズをpNステージングと比較して優れた予測因子として特定し、強力な予測性能を示し、堅牢な生存予測ツールを通じて臨床意思決定を支援します。