April 18th, 2025
In dieser Studie werden prognostische Systeme für Patienten mit kolorektalem Siegelringzellkarzinom unter Verwendung von Modellen des maschinellen Lernens und konkurrierenden Risikoanalysen evaluiert. Es identifiziert die logarithmische Wahrscheinlichkeit positiver Lymphknoten als überlegenen Prädiktor im Vergleich zum pN-Staging, zeigt eine starke Vorhersageleistung und unterstützt die klinische Entscheidungsfindung durch robuste Überlebensvorhersagewerkzeuge.
- Unsere Forschung evaluiert drei Lymphknoten-Staging-Systeme beim kolorektalen Siegelringzellkarzinom unter Verwendung von maschinellem Lernen und den konkurrierenden Risikomodellen, um die prognostische Genauigkeit und die Überlebensvorhersage zu optimieren.
Mit Hilfe von Informatikmethoden, einschließlich maschinellem Lernen, dem Vergleich von Risikomodellen und der Kaplan-Meier-Überlebensschätzung, werden Methoden verwendet, um die Überlebensvorhersage und die Genauigkeit der Lymphknotenklassifizierung zu verbessern.
Verlängerung der Nachbeobachtungszeit bei gleichzeitiger Datierung in verschiedenen Populationen, Verfeinerung prognostischer Nomogramme und Erforschung molekularer Merkmale des kolorektalen Siegelringzellkarzinoms, um die klinischen Entscheidungsfindungsinstrumente zu verbessern.
[Erzähler] Laden Sie zunächst SEER herunter und installieren Sie es. Laden Sie dann die Statistiksoftware 8.4.3 von der SEER-Datenbank-Website herunter. Melden Sie sich bei der Software an, klicken Sie auf Falllistensitzung, gefolgt von Daten, und wählen Sie die Datenbank SEER-Forschung plus Daten, 17 Register, November 2022, unter 2000 bis 2020 aus. Klicken Sie nun auf Auswahl, gefolgt von Bearbeiten und wählen Sie Rasse, Geschlecht, Jahr der Diagnose gleich 2004 bis 2015. Wählen Sie dann Site Recode ICD-0-3 WHO 2008 aus. Klicken Sie auf die Tabelle und wählen Sie in der Benutzeroberfläche für verfügbare Variablen alle erforderlichen Diagnosedetails aus. Klicken Sie dann auf Ausgabe. Benennen Sie die Daten und klicken Sie auf Ausführen, um die Daten auszugeben und zu speichern. Öffnen Sie anschließend die X-Tile-Software, klicken Sie auf Datei und wählen Sie Öffnen. Wählen Sie die Datendatei aus, um sie in die Software zu importieren. Sobald die Daten geladen sind, ordnen Sie den variablen Sensor dem Überlebensstatus zu, wobei die Überlebenszeit in Markierung eins als zu analysierende Variable gilt, und stellen Sie sicher, dass die Daten korrekt übereinstimmen. Klicken Sie nun auf do, gefolgt von Kaplan-Meier und Markierung eins, um die Kaplan-Meier-Überlebensanalyse durchzuführen und die Überlebenskurve zu generieren. Ordnen Sie dann nach dem Zufallsprinzip insgesamt 2.409 geeignete Patientendaten mit SRCC einer Trainingskohorte mit der Nummer 1.686 und einer Validierungskohorte mit der Nummer 723 im Verhältnis 7:3 zu. Verwenden Sie den bereitgestellten Code für die zufällige Aufteilung. Laden Sie die erforderlichen Versionen der RStudio- und R-Software herunter und installieren Sie sie. Klicken Sie auf Neue Datei, und wählen Sie R-Skript aus, um eine neue R-Programmierschnittstelle zu erstellen. Geben Sie dann den entsprechenden Code in den Code-Editor ein und klicken Sie auf Ausführen, um den Code auszuführen. Verwenden Sie den bereitgestellten Code, um die Variablen zu überprüfen, die in den Machine Learning-Modellen durch die Cox-Regressionsanalyse enthalten sind. Untersuchen Sie außerdem die Auswirkungen von LODDS-, LNR- und PN-Stadien auf das krebsspezifische Überleben bei SRCC-Patienten. Verwenden Sie den Code, um die prognostischen Vorhersagefähigkeiten von drei Lymphknotensystemen, LODDS, LNR und PN-Staging, in den Trainings-, Validierungs- und externen Validierungskohorten zu vergleichen. Verwenden Sie dann den Code, um ein XGBoost-Modell zu erstellen und Balkendiagramme zu generieren, die die relative Bedeutung von Variablen darstellen. Erstellung von Betriebskennlinien und Kalibrierungskurven des Empfängers, um die Leistung der drei Lymphknotensysteme zu bewerten. Verwenden Sie als Nächstes den Code, um ein Random-Forest-Modell zu erstellen und Balkendiagramme für die relative Bedeutung von Variablen zu generieren. Generieren Sie in ähnlicher Weise Betriebskennlinien und Kalibrierungskurven des Empfängers, um die drei Lymphknotensysteme zu bewerten und zu vergleichen. Erstellen Sie mit dem entsprechenden Code ein neuronales Netzwerkmodell, und erstellen Sie Balkendiagramme der relativen Bedeutung von Variablen. Generieren Sie Betriebskennlinien und Kalibrierungskurven des Empfängers, um die Vorhersageleistung der drei Lymphknotensysteme zu vergleichen. Führen Sie dann eine univariate Analyse durch, und stellen Sie die Funktionskurve für kumulative Vorfälle mithilfe der Datei data.csv dar. Ersetzen Sie den Standort durch andere Faktoren, um für jeden Faktor eine univariate Analyse durchzuführen. Für eine multivariate Analyse wenden Sie den Code an, und visualisieren Sie ihn mit data1.csv. Zeichnen Sie abschließend das Nomogramm, die Betriebskennlinie des Empfängers und die Kalibrierungskurve. Trainieren Sie das Modell mit Daten aus der Trainingskohorte und verwenden Sie Validierungs- und externe Validierungskohortendaten, um das Modell zu validieren. Basierend auf einer multivariaten Cox-Regressionsanalyse waren LNR, LODDS und PN-Staging signifikant mit dem krebsspezifischen Überleben bei SRCC-Patienten assoziiert. LNR zeigte die höchste Bedeutung in den RF- und XGBoost-Modellen, während LODDS die größte Vorhersagefähigkeit im NN-Modell aufwies, was darauf hindeutet, dass LODDS das zuverlässigste LN-System insgesamt ist. Die XGBoost-, RF- und NN-Modelle erreichten eine hohe Vorhersagegenauigkeit mit AUC-Werten von 0,777 bis 0,851 und Kalibrierungskurven, die eng an der 45-Grad-Linie ausgerichtet waren, was die Zuverlässigkeit des Modells bestätigte. Die Analyse konkurrierender Risikomodelle identifizierte T-Staging, N-Staging, M-Staging, LODDS-Klassifikation und Primärtumorlokalisation als unabhängige prognostische Faktoren. Das konkurrierende Risikonomogramm zeigte genaue ein-, drei- und fünfjährige krebsspezifische Überlebensvorhersagen, unterstützt durch eine gut abgestimmte Kalibrierung und ROC-Kurven mit AUCs über 0,75.
View the full transcript and gain access to thousands of scientific videos
Diese Studie bewertet prognostische Systeme für Patienten mit kolorektalem Signetringzellkarzinom unter Verwendung von Machine-Learning-Modellen und kompetitiver Risikoanalyse. Sie identifiziert Log-Odds von positiven Lymphknoten als überlegenen Prädiktor im Vergleich zum pN-Stadium und zeigt eine starke prädiktive Leistung. Zudem unterstützt sie die klinische Entscheidungsfindung durch robuste Überlebensprädiktionswerkzeuge.