April 18th, 2025
Cette étude évalue les systèmes pronostiques des patients atteints d’un carcinome colorectal à cellules en anneau à l’aide de modèles d’apprentissage automatique et d’analyses de risque concurrentes. Il identifie les probabilités logarithmiques de ganglions lymphatiques positifs comme un prédicteur supérieur par rapport à la stadification pN, démontrant une forte performance prédictive et aidant à la prise de décision clinique grâce à des outils de prédiction de survie robustes.
- Notre recherche évalue trois systèmes de stadification ganglionnaire dans le carcinome colorectal à chevalières à l’aide de l’apprentissage automatique et des modèles de risque concurrents afin d’optimiser l’exactitude du pronostic et la prédiction de la survie.
Par des méthodes informatiques, y compris l’apprentissage automatique, la comparaison des modèles de risque et l’estimation de la survie de Kaplan-Meier sont utilisées pour améliorer la prédiction de la survie et la précision de la classification des ganglions lymphatiques.
Prolonger les périodes de suivi, tout en établissant des datations dans des populations diverses, en affinant les nomogrammes pronostiques et en explorant les caractéristiques moléculaires du carcinome colorectal à cellules en anneau de chevalière pour améliorer les outils de prise de décision clinique.
[Narrateur] Pour commencer, téléchargez et installez SEER. Procurez-vous ensuite le logiciel de statistiques 8.4.3 sur le site Web de la base de données SEER. Connectez-vous au logiciel et cliquez sur la session de liste de cas, puis sur données, puis sélectionnez les incidents SEER research plus data, 17 registres, novembre 2022, base de données sub 2000 à 2020. Maintenant, cliquez sur sélection, puis sur modifier et choisissez la race, le sexe, l’année de diagnostic égale à 2004 à 2015. Sélectionnez ensuite le site recoder CIM-0-3 OMS 2008. Cliquez sur le tableau et dans l’interface des variables disponibles, sélectionnez tous les détails de diagnostic requis. Cliquez ensuite sur Sortie. Nommez les données et cliquez sur exécuter pour afficher et enregistrer les données. Ensuite, ouvrez le logiciel X-Tile, cliquez sur fichier et choisissez Ouvrir. Sélectionnez le fichier de données pour l’importer dans le logiciel. Une fois les données chargées, mappez le capteur de variable correspondant à l’état de survie, le temps de survie au marqueur un comme variable à analyser, en vous assurant que les données correspondent correctement. Cliquez maintenant sur faire, puis sur Kaplan-Meier et le marqueur un pour effectuer l’analyse de survie de Kaplan-Meier et générer la courbe de survie. Ensuite, attribuez au hasard un total de 2 409 données de patients éligibles avec le SRCC à une cohorte d’entraînement numéro 1 686 et à une cohorte de validation numéro 723 dans un rapport de 7-3. Utilisez le code fourni pour le fractionnement aléatoire. Téléchargez et installez les versions requises des logiciels RStudio et R. Cliquez sur nouveau fichier et sélectionnez R Script pour créer une nouvelle interface de programmation R. Entrez ensuite le code correspondant dans l’éditeur de code et cliquez sur exécuter pour exécuter le code. Utilisez le code fourni pour filtrer les variables incluses dans les modèles d’apprentissage automatique par l’analyse de régression de Cox. De plus, explorez l’impact de LODDS, LNR et NP sur la survie spécifique au cancer chez les patients atteints de SRCC. Utilisez le code pour comparer les capacités de prédiction pronostique de trois systèmes ganglionnaires, LODDS, LNR et stadification PN dans les cohortes d’entraînement, de validation et de validation externe. Ensuite, utilisez le code pour construire un modèle XGBoost et générer des graphiques à barres représentant l’importance relative des variables. Générer des courbes caractéristiques de fonctionnement du récepteur et des courbes d’étalonnage pour évaluer les performances des trois systèmes ganglionnaires. Ensuite, utilisez le code pour construire un modèle de forêt aléatoire et générer des graphiques à barres de l’importance relative des variables. De même, générer des courbes caractéristiques de fonctionnement du récepteur et des courbes d’étalonnage pour évaluer et comparer les trois systèmes ganglionnaires. Avec le code approprié, construisez un modèle de réseau neuronal et produisez des graphiques à barres de l’importance relative des variables. Générer des caractéristiques de fonctionnement du récepteur et des courbes d’étalonnage pour comparer les performances prédictives des trois systèmes de ganglions lymphatiques. Ensuite, effectuez une analyse univariée et tracez la courbe de fonction des incidents cumulés à l’aide du fichier data.csv. Remplacez le site par d’autres facteurs pour effectuer une analyse univariée de chaque facteur. Pour une analyse multivariée, appliquez le code et visualisez avec data1.csv. Enfin, tracez le nomogramme, la courbe caractéristique de fonctionnement du récepteur et la courbe d’étalonnage. Entraînez le modèle à l’aide des données de la cohorte d’entraînement et utilisez les données de la cohorte de validation et de la cohorte de validation externe pour valider le modèle. D’après l’analyse de régression multivariée de Cox, la LNR, le LODDS et la stadification PN étaient tous significativement associés à la survie spécifique au cancer chez les patients atteints de SRCC. La LNR a montré la plus grande importance dans les modèles RF et XGBoost, tandis que LODDS avait la plus grande capacité prédictive dans le modèle NN, suggérant que LODDS est le système LN le plus fiable dans l’ensemble. Les modèles XGBoost, RF et NN ont atteint une grande précision prédictive avec des valeurs AUC allant de 0,777 à 0,851, et des courbes d’étalonnage étroitement alignées sur la ligne de 45 degrés, confirmant la fiabilité du modèle. L’analyse des modèles de risque concurrents a identifié la stadification T, la stadification N, la stadification M, la classification LODDS et la localisation de la tumeur primaire comme facteurs pronostiques indépendants. Le nomogramme de risque concurrent a démontré des prédictions précises de survie spécifiques au cancer à un, trois et cinq ans, étayées par un étalonnage bien aligné et des courbes ROC avec des AUC supérieures à 0,75.
View the full transcript and gain access to thousands of scientific videos
Cette étude évalue les systèmes pronostiques pour les patients atteints de carcinome colorectal à cellules en bague à sceau en utilisant des modèles d'apprentissage automatique et des analyses de risques concurrents. Elle identifie les log-odds de ganglions lymphatiques positifs comme un prédicteur supérieur par rapport au stade pN, démontrant une forte performance prédictive et aidant à la prise de décision clinique grâce à des outils robustes de prédiction de survie.