April 18th, 2025
Este estudio evalúa los sistemas pronósticos para pacientes con carcinoma colorrectal de células en anillo de sello utilizando modelos de aprendizaje automático y análisis de riesgo competitivos. Identifica las probabilidades logarítmicas de ganglios linfáticos positivos como un predictor superior en comparación con la estadificación de pN, lo que demuestra un sólido rendimiento predictivo y ayuda a la toma de decisiones clínicas a través de sólidas herramientas de predicción de superviv
- Nuestra investigación evalúa tres sistemas de estadificación de ganglios linfáticos en carcinoma colorrectal de células en anillo de sello utilizando el aprendizaje automático y los modelos de riesgo competitivos para optimizar la precisión del pronóstico y la predicción de supervivencia.
Mediante métodos informáticos, incluido el aprendizaje automático, la comparación de modelos de riesgo y la estimación de supervivencia de Kaplan-Meier se utilizan para mejorar la predicción de supervivencia y la precisión de la clasificación de los ganglios linfáticos.
Extender los períodos de seguimiento, mientras se datan en poblaciones diversas, refinar los nomogramas pronósticos y explorar los rasgos moleculares del carcinoma colorrectal de células en anillo de sello para mejorar las herramientas de toma de decisiones clínicas.
[Narrador] Para comenzar, descargue e instale SEER. A continuación, obtenga el software estadístico 8.4.3 en el sitio web de la base de datos SEER. Inicie sesión en el software y haga clic en la sesión de la lista de casos, seguida de los datos, y seleccione los incidentes SEER research plus data, 17 registros, noviembre de 2022, base de datos sub 2000 a 2020. Ahora, haga clic en selección, seguido de editar y elija raza, sexo, año de diagnóstico igual a 2004 a 2015. Luego seleccione el sitio recodificar ICD-0-3 OMS 2008. Haga clic en la tabla y en la interfaz de variables disponibles, seleccione todos los detalles de diagnóstico requeridos. Luego haga clic en salida. Asigne un nombre a los datos y haga clic en ejecutar para generar y guardar los datos. A continuación, abra el software X-Tile, haga clic en archivo y elija abrir. Seleccione el archivo de datos para importarlo al software. Una vez cargados los datos, mapee el sensor variable correspondiente al estado de supervivencia, el tiempo de supervivencia en el marcador uno como la variable a analizar, asegurando que los datos coincidan correctamente. Ahora haga clic en hacer, seguido de Kaplan-Meier y el marcador uno para realizar el análisis de supervivencia de Kaplan-Meier y generar la curva de supervivencia. Luego, asigne aleatoriamente un total de 2,409 datos de pacientes elegibles con SRCC a una cohorte de entrenamiento número 1,686 y una cohorte de validación número 723 en una proporción de 7-3. Utilice el código proporcionado para la división aleatoria. Descargue e instale las versiones necesarias del software RStudio y R. Haga clic en nuevo archivo y seleccione R Script para crear una nueva interfaz de programación de R. Luego ingrese el código relevante en el editor de código y haga clic en ejecutar para ejecutar el código. Utilice el código proporcionado para examinar las variables incluidas en los modelos de aprendizaje automático mediante el análisis de regresión de Cox. Además, explore el impacto de la estadificación LODDS, LNR y PN en la supervivencia específica del cáncer en pacientes con CCR. Use el código para comparar las capacidades de predicción pronóstica de tres sistemas de ganglios linfáticos, LODDS, LNR y estadificación de NP en las cohortes de entrenamiento, validación y validación externa. A continuación, utilice el código para crear un modelo XGBoost y generar gráficos de barras que representen la importancia relativa de las variables. Genere curvas características operativas del receptor y curvas de calibración para evaluar el rendimiento de los tres sistemas de ganglios linfáticos. A continuación, emplee el código para construir un modelo de bosque aleatorio y generar gráficos de barras de la importancia relativa de las variables. De manera similar, genere curvas características operativas del receptor y curvas de calibración para evaluar y comparar los tres sistemas de ganglios linfáticos. Con el código apropiado, construya un modelo de red neuronal y produzca gráficos de barras de la importancia relativa de las variables. Genere curvas de calibración y características operativas del receptor para comparar el rendimiento predictivo de los tres sistemas de ganglios linfáticos. A continuación, realice un análisis univariante y trace la curva de función de incidentes acumulativos utilizando el archivo data.csv. Reemplace el sitio con otros factores para realizar un análisis univariante para cada factor. Para el análisis multivariante, aplique el código y visualícelo con data1.csv. Finalmente, trace el nomograma, la curva característica operativa del receptor y la curva de calibración. Entrene el modelo con datos de la cohorte de entrenamiento y use datos de validación y cohorte de validación externa para validar el modelo. Con base en el análisis de regresión multivariante de Cox, la LNR, la LODDS y la estadificación de NP se relacionaron significativamente con la supervivencia específica del cáncer en pacientes con CCRC. LNR mostró la mayor importancia en los modelos RF y XGBoost, mientras que LODDS tuvo la mayor capacidad predictiva en el modelo NN, lo que sugiere LODDS como el sistema LN más confiable en general. Los modelos XGBoost, RF y NN lograron una alta precisión predictiva con valores AUC que oscilan entre 0,777 y 0,851, y curvas de calibración que se alinearon estrechamente con la línea de 45 grados, lo que confirma la fiabilidad del modelo. En el análisis del modelo de riesgo competitivo, se identificó la estadificación T, la estadificación N, la estadificación M, la clasificación LODDS y la ubicación del tumor primario como factores pronósticos independientes. El nomograma de riesgo competitivo demostró predicciones precisas de supervivencia específica del cáncer a uno, tres y cinco años, respaldadas por curvas ROC y de calibración bien alineadas con AUC superiores a 0,75.
View the full transcript and gain access to thousands of scientific videos
Este estudio evalúa los sistemas pronósticos para pacientes con carcinoma de células de anillo signo colorrectal utilizando modelos de aprendizaje automático y análisis de riesgo competitivo. Identifica las probabilidades logarítmicas de ganglios linfáticos positivos como un predictor superior en comparación con la estadificación pN, demostrando un fuerte rendimiento predictivo y ayudando a la toma de decisiones clínicas a través de herramientas de predicción de supervivencia robustas.