April 18th, 2025
Este estudo avalia sistemas prognósticos para pacientes com carcinoma de células em anel de sinete colorretal usando modelos de aprendizado de máquina e análises de risco concorrentes. Ele identifica as chances logarítmicas de linfonodos positivos como um preditor superior em comparação com o estadiamento pN, demonstrando forte desempenho preditivo e auxiliando na tomada de decisões clínicas por meio de ferramentas robustas de previsão de sobrevida.
- Nossa pesquisa avalia três sistemas de estadiamento de linfonodos no carcinoma de células do anel de sinete colorretal usando aprendizado de máquina e os modelos de risco concorrentes para otimizar a precisão prognóstica e a previsão de sobrevida.
Por métodos de informática, incluindo aprendizado de máquina, comparação de modelos de risco e a estimativa de sobrevida de Kaplan-Meier são usados para melhorar a previsão de sobrevida e a precisão da classificação dos linfonodos.
Estendendo os períodos de acompanhamento, enquanto namora em diversas populações, refinando nomogramas prognósticos e explorando características moleculares do carcinoma de células em anel de sinete colorretal para aprimorar as ferramentas de tomada de decisão clínica.
[Narrador] Para começar, baixe e instale o SEER. Em seguida, obtenha o software de estatísticas 8.4.3 no site do banco de dados SEER. Faça login no software e clique na sessão da lista de casos, seguida de dados, e selecione o banco de dados de incidentes SEER research plus, 17 registros, novembro de 2022, sub 2000 a 2020. Agora, clique em seleção, seguido de editar e escolha raça, sexo, ano de diagnóstico igual a 2004 a 2015. Em seguida, selecione o site recode CID-0-3 OMS 2008. Clique na tabela e na interface de variáveis disponíveis, selecione todos os detalhes de diagnóstico necessários. Em seguida, clique em saída. Nomeie os dados e clique em executar para gerar e salvar os dados. Em seguida, abra o software X-Tile, clique em arquivo e escolha abrir. Selecione o arquivo de dados para importá-lo para o software. Depois que os dados forem carregados, mapeie o sensor variável correspondente ao status de sobrevivência, o tempo de sobrevivência no marcador um como a variável a ser analisada, garantindo que os dados correspondam corretamente. Agora clique em fazer, seguido de Kaplan-Meier e marcador um para realizar a análise de sobrevida de Kaplan-Meier e gerar a curva de sobrevida. Em seguida, atribua aleatoriamente um total de 2.409 dados de pacientes elegíveis com SRCC a uma coorte de treinamento número 1.686 e uma coorte de validação número 723 em uma proporção de 7-3. Use o código fornecido para divisão aleatória. Baixe e instale as versões necessárias do software RStudio e R. Clique em novo arquivo e selecione Script R para criar uma nova interface de programação R. Em seguida, insira o código relevante no editor de código e clique em executar para executar o código. Use o código fornecido para filtrar as variáveis incluídas nos modelos de aprendizado de máquina pela análise de regressão de Cox. Além disso, explore o impacto do estadiamento LODDS, LNR e NP na sobrevida específica do câncer em pacientes com SRCC. Use o código para comparar as habilidades de previsão prognóstica de três sistemas de linfonodos, LODDS, LNR e estadiamento de NP nas coortes de treinamento, validação e validação externa. Em seguida, use o código para criar um modelo XGBoost e gerar gráficos de barras que representam a importância relativa das variáveis. Gere curvas características de operação do receptor e curvas de calibração para avaliar o desempenho dos três sistemas de linfonodos. Em seguida, empregue o código para criar um modelo de floresta aleatória e gerar gráficos de barras da importância relativa das variáveis. Da mesma forma, gere curvas características de operação do receptor e curvas de calibração para avaliar e comparar os três sistemas de linfonodos. Com o código apropriado, crie um modelo de rede neural e produza gráficos de barras da importância relativa das variáveis. Gere curvas de calibração e características de operação do receptor para comparar o desempenho preditivo dos três sistemas de linfonodos. Em seguida, execute a análise univariada e plote a curva da função de incidentes cumulativos usando o arquivo data.csv. Substitua o site por outros fatores para realizar a análise univariada para cada fator. Para análise multivariada, aplique o código e visualize com data1.csv. Finalmente, plote o nomograma, a curva característica de operação do receptor e a curva de calibração. Treine o modelo usando dados da coorte de treinamento e use dados de validação e coorte de validação externa para validar o modelo. Com base na análise de regressão de Cox multivariada, LNR, LODDS e estadiamento de NP foram significativamente associados à sobrevida específica do câncer em pacientes com SRCC. O LNR mostrou a maior importância nos modelos RF e XGBoost, enquanto o LODDS teve a maior capacidade preditiva no modelo NN, sugerindo o LODDS como o sistema LN mais confiável em geral. Os modelos XGBoost, RF e NN alcançaram alta precisão preditiva com valores de AUC variando de 0,777 a 0,851 e curvas de calibração alinhadas estreitamente com a linha de 45 graus, confirmando a confiabilidade do modelo. A análise do modelo de risco competitivo identificou o estadiamento T, o estadiamento N, o estadiamento M, a classificação LODDS e a localização do tumor primário como fatores prognósticos independentes. O nomograma de risco competitivo demonstrou previsões precisas de sobrevida específica para câncer de um, três e cinco anos, apoiadas por calibração bem alinhada e curvas ROC com AUCs acima de 0,75.
View the full transcript and gain access to thousands of scientific videos
Este estudo avalia sistemas prognósticos para pacientes com carcinoma de células em anel de sinete colorretal usando modelos de aprendizado de máquina e análises de risco concorrente. Ele identifica log odds de linfonodos positivos como um preditor superior comparado ao estágio pN, demonstrando forte desempenho preditivo e auxiliando na tomada de decisões clínicas por meio de ferramentas robustas de previsão de sobrevida.