Method Article

Construindo e visualizando modelos usando a estrutura de aprendizado de máquina baseada em mime

DOI:

10.3791/68553

July 22nd, 2025

In This Article

Summary

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

O Mime é uma estrutura computacional flexível para construir um modelo de integração baseado em aprendizado de máquina com desempenho elegante. Aqui, fornecemos um procedimento passo a passo detalhado para o desenvolvimento de modelos preditivos com alta precisão, aproveitando conjuntos de dados complexos para identificar genes críticos associados à progressão da doença, resultados do paciente e resposta terapêutica.

Abstract

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

A tecnologia de sequenciamento de alto rendimento generalizada melhorou significativamente nossa compreensão da biologia e da heterogeneidade do câncer. Algoritmos de aprendizado de máquina em dados transcricionais tornaram-se vitais para prever o prognóstico do paciente e as respostas clínicas. Apesar dos avanços nos algoritmos de aprendizado de máquina, uma plataforma de código aberto que incorpora os algoritmos de aprendizado de máquina mais sofisticados em dados transcricionais permanece ausente. Para resolver essa lacuna, desenvolvemos o Mime, uma estrutura versátil de aprendizado de máquina para aprimorar a construção e visualização de modelos preditivos para características clínicas e assinaturas genéticas. Ao integrar diversos conjuntos de dados e empregar as técnicas de seleção de recursos mais avançadas, o Mime aborda desafios críticos em previsões clínicas. Ele fornece três funções principais, incluindo construção de modelo, seleção de recursos e visualização de dados. A construção do modelo abrange uma variedade de algoritmos de aprendizado de máquina, incluindo, entre outros, árvores de decisão, máquinas de vetores de suporte e métodos de conjunto, permitindo que os pesquisadores selecionem a abordagem mais adequada para sua análise específica. A seleção de recursos utiliza algoritmos avançados, como eliminação de recursos recursivos e regressão LASSO, para otimizar o conjunto de dados e focar nos recursos mais informativos. A estrutura oferece suporte ao ajuste de parâmetros personalizável por meio de métodos de validação cruzada, otimizando o desempenho do modelo e mitigando os riscos de sobreajuste. As ferramentas de visualização integradas ao Mime permitem que os pesquisadores interpretem os resultados do modelo de forma eficaz, fornecendo representações gráficas da importância do recurso e métricas de desempenho preditivo. Neste manuscrito, fornecemos um tutorial detalhado sobre os procedimentos passo a passo dessa estrutura versátil de aprendizado de máquina.

Introduction

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

A adoção generalizada de tecnologias de sequenciamento de alto rendimento influenciou significativamente nossa compreensão da biologia e da heterogeneidade do câncer1. Este avanço inovador na biotecnologia não apenas aprofundou nosso conhecimento científico, mas também revolucionou o campo da pesquisa médica. Ao permitir que os cientistas sequenciem grandes quantidades de material genético com rapidez e precisão, o sequenciamento de alto rendimento acelerou a descoberta de novos genes, mutações e vias biológicas. Um crescente corpo de pesquisa delineou assinaturas moleculares específicas associadas à progressão....

Access restricted. Please log in or start a trial to view this content.

Protocol

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

NOTA: Os tutoriais para este estudo são todos executados na plataforma Linux usando o software R. A versão do pacote R usada neste protocolo está listada na Tabela de Materiais. Cada etapa necessária para análise é mostrada abaixo e o protocolo detalhado também pode ser adquirido no GitHub (https://github.com/l-magnificence/Mime). Os usuários que encontrarem problemas com o Mime podem visitar a página de problemas do GitHub (https://github.com/l-magnificence/Mime/issues) para fornecer comentários.

1. Preparação de Mime e conjunto de dados de exemplo

  1. Instale a ve....

Access restricted. Please log in or start a trial to view this content.

Results

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

O genelist e o Example.cohort, incluindo uma coorte de treinamento e uma coorte de validação, foram usados para construir modelos prognósticos integrando 10 algoritmos de aprendizado de máquina no Mime. Entre os 117 modelos de prognóstico construídos por Mime, o modelo combinado StepCox [forward] + plsRcox (SPCOM) teve o maior índice C entre todas as coortes, indicando seu excelente desempenho (Figura 1A). Os pacientes foram separados em grupos de alto e baixo risco de acordo com a mediana d.......

Access restricted. Please log in or start a trial to view this content.

Discussion

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

Neste estudo, fornecemos uma descrição detalhada de como usar o pacote Mime para desenvolver modelos preditivos de aprendizado de máquina robustos e poderosos para dados transcriptômicos. Em estudos anteriores, os pesquisadores muitas vezes lutaram para selecionar o algoritmo de modelo preditivo apropriado com base nas características específicas de seus dados de sequenciamento13,14. Além disso, para pesquisadores sem formação em.......

Access restricted. Please log in or start a trial to view this content.

Disclosures

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

Não há conflitos de interesse declarados.

Acknowledgements

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

Agradecemos a todos os participantes e pesquisadores envolvidos na produção dos dados.

....

Access restricted. Please log in or start a trial to view this content.

Materials

List of materials used in this article
NameCompanyCatalog NumberComments
Nome do pacoteVersãoSoftware
enredo0.1.10Estúdio R
BART2.9.4Estúdio R
Boruta8.0.0Estúdio R
classe de câncer1.38.0Estúdio R
acento circunflexo6.0-89Estúdio R
Ckmeans.1d.dp4.3.5Estúdio R
compararC1.3.2Estúdio R
Mapa de calor complexo2.15.1Estúdio R
Composições2.0-4Estúdio R
data.table1.14.0Estúdio R
doParallel1.0.16Estúdio R
dplyr1.1.3Estúdio R
e10711.7-7Estúdio R
plotador florestal1.1.0Estúdio R
futuro1.21.0Estúdio R
Gbm2.1.8.1Estúdio R
bom jogo quebrado0.1.1Estúdio R
ggplot23.4.1Estúdio R
bom jogo pubr0.4.0Estúdio R
bom jogo2.9Estúdio R
boa sorte na rede4.1-2Estúdio R
grade4.1.3Estúdio R
gradeExtra2.3Estúdio R
GSEABase1.54.0Estúdio R
GSVA1.40.1Estúdio R
Hmisc5.1-1Estúdio R
kknn1.3.1Estúdio R
knitr1.42Estúdio R
magrittr2.7.2Estúdio R
Matriz1.5-4Estúdio R
meta5.2-0Estúdio R
Ferramentas Diversas0.6-28Estúdio R
mixOmics6.18.1Estúdio R
ferramentas de mistura1.2.0Estúdio R
pbapply1.4-3Estúdio R
por favorRcox1.7.7Estúdio R
Proc1.18.0Estúdio R
R4.1.3Estúdio R
randomForestSRC4.6-14Estúdio R
leitor1.4.0Estúdio R
Receitas0.1.17Estúdio R
remodelar 21.4.4Estúdio R
rmarkdown2.8Estúdio R
ROCit2.1.1Estúdio R
ROCR1.0-11Estúdio R
balança1.2.1Estúdio R
pardal1.0.3Estúdio R
longarina1.5.0Estúdio R
superpc1.12Estúdio R
sobrevivência3.3-1Estúdio R
survivalROC1.0.3Estúdio R
sobrevivênciasvm0.0.5Estúdio R
SVA3.40.0Estúdio R
teste isso3.1.0Estúdio R
Tibble3.2.1Estúdio R
Tirão1.3.0Estúdio R
arrumado1.3.1Estúdio R
UpSetR1.4.0Estúdio R
Viridis0.6.1Estúdio R

References

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,
  1. Reuter, J. A., Spacek, D. V., Snyder, M. P. High-throughput sequencing technologies. Mol Cell. 58 (4), 586-597 (2015).
  2. Adam, G., et al. Machine learning approaches to drug response prediction: challenges and recent progress. NPJ Precision Oncol. 4....

Access restricted. Please log in or start a trial to view this content.

Reprints and Permissions

Request permission to reuse the text or figures of this JoVE article

Request Permission

Tags

Machine Learning FrameworkPredictive Model ConstructionFeature SelectionData VisualizationTranscriptional SequencingPrognosis ModelingTherapeutic Response PredictionSurvival AnalysisCore Gene IdentificationModel Performance Metrics

Related Articles