Construindo e visualizando modelos usando a estrutura de aprendizado de máquina baseada em mime

Hongwei Liu; Wei Zhang; Yihao Zhang; Xuejun Li; Siyi Wanggou

doi:10.3791/68553

Method Article

Construindo e visualizando modelos usando a estrutura de aprendizado de máquina baseada em mime

DOI:

10.3791/68553

⸱

July 22nd, 2025

Hongwei Liu*¹^,²^,³^,⁴ , Wei Zhang*¹^,²^,³^,⁴ , Yihao Zhang*¹^,²^,³^,⁴ , Xuejun Li¹^,²^,³^,⁴ , Siyi Wanggou¹^,²^,³^,⁴

¹Department of Neurosurgery, Xiangya Hospital, Central South University, ²National Clinical Research Center for Geriatric Disorders, Xiangya Hospital, Central South University, ³Hunan International Scientific and Technological Cooperation Base of Brain Tumor Research, Xiangya Hospital, Central South University, ⁴Furong Laboratory

Summary

$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

O Mime é uma estrutura computacional flexível para construir um modelo de integração baseado em aprendizado de máquina com desempenho elegante. Aqui, fornecemos um procedimento passo a passo detalhado para o desenvolvimento de modelos preditivos com alta precisão, aproveitando conjuntos de dados complexos para identificar genes críticos associados à progressão da doença, resultados do paciente e resposta terapêutica.

Abstract

$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

A tecnologia de sequenciamento de alto rendimento generalizada melhorou significativamente nossa compreensão da biologia e da heterogeneidade do câncer. Algoritmos de aprendizado de máquina em dados transcricionais tornaram-se vitais para prever o prognóstico do paciente e as respostas clínicas. Apesar dos avanços nos algoritmos de aprendizado de máquina, uma plataforma de código aberto que incorpora os algoritmos de aprendizado de máquina mais sofisticados em dados transcricionais permanece ausente. Para resolver essa lacuna, desenvolvemos o Mime, uma estrutura versátil de aprendizado de máquina para aprimorar a construção e visualização de modelos preditivos para características clínicas e assinaturas genéticas. Ao integrar diversos conjuntos de dados e empregar as técnicas de seleção de recursos mais avançadas, o Mime aborda desafios críticos em previsões clínicas. Ele fornece três funções principais, incluindo construção de modelo, seleção de recursos e visualização de dados. A construção do modelo abrange uma variedade de algoritmos de aprendizado de máquina, incluindo, entre outros, árvores de decisão, máquinas de vetores de suporte e métodos de conjunto, permitindo que os pesquisadores selecionem a abordagem mais adequada para sua análise específica. A seleção de recursos utiliza algoritmos avançados, como eliminação de recursos recursivos e regressão LASSO, para otimizar o conjunto de dados e focar nos recursos mais informativos. A estrutura oferece suporte ao ajuste de parâmetros personalizável por meio de métodos de validação cruzada, otimizando o desempenho do modelo e mitigando os riscos de sobreajuste. As ferramentas de visualização integradas ao Mime permitem que os pesquisadores interpretem os resultados do modelo de forma eficaz, fornecendo representações gráficas da importância do recurso e métricas de desempenho preditivo. Neste manuscrito, fornecemos um tutorial detalhado sobre os procedimentos passo a passo dessa estrutura versátil de aprendizado de máquina.

Introduction

$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

A adoção generalizada de tecnologias de sequenciamento de alto rendimento influenciou significativamente nossa compreensão da biologia e da heterogeneidade do câncer¹. Este avanço inovador na biotecnologia não apenas aprofundou nosso conhecimento científico, mas também revolucionou o campo da pesquisa médica. Ao permitir que os cientistas sequenciem grandes quantidades de material genético com rapidez e precisão, o sequenciamento de alto rendimento acelerou a descoberta de novos genes, mutações e vias biológicas. Um crescente corpo de pesquisa delineou assinaturas moleculares específicas associadas à progressão....

Access restricted. Please log in or start a trial to view this content.

Protocol

$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

NOTA: Os tutoriais para este estudo são todos executados na plataforma Linux usando o software R. A versão do pacote R usada neste protocolo está listada na Tabela de Materiais. Cada etapa necessária para análise é mostrada abaixo e o protocolo detalhado também pode ser adquirido no GitHub (https://github.com/l-magnificence/Mime). Os usuários que encontrarem problemas com o Mime podem visitar a página de problemas do GitHub (https://github.com/l-magnificence/Mime/issues) para fornecer comentários.

1. Preparação de Mime e conjunto de dados de exemplo

Instale a ve....

Access restricted. Please log in or start a trial to view this content.

Results

$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

O genelist e o Example.cohort, incluindo uma coorte de treinamento e uma coorte de validação, foram usados para construir modelos prognósticos integrando 10 algoritmos de aprendizado de máquina no Mime. Entre os 117 modelos de prognóstico construídos por Mime, o modelo combinado StepCox [forward] + plsRcox (SPCOM) teve o maior índice C entre todas as coortes, indicando seu excelente desempenho (Figura 1A). Os pacientes foram separados em grupos de alto e baixo risco de acordo com a mediana d.......

Access restricted. Please log in or start a trial to view this content.

Discussion

$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

Neste estudo, fornecemos uma descrição detalhada de como usar o pacote Mime para desenvolver modelos preditivos de aprendizado de máquina robustos e poderosos para dados transcriptômicos. Em estudos anteriores, os pesquisadores muitas vezes lutaram para selecionar o algoritmo de modelo preditivo apropriado com base nas características específicas de seus dados de sequenciamento^13,14. Além disso, para pesquisadores sem formação em.......

Access restricted. Please log in or start a trial to view this content.

Disclosures

$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

Não há conflitos de interesse declarados.

Acknowledgements

$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

Agradecemos a todos os participantes e pesquisadores envolvidos na produção dos dados.

....

Access restricted. Please log in or start a trial to view this content.

Materials

List of materials used in this article
Name	Company	Catalog Number
Nome do pacote	Versão	Software
enredo	0.1.10	Estúdio R
BART	2.9.4	Estúdio R
Boruta	8.0.0	Estúdio R
classe de câncer	1.38.0	Estúdio R
acento circunflexo	6.0-89	Estúdio R
Ckmeans.1d.dp	4.3.5	Estúdio R
compararC	1.3.2	Estúdio R
Mapa de calor complexo	2.15.1	Estúdio R
Composições	2.0-4	Estúdio R
data.table	1.14.0	Estúdio R
doParallel	1.0.16	Estúdio R
dplyr	1.1.3	Estúdio R
e1071	1.7-7	Estúdio R
plotador florestal	1.1.0	Estúdio R
futuro	1.21.0	Estúdio R
Gbm	2.1.8.1	Estúdio R
bom jogo quebrado	0.1.1	Estúdio R
ggplot2	3.4.1	Estúdio R
bom jogo pubr	0.4.0	Estúdio R
bom jogo	2.9	Estúdio R
boa sorte na rede	4.1-2	Estúdio R
grade	4.1.3	Estúdio R
gradeExtra	2.3	Estúdio R
GSEABase	1.54.0	Estúdio R
GSVA	1.40.1	Estúdio R
Hmisc	5.1-1	Estúdio R
kknn	1.3.1	Estúdio R
knitr	1.42	Estúdio R
magrittr	2.7.2	Estúdio R
Matriz	1.5-4	Estúdio R
meta	5.2-0	Estúdio R
Ferramentas Diversas	0.6-28	Estúdio R
mixOmics	6.18.1	Estúdio R
ferramentas de mistura	1.2.0	Estúdio R
pbapply	1.4-3	Estúdio R
por favorRcox	1.7.7	Estúdio R
Proc	1.18.0	Estúdio R
R	4.1.3	Estúdio R
randomForestSRC	4.6-14	Estúdio R
leitor	1.4.0	Estúdio R
Receitas	0.1.17	Estúdio R
remodelar 2	1.4.4	Estúdio R
rmarkdown	2.8	Estúdio R
ROCit	2.1.1	Estúdio R
ROCR	1.0-11	Estúdio R
balança	1.2.1	Estúdio R
pardal	1.0.3	Estúdio R
longarina	1.5.0	Estúdio R
superpc	1.12	Estúdio R
sobrevivência	3.3-1	Estúdio R
survivalROC	1.0.3	Estúdio R
sobrevivênciasvm	0.0.5	Estúdio R
SVA	3.40.0	Estúdio R
teste isso	3.1.0	Estúdio R
Tibble	3.2.1	Estúdio R
Tirão	1.3.0	Estúdio R
arrumado	1.3.1	Estúdio R
UpSetR	1.4.0	Estúdio R
Viridis	0.6.1	Estúdio R

References

$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

Reuter, J. A., Spacek, D. V., Snyder, M. P. High-throughput sequencing technologies. Mol Cell. 58 (4), 586-597 (2015).
Adam, G., et al. Machine learning approaches to drug response prediction: challenges and recent progress. NPJ Precision Oncol. 4....

Access restricted. Please log in or start a trial to view this content.

Reprints and Permissions

Request permission to reuse the text or figures of this JoVE article

Request Permission

Construindo e visualizando modelos usando a estrutura de aprendizado de máquina baseada em mime

In This Article

Summary

Abstract

Introduction

Protocol

Results

Discussion

Disclosures

Acknowledgements

Materials

References

Reprints and Permissions

Tags

Related Articles