Research Article

A análise integrada de bioinformática dos dados transcriptômicos humanos identifica três biomarcadores diagnósticos e prognósticos chave no adenocarcinoma pulmonar

DOI:

10.3791/71214

June 30th, 2026

In This Article

Summary

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

Este estudo identificou biomarcadores diagnósticos e prognósticos para adenocarcinoma pulmonar usando TCGA-LUAD e GEO GSE115002 dados transcriptômicos. B3GNT3, FERMT1 e SPP1 foram regulados para cima, distinguindo tumores do tecido normal. Esses genes estão ligados à transição epitelial-mesenquimata e à imunossupressão. Um nomograma combinando expressão gênica com o estágio TNM mostrou valor preditivo confiável.

Abstract

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

O adenocarcinoma pulmonar (LUAD) é a principal causa de mortes relacionadas ao câncer no mundo. Apesar dos avanços em cirurgia, terapia direcionada e imunoterapia, a taxa de sobrevivência avançada do LUAD em 5 anos permanece abaixo de 20%, indicando uma necessidade urgente de biomarcadores moleculares confiáveis para detecção precoce e prognóstico. Neste estudo, os autores levantaram a hipótese de que três genes consistentemente aumentados poderiam atuar como biomarcadores diagnósticos e prognósticos eficazes para a LUAD. Os autores analisaram dados transcriptômicos de duas coortes independentes, TCGA-LUAD (535 tumores, 59 amostras normais) e GSE115002 (52 tumores, 52 amostras normais correspondentes), para triar genes expressos diferencialmente. Três genes centrais — B3GNT3, FERMT1 e SPP1 — foram consistentemente superexpressos nos tumores LUAD em ambos os conjuntos de dados. Esses genes apresentaram excelente desempenho diagnóstico, com valores de AUC acima de 0,95 no TCGA-LUAD e alta precisão em GSE115002. A análise de sobrevivência mostrou que alta expressão de cada gene estava significativamente associada a uma sobrevivência geral mais curta e livre de doença, e a regressão multivariada de Cox verificou seu valor prognóstico independente. A análise de enriquecimento funcional indicou que esses três genes participam da transição epitelial-mesenquimal, remodelação da matriz extracelular e imunosupressão, todos intimamente relacionados à invasão e metástase do LUAD. Os autores ainda construíram um nomograma prognóstico combinando os três genes e o estágio TNM, alcançando um índice de concordância de 0,743 e demonstrando bom desempenho preditivo. Esses achados confirmam que B3GNT3, FERMT1 e SPP1 são biomarcadores diagnósticos e prognósticos promissores para o LUAD, apoiando a aplicação clínica na estratificação e manejo de riscos.

Introduction

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

O câncer de pulmão é a principal causa de mortalidade global por câncer, representando aproximadamente 1,8 milhão de mortes em 2020. O adenocarcinoma pulmonar (LUAD) representa quase 40% de todos os casos de câncer depulmão 2. Apesar dos avanços em cirurgia, terapia direcionada e imunoterapia, a taxa de sobrevivência a 5 anos para LUAD avançado permanece abaixo de 20%3,4. Biomarcadores moleculares confiáveis para detecção precoce e prognóstica precisa são urgentemente necessários. Sequenciamento de alto rendimento e bancos de dados públicos como The Cancer Genome Atlas (TCGA) e Gene Expression Omnibus (GEO) permitem o perfilamento transcriptômico sistemático doscânceres 5,6. A bioinformática integrativa entre coortes melhora a confiabilidade da descoberta de biomarcadorescandidatos 5.

Muitos genes e vias foram implicados no LUAD, incluindo proliferação celular, sinalização de EGFR e fuga imune7. No entanto, poucos foram traduzidos para uso clínico. Modelos de risco que combinam assinaturas gênicas e características clinicopatológicas — especialmente nomogramas — melhoram a precisão prognóstica noLUAD 8. Embora B3GNT3, FERMT1 e SPP1 tenham sido individualmente ligados à progressão do câncer, seu valor diagnóstico combinado, prognóstico e regulatório imuno-microambiental no LUAD não foi validado sistematicamente entre coortes independentes. Este estudo fornece a primeira análise integrada multiplataforma desses três genes como um painel unificado de biomarcadores para LUAD, com um nomograma prognóstico clinicamente aplicável.

B3GNT3 codifica uma glicosiltransferase que estabiliza PD-L1 e promove a evasão imune 9,10. FERMT1 (kindlin-1) regula a ativação da integrina e impulsiona a metástase em câncer de pulmão de células não pequenas (NSCLC)11,12. SPP1 (osteopontina) media a remodelação da matriz extracelular, a transição epitelial-mesenquimatar (EMT) e a quimiorresistência 13,14,15. Genes relacionados ao relógio circadiano também demonstraram prever o prognóstico e o diagnósticodo LUAD 16, enquanto diferenças sexuais no LUAD foram descobertas por meio de redes integrativas de sinalização proteicamulti-ômicas 17. B3GNT3 e SPP1 são secretados ou localizados em membranas, apoiando o uso potencial como biomarcadores minimamente invasivos. A classificação eficaz do LUAD e a identificação de biomarcadores também podem ser alcançadas por meio de métodos sobrepostos de seleçãode características 18, e interações multiômicas desempenham papéis funcionais importantes na progressão do câncerde pulmão 19. Assinaturas genéticas mitocondriais, identificadas por meio de integração multi-ômica abrangente, também têm valor para o prognóstico do LUAD e para a terapiapersonalizada 20. B3GNT3 e SPP1 são secretados ou localizados em membranas, apoiando o uso potencial como biomarcadores minimamente invasivos. Este estudo teve como objetivo identificar biomarcadores robustos de LUAD usando bioinformática integrativa, avaliar seu desempenho diagnóstico e prognóstico, explorar suas funções biológicas e associações imunológicas, e construir um nomograma prognóstico clinicamente útil.

Protocol

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

1. Fontes de dados e pré-processamento

  1. Processar dados brutos em R (versão 4.1.3; Windows 10 Pro).
  2. Para GSE115002, aplique normalização de quantil usando limma (versão 3.52.3).
  3. Filtrar genes de baixa expressão para TCGA: reter genes com CPM > 0,5 em ≥50% das amostras.
  4. Filtrar genes de baixa expressão para GSE115002: manter genes com sinal médio >50.
  5. log2Transforme valores de expressão com uma pseudocontagem de +1.
    NOTA: A expressão gênica e os dados clínicos do LUAD foram obtidos do TCGA-LUAD (versão 33.0, Portal GDC, baixado em 7 de agosto de 2025) e GSE115002 (Agilent microarray, GEO, baixado em 7 de agosto de 2025). O TGA-LUAD incluiu 535 tumores e 59 amostras normais. GSE115002 incluíram 52 tumores e 52 amostras normais correspondentes.

2. Identificação de genes diferencialmente expressos

  1. Use o DESeq2 (versão 1.36.0) para o RNA-seq do TCGA e o limma (versão 3.52.3) para GSE115002 para análise diferencial de expressão. Calcule os valores P ajustados (FDR) usando o método de Benjamini–Hochberg.
  2. Para garantir a comparabilidade entre conjuntos de dados, um |log₂FC| unificado ≥ 1,0 foi aplicado para ambas as turmas. Os DEGs foram definidos como FDR < 0,05 e |log₂FC| ≥ 1.0. DEGs sobrepostos foram identificados usando o VennDiagram (versão 1.7.3). B3GNT3, FERMT1 e SPP1 foram selecionados como candidatos consistentemente aumentados e com relevância conhecida para o câncer.

3. Avaliação do valor diagnóstico

  1. Construa curvas ROC para cada gene candidato.
  2. Determine os valores de corte ótimos usando o índice de Youden.
  3. Calcule AUC, sensibilidade e especificidade para cada gene.
  4. Construa um painel diagnóstico combinado usando regressão logística multivariada.
    NOTA: O pacote pROC v1.18.0 foi usado para análise ROC. A função glm com a família binomial foi usada para construir o modelo diagnóstico.

4. Análise de sobrevivência

  1. Estratificar os pacientes em grupos de alta e baixa expressão usando a expressão mediana.
  2. Gerar curvas de sobrevivência de Kaplan–Meier para cada gene.
  3. Realize testes log-rank para comparar as diferenças de sobrevivência.
  4. Realize uma análise de regressão de Cox univariada.
  5. Realize uma análise multivariada de regressão de Cox.
  6. Incluir covariáveis clínicas em modelos de regressão.
  7. Verifique a suposição de riscos proporcionais usando resíduos de Schoenfeld.
  8. Calcule uma pontuação de risco de três genes.
    NOTA: Foram usados Survival v3.3.1 e survminer v0.4.9. As covariáveis incluíam idade, sexo, estágio T, estágio N e estágio M. A pontuação de risco foi calculada como:
    Pontuação de risco = (0,328 × B3GNT3) + (0,331 × FERMT1) + (0,321 × SPP1). (1)

5. Enriquecimento de conjuntos gênicos e anotação funcional

  1. Realize a análise de enriquecimento GO usando DEGs.
  2. Realize a análise de enriquecimento de vias KEGG usando DEGs.
  3. Realize a análise de enriquecimento do conjunto de genes (GSEA).
  4. Classifice genes pela correlação de Pearson com a expressão gênica candidata.
  5. Identifique termos significativos usando P ajustado < 0,05.
    NOTA: o clusterProfiler v4.6.2 foi usado para análises GO e KEGG. FGSEA v1.22.0 e MSigDB Hallmark v7.5 foram usados para GSEA.

6. Correlação e análise de redes

NOTA: A correlação de Pearson foi usada para expressão gênica normalmente distribuída; Correlação de Spearman para frações de células imunes. Redes PPI foram geradas usando STRING (versão 11.5, confiança > 0.7) e visualizadas no Cytoscape (versão 3.9.1). A infiltração imune foi estimada usando CIBERSORT (modo absoluto, 100 permutações). O sequenciamento de RNA unicelular demonstrou revelar transições específicas no microambiente NSCLC, relevantes para a análise de infiltraçãoimune 21,22, e a análise integrativa de célula única pode dissecar ainda mais os papéis das células imunes, como as células de memória CD8+, no LUAD 23,24,25.

7. Construção e validação de nomogramas

NOTA: As variáveis para o nomograma foram selecionadas com base na significância multivariada de Cox (P < 0,05): Estágio T, Estágio N, B3GNT3, FERMT1 e SPP1. O nomograma foi construído usando rms (versão 6.5.0). A validação interna usava 1000 reamostragem bootstrap com substituição. Curvas de calibração e análise de curvas de decisão (DCA) foram realizadas usando RMDA (versão 1.7). O ambiente computacional incluía R 4.1.3, Windows 10 Pro e Bioconductor 3.15. Os roteiros de análise estão disponíveis em https://github.com/[redacted]/LUAD-biomarker-2025 mediante solicitação razoável.

8. Análise estatística

NOTA: Todos os testes estatísticos foram bilaterais; P < 0,05 foi considerado significativo.

Results

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

Alterações globais na expressão gênica no LUAD

Comparações transcriptômicas entre tecidos adenocarcinomas pulmonares e tecidos pulmonares normais identificaram mudanças generalizadas na expressão gênica. A Figura 1A mostra gráficos vulcânicos de genes diferencialmente expressos no conjunto de dados TCGA-LUAD, e a Figura 1B mostra aqueles do conjunto de dados GSE115002. Na coorte TCGA-LUAD (Figura 1A), 1865 genes foram significativamente regulados para cima, e 1247 genes foram regulados para baixo. Na GSE115002 coorte (Figura 1B), 645 genes foram regulados para cima e 609 para baixo. Um total de 421 genes foi consistentemente regulado para cima em ambos os conjuntos de dados. Entre esses genes sobrepostos, B3GNT3, FERMT1 e SPP1 estão marcados nas Figuras 1A e 1B como marcadamente superexpressos em amostras tumorais. No TCGA-LUAD, a expressão de B3GNT3 aumentou aproximadamente 5 vezes, FERMT1 8 vezes e SPP1 10 vezes em comparação com tecidos normais. Regulação para cima semelhante foi confirmada em GSE115002, com os três genes apresentando elevação mais do que o dobro.

Desempenho diagnóstico de B3GNT3, FERMT1 e SPP1

A análise da curva característica operacional do receptor foi usada para avaliar o desempenho diagnóstico de B3GNT3, FERMT1 e SPP1. A Figura 2A apresenta as curvas ROC na coorte TCGA-LUAD, e a Figura 2B apresenta as da coorte GSE115002. Todos os três genes alcançaram alta precisão diagnóstica em ambas as coortes. Na coorte TCGA-LUAD (Figura 2A), a área sob os valores da curva excedeu 0,95 para todos os marcadores. Na coorte independente de GSE115002 (Figura 2B), áreas igualmente altas sob os valores da curva foram observadas. Sensibilidade e especificidade variaram de 85% a 95% nos valores de corte ótimos. Esses resultados confirmam que cada gene oferece excelente discriminação entre tecido tumoral e normal.

Significado prognóstico da expressão de B3GNT3, FERMT1 e SPP1

As curvas de sobrevivência de Kaplan–Meier na Figura 3 revelam que a alta expressão de cada gene esteve significativamente associada a uma sobrevivência geral mais curta em ambas as coortes. As figuras 3A–3C mostram curvas de sobrevivência geral para B3GNT3, FERMT1 e SPP1 na coorte TCGA-LUAD. As figuras 3D–3F mostram as curvas correspondentes na coorte GSE115002. Pacientes com expressão alta de B3GNT3, FERMT1 ou SPP1 apresentaram redução da sobrevivência mediana e taxas de sobrevivência menores em 5 anos. A análise de regressão multivariada confirmou que a alta expressão de SPP1 permaneceu um fator prognóstico independente e ruim. A expressão elevada dos três genes também esteve associada a uma sobrevivência livre de doença mais curta. Tendências consistentes em ambas as coortes indicam que a superexpressão de B3GNT3, FERMT1 e SPP1 prevê desfechos clínicos desfavoráveis no adenocarcinoma pulmonar.

Análise de enriquecimento funcional

Os resultados da análise de enriquecimento funcional são resumidos na Figura 4. A Figura 4A mostra o enriquecimento GO e KEGG na coorte TCGA-LUAD, e a Figura 4B mostra o enriquecimento na coorte GSE115002. Genes regulados para cima foram fortemente enriquecidos na progressão do ciclo celular, organização da matriz extracelular, adesão focal e sinalização oncogênica. Genes com regulação negativa foram associados à diferenciação epitelial normal e à sinalização p53. Essas observações indicam que os três genes candidatos participam de vias que promovem proliferação, invasão e desregulação imunológica no adenocarcinoma pulmonar.

Redes de coexpressões

Redes de coexpressões associadas a B3GNT3, FERMT1 e SPP1 são apresentadas na Figura 5. A Figura 5A mostra a rede na coorte TCGA-LUAD, e a Figura 5B mostra a rede na coorte GSE115002. Nós representam genes e arestas representam coeficientes de correlação. Os três genes-chave se agrupam com genes de remodelação ECM, regulação imune e organização do citoesqueleto. Esses achados sugerem que a superexpressão dos três genes está associada a um microambiente tumoral imunossupressor.

Desempenho do nomograma prognóstico

O nomograma prognóstico é apresentado na Figura 6. O modelo foi construído integrando o estágio T patológico, o estágio N patológico e os níveis de expressão de B3GNT3, FERMT1 e SPP1 para prever a sobrevivência geral de 1, 2 e 3 anos no LUAD. Pontos são atribuídos para cada variável, e o total de pontos corresponde à probabilidade prevista de sobrevivência. O modelo alcançou um índice de concordância de 0,743, indicando bom desempenho preditivo. As curvas de calibração mostraram uma concordância próxima entre as probabilidades previstas e reais de sobrevivência. A análise da curva de decisão confirmou o benefício líquido clínico. Este nomograma melhora a previsão individualizada de sobrevivência além do estádio convencional de TNM.

Em resumo, este estudo destaca B3GNT3, FERMT1 e SPP1 como atores moleculares centrais na patogênese do LUAD. Sua superexpressão está correlacionada com fenótipos tumorais invasivos, remodelação estromalica e evasão imunológica. Por meio da integração multi-ômica, demonstramos o valor combinado desses genes para diagnóstico, prognóstico e estratificação do paciente. Pesquisas futuras devem explorar sua relevância preditiva para a resposta imunoterapêutica e avaliar seu potencial como alvos terapêuticos no LUAD.

figure-results-1
Figura 1: Gráficos vulcânicos de genes diferencialmente expressos em tumores LUAD versus tecidos normais. (A) Conjunto de dados TCGA-LUAD. (B) GSE115002 conjunto de dados. Vermelho indica genes significativamente aumentados; Azul indica genes com regulação negativa. B3GNT3, FERMT1 e SPP1 são rotulados como consistentemente regulados para cima. Por favor, clique aqui para ver uma versão ampliada desta figura.

figure-results-2
Figura 2: Curvas ROC para B3GNT3, FERMT1 e SPP1 na distinção entre LUAD e tecidos normais. (A) Coorte TCGA-LUAD. (B) GSE115002 coorte. Os valores de AUC demonstram alta precisão diagnóstica. Por favor, clique aqui para ver uma versão ampliada desta figura.

figure-results-3
Figura 3: Curvas de sobrevivência geral de Kaplan-Meier estratificadas pelos níveis de expressão de B3GNT3, FERMT1 e SPP1 . (A–C) Coorte TCGA-LUAD. (A) B3GNT3, (B) FERMT1, (C) SPP1. (D–F) GSE115002 coorte. (D) B3GNT3, (E) FERMT1, (F) SPP1. A alta expressão de cada gene está significativamente associada a uma sobrevivência geral mais curta em ambas as coortes. Os valores de HR e P dos testes log-rank são fornecidos. Por favor, clique aqui para ver uma versão ampliada desta figura.

figure-results-4
Figura 4: Análise de enriquecimento GO e KEGG dos DEGs correlacionada com os três genes-chave. (A) Coorte TCGA-LUAD. (B) GSE115002 coorte. Os termos de enriquecimento incluem processo biológico (BP), componente celular (CC), função molecular (MF) e vias KEGG. Genes regulados em alta são enriquecidos em proliferação, remodelação de ECM e sinalização oncogênica. Por favor, clique aqui para ver uma versão ampliada desta figura.

figure-results-5
Figura 5: Redes de coexpressões gênicas associadas a B3GNT3, FERMT1 e SPP1. (A) Coorte TCGA-LUAD. (B) GSE115002 coorte. Nós representam genes, e arestas representam coeficientes de correlação. Os três genes-chave se agrupam com genes de remodelação ECM, regulação imune e organização do citoesqueleto. Por favor, clique aqui para ver uma versão ampliada desta figura.

figure-results-6
Figura 6: Nomograma prognóstico integrando estágios patológicos T, estágio patológico N, B3GNT3, FERMT1 e SPP1 para prever a sobrevivência geral de 1, 2 e 3 anos em LUAD. Pontos são atribuídos para cada variável, e o total de pontos corresponde à probabilidade prevista de sobrevivência. Por favor, clique aqui para ver uma versão ampliada desta figura.

Discussion

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

O nomograma foi construído usando análise multivariada de regressão de Cox baseada na coorte TCGA-LUAD. Os preditores incluem o estágio patológico T, o estágio patológico N e o estado de expressão gênica de B3GNT3, FERMT1 e SPP1 (categorizados como Alto vs. Baixo com base na expressão mediana). Para cada paciente, as pontuações individuais de cada variável são somadas para gerar um valor de "Pontos Totais", que corresponde às probabilidades estimadas de sobrevivência geral de 1, 2 e 3 anos. Escores totais mais altos indicam maior risco de mortalidade. Essa ferramenta fornece previsão individualizada de sobrevivência e auxilia na estratificação de risco de LUAD. O aprendizado de máquina tem sido usado para revelar padrões diversos de morte celular no prognóstico e na terapiado LUAD 21,22,23, o que pode otimizar ainda mais nosso modelo de nomograma.

Este estudo identificou B3GNT3, FERMT1 e SPP1 como biomarcadores diagnósticos e prognósticos robustos no LUAD usando análise integrada de bioinformática. Todos os três genes são consistentemente superexpressos em tumores, distinguem tumores de tecidos normais com alta precisão, preveem baixa sobrevivência e regulam vias relacionadas à EMT, remodelação matricial e evasão imunológica. Um nomograma combinado melhora a estratificação de risco além do estágio TNM. O B3GNT3 promove a evasão imune ao estabilizar PD-L1 por glicosilação 9,10. O FERMT1 potencializa a sinalização da integrina e a motilidade celular, impulsionando invasão e metástase 11,12. O SPP1 funciona como um driver secretado da EMT, angiogênese e da polarização 13,14,15 dos macrófagos M2. Juntos, definem um subtipo agressivo de LUAD, caracterizado por invasividade e imunossupressão.

Estudos anteriores relataram papéis individuais de B3GNT3, FERMT1 ou SPP1 no LUAD. Este estudo é o primeiro a validar os três como um painel unificado entre coortes transcriptômicas independentes, com desempenho diagnóstico e prognóstico confirmado tanto em dados TCGA quanto GEO. Trabalhos recentes sobre biomarcadores LUAD apoiam o valor das assinaturas genéticas imunológicas associadas para prognóstico e orientação em imunoterapia. Estudos recentes usando bioinformática integrada e aprendizado de máquina identificaram múltiplas assinaturas gênicas para diagnóstico e prognóstico deLUAD 21,22. Essas abordagens, semelhantes ao nosso painel de três genes, destacam o valor dos biomarcadores baseados em transcriptoma na estratificação clínica.

A remodelação da matriz extracelular é uma característica central do LUAD agressivo, e assinaturas relacionadas à ECM foram validadas como fatores prognósticos independentes. Nossas descobertas de que FERMT1 e SPP1 estão intimamente associadas à adesão focal e à interação ECM–receptor reforçam ainda mais o papel crítico da remodelação matricial na progressão do LUAD. Semelhante ao CHAF1B e assinaturas genéticas relacionadas à ubiquitina relatadas na medicina interdisciplinar (IMed)21,23, nossos três genes estão intimamente associados à infiltração imune e podem servir tanto como marcadores prognósticos quanto preditivos. Estratégias alternativas para identificar biomarcadores LUAD incluem sequenciamento de RNA unicelular, transcriptômica espacial, seleção de características baseada em aprendizado de máquina e perfil proteômicoplasmático 24,25,26. Algoritmos de aprendizado de máquina como random forest ou LASSO poderiam refinar ainda mais a seleção de biomarcadores. A validação em laboratório úmido usando qPCR, IHC e ELISA é essencial para confirmar a tradução clínica 27,28,29,30.

Este estudo é limitado por seu desenho retrospectivo, dependência de dados transcriptômicos públicos e falta de validação clínica externa. A validação por nomograma se limitava à reamostragem interna de bootstrap. Dados transcriptômicos em massa não podem resolver a expressão em nível celular. A causalidade mecanicista requer experimentos funcionais. Correlações com infiltração imune baseiam-se em deconvolução computacional e devem ser interpretadas com cautela. Estudos futuros devem validar esses biomarcadores em coortes prospectivas usando IHC, qPCR e ELISA sérico. A transcriptômica de célula única e espacial esclarecerá fontes celulares e distribuição espacial. O valor preditivo da imunoterapia e da resposta terapêutica direcionada deve ser avaliado. A segmentação terapêutica de B3GNT3, FERMT1 e SPP1 pode oferecer novas estratégias para o tratamento com LUAD.

Disclosures

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

Os autores declaram não haver interesses concorrentes.

Acknowledgements

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

Esse trabalho foi apoiado pelo Projeto Universitário de Nível Universitário da Universidade de Medicina Tradicional Chinesa de Fujian 2024 (Número da Bolsa: XB2024012), liderado por Yuhui Lin do Hospital Popular Afiliado da Universidade de Medicina Tradicional Chinesa de Fujian. e Fundos Conjuntos para a inovação em ciência e tecnologia, Província de Fujian (Subsídio nº 2025Y9530), liderados por Xiaoting Chen do Hospital Municipal de Jinjiang (Hospital Popular Sexto de Xangai, Fujian).

Materials

List of materials used in this article
NameCompanyCatalog NumberComments
Publicly Available DatasetsTCGA-LUAD DatasetThe Cancer Genome Atlas (TCGA) Portal (https://portal.gdc.cancer.gov/); 535 LUAD tumor samples, 59 adjacent normal lung tissue samples (RNA-sequencing count/FPKM values + clinical data: survival, TNM staging)Transcriptomic and clinical data for differential expression, survival, and nomogram analysis; primary study cohort
GSE115002 DatasetGene Expression Omnibus (GEO) (https://www.ncbi.nlm.nih.gov/geo/query/acc.cgi?acc=GSE115002); Agilent microarray, 52 LUAD tumor tissues, 52 matched adjacent normal lung tissues (treatment-naïve primary tumors)Independent validation cohort for differential expression, diagnostic performance, and immune infiltration analysis
Bioinformatics Software & Programming EnvironmentR Programming LanguageVersion 4.1Core platform for all transcriptomic, statistical, and graphical analyses
R Packages (Differential Expression)DESeq2, limmaDESeq2: TCGA RNA-seq raw count differential expression analysis; limma: GSE115002 microarray normalization and differential expression analysis (Benjamini–Hochberg FDR correction)
R Packages (Diagnostic Analysis)pROCConstruction of ROC curves, calculation of AUC (95% CI), optimal cutoff determination (Youden’s index) for diagnostic performance assessment
R Packages (Survival Analysis)survival, survminerKaplan–Meier survival curve generation, log-rank test, univariate/multivariate Cox proportional hazards regression (HR + 95% CI); patient stratification by median gene expression
R Packages (Functional Enrichment)clusterProfiler, fgseaclusterProfiler: GO (BP/CC/MF) and KEGG pathway enrichment analysis (adjusted P < 0.05); fgsea: GSEA for MSigDB Hallmark/KEGG gene sets (FDR < 0.25)
R Packages (Nomogram Construction & Validation)rmsDevelopment of prognostic nomogram (integration of gene expression + TNM stage); Harrell’s C-index calculation, bootstrap resampling (1000 repetitions) for bias correction, calibration plot generation
R Packages (Statistical & Visualization)ggplot2, ComplexHeatmap, corrplotGeneration of volcano plots, bubble plots (enrichment), heatmaps (immune infiltration correlation), scatter plots (gene co-expression); Pearson/Spearman correlation analysis
Bioinformatics Databases & Tools (Network/Immune Analysis)STRING DatabaseConfidence score > 0.7Construction of protein–protein interaction (PPI) networks for B3GNT3/FERMT1/SPP1 and first-degree interactors
Cytoscape-Visualization of PPI and gene co-expression networks (edge weighting by correlation strength, hub gene identification)
Immune Deconvolution AlgorithmCIBERSORTEstimation of immune cell infiltration abundance (M2 macrophages, CD8+ T cells, neutrophils, NK cells, etc.) in LUAD samples; correlation with candidate gene expression
Other ToolsMicrosoft Office/LaTeX-Manuscript preparation, figure assembly, and table formatting; statistical result compilation

Reprints and Permissions

Request permission to reuse the text or figures of this JoVE article

Request Permission

Tags

Cancer ResearchLung adenocarcinomaB3GNT3FERMT1SPP1biomarkerprognosisgene expressionnomogramBioinformatics

Related Articles