Research Article

L'analisi integrata bioinformatica dei dati trascrittomici umani identifica tre biomarcatori diagnostici e prognostici chiave nell'adenocarcinoma polmonare

DOI:

10.3791/71214

June 30th, 2026

In This Article

Summary

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

Questo studio ha identificato biomarcatori diagnostici e prognostici per l'adenocarcinoma polmonare utilizzando TCGA-LUAD e GEO GSE115002 dati trastomici. B3GNT3, FERMT1 e SPP1 sono stati regolati al massimo, distinguendo i tumori dal tessuto normale. Questi geni sono collegati alla transizione epiteliale-mesenchimale e all'immunosoppressione. Un nomogramma che combina l'espressione genica con lo stadio TNM ha mostrato un valore predittivo affidabile.

Abstract

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

L'adenocarcinoma polmonare (LUAD) è la principale causa di morte correlata al cancro a livello mondiale. Nonostante i progressi nella chirurgia, nella terapia mirata e nell'immunoterapia, il tasso di sopravvivenza a 5 anni del LUAD avanzato rimane sotto il 20%, indicando un bisogno urgente di biomarcatori molecolari affidabili per la diagnosi precoce e la prognosi. In questo studio, gli autori hanno ipotizzato che tre geni costantemente aumentati potessero agire come biomarcatori diagnostici e prognostici efficaci per la LUAD. Gli autori hanno analizzato dati trascritomici di due coorti indipendenti, TCGA-LUAD (535 tumori, 59 campioni normali) e GSE115002 (52 tumori, 52 campioni normali corrispondenti), per analizzare geni espressi differenzialmente. Tre geni fondamentali—B3GNT3, FERMT1 e SPP1—sono stati costantemente sovraespressi nei tumori LUAD in entrambi i dataset. Questi geni hanno mostrato eccellenti prestazioni diagnostiche, con valori AUC superiori a 0,95 in TCGA-LUAD e alta accuratezza in GSE115002. L'analisi di sopravvivenza ha mostrato che un'alta espressione di ciascun gene era significativamente associata a una sopravvivenza complessiva più breve e senza malattia, e la regressione multivariata di Cox ne ha verificato il valore prognostico indipendente. L'analisi dell'arricchimento funzionale ha indicato che questi tre geni partecipano alla transizione epiteliale-mesenchimatore, alla rimodellazione della matrice extracellulare e alla soppressione immunitaria, tutti strettamente correlati all'invasione e alla metastasi del LUAD. Gli autori hanno inoltre costruito un nomogramma prognostico combinando i tre geni e lo stadio TNM, raggiungendo un indice di concordanza di 0,743 e dimostrando buone prestazioni predittive. Questi risultati confermano che B3GNT3, FERMT1 e SPP1 sono biomarcatori diagnostici e prognostici promettenti per LUAD, supportando l'applicazione clinica nella stratificazione e gestione del rischio.

Introduction

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

Il cancro ai polmoni è la principale causa di mortalità globale per cancro, con circa 1,8 milioni di decessi nel 2020. L'adenocarcinoma polmonare (LUAD) rappresenta quasi il 40% di tutti i casi di cancroai polmoni 2. Nonostante i progressi nella chirurgia, nella terapia mirata e nell'immunoterapia, il tasso di sopravvivenza a 5 anni per il LUAD avanzato rimane sotto il 20%3,4. Sono urgentemente necessari biomarcatori molecolari affidabili per una diagnosi precoce e una previsione precisa. Il sequenziamento ad alta produttività e i database pubblici come The Cancer Genome Atlas (TCGA) e Gene Expression Omnibus (GEO) permettono una profilazione trascritomica sistematica deitumori 5,6. La bioinformatica integrativa cross-cohort migliora l'affidabilità della scoperta di biomarcatoricandidati 5.

Molti geni e vie sono stati implicati nel LUAD, tra cui la proliferazione cellulare, la segnalazione dell'EGFR e la fugaimmunitaria 7. Tuttavia, pochi sono stati tradotti in uso clinico. I modelli di rischio che combinano firme geniche e caratteristiche clinicopatologiche—specialmente nomogrammi—migliorano l'accuratezza prognostica in LUAD8. Sebbene B3GNT3, FERMT1 e SPP1 siano stati individualmente collegati alla progressione del cancro, il loro valore regolatorio combinato diagnostico, prognostico e microambientale immunitario nel LUAD non è stato sistematicamente validato tra coorti indipendenti. Questo studio fornisce la prima analisi integrata e cross-platform di questi tre geni come pannello unificato di biomarcatori per LUAD, con un nomogramma prognostico clinicamente applicabile.

B3GNT3 codifica una glicosiltransferasi che stabilizza PD-L1 e promuove l'evasioneimmunitaria 9,10. FERMT1 (kindlin-1) regola l'attivazione dell'integrina e favorisce la metastasi nel cancro polmonare non a piccole cellule (NSCLC)11,12. SPP1 (osteopontina) media la rimodellazione della matrice extracellulare, la transizione epiteliale-mesenchimale (EMT) e la chemioresistenza 13,14,15. È stato inoltre dimostrato che i geni correlati all'orologio circadiano prevedono la prognosi e la diagnosi16 della LUAD, mentre le differenze di sesso nella LUAD sono state scoperte tramite reti di segnalazione proteica integrativamulti-omiche 17. B3GNT3 e SPP1 sono secreti o localizzati in membrana, supportando un potenziale utilizzo come biomarcatori minimamente invasivi. Una classificazione efficace LUAD e l'identificazione dei biomarcatori possono essere ottenute anche attraverso metodi di selezione delle caratteristichesovrapposti 18, e le interazioni multi-omiche svolgono ruoli funzionali importanti nella progressione del cancropolmonare 19. Le firme geniche mitocondriali, identificate tramite integrazione multi-omica completa, hanno anch'esse valore per la prognosi LUAD e la terapiapersonalizzata 20. B3GNT3 e SPP1 sono secreti o localizzati in membrana, supportando un potenziale utilizzo come biomarcatori minimamente invasivi. Questo studio mirava a identificare biomarcatori LUAD robusti utilizzando bioinformatica integrativa, valutarne le prestazioni diagnostiche e prognostiche, esplorarne le funzioni biologiche e le associazioni immunitarie, e costruire un nomogramma prognostico clinicamente utile.

Protocol

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

1. Fonti di dati e preelaborazione

  1. Elaborare i dati grezzi in R (versione 4.1.3; Windows 10 Pro).
  2. Per GSE115002, applicare la normalizzazione dei quantili usando limma (versione 3.52.3).
  3. Filtrare i geni a bassa espressione per TCGA: trattenere geni con CPM > 0,5 nel ≥50% dei campioni.
  4. Filtrare i geni a bassa espressione per GSE115002: mantenere i geni con segnale medio >50.
  5. log2Trasformare i valori delle espressioni con un pseudoconteggio di +1.
    NOTA: L'espressione genica e i dati clinici del LUAD sono stati ottenuti da TCGA-LUAD (versione 33.0, GDC Portal, scaricato il 7 agosto 2025) e GSE115002 (Agilent microarray, GEO, scaricato il 7 agosto 2025). TCGA-LUAD ha incluso 535 tumori e 59 campioni normali. GSE115002 includevano 52 tumori e 52 campioni normali corrispondenti.

2. Identificazione di geni espressi differenzialmente

  1. Usa DESeq2 (versione 1.36.0) per TCGA RNA-seq e limma (versione 3.52.3) per GSE115002 per l'analisi delle espressioni differenziali. Calcola i valori P aggiustati (FDR) usando il metodo di Benjamini–Hochberg.
  2. Per garantire la comparabilità tra dataset, un unificato |log₂FC| ≥ 1.0 è stato applicato per entrambe le coorti. I DEG erano definiti come FDR < 0,05 e |log₂FC| ≥ 1.0. I DEG sovrapposti sono stati identificati utilizzando VennDiagram (versione 1.7.3). B3GNT3, FERMT1 e SPP1 sono stati selezionati come candidati costantemente aumentati e con rilevanza nota per il cancro.

3. Valutazione del valore diagnostico

  1. Costruire curve ROC per ogni gene candidato.
  2. Determina i valori ottimali del cutoff utilizzando l'indice di Youden.
  3. Calcola AUC, sensibilità e specificità per ogni gene.
  4. Costruisci un pannello diagnostico combinato usando regressione logistica multivariata.
    NOTA: Il pacchetto pROC v1.18.0 è stato utilizzato per l'analisi ROC. La funzione glm con la famiglia binomiale è stata utilizzata per costruire il modello diagnostico.

4. Analisi della sopravvivenza

  1. Stratificare i pazienti in gruppi ad alta e bassa espressione usando l'espressione mediana.
  2. Generare curve di sopravvivenza di Kaplan–Meier per ogni gene.
  3. Esegui test log-rank per confrontare le differenze di sopravvivenza.
  4. Condurre un'analisi di regressione di Cox univariata.
  5. Condurre un'analisi di regressione Cox multivariata.
  6. Includere le covariate cliniche nei modelli di regressione.
  7. Verificare l'assunzione dei rischi proporzionali utilizzando i residui di Schoenfeld.
  8. Calcola un punteggio di rischio su tre geni.
    NOTA: Sono stati utilizzati Survival v3.3.1 e survivor v0.4.9. Le covariate includevano età, sesso, stadio T, stadio N e stadio M. Il punteggio di rischio è stato calcolato come:
    Punteggio di rischio = (0,328 × B3GNT3) + (0,331 × FERMT1) + (0,321 × SPP1). (1)

5. Arricchimento degli insiemi genici e annotazione funzionale

  1. Esegui l'analisi di arricchimento GO utilizzando i DEG.
  2. Eseguire l'analisi di arricchimento dei percorsi KEGG utilizzando i DEG.
  3. Condurre l'analisi di arricchimento del set genico (GSEA).
  4. Classificare i geni in base alla correlazione di Pearson con l'espressione genica candidata.
  5. Identificare termini significativi usando P < 0,05 aggiustata.
    NOTA: il clusterProfiler v4.6.2 è stato utilizzato per le analisi GO e KEGG. FGSEA v1.22.0 e MSigDB Hallmark v7.5 sono stati utilizzati per GSEA.

6. Correlazione e analisi delle reti

NOTA: La correlazione di Pearson è stata utilizzata per l'espressione genica normalmente distribuita; Correlazione di Spearman per le frazioni delle cellule immunitarie. Le reti PPI sono state generate utilizzando STRING (versione 11.5, confidenza > 0.7) e visualizzate in Cytoscape (versione 3.9.1). L'infiltrazione immunitaria è stata stimata usando CIBERSORT (modalità assoluta, 100 permutazioni). Il sequenziamento a RNA a singola cellula ha dimostrato di rivelare transizioni di nicchia nel microambiente NSCLC, rilevanti per l'analisi dell'infiltrazioneimmunitaria 21,22, e l'analisi integrativa a singola cellula può ulteriormente dissezionare i ruoli delle cellule immunitarie, come le cellule di memoria CD8+, in LUAD 23,24,25.

7. Costruzione e validazione del nomogramma

NOTA: Le variabili per il nomogramma sono state selezionate in base alla significanza multivariata di Cox (P < 0,05): stadio T, stadio N, B3GNT3, FERMT1 e SPP1. Il nomogramma è stato costruito usando rms (versione 6.5.0). La validazione interna utilizzava 1000 bootstrap resampling con sostituzione. Le curve di calibrazione e l'analisi della curva decisionale (DCA) sono state eseguite utilizzando rmda (versione 1.7). L'ambiente computazionale includeva R 4.1.3, Windows 10 Pro e Bioconductor 3.15. Gli script di analisi sono disponibili su https://github.com/[redacted]/LUAD-biomarker-2025 su richiesta ragionevole.

8. Analisi statistica

NOTA: Tutti i test statistici erano a doppio verso; P < 0,05 è stato considerato significativo.

Results

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

Alterazioni globali dell'espressione genica in LUAD

Confronti trascricomici tra tessuti adenocarcinomi polmonari e tessuti polmonari normali hanno identificato ampi cambiamenti nell'espressione genica. La Figura 1A mostra i grafici vulcanici dei geni espressi differenzialmente nel dataset TCGA-LUAD, mentre la Figura 1B mostra quelli presenti nel dataset GSE115002. Nella coorte TCGA-LUAD (Figura 1A), 1865 geni erano significativamente alzati e 1247 geni erano sottoregolati. Nella GSE115002 coorte (Figura 1B), 645 geni sono stati aumentati e 609 sottoregolati. Un totale di 421 geni è stato costantemente aumentato in entrambi i dataset. Tra questi geni sovrapposti, B3GNT3, FERMT1 e SPP1 sono etichettati nelle Figure 1A e 1B come marcatamente sovraespressi nei campioni tumorali. Nel TCGA-LUAD, l'espressione di B3GNT3 è aumentata di circa 5 volte, di FERMT1 8 volte e di SPP1 di 10 volte rispetto ai tessuti normali. Una regolazione al rialzo simile è stata confermata nel GSE115002, con tutti e tre i geni che hanno mostrato un'elevazione superiore al doppio.

Prestazioni diagnostiche di B3GNT3, FERMT1 e SPP1

L'analisi della curva caratteristica di funzionamento del ricevitore è stata utilizzata per valutare le prestazioni diagnostiche di B3GNT3, FERMT1 e SPP1. La Figura 2A presenta le curve ROC nella coorte TCGA-LUAD, mentre la Figura 2B presenta quelle della coorte GSE115002. Tutti e tre i geni hanno raggiunto un'elevata accuratezza diagnostica in entrambe le coorti. Nella coorte TCGA-LUAD (Figura 2A), l'area sotto i valori della curva ha superato 0,95 per tutti i marcatori. Nella coorte GSE115002 indipendente (Figura 2B), sono state osservate un'area altissima sotto i valori della curva. Sensibilità e specificità variavano dall'85% al 95% ai valori di soglia ottimali. Questi risultati confermano che ogni gene fornisce un'eccellente discriminazione tra tessuto tumorale e tessuti normali.

Significato prognostico dell'espressione di B3GNT3, FERMT1 e SPP1

Le curve di sopravvivenza di Kaplan–Meier nella Figura 3 rivelano che un'alta espressione di ciascun gene era significativamente associata a una sopravvivenza complessiva più breve in entrambe le coorti. Le figure 3A–3C mostrano le curve di sopravvivenza complessiva per B3GNT3, FERMT1 e SPP1 nella coorte TCGA-LUAD. Le figure 3D–3F mostrano le corrispondenti curve nella coorte GSE115002. I pazienti con espressione elevata di B3GNT3, FERMT1 o SPP1 hanno mostrato una sopravvivenza mediana ridotta e tassi di sopravvivenza a 5 anni più bassi. L'analisi di regressione multivariata ha confermato che un'elevata espressione di SPP1 è rimasta un fattore prognostico negativo indipendente. L'elevata espressione di tutti e tre i geni è stata inoltre associata a una sopravvivenza più breve senza malattia. Tendenze coerenti in entrambe le coorti indicano che la sovraespressione di B3GNT3, FERMT1 e SPP1 prevede esiti clinici sfavorevoli nell'adenocarcinoma polmonare.

Analisi dell'arricchimento funzionale

I risultati dell'analisi dell'arricchimento funzionale sono riassunti nella Figura 4. La Figura 4A mostra l'arricchimento GO e KEGG nella coorte TCGA-LUAD, mentre la Figura 4B mostra l'arricchimento nella coorte GSE115002. I geni sopraregolati sono stati fortemente arricchiti nella progressione del ciclo cellulare, nell'organizzazione della matrice extracellulare, nell'adesione focale e nella segnalazione oncogenica. I geni sottoregolati erano associati a una differenziazione epiteliale normale e a una segnalazione p53. Queste osservazioni indicano che i tre geni candidati partecipano a vie che promuovono proliferazione, invasione e disregolazione immunitaria nell'adenocarcinoma polmonare.

Reti di coespressione

Le reti di co-espressione associate a B3GNT3, FERMT1 e SPP1 sono mostrate nella Figura 5. La Figura 5A mostra la rete nella coorte TCGA-LUAD, mentre la Figura 5B mostra la rete nella coorte GSE115002. I nodi rappresentano geni e gli archi rappresentano i coefficienti di correlazione. I tre geni chiave si raggruppano con i geni della rimodellazione ECM, della regolazione immunitaria e dell'organizzazione del citoscheletro. Questi risultati suggeriscono che la sovraespressione dei tre geni sia associata a un microambiente tumorale immunosoppressivo.

Esecuzione del nomogramma prognostico

Il nomogramma prognostico è presentato nella Figura 6. Il modello è stato costruito integrando stadio patologico T, stadio patologico N e livelli di espressione di B3GNT3, FERMT1 e SPP1 per prevedere la sopravvivenza complessiva su 1, 2 e 3 anni nel LUAD. I punti vengono assegnati a ciascuna variabile e il totale corrisponde alla probabilità di sopravvivenza prevista. Il modello ha raggiunto un indice di concordanza di 0,743, indicando una buona performance predittiva. Le curve di calibrazione hanno mostrato una stretta concordanza tra probabilità di sopravvivenza prevista e reale. L'analisi della curva decisionale ha confermato il beneficio netto clinico. Questo nomogramma migliora la previsione individualizzata della sopravvivenza oltre la tradizionale staging TNM.

In sintesi, questo studio evidenzia B3GNT3, FERMT1 e SPP1 come attori molecolari principali nella patogenesi LUAD. La loro sovraespressione è correlata a fenotipi tumorali invasivi, rimodellamento stromale ed evasione immunitaria. Attraverso l'integrazione multi-omica, dimostriamo il valore combinato di questi geni per la diagnosi, la prognosi e la stratificazione del paziente. Le ricerche future dovrebbero esplorare la loro rilevanza predittiva per la risposta immunoterapica e valutarne il potenziale come bersagli terapeutici nel LUAD.

figure-results-1
Figura 1: Grafici vulcanici dei geni espressi differenzialmente nel tumore LUAD rispetto ai tessuti normali. (A) Dataset TCGA-LUAD. (B) GSE115002 dataset. Il rosso indica geni significativamente aumentati; Il blu indica geni ridimensionati. B3GNT3, FERMT1 e SPP1 sono etichettati come costantemente sovraregolati. Clicca qui per visualizzare una versione più grande di questa figura.

figure-results-2
Figura 2: Curve ROC per B3GNT3, FERMT1 e SPP1 nel distinguere LUAD dai tessuti normali. (A) Coorte TCGA-LUAD. (B) GSE115002 coorte. I valori AUC dimostrano un'elevata accuratezza diagnostica. Clicca qui per visualizzare una versione più grande di questa figura.

figure-results-3
Figura 3: Curve di sopravvivenza complessiva di Kaplan-Meier stratificate dai livelli di espressione di B3GNT3, FERMT1 e SPP1 . (A–C) Coorte TCGA-LUAD. (A) B3GNT3, (B) FERMT1, (C) SPP1. (D–F) GSE115002 coorte. (D) B3GNT3, (E) FERMT1, (F) SPP1. Un'elevata espressione di ciascun gene è significativamente associata a una sopravvivenza complessiva più breve in entrambe le coorti. Sono forniti valori HR e P dai test log-rank. Clicca qui per visualizzare una versione più grande di questa figura.

figure-results-4
Figura 4: L'analisi di arricchimento GO e KEGG dei DEG correlata ai tre geni chiave. (A) Coorte TCGA-LUAD. (B) GSE115002 coorte. I termini di arricchimento includono processo biologico (BP), componente cellulare (CC), funzione molecolare (MF) e vie KEGG. I geni sopraregolati sono arricchiti nella proliferazione, nel rimodellamento ECM e nella segnalazione oncogenica. Clicca qui per visualizzare una versione più grande di questa figura.

figure-results-5
Figura 5: Reti di coespressione genica associate a B3GNT3, FERMT1 e SPP1. (A) Coorte TCGA-LUAD. (B) GSE115002 coorte. I nodi rappresentano geni, e gli archi rappresentano i coefficienti di correlazione. I tre geni chiave si raggruppano con i geni della rimodellazione ECM, della regolazione immunitaria e dell'organizzazione del citoscheletro. Clicca qui per visualizzare una versione più grande di questa figura.

figure-results-6
Figura 6: Nomogramma prognostico che integra lo stadio patologico T, stadio patologico N, B3GNT3, FERMT1 e SPP1 per la previsione della sopravvivenza complessiva a 1, 2 e 3 anni nel LUAD. I punti vengono assegnati a ciascuna variabile e il totale corrisponde alla probabilità di sopravvivenza prevista. Clicca qui per visualizzare una versione più grande di questa figura.

Discussion

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

Il nomogramma è stato costruito utilizzando l'analisi di regressione multivariata di Cox basata sulla coorte TCGA-LUAD. I predittori includono stadio patologico T, stadio patologico N e stato di espressione genica di B3GNT3, FERMT1 e SPP1 (classificati come Alto vs. Basso in base all'espressione mediana). Per ogni paziente, i punteggi individuali di ogni variabile vengono sommati per generare un valore di "Total Points", che corrisponde alle probabilità di sopravvivenza complessiva stimate su 1, 2 e 3 anni. Punteggi totali più alti indicano un aumento del rischio di mortalità. Questo strumento fornisce previsioni individualizzate della sopravvivenza e aiuta nella stratificazione del rischio LUAD. Il machine learning è stato utilizzato per rivelare diversi modelli di morte cellulare nella prognosi e nella terapiaLUAD 21,22,23, il che potrebbe ottimizzare ulteriormente il nostro modello di nomogrammi.

Questo studio ha identificato B3GNT3, FERMT1 e SPP1 come biomarcatori diagnostici e prognostici robusti in LUAD utilizzando analisi bioinformatica integrata. Tutti e tre i geni sono costantemente sovraespressi nei tumori, distinguono i tumori dai tessuti normali con alta precisione, prevedono una scarsa sopravvivenza e regolano vie correlate all'EMT, al rimodellamento della matrice e all'evasione immunitaria. Un nomogramma combinato migliora la stratificazione del rischio oltre la fase TNM. B3GNT3 promuove l'evasione immunitaria stabilizzando PD-L1 tramiteglicosilazione 9,10. FERMT1 migliora la segnalazione dell'integrina e la motilità cellulare, favorendo invasione emetastasi 11,12. SPP1 funziona come motore secreto dell'EMT, dell'angiogenesi e della polarizzazione 13,14,15 dei macrofagi M2. Insieme, definiscono un sottotipo aggressivo di LUAD caratterizzato da invasività e immunosoppressione.

Studi precedenti hanno riportato i ruoli individuali di B3GNT3, FERMT1 o SPP1 in LUAD. Questo studio è il primo a convalidare tutti e tre come un panel unificato tra coorti trascricomiche indipendenti, con prestazioni diagnostiche e prognostiche confermate sia nei dati TCGA che GEO. Lavori recenti sui biomarcatori LUAD supportano il valore delle firme geniche associate al sistema immunitario per la prognosi e la guida sull'immunoterapia. Studi recenti che utilizzano bioinformatica integrata e apprendimento automatico hanno identificato molteplici firme geniche per la diagnosi e la prognosiLUAD 21,22. Questi approcci, simili al nostro panel di tre geni, evidenziano il valore dei biomarcatori basati su trascrivomi nella stratificazione clinica.

Il rimodellamento della matrice extracellulare è una caratteristica centrale del LUAD aggressivo, e le firme correlate all'ECM sono state validate come fattori prognostici indipendenti. I nostri risultati che FERMT1 e SPP1 sono strettamente associati all'adesione focale e all'interazione ECM–recettore supportano ulteriormente il ruolo critico della rimodellazione matriciale nella progressione di LUAD. Similmente a CHAF1B e alle firme geniche correlate all'ubiquitina riportate nella medicina interdisciplinare (IMed)21,23, i nostri tre geni sono strettamente associati all'infiltrazione immunitaria e possono fungere sia da marcatori prognostici che predittivi. Le strategie alternative per identificare i biomarcatori LUAD includono il sequenziamento dell'RNA a singola cellula, la trascridemica spaziale, la selezione delle caratteristiche basata su machine learning e la profilazione proteomicaplasmatica 24,25,26. Algoritmi di machine learning come la foresta casuale o LASSO potrebbero affinare ulteriormente la selezione dei biomarcatori. La validazione in laboratorio umido tramite qPCR, IHC ed ELISA è essenziale per confermare la traduzioneclinica 27,28,29,30.

Questo studio è limitato dal suo disegno retrospettivo, dalla dipendenza da dati trascrivomici pubblici e dalla mancanza di validazione clinica esterna. La validazione del nomogramma era limitata al ricampionamento interno di bootstrap. I dati trascrittomici di massa non possono risolvere l'espressione a livello cellulare. La causalità meccanicistica richiede esperimenti funzionali. Le correlazioni con l'infiltrazione immunitaria si basano sulla deconvoluzione computazionale e devono essere interpretate con cautela. Studi futuri dovrebbero convalidare questi biomarcatori in coorti potenziali utilizzando IHC, qPCR e ELISA siero. La trasscrittomica a singola cellula e spaziale chiarirà le fonti cellulari e la distribuzione spaziale. Dovrebbe essere valutato il valore predittivo per l'immunoterapia e la risposta alla terapia mirata. Il targeting terapeutico di B3GNT3, FERMT1 e SPP1 potrebbe offrire nuove strategie per il trattamento LUAD.

Disclosures

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

Gli autori dichiarano di non avere interessi in conflitto.

Acknowledgements

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

Questo lavoro è stato supportato dal progetto universitario 2024 dell'Università di Medicina Tradizionale Cinese del Fujian (Numero di Grant: XB2024012), guidato da Yuhui Lin dell'Ospedale Popolare Affiliato dell'Università di Medicina Tradizionale Cinese del Fujian. e fondi congiunti per l'innovazione della scienza e tecnologia, Provincia di Fujian (Grant No:2025Y9530), guidati da Xiaoting Chen dell'Ospedale Municipale di Jinjiang (Shanghai Sixth People's Hospital, Fujian).

Materials

List of materials used in this article
NameCompanyCatalog NumberComments
Dataset Pubblicamente DisponibiliTCGA-LUAD DatasetIl Portale dell'Atlante del Genoma del Cancro (TCGA) (https://portal.gdc.cancer.gov/); 535 campioni tumorali LUAD, 59 campioni di tessuto polmonare normale adiacente (conteggio RNA-sequencing/valori FPKM + dati clinici: sopravvivenza, stadiazione TNM)Dati trascrivomici e clinici per l'analisi differenziale di espressione, sopravvivenza e nomogrammi; Coorte di studio primario
GSE115002 DatasetOmnibus sull'Espressione Genica (GEO) (https://www.ncbi.nlm.nih.gov/geo/query/acc.cgi?acc=GSE115002); Microarray Agilent, 52 tessuti tumorali LUAD, 52 tessuti polmonari normali adiacenti corrispondenti (treatment-naï tumori primari della ve)Coorte indipendente di validazione per espressione differenziale, performance diagnostica e analisi dell'infiltrazione immunitaria
Software e Bioinformatica Ambiente di programmazioneLinguaggio di programmazione RVersione 4.1Piattaforma centrale per tutte le analisi trasscrittomiche, statistiche e grafiche
R Package (Espressione Differenziale)DESeq2, limmaDESeq2: analisi differenziale differenziale del conteggio grezzo RNA-seq TCGA; limma: GSE115002 normalizzazione dei microarray e analisi di espressione differenziale (Benjamini– Correzione di Hochberg FDR)
R Packages (Analisi diagnostica)pROCCostruzione delle curve ROC, calcolo dell'AUC (IC 95%), determinazione ottimale del cutoff (Youden' S Index) per la valutazione delle prestazioni diagnostiche
R Package (Analisi della Sopravvivenza)Sopravvivenza, SurvMinerKaplan– Generazione della curva di sopravvivenza di Meier, test log-rank, regressione dei rischi proporzionali di Cox univariata/multivariata (HR + IC 95%); Stratificazione del paziente tramite espressione genica mediana
R Pacchetti (Arricchimento Funzionale)clusterProfiler, fgseaclusterProfiler: GO (BP/CC/MF) e analisi di arricchimento delle vie KEGG (P & lt aggiustato 0,05); fgsea: GSEA per insiemi geni MSigDB Hallmark/KEGG (FDR < 0.25)
R Package (Nomogram Construction & Nomogram Construction Validazione)RMSSviluppo di nomogramma prognostico (integrazione di espressione genica + stadio TNM); Harrell' calcolo dell'indice C, ricampionamento bootstrap (1000 ripetizioni) per la correzione del bias, generazione di grafici di calibrazione
R Packages (Statistici e Statistici Visualizzazione)ggplot2, ComplexHeatmap, corrplotGenerazione di grafici vulcanici, grafici a bolle (arricchimento), mappe di calore (correlazione per infiltrazione immunitaria), diagrammi di dispersione (coespressione genica); Analisi della correlazione Pearson/Spearman
Banche dati e banche dati di bioinformatica Strumenti (Analisi di Rete/Immunità)STRING DatabasePunteggio di fiducia > 0,7Costruzione della proteina e ndash; reti di interazione proteica (PPI) per B3GNT3/FERMT1/SPP1 e interattori di primo grado
Cytoscape-Visualizzazione di reti di PPI e co-espressione genica (ponderazione dei bordi tramite forza di correlazione, identificazione del genio hub)
Algoritmo di Deconvoluzione ImmunitariaCIBERSORTStima dell'abbondanza di infiltrazione delle cellule immunitarie (macrofagi M2, CD8+ cellule T, neutrofili, cellule NK, ecc.) in campioni LUAD; Correlazione con l'espressione genica candidata
Altri strumentiMicrosoft Office/LaTeX-Preparazione dei manoscritti, assemblaggio delle figure e formattazione delle tavole; Compilazione dei risultati statistici

Reprints and Permissions

Request permission to reuse the text or figures of this JoVE article

Request Permission

Tags

Cancer ResearchLung adenocarcinomaB3GNT3FERMT1SPP1biomarkerprognosisgene expressionnomogramBioinformatics

Related Articles