Research Article

L’analyse bioinformatique intégrée des données transcriptomiques humaines identifie trois biomarqueurs diagnostiques et pronostiques clés dans l’adénocarcinome pulmonaire

DOI:

10.3791/71214

June 30th, 2026

In This Article

Summary

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

Cette étude a identifié des biomarqueurs diagnostiques et pronostiques de l’adénocarcinome pulmonaire en utilisant TCGA-LUAD et GEO GSE115002 des données transcriptomiques. B3GNT3, FERMT1 et SPP1 étaient régulés à la hausse, distinguant les tumeurs des tissus normaux. Ces gènes sont liés à la transition épithéliale-mésenchymatose et à l’immunosuppression. Un nomogramme combinant l’expression génique avec le stade TNM a montré une valeur prédictive fiable.

Abstract

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

L’adénocarcinome pulmonaire (LUAD) est la principale cause de décès liés au cancer dans le monde. Malgré les avancées en chirurgie, thérapie ciblée et immunothérapie, le taux de survie à 5 ans du LUAD avancé reste inférieur à 20 %, indiquant un besoin urgent de biomarqueurs moléculaires fiables pour la détection précoce et le pronostic. Dans cette étude, les auteurs ont émis l’hypothèse que trois gènes constamment augmentés pourraient agir comme des biomarqueurs diagnostiques et pronostiques efficaces pour la LUAD. Les auteurs ont analysé les données transcriptomiques de deux cohortes indépendantes, TCGA-LUAD (535 tumeurs, 59 échantillons normaux) et GSE115002 (52 tumeurs, 52 échantillons normaux correspondants), afin de dépister les gènes exprimés différiellement. Trois gènes principaux — B3GNT3, FERMT1 et SPP1 — étaient systématiquement surexprimés dans les tumeurs LUAD dans les deux ensembles de données. Ces gènes ont montré d’excellentes performances diagnostiques, avec des valeurs d’AUC supérieures à 0,95 dans TCGA-LUAD et une grande précision en GSE115002. L’analyse de survie a montré qu’une forte expression de chaque gène était significativement associée à une survie globale plus courte et sans maladie, et la régression de Cox multivariée a confirmé leur valeur pronostique indépendante. L’analyse d’enrichissement fonctionnel a indiqué que ces trois gènes participent à la transition épithéliale-mésenchymate, au remodelage de la matrice extracellulaire et à la suppression immunitaire, tous étroitement liés à l’invasion et à la métastase des LUAD. Les auteurs ont également construit un nomogramme pronostique combinant les trois gènes et le stade TNM, atteignant un indice de concordance de 0,743 et démontrant de bonnes performances prédictives. Ces résultats confirment que B3GNT3, FERMT1 et SPP1 sont des biomarqueurs diagnostiques et pronostiques prometteurs pour le LUAD, soutenant leur application clinique en stratification et gestion du risque.

Introduction

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

Le cancer du poumon est la principale cause de mortalité mondiale par cancer, représentant environ 1,8 million de décès en 2020. L’adénocarcinome pulmonaire (LUAD) représente près de 40 % de tous les cas de cancer dupoumon 2. Malgré les avancées en chirurgie, thérapie ciblée et immunothérapie, le taux de survie à 5 ans pour les LUAD avancés reste inférieur à 20 %3,4. Des biomarqueurs moléculaires fiables pour une détection précoce et une pronostication précise sont urgemment nécessaires. Le séquençage à haut débit et les bases de données publiques telles que The Cancer Genome Atlas (TCGA) et Gene Expression Omnibus (GEO) permettent un profilage transcriptomique systématique descancers 5,6. La bioinformatique intégrative inter-cohortes améliore la fiabilité de la découverte de biomarqueurscandidats 5.

De nombreux gènes et voies ont été impliqués dans la LUAD, notamment la prolifération cellulaire, la signalisation EGFR et l’évasionimmunitaire 7. Cependant, peu ont été adaptés en usage clinique. Les modèles de risque combinant signatures géniques et caractéristiques clinicopathologiques — en particulier les nomogrammes — améliorent la précision pronostique dansLUAD 8. Bien que B3GNT3, FERMT1 et SPP1 aient été individuellement liés à la progression du cancer, leur valeur combinée diagnostique, pronostique et régulatrice du microenvironnement immunitaire dans le LUAD n’a pas été systématiquement validée entre les cohortes indépendantes. Cette étude fournit la première analyse intégrée multiplateforme de ces trois gènes en tant que panel unifié de biomarqueurs pour LUAD, avec un nomogramme pronostique cliniquement applicable.

B3GNT3 code pour une glycosyltransférase qui stabilise -L1 et favorise l’évasionimmunitaire 9,10. FERMT1 (kindlin-1) régule l’activation de l’intégrine et favorise la métastase dans le cancer du poumon non à petites cellules (NSCLC)11,12. SPP1 (ostéopontine) assure la médiation du remodelage de la matrice extracellulaire, de la transition épithéliale-mésenchymatose (EMT) et de la chimiorésistance 13,14,15. Les gènes liés à l’horloge circadienne ont également démontré la possibilité de prédire le pronostic et le diagnostic duLUAD 16, tandis que les différences entre sexes dans le LUAD ont été découvertes via des réseaux de signalisation protéique intégrativemulti-omiques 17. B3GNT3 et SPP1 sont sécrétés ou localisés dans la membrane, ce qui soutient une utilisation potentielle comme biomarqueurs mini-invasifs. Une classification efficace des LUAD et l’identification des biomarqueurs peuvent également être réalisées grâce à des méthodes de sélection des caractéristiques qui sechevauchent 18, et les interactions multi-omiques jouent un rôle fonctionnel important dans la progression du cancer dupoumon 19. Les signatures géniques mitochondriales, identifiées via une intégration multi-omique complète, ont également une valeur pour le pronostic LUAD et la thérapiepersonnalisée 20. B3GNT3 et SPP1 sont sécrétés ou localisés dans la membrane, ce qui soutient une utilisation potentielle comme biomarqueurs mini-invasifs. Cette étude visait à identifier des biomarqueurs LUAD robustes à l’aide de la bioinformatique intégrative, à évaluer leur performance diagnostique et pronostique, à explorer leurs fonctions biologiques et leurs associations immunitaires, et à construire un nomogramme pronostique cliniquement utile.

Protocol

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

1. Sources de données et prétraitement

  1. Traiter les données brutes dans R (version 4.1.3 ; Windows 10 Pro).
  2. Pour GSE115002, appliquer la normalisation en quantile à l’aide de limma (version 3.52.3).
  3. Filtrer les gènes à faible expression pour les TCGA : conserver les gènes avec CPM > 0,5 dans ≥50 % des échantillons.
  4. Filtrer les gènes à faible expression pour GSE115002 : conserver les gènes avec un signal moyen >50.
  5. log2Transformer les valeurs d’expression avec un pseudo-compte de +1.
    REMARQUE : L’expression génique et les données cliniques du LUAD ont été obtenues à partir de TCGA-LUAD (version 33.0, portail GDC, téléchargée le 7 août 2025) et GSE115002 (microarray Agilent, GEO, téléchargée le 7 août 2025). TCGA-LUAD comprenait 535 tumeurs et 59 échantillons normaux. GSE115002 comprenaient 52 tumeurs et 52 échantillons normaux appariés.

2. Identification des gènes exprimés différenciellement

  1. Utilisez DESeq2 (version 1.36.0) pour TCGA RNA-seq et limma (version 3.52.3) pour GSE115002 pour l’analyse d’expression différentielle. Calculez les valeurs p ajustées (FDR) en utilisant la méthode de Benjamini–Hochberg.
  2. Pour garantir la comparabilité entre ensembles de données, un |log₂FC| unifié ≥ 1,0 a été appliqué pour les deux cohortes. Les DEG étaient définis comme FDR < 0,05 et |log₂FC| ≥ 1.0. Les DEG chevauchants ont été identifiés à l’aide de VennDiagram (version 1.7.3). B3GNT3, FERMT1 et SPP1 ont été sélectionnés comme candidats constamment surélevés et ayant une pertinence connue pour le cancer.

3. Évaluation de la valeur diagnostique

  1. Construisez des courbes ROC pour chaque gène candidat.
  2. Déterminer les valeurs de seuil optimales à l’aide de l’indice de Youden.
  3. Calculez l’AUC, la sensibilité et la spécificité pour chaque gène.
  4. Construisez un panel diagnostique combiné en utilisant la régression logistique multivariée.
    REMARQUE : Le package pROC v1.18.0 a été utilisé pour l’analyse ROC. La fonction glm avec la famille binomiale a été utilisée pour construire le modèle diagnostique.

4. Analyse de la survie

  1. Stratifiez les patients en groupes à haute et basse expression en utilisant l’expression médiane.
  2. Générez des courbes de survie de Kaplan–Meier pour chaque gène.
  3. Effectuer des tests log-rang pour comparer les différences de survie.
  4. Réalisez une analyse de régression de Cox univariée.
  5. Réaliser une analyse de régression de Cox multivariée.
  6. Inclure les covariables cliniques dans les modèles de régression.
  7. Vérifier l’hypothèse des aléas proportionnelles à l’aide des résidus de Schoenfeld.
  8. Calculez un score de risque sur trois gènes.
    REMARQUE : Survival v3.3.1 et survminer v0.4.9 ont été utilisés. Les covariables comprenaient l’âge, le sexe, le stade T, le stade N et le stade M. Le score de risque était calculé comme suit :
    Score de risque = (0,328 × B3GNT3) + (0,331 × FERMT1) + (0,321 × SPP1). (1)

5. Enrichissement des ensembles géniques et annotation fonctionnelle

  1. Effectuez une analyse d’enrichissement GO à l’aide de DEG.
  2. Effectuer une analyse d’enrichissement des voies KEGG à l’aide de DEG.
  3. Réaliser une analyse d’enrichissement des ensembles géniques (GSEA).
  4. Classez les gènes par corrélation de Pearson avec l’expression génique candidate.
  5. Identifier les termes significatifs en utilisant un P ajusté < 0,05.
    REMARQUE : clusterProfiler v4.6.2 a été utilisé pour les analyses GO et KEGG. FGSEA v1.22.0 et MSigDB Hallmark v7.5 ont été utilisés pour GSEA.

6. Corrélation et analyse de réseaux

REMARQUE : La corrélation de Pearson était utilisée pour l’expression génique normalement distribuée ; Corélation de Spearman pour les fractions des cellules immunitaires. Les réseaux PPI ont été générés à l’aide de STRING (version 11.5, confiance > 0.7) et visualisés dans Cytoscape (version 3.9.1). L’infiltration immunitaire a été estimée à l’aide de CIBERSORT (mode absolu, 100 permutations). Le séquençage à ARN unicellulaire a montré qu’il révèle des transitions de niche dans le microenvironnement NSCLC, ce qui est pertinent pour l’analyse d’infiltrationimmunitaire 21,22, et l’analyse intégrative unicellulaire peut approfondir le rôle des cellules immunitaires, telles que les cellules mémoire CD8+, dans LUAD 23,24,25.

7. Construction et validation du nomogramme

REMARQUE : Les variables pour le nomogramme ont été sélectionnées en fonction de la signification multivariée de Cox (P < 0,05) : Stade T, Stade N, B3GNT3, FERMT1 et SPP1. Le nomogramme a été construit avec rms (version 6.5.0). La validation interne utilisait un rééchantillonnage de 1000 bootstraps avec remplacement. Les courbes d’étalonnage et l’analyse des courbes de décision (DCA) ont été réalisées à l’aide de la RMDA (version 1.7). L’environnement informatique comprenait R 4.1.3, Windows 10 Pro et Bioconductor 3.15. Les scripts d’analyse sont disponibles à https://github.com/[censuré]/LUAD-biomarker-2025 sur demande raisonnable.

8. Analyse statistique

REMARQUE : Tous les tests statistiques étaient bidirectionnels ; P < 0,05 était considéré comme significatif.

Results

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

Altérations globales de l’expression génique dans LUAD

Des comparaisons transcriptomiques entre les tissus adénocarcinomes pulmonaires et les tissus pulmonaires normaux ont identifié des changements généralisés dans l’expression génique. La figure 1A montre les graphiques volcaniques des gènes différenciellement exprimés dans le jeu de données TCGA-LUAD, et la figure 1B montre ceux du jeu de données GSE115002. Dans la cohorte TCGA-LUAD (Figure 1A), 1865 gènes étaient significativement augmentés et 1247 gènes étaient régulés à la baisse. Dans la cohorte GSE115002 (Figure 1B), 645 gènes étaient surélevés et 609 sous-régulés. Au total, 421 gènes ont été systématiquement surélevés dans les deux ensembles de données. Parmi ces gènes qui se chevauchent, B3GNT3, FERMT1 et SPP1 sont marqués dans les figures 1A et 1B comme étant nettement surexprimés dans les échantillons tumoraux. Dans TCGA-LUAD, l’expression de B3GNT3 a été multipliée par environ 5, FERMT1 8 fois et SPP1 10 fois par rapport aux tissus normaux. Une régulation à la hausse similaire a été confirmée en GSE115002, les trois gènes montrant une élévation supérieure à deux fois.

Performance diagnostique de B3GNT3, FERMT1 et SPP1

L’analyse de la courbe caractéristique de fonctionnement du récepteur a été utilisée pour évaluer la performance diagnostique de B3GNT3, FERMT1 et SPP1. La figure 2A présente les courbes ROC dans la cohorte TCGA-LUAD, et la figure 2B présente celles de la cohorte GSE115002. Les trois gènes ont atteint une grande précision diagnostique dans les deux cohortes. Dans la cohorte TCGA-LUAD (Figure 2A), la surface sous les valeurs de la courbe dépassait 0,95 pour tous les marqueurs. Dans la cohorte indépendante GSE115002 (Figure 2B), une aire également élevée sous les valeurs de la courbe a été observée. La sensibilité et la spécificité variaient de 85 % à 95 % aux valeurs de seuil optimales. Ces résultats confirment que chaque gène assure une excellente distinction entre la tumeur et les tissus normaux.

Signification pronostique de l’expression de B3GNT3, FERMT1 et SPP1

Les courbes de survie de Kaplan–Meier dans la Figure 3 révèlent qu’une forte expression de chaque gène était significativement associée à une survie globale plus courte dans les deux cohortes. Les figures 3A–3C montrent les courbes de survie globale pour B3GNT3, FERMT1 et SPP1 dans la cohorte TCGA-LUAD. Les figures 3D à 3F montrent les courbes correspondantes dans la cohorte GSE115002. Les patients présentant une expression élevée de B3GNT3, FERMT1 ou SPP1 ont montré une survie médiane réduite et des taux de survie plus faibles sur 5 ans. L’analyse de régression multivariée a confirmé qu’une forte expression de SPP1 restait un facteur pronostique médiocre indépendant. Une expression élevée des trois gènes était également associée à une survie sans maladie plus courte. Des tendances cohérentes entre les deux cohortes indiquent que la surexpression de B3GNT3, FERMT1 et SPP1 prédit des résultats cliniques défavorables dans l’adénocarcinome pulmonaire.

Analyse de l’enrichissement fonctionnel

Les résultats de l’analyse d’enrichissement fonctionnel sont résumés à la Figure 4. La figure 4A montre l’enrichissement GO et KEGG dans la cohorte TCGA-LUAD, et la figure 4B montre l’enrichissement dans la cohorte GSE115002. Les gènes à la hausse étaient fortement enrichis dans la progression du cycle cellulaire, l’organisation de la matrice extracellulaire, l’adhésion focale et la signalisation oncogénique. Les gènes régulés à la baisse étaient associés à une différenciation épithéliale normale et à la signalisation p53. Ces observations indiquent que les trois gènes candidats participent à des voies qui favorisent la prolifération, l’invasion et la dysrégulation immunitaire dans l’adénocarcinome pulmonaire.

Réseaux de co-expressions

Les réseaux de co-expressions associés à B3GNT3, FERMT1 et SPP1 sont présentés à la Figure 5. La figure 5A montre le réseau dans la cohorte TCGA-LUAD, et la figure 5B montre le réseau dans la cohorte GSE115002. Les nœuds représentent les gènes et les arêtes représentent les coefficients de corrélation. Les trois gènes clés regroupent les gènes de remodelage ECM, de régulation immunitaire et d’organisation cytosquelettique. Ces résultats suggèrent que la surexpression des trois gènes est associée à un microenvironnement tumoral immunosuppressif.

Performance du nomogramme pronostique

Le nomogramme pronostique est présenté à la Figure 6. Le modèle a été construit en intégrant les niveaux d’expression de B3GNT3, FERMT1 et SPP1 pour prédire la survie globale sur 1, 2 et 3 ans dans LUAD. Des points sont attribués à chaque variable, et le total correspond à la probabilité de survie prédite. Le modèle a atteint un indice de concordance de 0,743, indiquant une bonne performance prédictive. Les courbes d’étalonnage montraient une étroite concordance entre les probabilités de survie prédite et réelles. L’analyse de la courbe de décision a confirmé le bénéfice net clinique. Ce nomogramme améliore la prédiction individualisée de la survie au-delà de la phase conventionnelle de TNM.

En résumé, cette étude met en avant B3GNT3, FERMT1 et SPP1 comme acteurs moléculaires clés dans la pathogenèse des LUAD. Leur surexpression est corrélée à des phénotypes tumoraux invasifs, à un remodelage stromal et à une évasion immunitaire. Grâce à l’intégration multi-omique, nous démontrons la valeur combinée de ces gènes pour le diagnostic, le pronostic et la stratification des patients. Les recherches futures devraient explorer leur pertinence prédictive pour la réponse immunothérapeutique et évaluer leur potentiel en tant que cibles thérapeutiques dans le LUAD.

figure-results-1
Figure 1 : Graphiques volcaniques des gènes exprimés différemment dans la tumeur LUAD versus des tissus normaux. (A) Jeu de données TCGA-LUAD. (B) GSE115002 jeu de données. Le rouge indique des gènes fortement surélevés ; Le bleu indique des gènes à la baisse. B3GNT3, FERMT1 et SPP1 sont classés comme constamment augmentés. Veuillez cliquer ici pour voir une version agrandie de cette figurine.

figure-results-2
Figure 2 : Courbes ROC pour B3GNT3, FERMT1 et SPP1 pour distinguer le LUAD des tissus normaux. (A) Cohorte TCGA-LUAD. (B) GSE115002 cohorte. Les valeurs AUC démontrent une grande précision diagnostique. Veuillez cliquer ici pour voir une version agrandie de cette figurine.

figure-results-3
Figure 3 : Courbes de survie globale de Kaplan-Meier stratifiées par les niveaux d’expression de B3GNT3, FERMT1 et SPP1. (A–C) Cohorte TCGA-LUAD. (A) B3GNT3, (B) FERMT1, (C) SPP1. (D–F) GSE115002 cohorte. (D) B3GNT3, (E) FERMT1, (F) SPP1. Une expression élevée de chaque gène est significativement associée à une survie globale plus courte dans les deux cohortes. Les valeurs de fréquence cardiaque et de P issues des tests log-rank sont fournies. Veuillez cliquer ici pour voir une version agrandie de cette figurine.

figure-results-4
Figure 4 : L’analyse d’enrichissement GO et KEGG des DEG est corrélée aux trois gènes clés. (A) cohorte TCGA-LUAD. (B) GSE115002 cohorte. Les termes d’enrichissement incluent le processus biologique (BP), le composant cellulaire (CC), la fonction moléculaire (MF) et les voies KEGG. Les gènes à la hausse sont enrichis par la prolifération, le remodelage de la ME et la signalisation oncogénique. Veuillez cliquer ici pour voir une version agrandie de cette figurine.

figure-results-5
Figure 5 : Réseaux de co-expression génique associés à B3GNT3, FERMT1 et SPP1. (A) cohorte TCGA-LUAD. (B) GSE115002 cohorte. Les nœuds représentent les gènes, et les arêtes représentent les coefficients de corrélation. Les trois gènes clés regroupent les gènes de remodelage ECM, de régulation immunitaire et d’organisation cytosquelettique. Veuillez cliquer ici pour voir une version agrandie de cette figurine.

figure-results-6
Figure 6 : Nomogramme pronostique intégrant les stades pathologiques T, stades pathologiques N, B3GNT3, FERMT1 et SPP1 pour prédire la survie globale sur 1, 2 et 3 ans dans LUAD. Des points sont attribués à chaque variable, et le total correspond à la probabilité de survie prédite. Veuillez cliquer ici pour voir une version agrandie de cette figurine.

Discussion

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

Le nomogramme a été construit à l’aide d’une analyse de régression de Cox multivariée basée sur la cohorte TCGA-LUAD. Les prédicteurs incluent le stade T pathologique, le stade N pathologique, et l’état d’expression génique de B3GNT3, FERMT1 et SPP1 (catégorisés en Élevé vs. Faible selon l’expression médiane). Pour chaque patient, les scores individuels de chaque variable sont additionnés afin de générer une valeur de « Total Points », qui correspond aux probabilités globales estimées de survie sur 1, 2 et 3 ans. Des scores totaux plus élevés indiquent un risque de mortalité accru. Cet outil fournit une prédiction de survie individualisée et aide à la stratification du risque LUAD. L’apprentissage automatique a été utilisé pour révéler des schémas de mort cellulaire diversifiés dans le pronostic et la thérapieLUAD 21,22,23, ce qui pourrait optimiser davantage notre modèle de nomogrammes.

Cette étude a identifié B3GNT3, FERMT1 et SPP1 comme biomarqueurs diagnostiques et pronostiques robustes dans le LUAD à l’aide d’une analyse bioinformatique intégrée. Les trois gènes sont systématiquement surexprimés dans les tumeurs, distinguent les tumeurs des tissus normaux avec une grande précision, prédisent une mauvaise survie et régulent les voies liées à l’EMT, au remodelage matriciel et à l’évasion immunitaire. Un nomogramme combiné améliore la stratification du risque au-delà de la phase TNM. B3GNT3 favorise l’évasion immunitaire en stabilisant-L1 via laglycosylation 9,10. FERMT1 améliore la signalisation de l’intégrine et la motilité cellulaire, favorisant l’invasion et lamétastase 11,12. SPP1 agit comme un moteur sécrété de l’EMT, de l’angiogenèse et de la polarisation des macrophagesM2 13,14,15. Ensemble, ils définissent un sous-type agressif de LUAD, caractérisé par l’invasivité et l’immunosuppression.

Des études antérieures ont rapporté les rôles individuels de B3GNT3, FERMT1 ou SPP1 dans le LUAD. Cette étude est la première à valider les trois comme un panel unifié entre cohortes transcriptomiques indépendantes, avec des performances diagnostiques et pronostiques confirmées dans les données TCGA et GEO. Des travaux récents sur les biomarqueurs LUAD soutiennent la valeur des signatures géniques associées à l’immunité pour le pronostic et les conseils en immunothérapie. Des études récentes utilisant la bioinformatique intégrée et l’apprentissage automatique ont identifié plusieurs signatures géniques pour le diagnostic et le pronostic desLUAD 21,22. Ces approches, similaires à notre panel de trois gènes, soulignent la valeur des biomarqueurs basés sur le transcriptome dans la stratification clinique.

Le remodelage extracellulaire de la matrice est une caractéristique centrale du LUAD agressif, et les signatures liées à la MCE ont été validées comme des facteurs pronostiques indépendants. Nos résultats selon lesquels FERMT1 et SPP1 sont étroitement associés à l’adhésion focale et à l’interaction ECM–récepteur renforcent davantage le rôle crucial du remodelage matriciel dans la progression des LUAD. À l’instar de CHAF1B et des signatures géniques liées à l’ubiquitine rapportées en médecine interdisciplinaire (IMed)21,23, nos trois gènes sont étroitement associés à l’infiltration immunitaire et peuvent servir à la fois de marqueurs pronostiques et prédictifs. Les stratégies alternatives pour identifier les biomarqueurs LUAD incluent le séquençage d’ARN unicellulaire, la transcriptomique spatiale, la sélection de caractéristiques basée sur l’apprentissage automatique, et le profilage protéomiqueplasmalogique 24,25,26. Des algorithmes d’apprentissage automatique tels que la forêt aléatoire ou le LASSO pourraient affiner davantage la sélection des biomarqueurs. La validation en laboratoire humide à l’aide de qPCR, IHC et ELISA est essentielle pour confirmer la traductionclinique 27,28,29,30.

Cette étude est limitée par sa conception rétrospective, sa dépendance aux données transcriptomiques publiques et l’absence de validation clinique externe. La validation par nomogramme se limitait au rééchantillonnage interne de bootstrap. Les données transcriptomiques en masse ne peuvent pas résoudre l’expression au niveau cellulaire. La causalité mécaniste nécessite des expériences fonctionnelles. Les corrélations avec l’infiltration immunitaire sont basées sur la déconvolution computationnelle et doivent être interprétées avec prudence. De futures études devraient valider ces biomarqueurs dans des cohortes prospectives en utilisant IHC, qPCR et ELISA sérique. La transcriptomique unicellulaire et spatiale clarifiera les sources cellulaires et la distribution spatiale. La valeur prédictive de l’immunothérapie et de la réponse ciblée à la thérapie doit être évaluée. La ciblisation thérapeutique de B3GNT3, FERMT1 et SPP1 pourrait offrir de nouvelles stratégies pour le traitement du LUAD.

Disclosures

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

Les auteurs ne déclarent aucun intérêt concurrent.

Acknowledgements

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

Ce travail a été soutenu par le projet universitaire 2024 de l’Université de médecine traditionnelle chinoise du Fujian (numéro de subvention : XB2024012), dirigé par Yuhui Lin de l’Hôpital Populaire affilié de l’Université de médecine traditionnelle chinoise du Fujian. et fonds conjoints pour l’innovation en science et technologie, province du Fujian (Subvention n° 2025Y9530), dirigés par Xiaoting Chen de l’hôpital municipal de Jinjiang (Sixième hôpital populaire de Shanghai, Fujian).

Materials

List of materials used in this article
NameCompanyCatalog NumberComments
Publicly Available DatasetsTCGA-LUAD DatasetThe Cancer Genome Atlas (TCGA) Portal (https://portal.gdc.cancer.gov/); 535 LUAD tumor samples, 59 adjacent normal lung tissue samples (RNA-sequencing count/FPKM values + clinical data: survival, TNM staging)Transcriptomic and clinical data for differential expression, survival, and nomogram analysis; primary study cohort
GSE115002 DatasetGene Expression Omnibus (GEO) (https://www.ncbi.nlm.nih.gov/geo/query/acc.cgi?acc=GSE115002); Agilent microarray, 52 LUAD tumor tissues, 52 matched adjacent normal lung tissues (treatment-naïve primary tumors)Independent validation cohort for differential expression, diagnostic performance, and immune infiltration analysis
Bioinformatics Software & Programming EnvironmentR Programming LanguageVersion 4.1Core platform for all transcriptomic, statistical, and graphical analyses
R Packages (Differential Expression)DESeq2, limmaDESeq2: TCGA RNA-seq raw count differential expression analysis; limma: GSE115002 microarray normalization and differential expression analysis (Benjamini–Hochberg FDR correction)
R Packages (Diagnostic Analysis)pROCConstruction of ROC curves, calculation of AUC (95% CI), optimal cutoff determination (Youden’s index) for diagnostic performance assessment
R Packages (Survival Analysis)survival, survminerKaplan–Meier survival curve generation, log-rank test, univariate/multivariate Cox proportional hazards regression (HR + 95% CI); patient stratification by median gene expression
R Packages (Functional Enrichment)clusterProfiler, fgseaclusterProfiler: GO (BP/CC/MF) and KEGG pathway enrichment analysis (adjusted P < 0.05); fgsea: GSEA for MSigDB Hallmark/KEGG gene sets (FDR < 0.25)
R Packages (Nomogram Construction & Validation)rmsDevelopment of prognostic nomogram (integration of gene expression + TNM stage); Harrell’s C-index calculation, bootstrap resampling (1000 repetitions) for bias correction, calibration plot generation
R Packages (Statistical & Visualization)ggplot2, ComplexHeatmap, corrplotGeneration of volcano plots, bubble plots (enrichment), heatmaps (immune infiltration correlation), scatter plots (gene co-expression); Pearson/Spearman correlation analysis
Bioinformatics Databases & Tools (Network/Immune Analysis)STRING DatabaseConfidence score > 0.7Construction of protein–protein interaction (PPI) networks for B3GNT3/FERMT1/SPP1 and first-degree interactors
Cytoscape-Visualization of PPI and gene co-expression networks (edge weighting by correlation strength, hub gene identification)
Immune Deconvolution AlgorithmCIBERSORTEstimation of immune cell infiltration abundance (M2 macrophages, CD8+ T cells, neutrophils, NK cells, etc.) in LUAD samples; correlation with candidate gene expression
Other ToolsMicrosoft Office/LaTeX-Manuscript preparation, figure assembly, and table formatting; statistical result compilation

Reprints and Permissions

Request permission to reuse the text or figures of this JoVE article

Request Permission

Tags

Cancer ResearchLung adenocarcinomaB3GNT3FERMT1SPP1biomarkerprognosisgene expressionnomogramBioinformatics

Related Articles