Research Article

Die integrierte bioinformatische Analyse menschlicher transkriptomischer Daten identifiziert drei zentrale diagnostische und prognostische Biomarker im Lungenadenokarzinom

DOI:

10.3791/71214

June 30th, 2026

In This Article

Summary

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

Diese Studie identifizierte diagnostische und prognostische Biomarker für Lungenadenokarzinom anhand von TCGA-LUAD- und GEO-GSE115002 Transkriptomdaten. B3GNT3, FERMT1 und SPP1 wurden hochreguliert und unterschieden Tumore von normalem Gewebe. Diese Gene sind mit dem epithelial-mesenchymalen Übergang und der Immunsuppression verbunden. Ein Nomogramm, das Genexpression mit der TNM-Stufe kombiniert, zeigte einen zuverlässigen Prädiktionswert.

Abstract

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

Das Lungenadenokarzinom (LUAD) ist weltweit die Hauptursache für krebsbedingte Todesfälle. Trotz Fortschritten in der Chirurgie, gezielten Therapie und Immuntherapie bleibt die 5-Jahres-Überlebensrate von fortgeschrittenem LUAD unter 20 %, was auf einen dringenden Bedarf an zuverlässigen molekularen Biomarkern für frühzeitige Erkennung und Prognose hinweist. In dieser Studie stellten die Autoren die Hypothese auf, dass drei konsequent hochregulierte Gene als wirksame diagnostische und prognostische Biomarker für LUAD wirken könnten. Die Autoren analysierten transkriptomische Daten von zwei unabhängigen Kohorten, TCGA-LUAD (535 Tumore, 59 normale Proben) und GSE115002 (52 Tumore, 52 übereinstimmende normale Proben), um differenziell exprimierte Gene zu screenen. Drei Kerngene – B3GNT3, FERMT1 und SPP1 – wurden in beiden Datensätzen in LUAD-Tumoren konstant überexprimiert. Diese Gene zeigten eine ausgezeichnete diagnostische Leistung, mit AUC-Werten über 0,95 bei TCGA-LUAD und hoher Genauigkeit in GSE115002. Die Überlebensanalyse zeigte, dass eine hohe Expression jedes Gens signifikant mit einem kürzeren Gesamt- und krankheitsfreien Überleben assoziiert war, und die multivariate Cox-Regression bestätigte ihren unabhängigen prognostischen Wert. Die Analyse der funktionellen Anreicherung zeigte, dass diese drei Gene am epithelial-mesenchymalen Übergang, der Remodellierung der extrazellulären Matrix und der Immunsuppression beteiligt sind, die alle eng mit der Invasion und Metastasierung von LUAD verbunden sind. Die Autoren entwickelten zudem ein prognostisches Nomogramm, das die drei Gene und die TNM-Stufe kombiniert, erreichte einen Konkordanzindex von 0,743 und zeigte eine gute prädiktive Leistung. Diese Ergebnisse bestätigen, dass B3GNT3, FERMT1 und SPP1 vielversprechende diagnostische und prognostische Biomarker für LUAD sind, was die klinische Anwendung in der Risikostratifizierung und -steuerung unterstützt.

Introduction

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

Lungenkrebs ist die Hauptursache für die weltweite Krebssterblichkeit und verursachte im Jahr 2020 etwa 1,8 Millionen Todesfälle. Lungenadenokarzinom (LUAD) macht fast 40 % aller Lungenkrebsfälleaus 2. Trotz Fortschritten in der Chirurgie, gezielten Therapie und Immuntherapie bleibt die 5-Jahres-Überlebensrate für fortgeschrittenes LUAD unter 20 %. Zuverlässige molekulare Biomarker für die Früherkennung und präzise Prognose werden dringend benötigt. Hochdurchsatzsequenzierung und öffentliche Datenbanken wie The Cancer Genome Atlas (TCGA) und Gene Expression Omnibus (GEO) ermöglichen systematische transkriptomische Profilierung von Krebserkrankungen 5,6. Integrative kohortenübergreifende Bioinformatik verbessert die Zuverlässigkeit der Entdeckung von Kandidaten-Biomarkern5.

Viele Gene und Signalwege sind mit LUAD in Verbindung gebracht, darunter Zellproliferation, EGFR-Signalübertragung und Immunentkommen7. Allerdings wurden nur wenige in die klinische Anwendung übertragen. Risikomodelle, die Gensignaturen und klinisch-pathologische Merkmale – insbesondere Nomogramme – kombinieren, verbessern die prognostische Genauigkeit bei LUAD8. Obwohl B3GNT3, FERMT1 und SPP1 einzeln mit dem Krebsfortschreiten in Verbindung gebracht wurden, wurde ihr kombinierter diagnostischer, prognostischer und immun-mikroumweltregulatorischer Wert in LUAD nicht systematisch über unabhängige Kohorten hinweg validiert. Diese Studie bietet die erste integrierte plattformübergreifende Analyse dieser drei Gene als einheitliches Biomarkerpanel für LUAD, mit einem klinisch anwendbaren prognostischen Nomogramm.

B3GNT3 kodiert eine Glykosyltransferase, die PD-L1 stabilisiert und die Immunausweichung 9,10 fördert. FERMT1 (Kindlin-1) reguliert die Integrinaktivierung und treibt Metastasen bei nicht-kleinzelligem Lungenkrebs (NSCLC) voran. SPP1 (Osteopontin) vermittelt die Remodellierung der extrazellulären Matrix, den epithelial-mesenchymalen Übergang (EMT) und Chemoresistenz 13,14,15. Auch zirkadiane Uhren-bezogene Gene haben gezeigt, dass sie die Prognose und Diagnose von LUADvorhersagen 16, während Geschlechtsunterschiede in LUAD über multi-omische integrative Protein-Signalnetzwerke17 entdeckt wurden. B3GNT3 und SPP1 werden ausgesezernt oder membranlokalisiert, was eine mögliche Nutzung als minimalinvasive Biomarker unterstützt. Eine effektive LUAD-Klassifikation und Biomarker-Identifikation können ebenfalls durch überlappende Merkmalsauswahlmethoden erreicht werden.18, und multi-omische Interaktionen spielen eine wichtige funktionelle Rolle beim Fortschreiten von Lungenkrebs19. Mitochondriale Gensignaturen, die durch umfassende Multi-Omics-Integration identifiziert wurden, haben ebenfalls Wert für die LUAD-Prognose und die personalisierte Therapie20. B3GNT3 und SPP1 werden ausgesezernt oder membranlokalisiert, was eine mögliche Nutzung als minimalinvasive Biomarker unterstützt. Diese Studie zielte darauf ab, robuste LUAD-Biomarker mittels integrativer Bioinformatik zu identifizieren, deren diagnostische und prognostische Leistung zu bewerten, ihre biologischen Funktionen und Immunassoziationen zu erforschen und ein klinisch nützliches prognostisches Nomogramm zu erstellen.

Protocol

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

1. Datenquellen und Vorverarbeitung

  1. Rohdaten in R verarbeiten (Version 4.1.3; Windows 10 Pro).
  2. Für GSE115002 wenden Sie die Quantilnormalisierung mit Limma an (Version 3.52.3).
  3. Filter von Gene mit niedriger Expression für TCGA: Gene mit CPM > 0,5 in ≥50 % der Proben behalten.
  4. Gene mit niedriger Expression filtern auf GSE115002: Gene mit durchschnittlichem Signal >50 behalten.
  5. log2Transformationsausdruckswerte mit einem Pseudocount von +1.
    HINWEIS: LUAD-Genexpressions- und klinische Daten wurden von TCGA-LUAD (Version 33.0, GDC Portal, heruntergeladen am 7. August 2025) und GSE115002 (Agilent Microarray, GEO, heruntergeladen am 7. August 2025) gewonnen. TCGA-LUAD umfasste 535 Tumore und 59 normale Proben. GSE115002 umfasste 52 Tumore und 52 übereinstimmende normale Proben.

2. Identifikation unterschiedlich exprimierter Gene

  1. Verwenden Sie DESeq2 (Version 1.36.0) für TCGA RNA-seq und Limma (Version 3.52.3) für GSE115002 für die Analyse der differenziellen Expression. Berechnen Sie angepasste P-Werte (FDR) mit der Benjamini–Hochberg-Methode.
  2. Um die Vergleichbarkeit von Datensätzen zu gewährleisten, wird ein einheitliches |log₂FC| ≥ 1,0 wurde für beide Kohorten angewendet. DEGs wurden als FDR < 0,05 und |log₂FC| ≥ 1.0. Überlappende DEGs wurden mit VennDiagram (Version 1.7.3) identifiziert. B3GNT3, FERMT1 und SPP1 wurden als konsequent hochregulierte Kandidaten mit bekannter Krebsrelevanz ausgewählt.

3. Bewertung des diagnostischen Werts

  1. Konstruiere ROC-Kurven für jedes Kandidatengen.
  2. Bestimme optimale Cutoff-Werte mit dem Youden-Index.
  3. Berechnen Sie AUC, Sensitivität und Spezifität für jedes Gen.
  4. Baue ein kombiniertes Diagnosepanel mit multivariater logistischer Regression auf.
    HINWEIS: Das pROC-Paket v1.18.0 wurde für die ROC-Analyse verwendet. Die glm-Funktion mit der Binomialfamilie wurde verwendet, um das diagnostische Modell zu konstruieren.

4. Überlebensanalyse

  1. Schichten Sie Patienten in Gruppen mit hoher und niedriger Expression anhand der median Expression.
  2. Erzeugen Sie Kaplan–Meier-Überlebenskurven für jedes Gen.
  3. Führen Sie Log-Rank-Tests durch, um Überlebensunterschiede zu vergleichen.
  4. Führen Sie eine Univariate Cox-Regressionsanalyse durch.
  5. Durchführung einer multivariaten Cox-Regressionsanalyse.
  6. Klinische Kovariaten in Regressionsmodelle einbeziehen.
  7. Verifizieren Sie die Annahme der proportionalen Gefahren mit Schoenfeld-Residuen.
  8. Berechnen Sie einen Drei-Gen-Risikoscore.
    HINWEIS: Survival v3.3.1 und survminer v0.4.9 wurden verwendet. Kovariaten umfassten Alter, Geschlecht, T-Stadium, N-Stadium und M-Stadium. Der Risikoscore wurde wie folgt berechnet:
    Risiko-Score = (0,328 × B3GNT3) + (0,331 × FERMT1) + (0,321 × SPP1). (1)

5. Genmengenanreicherung und funktionale Annotation

  1. Führen Sie eine GO-Anreicherungsanalyse mit DEGs durch.
  2. Führen Sie eine KEGG-Signalweganreicherungsanalyse mit DEGs durch.
  3. Führen Sie eine Gensatzanreicherungsanalyse (GSEA) durch.
  4. Ranken Sie Gene anhand der Pearson-Korrelation mit der Kandidatengenexpression.
  5. Identifizieren Sie signifikante Terme mit bereinigtem P < 0,05.
    HINWEIS: clusterProfiler v4.6.2 wurde für GO- und KEGG-Analysen verwendet. FGSEA v1.22.0 und MSigDB Hallmark v7.5 wurden für GSEA verwendet.

6. Korrelation und Netzwerkanalyse

HINWEIS: Pearson-Korrelation wurde für die normal verteilte Genexpression verwendet; Spearman-Korrelation für Immunzellfraktionen. PPI-Netzwerke wurden mit STRING (Version 11.5, Konfidenz > 0.7) generiert und in Cytoscape (Version 3.9.1) visualisiert. Die Immuninfiltration wurde mit CIBERSORT (absoluter Modus, 100 Permutationen) geschätzt. Die Einzelzell-RNA-Sequenzierung hat gezeigt, dass sie Nischenübergänge im NSCLC-Mikroumfeld aufzeigt, was für die Immuninfiltrationsanalyserelevant ist 21,22, und die integrative Einzelzellanalyse kann die Rolle von Immunzellen, wie CD8+-Gedächtniszellen, in LUAD 23,24,25 weiter analysieren.

7. Nomogrammkonstruktion und Validierung

HINWEIS: Die Variablen für das Nomogramm wurden basierend auf der multivariaten Cox-Signifikanz (P < 0,05) ausgewählt: T-Stufe, N-Stufe, B3GNT3, FERMT1 und SPP1. Das Nomogramm wurde mit RMS (Version 6.5.0) gebaut. Die interne Validierung nutzte 1000 Bootstrap-Resampling mit Ersatz. Kalibrierungskurven und Entscheidungskurvenanalyse (DCA) wurden mit RMDA (Version 1.7) durchgeführt. Die rechnerische Umgebung umfasste R 4.1.3, Windows 10 Pro und Bioconductor 3.15. Analyseskripte sind auf angemessener Anfrage unter https://github.com/[redacted]/LUAD-biomarker-2025 verfügbar.

8. Statistische Analyse

HINWEIS: Alle statistischen Tests waren zweiseitig; P < 0,05 wurde als signifikant angesehen.

Results

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

Globale Genexpressionsänderungen bei LUAD

Transkriptomische Vergleiche zwischen Adenokarzinomgeweben der Lunge und normalen Lungengeweben zeigten weit verbreitete Veränderungen in der Genexpression. Abbildung 1A zeigt Vulkandiagramme unterschiedlich exprimierter Gene im TCGA-LUAD-Datensatz, und Abbildung 1B zeigt diese im GSE115002-Datensatz. In der TCGA-LUAD-Kohorte (Abbildung 1A) wurden 1865 Gene signifikant hochreguliert und 1247 Gene herunterreguliert. In der GSE115002-Kohorte (Abbildung 1B) wurden 645 Gene hochreguliert und 609 herunterreguliert. Insgesamt wurden 421 Gene in beiden Datensätzen konstant hochreguliert. Unter diesen überlappenden Genen sind B3GNT3, FERMT1 und SPP1 in Abbildung 1A und Abbildung 1B als deutlich überexprimiert in Tumorproben gekennzeichnet. Bei TCGA-LUAD war die Expression von B3GNT3 etwa fünffach, FERMT1 achtfach und SPP1 zehnfach im Vergleich zu normalen Geweben. Eine ähnliche Hochregulation wurde in GSE115002 bestätigt, wobei alle drei Gene eine mehr als doppelte Erhöhung zeigten.

Diagnostische Leistung von B3GNT3, FERMT1 und SPP1

Die Analyse der Empfänger-Betriebscharakteristik wurde verwendet, um die diagnostische Leistung von B3GNT3, FERMT1 und SPP1 zu bewerten. Abbildung 2A zeigt ROC-Kurven in der TCGA-LUAD-Kohorte, und Abbildung 2B zeigt die in der GSE115002-Kohorte. Alle drei Gene erreichten in beiden Kohorten eine hohe diagnostische Genauigkeit. In der TCGA-LUAD-Kohorte (Abbildung 2A) überschritt die Fläche unter den Kurvenwerten für alle Marker 0,95. In der unabhängigen GSE115002-Kohorte (Abbildung 2B) wurde eine ähnlich hohe Fläche unter den Kurvenwerten beobachtet. Sensitivität und Spezifität lagen bei optimalen Grenzwerten zwischen 85 % und 95 %. Diese Ergebnisse bestätigen, dass jedes Gen eine ausgezeichnete Unterscheidung zwischen Tumor- und normalem Gewebe bietet.

Prognostische Bedeutung der Expression von B3GNT3, FERMT1 und SPP1

Die Kaplan–Meier-Überlebenskurven in Abbildung 3 zeigen, dass eine hohe Expression jedes Gens in beiden Kohorten signifikant mit einem kürzeren Gesamtüberleben assoziiert war. Die Abbildungen 3A–3C zeigen die Gesamtüberlebenskurven für B3GNT3, FERMT1 und SPP1 in der TCGA-LUAD-Kohorte. Die Abbildungen 3D–3F zeigen die entsprechenden Kurven in der GSE115002-Kohorte. Patienten mit hoher B3GNT3-, FERMT1- oder SPP1-Expression zeigten eine verringerte mediane Überlebensrate und niedrigere 5-Jahres-Überlebensraten. Die multivariate Regressionsanalyse bestätigte, dass eine hohe SPP1-Expression weiterhin ein unabhängiger schlechter prognostischer Faktor ist. Eine erhöhte Expression aller drei Gene war ebenfalls mit einem kürzeren krankheitsfreien Überleben verbunden. Konsistente Trends in beiden Kohorten zeigen, dass die Überexpression von B3GNT3, FERMT1 und SPP1 ungünstige klinische Ergebnisse beim Lungenadenokarzinom vorhersagt.

Funktionale Anreicherungsanalyse

Die Ergebnisse der funktionellen Anreicherungsanalyse sind in Abbildung 4 zusammengefasst. Abbildung 4A zeigt die GO- und KEGG-Anreicherung in der TCGA-LUAD-Kohorte, und Abbildung 4B zeigt die Anreicherung in der GSE115002-Kohorte. Hochregulierte Gene waren stark bereichert durch den Zellzyklusverlauf, die Organisation der extrazellulären Matrix, die fokale Adhäsion und die onkogene Signalübertragung. Herunterregulierte Gene waren mit normaler Epitheldifferenzierung und p53-Signalübertragung assoziiert. Diese Beobachtungen deuten darauf hin, dass die drei Kandidatengene an Signalwegen beteiligt sind, die Proliferation, Invasion und Immundysregulation im Lungenadenokarzinom fördern.

Koexpressionsnetzwerke

Koexpressionsnetzwerke, die mit B3GNT3, FERMT1 und SPP1 assoziiert sind, sind in Abbildung 5 dargestellt. Abbildung 5A zeigt das Netzwerk in der TCGA-LUAD-Kohorte, und Abbildung 5B zeigt das Netzwerk in der GSE115002-Kohorte. Knoten repräsentieren Gene und Kanten Korrelationskoeffizienten. Die drei Schlüsselgene clustern mit ECM-Remodellierung, Immunregulation und zytoskelettaler Organisationsgen. Diese Ergebnisse deuten darauf hin, dass die Überexpression der drei Gene mit einer immunsuppressiven Tumor-Mikroumgebung assoziiert ist.

Leistung des prognostischen Nomogramms

Das prognostische Nomogramm ist in Abbildung 6 dargestellt. Das Modell wurde durch Integration der pathologischen T-Stufe, pathologischer N-Stufe und Expressionsniveaus von B3GNT3, FERMT1 und SPP1 zur Vorhersage des 1-, 2- und 3-jährigen Gesamtüberlebens in LUAD erstellt. Für jede Variable werden Punkte vergeben, und die Gesamtpunkte entsprechen der vorhergesagten Überlebenswahrscheinlichkeit. Das Modell erreichte einen Konkordanzindex von 0,743, was auf eine gute prädiktive Leistung hinweist. Die Kalibrierungskurven zeigten eine enge Übereinstimmung zwischen vorhergesagten und tatsächlichen Überlebenswahrscheinlichkeiten. Die Analyse der Entscheidungskurve bestätigte den klinischen Nettonutzen. Dieses Nomogramm verbessert die individualisierte Überlebensvorhersage über die herkömmliche TNM-Stadieneinteilung hinaus.

Zusammenfassend hebt diese Studie B3GNT3, FERMT1 und SPP1 als zentrale molekulare Akteure in der LUAD-Pathogenese hervor. Ihre Überexpression korreliert mit invasiven Tumorphänotypen, stromaler Remodellierung und Immunausweichung. Durch Multi-Omics-Integration zeigen wir den kombinierten Wert dieser Gene für Diagnose, Prognose und Patientenstratifizierung. Zukünftige Forschungen sollten ihre prädiktive Relevanz für die Immuntherapie-Antwort untersuchen und ihr Potenzial als therapeutische Ziele bei LUAD bewerten.

figure-results-1
Abbildung 1: Vulkandiagramme unterschiedlich exprimierter Gene im LUAD-Tumor im Vergleich zu normalen Geweben. (A) TCGA-LUAD-Datensatz. (B) GSE115002 Datensatz. Rot weist auf deutlich hochregulierte Gene hin; Blau steht für herunterregulierte Gene. B3GNT3, FERMT1 und SPP1 werden als konsequent hochreguliert eingestuft. Bitte klicken Sie hier, um eine größere Version dieser Abbildung anzusehen.

figure-results-2
Abbildung 2: ROC-Kurven für B3GNT3, FERMT1 und SPP1 zur Unterscheidung von LUAD und normalem Gewebe. (A) TCGA-LUAD-Kohorte. (B) GSE115002 Kohorte. AUC-Werte zeigen eine hohe diagnostische Genauigkeit. Bitte klicken Sie hier, um eine größere Version dieser Abbildung anzusehen.

figure-results-3
Abbildung 3: Kaplan-Meier-Gesamtüberlebenskurven, geschichtet nach B3GNT3-, FERMT1- und SPP1-Expressionsniveaus. (A–C) TCGA-LUAD-Kohorte. (A) B3GNT3, (B) FERMT1, (C) SPP1. (D–F) GSE115002 Kohorte. (D) B3GNT3, (E) FERMT1, (F) SPP1. Eine hohe Expression jedes Gens ist in beiden Kohorten signifikant mit einer kürzeren Gesamtüberlebenszeit verbunden. HR- und P-Werte aus Log-Rank-Tests werden bereitgestellt. Bitte klicken Sie hier, um eine größere Version dieser Abbildung anzusehen.

figure-results-4
Abbildung 4: GO- und KEGG-Anreicherungsanalyse der DEGs, die mit den drei Schlüsselgenen korreliert sind. (A) TCGA-LUAD-Kohorte. (B) GSE115002 Kohorte. Die Anreicherungsterme umfassen biologischen Prozess (BP), zelluläre Komponente (CC), molekulare Funktion (MF) und KEGG-Wege. Hochregulierte Gene sind durch Proliferation, ECM-Remodellierung und onkogene Signalübertragung bereichert. Bitte klicken Sie hier, um eine größere Version dieser Abbildung anzusehen.

figure-results-5
Abbildung 5: Gen-Koexpressionsnetzwerke, die mit B3GNT3, FERMT1 und SPP1 assoziiert sind. (A) TCGA-LUAD-Kohorte. (B) GSE115002 Kohorte. Knoten stehen für Gene, und Kanten für Korrelationskoeffizienten. Die drei Schlüsselgene clustern mit ECM-Remodellierung, Immunregulation und zytoskelettaler Organisationsgen. Bitte klicken Sie hier, um eine größere Version dieser Abbildung anzusehen.

figure-results-6
Abbildung 6: Prognostisches Nomogramm, das pathologische T-Phase, pathologische N-Phase, B3GNT3, FERMT1 und SPP1-Expression zur Vorhersage der Gesamtüberlebensrate von 1, 2 und 3 Jahren bei LUAD integriert. Für jede Variable werden Punkte vergeben, und die Gesamtpunkte entsprechen der vorhergesagten Überlebenswahrscheinlichkeit. Bitte klicken Sie hier, um eine größere Version dieser Abbildung anzusehen.

Discussion

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

Das Nomogramm wurde mittels multivariater Cox-Regressionsanalyse auf Basis der TCGA-LUAD-Kohorte konstruiert. Prädiktoren sind das pathologische T-Stadium, das pathologische N-Stadium und der Genexpressionsstatus von B3GNT3, FERMT1 und SPP1 (kategorisiert als High vs. Low basierend auf medianer Expression). Für jeden Patienten werden die individuellen Werte für jede Variable summiert, um einen "Gesamtpunkt"-Wert zu erzeugen, der den geschätzten Überlebenswahrscheinlichkeiten von 1, 2 und 3 Jahren entspricht. Höhere Gesamtwerte deuten auf ein erhöhtes Sterblichkeitsrisiko hin. Dieses Tool bietet individuelle Überlebensvorhersagen und unterstützt die Risikostratifizierung von LUAD. Maschinelles Lernen wurde eingesetzt, um verschiedene Zelltodsmuster bei LUAD-Prognose und -Therapie 21,22,23 aufzuzeigen, was unser Nomogrammmodell weiter optimieren könnte.

Diese Studie identifizierte B3GNT3, FERMT1 und SPP1 als robuste diagnostische und prognostische Biomarker in LUAD mittels integrierter bioinformatischer Analyse. Alle drei Gene sind in Tumoren konstant überexprimiert, unterscheiden Tumore mit hoher Genauigkeit von normalem Gewebe, sagen ein schlechtes Überleben voraus und regulieren Signalwege im Zusammenhang mit EMT, Matrixremodellierung und Immunumgehung. Ein kombiniertes Nomogramm verbessert die Risikostratifizierung über die TNM-Stufen hinaus. B3GNT3 fördert die Immunvermeidung, indem es PD-L1 mittels Glykosylierung 9,10 stabilisiert. FERMT1 verbessert die Integrin-Signalübertragung und die Zellmotilität und treibt Invasion und Metastasen 11,12 voran. SPP1 fungiert als sekretierter Treiber von EMT, Angiogenese und M2-Makrophagenpolarisation 13,14,15. Zusammen definieren sie einen aggressiven LUAD-Subtyp, der durch Invasivität und Immunsuppression gekennzeichnet ist.

Frühere Studien berichteten individuelle Rollen von B3GNT3, FERMT1 oder SPP1 in LUAD. Diese Studie ist die erste, die alle drei als einheitliches Panel über unabhängige transkriptomische Kohorten hinweg validiert, wobei diagnostische und prognostische Leistung sowohl in TCGA- als auch in GEO-Daten bestätigt sind. Jüngste Arbeiten zu LUAD-Biomarkern untermauern den Wert immunassoziierter Gensignaturen für Prognose und Immuntherapieberatung. Jüngste Studien mit integrierter Bioinformatik und maschinellem Lernen haben mehrere Gensignaturen für die Diagnose und Prognose von LUADidentifiziert 21,22. Diese Ansätze, ähnlich wie unser Drei-Gen-Panel, heben den Wert transkriptombasierter Biomarker in der klinischen Stratifizierung hervor.

Die Umgestaltung der extrazellulären Matrix ist ein zentrales Merkmal aggressiver LUAD, und ECM-bezogene Signaturen wurden als unabhängige prognostische Faktoren validiert. Unsere Erkenntnisse, dass FERMT1 und SPP1 eng mit fokaler Adhäsion und ECM-Rezeptor-Interaktion verbunden sind, untermauern die entscheidende Rolle der Matrizenremodellierung im Fortschritt von LUAD weiter. Ähnlich wie CHAF1B und ubiquitin-bezogene Gensignaturen, die in der interdisziplinären Medizin (IMed)21,23 berichtet wurden, sind unsere drei Gene eng mit der Immuninfiltration verbunden und können sowohl als prognostische als auch als prädiktive Marker dienen. Alternative Strategien zur Identifizierung von LUAD-Biomarkern sind Einzelzell-RNA-Sequenzierung, räumliche Transkriptomik, maschinell-learningbasierte Merkmalsauswahl und plasmaproteomisches Profiling 24,25,26. Maschinelle Lernalgorithmen wie Random Forest oder LASSO könnten die Biomarker-Auswahl weiter verfeinern. Eine Nasslaborvalidierung mit qPCR, IHC und ELISA ist unerlässlich, um die klinische Übersetzungzu bestätigen 27,28,29,30.

Diese Studie ist durch ihr retrospektives Design, die Abhängigkeit von öffentlichen transkriptomischen Daten und das Fehlen externer klinischer Validierung begrenzt. Die Nomogramm-Validierung beschränkte sich auf interne Bootstrap-Resampling. Bulk-transkriptomische Daten können die zelluläre Expression nicht auflösen. Mechanistische Kausalität erfordert funktionale Experimente. Korrelationen mit Immuninfiltration basieren auf rechnerischer Dekonvolution und sollten mit Vorsicht interpretiert werden. Zukünftige Studien sollten diese Biomarker in prospektiven Kohorten unter Verwendung von IHC, qPCR und Serum-ELISA validieren. Einzelzell- und räumliche Transkriptomik wird zelluläre Quellen und räumliche Verteilung klarstellen. Der prädiktive Wert für Immuntherapie und die gezielte Therapieansprache sollten bewertet werden. Die therapeutische Zielsetzung von B3GNT3, FERMT1 und SPP1 könnte neue Strategien für die LUAD-Behandlung bieten.

Disclosures

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

Die Autoren erklären keine konkurrierenden Interessen.

Acknowledgements

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

Diese Arbeit wurde 2024 vom Universitätsprojekt der Fujian University of Traditional Chinese Medicine (Fördernummer: XB2024012) unterstützt, geleitet von Yuhui Lin vom Affiliated People's Hospital der Fujian University of Traditional Chinese Medicine. und gemeinsame Mittel für die Innovation von Wissenschaft und Technologie, Provinz Fujian (Zuschussnummer: 2025Y9530), geleitet von Xiaoting Chen vom Jinjiang Municipal Hospital (Shanghai Sixth People's Hospital, Fujian).

Materials

List of materials used in this article
NameCompanyCatalog NumberComments
Publicly Available DatasetsTCGA-LUAD DatasetThe Cancer Genome Atlas (TCGA) Portal (https://portal.gdc.cancer.gov/); 535 LUAD tumor samples, 59 adjacent normal lung tissue samples (RNA-sequencing count/FPKM values + clinical data: survival, TNM staging)Transcriptomic and clinical data for differential expression, survival, and nomogram analysis; primary study cohort
GSE115002 DatasetGene Expression Omnibus (GEO) (https://www.ncbi.nlm.nih.gov/geo/query/acc.cgi?acc=GSE115002); Agilent microarray, 52 LUAD tumor tissues, 52 matched adjacent normal lung tissues (treatment-naïve primary tumors)Independent validation cohort for differential expression, diagnostic performance, and immune infiltration analysis
Bioinformatics Software & Programming EnvironmentR Programming LanguageVersion 4.1Core platform for all transcriptomic, statistical, and graphical analyses
R Packages (Differential Expression)DESeq2, limmaDESeq2: TCGA RNA-seq raw count differential expression analysis; limma: GSE115002 microarray normalization and differential expression analysis (Benjamini–Hochberg FDR correction)
R Packages (Diagnostic Analysis)pROCConstruction of ROC curves, calculation of AUC (95% CI), optimal cutoff determination (Youden’s index) for diagnostic performance assessment
R Packages (Survival Analysis)survival, survminerKaplan–Meier survival curve generation, log-rank test, univariate/multivariate Cox proportional hazards regression (HR + 95% CI); patient stratification by median gene expression
R Packages (Functional Enrichment)clusterProfiler, fgseaclusterProfiler: GO (BP/CC/MF) and KEGG pathway enrichment analysis (adjusted P < 0.05); fgsea: GSEA for MSigDB Hallmark/KEGG gene sets (FDR < 0.25)
R Packages (Nomogram Construction & Validation)rmsDevelopment of prognostic nomogram (integration of gene expression + TNM stage); Harrell’s C-index calculation, bootstrap resampling (1000 repetitions) for bias correction, calibration plot generation
R Packages (Statistical & Visualization)ggplot2, ComplexHeatmap, corrplotGeneration of volcano plots, bubble plots (enrichment), heatmaps (immune infiltration correlation), scatter plots (gene co-expression); Pearson/Spearman correlation analysis
Bioinformatics Databases & Tools (Network/Immune Analysis)STRING DatabaseConfidence score > 0.7Construction of protein–protein interaction (PPI) networks for B3GNT3/FERMT1/SPP1 and first-degree interactors
Cytoscape-Visualization of PPI and gene co-expression networks (edge weighting by correlation strength, hub gene identification)
Immune Deconvolution AlgorithmCIBERSORTEstimation of immune cell infiltration abundance (M2 macrophages, CD8+ T cells, neutrophils, NK cells, etc.) in LUAD samples; correlation with candidate gene expression
Other ToolsMicrosoft Office/LaTeX-Manuscript preparation, figure assembly, and table formatting; statistical result compilation

Reprints and Permissions

Request permission to reuse the text or figures of this JoVE article

Request Permission

Tags

Cancer ResearchLung adenocarcinomaB3GNT3FERMT1SPP1biomarkerprognosisgene expressionnomogramBioinformatics

Related Articles