Method Article

Identificazione di geni hub, polimorfismi a singolo nucleotide e potenziali bersagli farmacologici nel cancro al seno tramite analisi trascrittomica

DOI:

10.3791/70964

June 9th, 2026

In This Article

Summary

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

Questo studio ha indagato geni correlati allo stress ossidativo mitocondriale associati alla resistenza terapeutica nel cancro mammario HER2-positivo. Utilizzando dataset trascrivistivi, bioinformatica integrata e dati clinici (n = 4.929), gli autori hanno identificato MTHFD2 e PRDX3 come geni chiave espressi differenzialmente con potenziale valore prognostico. In silico. Le analisi suggeriscono effetti funzionali delle varianti genetiche.

Abstract

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

Il cancro al seno HER2-positivo (HER2+) sviluppa spesso resistenza a terapie come Lapatinib, che possono coinvolgere il metabolismo mitocondriale e la riprogrammazione redox. Questo studio mirava a identificare geni legati allo stress ossidativo mitocondriale (MOS-DEG) come biomarcatori di resistenza e a caratterizzare i loro nsSNP funzionali e gli impatti strutturali. I dataset RNA-seq (GSE231524, GSE231525) sono stati analizzati utilizzando DESeq2 per identificare i DEG, che sono stati intersecati con geni di stress ossidativo mitocondriale per ottenere MOS-DEG. Sono stati eseguiti arricchimenti funzionali, analisi PPI, analisi ROC, profilazione delle espressioni e analisi della sopravvivenza. Gli nsSNP sono stati valutati utilizzando molteplici strumenti predittivi, e gli impatti strutturali sono stati valutati tramite modellazione secondaria e 3D. Analisi trascrivomica e clinica integrate ha identificato MTHFD2 e PRDX3 come MOS-DEG centrali che mostrano ruoli regolatori opposti nel metabolismo redox mitocondriale. MTHFD2 è stata significativamente aumentata e associata a una prognosi scorretta (HR = 1,53, p = 1,1 × 10⁻16), mentre PRDX3 ha mostrato modelli di espressione protettivi (HR = 0,73, p = 7,7×10⁻10). L'analisi ROC suggeriva il loro potenziale come predittori della risposta terapeutica. L'analisi nsSNP ha rivelato cinque varianti deleterie in MTHFD2 e quattro varianti deleterie in PRDX3, con rs1471336772 (MTHFD2) e rs747786383 (PRDX3.) identificate come le più patogene. Queste varianti erano previste come dannose basandosi su molteplici sistemi di punteggio computazionale, tra cui SIFT ≤ 0,05, PolyPhen-2 ≥ 0,85, punteggi CADD deleteri e punteggi REVEL alti, e si trovavano all'interno di domini catalitici o redox-attivi. La modellizzazione strutturale suggerisce che queste sostituzioni possono destabilizzare la conformazione, disturbare i siti di legame di metalli e cofattori e influenzare la rigenerazione di NADPH o l'attività della perossidasi dipendente dalla tioredossina. Le previsioni della dinamica molecolare indicavano una possibile perdita di stabilità strutturale e alterazione della flessibilità, suggerendo un possibile deterioramento funzionale del controllo redox mitocondriale. Questo studio identifica MTHFD2 e PRDX3 come regolatori dello stress ossidativo mitocondriale nel cancro al seno HER2+ . Gli nsSNP deleteri in questi geni possono contribuire a alterare l'equilibrio redox, influenzando potenzialmente l'adattamento metabolico (MTHFD2) e la difesa antiossidante (PRDX3).

Introduction

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

Il cancro al seno è il cancro più comunemente diagnosticato nelle donne a livello mondiale e una delle principali cause di morte correlata al cancro, nonostante i notevoli progressi nella diagnosi precoce e nelle terapie mirate 1,2,3. L'eterogeneità molecolare all'interno dei tumori mammari è alla base di diversi esiti clinici e risposte terapeutiche, ponendo sfide persistenti per l'oncologiadi precisione 4,5. Tra i sottotipi molecolari riconosciuti, il carcinoma al seno positivo per il recettore del fattore di crescita epidermico 2 (HER2) umano rappresenta circa il 15–20% di tutti i tumori al seno ed è caratterizzato dall'amplificazione del gene HER2 e dalla sovraespressione del recettore HER2 tirosina chinasi 6,7. Sebbene le terapie mirate a HER2, come trastuzumab e lapatinib, abbiano migliorato notevolmente la prognosi del paziente, emerge frequentemente resistenza primaria e acquisita a questi agenti, portando a ricadute tumorali e progressionedella malattia 8,9. Comprendere i meccanismi molecolari che guidano la resistenza alla terapia HER2 rimane quindi una delle principali esigenze insoddisfatte in oncologia clinica.

Le evidenze emergenti suggeriscono che la disfunzione mitocondriale e lo stress ossidativo svolgono ruoli fondamentali nella mediazione della resistenza ai farmaci nel cancro al seno. I mitocondri, oltre al loro ruolo canonico nella produzione di ATP, sono regolatori chiave dell'apoptosi, della segnalazione redox e della plasticità metabolica—tutti processi che le cellule tumorali sfruttano per sopravvivere alla pressione terapeutica. In particolare, le cellule tumorali resistenti HER2+ mostrano uno spostamento metabolico verso la fosforilazione ossidativa (OXPHOS), il tamponamento aumentato delle specie reattive dell'ossigeno (ROS) e una biogenesi mitocondriale alterata. Queste adattazioni permettono alle cellule di mantenere la segnalazione di sopravvivenza ed eludere l'apoptosi nonostante l'inibizione sostenuta delle vie di segnalazione HER2. I geni che codificano le subunità del complesso mitocondriale e gli enzimi redox regolatori sono quindi potenziali biomarcatori e bersagli terapeutici per superare la resistenza.

Parallelamente, polimorfismi a singolo nucleotide (nsSNP) non sinonimi nei geni mitocondriali o legati allo stress ossidativo possono modificare la struttura e la funzione delle proteine, influenzando l'attività enzimatica, la risposta farmacologica e la suscettibilità allemalattie 10. Previsione computazionale degli effetti deleteri degli nsSNP usando in silico.strumenti come SIFT, PolyPhen-2 e CADD forniscono un modo rapido per identificare varianti funzionali che possono contribuire all'eterogeneità del cancro e alla resistenza terapeutica. L'integrazione dei dati trascrittomici e mutazionali offre quindi una visione multidimensionale della disregolazione genica e dell'alterazione strutturale sia a livello trascrizionale che genomico.

I recenti progressi in bioinformatica e biologia dei sistemi hanno permesso l'identificazione ad alta capacità di geni driver potenziali tramite profilazione di espressione su larga scala e analisi basate su rete. Repository pubblici come il Gene Expression Omnibus (GEO) forniscono preziosi dataset di sequenziamento dell'RNA che catturano i cambiamenti molecolari tra modelli sperimentali e coorti di pazienti. Abbinate a strumenti analitici come DESeq2, clusterProfiler e l'analisi della rete STRING–Cytoscape, queste risorse permettono la caratterizzazione completa dei geni differenzialmente espressi (DEG), l'arricchimento delle vie e la scoperta dei geni hub. È importante sottolineare l'integrazione delle firme geniche dello stress ossidativo mitocondriale con i DEG che può illuminare nuovi meccanismi molecolari alla base della resistenza alla terapia mirata a HER2 e identificare biomarcatori candidati per l'intervento terapeutico.

L'asse di resistenza guidato da HER3 ha recentemente attirato attenzione come principale via compensatoria dopo l'inibizione di HER2. L'attivazione di HER3 ripristina la segnalazione a valle di PI3K/AKT, promuovendo la sopravvivenza cellulare e la tolleranza ai farmaci (Figura 1). La DUSP6 (Fosfatasi a Doppia Specificità 6), un regolatore negativo della segnalazione ERK, è stata implicata nella modulazione di questa risposta adattativa. L'inibizione di DUSP6 riattiva la segnalazione ERK e può contrastare la resistenza mediata da HER3, ma la sua interazione con lo stress ossidativo mitocondriale e l'adattamento metabolico rimane insufficientemente compresa. Pertanto, analisi trascristatiche comparative delle linee cellulari HER2+ (BT474 e MDA-MB-453) sotto inibizione da DUSP6 ed esposizione cronica al Lapatinib offrono un modello ideale per analizzare i determinanti molecolari della resistenza ai farmaci.

figure-introduction-1
Figura 1. Rappresentazione schematica del paesaggio molecolare che collega la disfunzione mitocondriale, lo stress ossidativo e la progressione del tumore al seno. Questi meccanismi molecolari integrati alla base dello stress ossidativo mitocondriale hanno mediato l'oncogenesi nel cancro al seno. Complessi di catena di trasporto elettronico mitocondriali disregolati, in particolare che coinvolgono DUFS3, UQCRC1, COX4I1, SDHA e ATP5PO, portano a una generazione eccessiva di specie reattive dell'ossigeno (ROS), causando danni ossidati al DNA, perossidazione lipidica e potenziale della membrana mitocondriale compromesso. Queste perturbazioni ossidative attivano vie di segnalazione oncogeniche come PI3K/AKT, MACK e NF-κB, sopprimendo al contempo i regolatori apoptotici tra cui p53 e BAX, favorendo così la sopravvivenza, la proliferazione e l'evasione immunitaria delle cellule tumorali. Il diagramma evidenzia anche il doppio impatto dello stress ossidativo mitocondriale sul metabolismo del cancro e sul microambiente tumorale, sottolineandone il contributo alla resistenza alla terapia e alla modulazione immunitaria nelle condizioni di cancro al seno HER2+. Questo modello integrativo costituisce la base meccanicistica per le successive analisi trascricomiche e basate su SNP, volte a identificare geni driver mitocondriali e potenziali bersagli terapeutici. Clicca qui per visualizzare una versione più grande di questa figura.

Il presente studio è stato progettato per identificare sistematicamente geni hub, nsSNP funzionali e potenziali target farmacologici associati allo stress ossidativo mitocondriale nel cancro al seno HER2+ . Integrando dati trascrittomici provenienti da GSE231524 e GSE231525 con set genici mitocondriali e correlati allo stress ossidativo, lo studio attuale ha mirato a definire geni differenzialmente espressi (MOS-DEG) legati allo stress ossidativo mitocondriale che contribuiscono alla resistenza alla terapia. Le analisi a valle includevano l'arricchimento dell'ontologia genica (GO) e della via KEGG, la costruzione di reti di interazione proteina-proteina (PPI), la priorità dei geni hub e l'analisi di correlazione di sopravvivenza utilizzando il database di immunoterapia Kaplan–Meier. Inoltre, sono stati ulteriormente indagati geni chiave per variazione dei nsSNP e potenziale impatto strutturale per delineare le conseguenze funzionali guidate dalla mutazione.

Combinando profilazione trascrictoriale, biologia delle reti e analisi mutazionale in silico , questo studio fornisce un quadro integrato per scoprire potenziali biomarcatori mitocondriali e bersagli terapeutici nel cancro al seno HER2+ . L'identificazione dei geni hub collegati alla fosforilazione ossidativa e dei loro SNP funzionali potrebbe aprire la strada allo sviluppo di strategie terapeutiche di precisione per superare la resistenza dei farmaci mirati all'HER2 e migliorare i risultati per i pazienti.

Protocol

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

Recupero e preelaborazione dei dati

Questo studio è stato condotto utilizzando dati trascristomici e genetici disponibili pubblicamente; Non erano direttamente coinvolti soggetti umani o animali. I dataset trascrivomici rilevanti per la resistenza alla terapia del cancro al seno HER2+ sono stati recuperati dal database NCBI Gene Expression Omnibus (GEO) (https://www.ncbi.nlm.nih.gov/geo/)11. Due dataset RNA-seq, GSE231524 e GSE231525, sono stati selezionati per il loro focus specifico sulla resistenza guidata da HER3 e sull'inibizione di DUSP6 nelle linee cellulari del cancro al seno HER2+ (BT474 e MDA-MB-453). Questi dataset includevano fenotipi parentali, tolleranti e resistenti ai farmaci derivati dall'esposizione a Lapatinib (1 μM) e dal knockdown a DUSP6. Le matrici grezze di conteggio e i relativi file di metadati venivano acceduti utilizzando i pacchetti GEOquery (v2.70.0) e Biobase (v2.62.0) in RStudio (v4.3.2)12. I metadati sono stati selezionati per definire due principali contrasti per ciascun dataset: GSE231524 confrontato il controllo (BT474 parentale, Giorno 0) con campioni tolleranti e resistenti ai farmaci (Giorno 9–Mese 9), mentre GSE231525 confrontato il controllo (Scrambled siRNA) con il knockdown di DUSP6 (DUSP6-KD). Il controllo qualità e la normalizzazione dei dati sono stati eseguiti utilizzando il framework DESeq2 (v1.42.0), che applica una trasformazione stabilizzante della varianza (VST) per ridurre l'eteroscedasticità e garantire la comparabilità tra i campioni. La distribuzione dei dati e i modelli di clustering sono stati valutati visivamente utilizzando ggplot2 (v3.5.0) e pheatmap (v1.0.12) per confermare l'uniformità dei dati e identificare potenziali valori aberranti prima dell'analisi differenzialedelle espressioni 13,14.

In questo studio, è stata mantenuta una chiara distinzione tra i risultati derivati da dataset trascritomici di linee cellulari e quelli ottenuti da dataset clinici derivati dai pazienti. I dati delle linee cellulari sono stati utilizzati principalmente per analisi esplorative, inclusa l'identificazione di geni espressi differenzialmente e la generazione di intuizioni meccanicistiche preliminari in modelli sperimentali controllati. Al contrario, sono stati utilizzati dataset derivati dai pazienti per la validazione esterna dei modelli di espressione genica e per la valutazione della rilevanza clinica, inclusa la valutazione prognostica. Di conseguenza, i risultati dei modelli di linee cellulari e delle coorti cliniche vengono interpretati separatamente per evitare generalizzazioni eccessiva e garantire un contesto traslazionale adeguato per tutti i risultati.

Analisi differenziale dell'espressione genica

È stata effettuata un'analisi di espressione differenziale per identificare geni significativamente modulati tra le condizioni di controllo e quelle di trattamento. I conteggi normalizzati sono stati elaborati utilizzando il modello di regressione aggiustata (ARM) integrato in DESeq2 per stimare con precisione le variazioni log₂ di fold e la significanza statistica. La formula di progettazione fu definita come ~condizione, rappresentando i gruppi di controllo contro quelli trattati. I geni con un valore p (FDR) aggiustato < 0,05 e un cambiamento assoluto log₂ fold ≥ 1 sono stati considerati espressi in modo significativamente differenziale. Il ritiro del cambiamento di piega log₂ è stato eseguito utilizzando il metodo apeglm per aumentare la robustezza nella stima della dimensione dell'effetto. I risultati dell'analisi sono stati visualizzati utilizzando EnhancedVolcano (v1.22.0)15 e ggplot216, che hanno generato grafici vulcanici e grafici MA mostrando la relazione tra grandezza di espressione e fiducia statistica. Le stime della dispersione sono state valutate anche all'interno di DESeq2 per garantire una modellazione accurata della varianza e una normalizzazione coerente tra replichebiologiche 17.

Recupero e identificazione di geni differenzialmente espressi da stress ossidativo mitocondriali (MOS-DEG)

Per indagare il legame tra metabolismo energetico, stress ossidativo e resistenza ai farmaci, è stato compilato un elenco completo di geni associati allo stress mitocondriale e ossidativo da più database, tra cui Human MitoCarta3.018 (https://personal.broadinstitute.org/scalvo/MitoCarta3.0/human.mitocarta3.0.html), Gene Ontology (GO:0006979, response to oxidative stress) (http://geneontology.org/), la Kyoto Encyclopedia of Genes and Genomes (KEGG) via di fosforilazione ossidativa (https://www.genome.jp/kegg/), e il Database Genetico dello Stress Ossidativo Umano (HOSGDB) (http://hosgdb.com/). Tutti i geni recuperati sono stati standardizzati con simboli genici approvati da HGNC utilizzando org. Hs.eg.db (v3.18.0) e AnnotationDbi (v1.64.0), mentre voci duplicate, pseudogeni e RNA non codificanti sono stati rimossi per garantire l'accuratezza delle annotazioni. Il pannello genico dello stress ossidativo mitocondriale (geni MOS) risultante è stato successivamente utilizzato come set di riferimento per l'integrazione con i geni differenzialmente espressi identificati da entrambi i dataset trascrictorici.

L'intersezione della lista genica MOS curata con i DEG ottenuti da GSE231524 e GSE231525 è stata eseguita in R utilizzando funzioni dplyr (v1.1.3)19 e base R intersect(). Questo approccio integrativo ha permesso l'identificazione dei MOS-DEG, che rappresentano geni funzionalmente collegati al metabolismo mitocondriale, alla regolazione redox e all'adattamento allo stress ossidativo. La sovrapposizione tra i dataset è stata visualizzata utilizzando il pacchetto VennDiagram (v1.7.3) in R per illustrare geni condivisi e unici tra i modellisperimentali 20. La lista raffinata di MOS-DEG è stata utilizzata per analisi a valle, fornendo una visione meccanicistica della riprogrammazione trascrizionale e metabolica alla base della resistenza alla terapia mirata a HER2.

Profilazione delle espressioni e visualizzazione dei MOS-DEG

Il profilaggio delle espressioni identificati (MOS-DEG) è stato condotto utilizzando i package ComplexHeatmap (v2.18.0)21 e pheatmap (v1.0.12) in RStudio per visualizzare i modelli di espressione globale tra condizioni parentali, tolleranti ai farmaci e resistenti. I dati di conteggio normalizzato sono stati trasformati utilizzando la scala z-score per standardizzare la matrice di espressione genica tra i campioni. Il clustering è stato effettuato utilizzando metodi di distanza euclidea e collegamento completo per rilevare i modelli di co-espressione e distinguere profili trascrizionali specifici per condizioni. Mappe di calore e grafici di clustering sono stati generati utilizzando ggplot2 per garantire una chiara differenziazione visiva tra le condizioni. Questo approccio di visualizzazione ha facilitato l'identificazione di gruppi genici associati all'attività mitocondriale, alla modulazione dello stress ossidativo e alla riprogrammazione metabolica sotto stati resistenti ai farmaci.

Arricchimento funzionale e annotazione dei percorsi

Per esplorare il significato biologico e i meccanismi regolatori dei MOS-DEG identificati, sono state condotte analisi di arricchimento di Gene Ontology (GO) e Kyoto Encyclopedia of Genes and Genomes (KEGG) utilizzando R Studio (versione 4.3.1). Le analisi sono state effettuate nell'ambiente tidyverse utilizzando molteplici pacchetti Bioconductor per calcoli e visualizzazioni riproducibili. L'annotazione genica e la mappatura degli identificatori venivano eseguite tramite l'org. Hs.eg.db database (https://bioconductor.org/packages/org.Hs.eg.db/) basato sul genoma di riferimento Homo sapiens (GRCh38). L'analisi di arricchimento GO è stata effettuata utilizzando il pacchetto clusterProfiler (versione 4.8.1; https://bioconductor.org/packages/clusterProfiler/), che classifica i geni in tre ontologie principali: Processo Biologico (BP), Componente Cellulare (CC) e Funzione Molecolare (MF). La funzioneenrichGO 22 veniva utilizzata con parametri impostati al valore p < 0,05 e valore p adeguato. (FDR) < 0,05, applicando il metodo di correzione Benjamini–Hochberg. Le visualizzazioni, inclusi diagrammi a barre, diagrammi di punti e diagrammi di corde, sono state generate utilizzando enrichplot (https://bioconductor.org/packages/enrichplot/), ggplot213 (https://cran.r-project.org/web/packages/ggplot2/) e GOplot (https://cran.r-project.org/web/packages/GOplot/). Questi strumenti fornivano una visione strutturata dei termini GO arricchiti e delle loro associazioni geniche.

L'arricchimento delle vie KEGG veniva eseguito utilizzando la funzione enrichKEGG() all'interno del pacchetto clusterProster, facendo riferimento al database umano KEGG (https://www.genome.jp/kegg/). Il pacchetto KEGGREST (https://bioconductor.org/packages/KEGGREST/) veniva utilizzato per il recupero e l'annotazione dei dati dei percorsi. I percorsi con un valore p aggiustato. (valore q) < 0,05 sono stati considerati significativi. La visualizzazione e la mappatura dei percorsi sono state condotte utilizzando pathview (https://bioconductor.org/packages/pathview/), ggplot2 ed enrichplot, mentre igraph e ggraph sono stati utilizzati per la rappresentazionedella rete 23. Tutte le analisi e visualizzazioni di arricchimento sono state implementate in R Studio (v4.3.1) utilizzando codice riproducibile e flussi di lavoro standardizzati di Bioconductor, garantendo un'identificazione affidabile delle categorie funzionali arricchite e dei percorsi biologici associati ai MOS-DEG.

Validazione basata su ROC dei biomarcatori predittivi nel cancro al seno

Per convalidare il potere predittivo clinico dei MOS-DEG, è stata eseguita un'analisi della curva delle caratteristiche operative del ricevitore (ROC) utilizzando lo strumento online ROCplotter (https://www.rocplot.org/)24. ROCplotter è una piattaforma web integrata che combina dati sull'espressione genica con dataset clinicamente annotati di risposta al trattamento provenienti da 3.104 pazienti con cancro al seno, inclusi quelli trattati con chemioterapia, terapia ormonale o agenti anti-HER2.

L'analisi è stata condotta utilizzando i parametri "risposta completa patologica" come variabile di esito e "qualsiasi chemioterapia" come categoria di trattamento. I valori di espressione genica derivati dai dataset di microarray di Affymetrix sono stati automaticamente stratificati in gruppi risponditori e non rispondenti in base alle annotazioni cliniche presenti sulla piattaforma.

La curva della caratteristica operativa del ricevitore (ROC) (AUC), il test U di Mann–Whitney, il cambiamento di pieghe e il test chi-quadrato sono stati applicati per valutare la capacità di ciascun gene di distinguere i rispondenti dai non rispondenti. L'area sotto la curva (AUC) è stata utilizzata come metrica principale per valutare la performance discriminativa. I valori AUC superiori a 0,55 con valori p ROC < 0,05 sono stati considerati significativi, rappresentando una performance predittiva moderata tipica dei biomarcatori trascritomici, mentre la correzione del tasso di false discovery (FDR) è stata applicata per mantenere il rigore analitico.

Tutti i MOS-DEG selezionati sono stati interrogati utilizzando i rispettivi ID di sonda Affymetrix. Il potenziale discriminativo di ciascun gene è stato valutato tra le coorti cliniche di cancro al seno, dove i dati di espressione sono stati stratificati in gruppi risponditori e non rispondenti. Le curve ROC, i boxplot e gli output statistici associati venivano generati direttamente dalla piattaforma ROCplotter ed esportati per la visualizzazione e il confronto a valle. L'analisi ha quantificato il valore predittivo dei regolatori redox e metabolici coinvolti nello stress ossidativo mitocondriale. I geni che hanno mostrato significatività predittiva costante tra i campioni clinici sono stati mantenuti per l'inclusione nel panel predittivo finale.

Analisi dell'espressione differenziale nei tessuti tumorali, normali e metastatici (analisi TNMplot)

I modelli di espressione dei MOS-DEG superiori sono stati analizzati su tessuti mammari normali, tumorali e metastatici utilizzando lo strumento web TNMplot v2 (https://tnmplot.com/analysis/)25. Sono stati esaminati sia i dataset di RNA-Seq (TCGA + GTEx + MET500) sia quelli dei chip genici per garantire la validazione cross-platform. Il modulo "Multiple Gene Analysis" è stato utilizzato con il Carcinoma Invasivo del Seno come tipo di tessutoselezionato 26. I valori di espressione sono stati trasformati log₂ e confrontati tra i gruppi Tumore vs. Normale (TvsN), Metastatico vs. Tumore (MvsT) e Metastatico vs. Normale (MvsN). TNMplot calcolava automaticamente il fold-change (FC) e i valori p utilizzando il test Mann–Whitney U per valutare la significanza statistica. Le distribuzioni di espressione sono state visualizzate come boxplot e diagrammi di densità generati direttamente dall'interfaccia TNMplot, con verde, rosso e grigio che rappresentano rispettivamente tessuti normali, tumorali e metastatici. Tutte le figure sono state esportate in alta risoluzione per essere integrate nella sezione risultati. Questa analisi a doppia piattaforma ha permesso un'identificazione e validazione robusta dei principali regolatori redox–metabolici mitocondriali associati alla progressione del tumoreal seno 27.

Sopravvivenza e analisi prognostica utilizzando il plotter di Kaplan–Meier

Per valutare la rilevanza prognostica dei MOS-DEG nel cancro al seno, è stata condotta un'analisi di sopravvivenza utilizzando lo strumento online Kaplan–Meier Plotter (https://kmplot.com/analysis/)28. Questo database integra dati sull'espressione genica e la sopravvivenza di oltre 4.900 pazienti con cancro al seno, derivati da molteplici dataset GEO, EGA e TCGA. L'analisi è stata effettuata per la sopravvivenza senza recidiva (RFS) utilizzando singoli ID delle sonde Affymetrix corrispondenti ai geni prioritari: 225609_at (GSR), 201761_at (MTHFD2), 201619_at (PRDX3/AOP1) e 201128_s_at (ACLY). I pazienti sono stati divisi in gruppi ad alta e bassa espressione in base al cutoff mediano di espressione, e le probabilità di sopravvivenza sono state stimate utilizzando il metodo Kaplan–Meier. Il test log-rank è stato utilizzato per valutare la significatività statistica tra curve di sopravvivenza, e i rapporti di rischio (HR) con intervalli di confidenza (IC) del 95% sono stati calcolati automaticamente dallo strumento. Tutte le analisi sono state effettuate utilizzando l'endpoint RFS, senza restrizioni basate sul recettore ormonale o sullo stato HER2 (ER, PR, HER2 = tutti). I campioni ridondanti sono stati rimossi e sono state verificate le assunzioni di rischio proporzionale per garantire la robustezza statistica. I filtri di controllo qualità escludevano i microarray polarizzati. Non è stata applicata alcuna selezione manuale della sonda o correzione dei p-value per test multipli, in conformità con le impostazioni predefinite del KM Plotter. La significatività statistica è stata definita come p. < 0,05. I grafici di sopravvivenza sono stati visualizzati e scaricati in alta risoluzione per ulteriori interpretazioni, confrontando i risultati tra espressori ad alto e basso valore di ciascun candidato geneMOS 29,30.

La presente analisi è stata avviata utilizzando dataset composti esclusivamente da campioni di cancro al seno HER2+ per l'identificazione di geni differenzialmente espressi (DEG) e geni hub. Successivamente, è stata effettuata un'analisi di sopravvivenza senza restrizioni allo stato HER2 (ER, PR, HER2 = tutti) per valutare la rilevanza prognostica più ampia e la generalizzazione dei geni identificati. Questo approccio è stato impiegato come passaggio secondario di validazione piuttosto che per ridefinire il focus dello studio. Pertanto, le implicazioni prognostiche dei geni hub identificati sono interpretate con cautela, mantenendo le conclusioni primarie specifiche per il cancro al seno HER2+ .

Le sequenze di trascrizione canoniche di MTHFD2-201 (ENST00000394053.7) e PRDX3-201 (ENST00000298510.4) sono state recuperate dall'Ensembl Genome Browser (https://www.ensembl.org)31,32. L'annotazione e la classificazione delle varianti sono state effettuate utilizzando l'Ensembl Variant Effect Predictor (VEP) (https://www.ensembl.org/vep), che forniva un contesto genomico dettagliato, alterazioni dei codoni e sostituzioni di amminoacidi per ciascuna variante identificata. Solo varianti di missense (SNP non sinonimi) sono state selezionate per l'analisi a valle.

Previsione della patogenicità e priorità delle varianti

Le conseguenze funzionali di ogni nsSNP sono state valutate utilizzando una combinazione di strumenti di previsione computazionale. La SIFT (https://sift.bii.a-star.edu.sg) è stata applicata per valutare la conservazione degli amminoacidi, classificando varianti con punteggio ≤ 0,05 comedeleterie 33. PolyPhen-2 (http://genetics.bwh.harvard.edu/pph2) ha stimato l'impatto strutturale ed evolutivo delle sostituzioni, dove punteggi ≥ 0,85 indicavano danniprobabili 34. CADD (https://cadd.gs.washington.edu) ha fornito un punteggio composito di deleterietà che integra più annotazioni, con valori ≥ 20 che indicano un alto potenziale patogeno35. Metriche complementari da MetaLR36, Mutation Assessor e REVEL sono state integrate dall'interfaccia VEP per una maggiore affidabilità dellaprevisione 37. Le varianti che soddisfano le soglie MetaLR ≥ 0,70, Mutation Assessor ≥ 3,5 e REVEL ≥ 0,75 sono state considerate probabilmente patogene.

Previsione dell'impatto strutturale e meccanicistico

Per valutare come le sostituzioni degli amminoacidi influenzino l'integrità strutturale e la funzione biochimica, ogni nsSNP di primo grado è stato ulteriormente analizzato utilizzando MutPred2 (http://mutpred.mutdb.org)38 e DynaMut (http://biosig.unimelb.edu.au/dynamut)39. MutPred2 ha stimato la probabilità di alterazione funzionale, inclusa alterazione dell'attività catalitica, guadagno o perdita di residui di legaggio ai metalli, cambiamenti nell'accessibilità al solvente e modulazione allosterica, con punteggi ≥ 0,80 classificati come altamente patogenici. DynaMut calcolò il cambiamento di energia libera di Gibbs (ΔΔG) tra proteine di tipo selvatico e mutanti, valutando la direzione e l'entità dell'alterazione della stabilità, e generò visualizzazioni di spostamenti atomici e riarrangiamenti dei legami all'idrogeno.

Modellazione strutturale secondaria e 3D e profilazione dell'accessibilità dei solventi

Le strutture cristalline risolte sperimentalmente di MTHFD2 e PRDX3 sono state ottenute dal Protein Data Bank (PDB) e processate utilizzando PyMOL V:3.1(https://pymol.org)40 per visualizzare la distribuzione spaziale dei residui deleteri. I modelli mutanti sono stati creati introducendo le corrispondenti sostituzioni di amminoacidi, seguite da raffinamento strutturale e minimizzazione dell'energia. L'ispezione 3D comparativa ha evidenziato cambiamenti negli elementi secondari, contatti interatomici alterati e la vicinanza spaziale degli nsSNP ai domini catalitici e di legame dei cofattori, rivelando potenziali interruzioni nelle funzioni redox e metaboliche.

Le analisi secondarie della struttura e dell'esposizione al solvente sono state effettuate utilizzando PSIPRED V: 3.2 (http://bioinf.cs.ucl.ac.uk/psipred)41,42 e NetSurfP 3.0 (https://services.healthtech.dtu.dk/service.php?NetSurfP-2.0)43. Questi strumenti prevedevano α-eliche, β-filamenti, bobine e regioni disordinate insieme ai punteggi relativi di accessibilità ai solventi (RSA). I residui con valori RSA moderati a alti e un ordine strutturale sono stati mappati per identificare posizioni esposte al solvente e funzionalmente critiche. I siti interessati sono stati visualizzati in diagrammi topologici 2D per determinare se si verificavano mutazioni deleterie nei nuclei catalitici rigidi o nelle regioni ad anelli flessibili, prevedendo così i loro probabili effetti sulla dinamica del ripiegamento delle proteine e sull'efficienza enzimatica.

Validazione incrociata del database, integrazione funzionale e validazione della stabilità

Ogni nsSNP prioritizzato è stato incrociato con database genomici a livello di popolazione tra cui dbSNP, 1000 Genomes, ExAC e gnomAD per confermare la frequenza delle varianti, la distribuzione allelica globale e le associazioni cliniche precedentemente riportate. L'integrazione della conservazione evolutiva, della modellazione strutturale e della previsione funzionale basata sul machine learning ha permesso l'identificazione di varianti deleterie ad alta fiducia in MTHFD2 e PRDX3. Queste mutazioni ad alto impatto sono state successivamente mappate in domini funzionali per chiarire il loro potenziale ruolo nello squilibrio di stress ossidativo mitocondriale, nella segnalazione metabolica alterata e nella resistenza terapeutica nel cancro al seno. Per confermare ulteriormente le conseguenze termodinamiche di ogni sostituzione deleteria, è stato utilizzato iMutant 3.0 (https://folding.biofold.org/i-mutant/i-mutant3.0.html)44 per prevedere gli effetti delle mutazioni sulla stabilità delle proteine utilizzando dati di sequenza e strutturali. L'analisi ha calcolato valori di ΔΔG (kcal/mol) che rappresentano la variazione dell'energia libera tra proteine di tipo selvatico e mutanti. Le varianti con valori negativi di ΔΔG sono state classificate come mutazioni destabilizzanti, indicando una riduzione della stabilità proteica e una maggiore probabilità di dispiegamento. L'integrazione delle previsioni degli iMutant con i risultati di DynaMut e MutPred2 ha fornito una validazione incrociata per identificare residui strutturalmente critici che potrebbero influenzare la funzione redox, l'integrità catalitica e la stabilità conformazionale complessiva delle proteine.

Interpretazione funzionale integrata e rilevanza terapeutica

Tutti gli nsSNP deleteri identificati sono stati validati tramite incrocio con database di popolazione dbSNP, gnomAD ed ExAC per verificare le frequenze alleli minori e le associazioni precedentemente riportate con fenotipi tumorali. L'interpretazione integrativa dei dati sulla conservazione evolutiva, modellazione strutturale e stabilità ha indicato che le mutazioni ad alto impatto rs1471336772 (MTHFD2) e rs747786383 (PRDX3) esercitano gli effetti deleteri più forti sulla conformazione proteica e sull'efficienza catalitica. I risultati computazionali suggeriscono collettivamente che le mutazioni in MTHFD2 destabilizzano il metabolismo redox dipendente da NADPH, mentre le mutazioni in PRDX3 compromettono la difesa da stress ossidativo mediata dalla perossidasi, contribuendo alla disfunzione mitocondriale e all'aggressività tumorale. Questa analisi strutturale e funzionale basata su nsSNP fornisce una base computazionale per future verifiche terapeutiche e validazione mutazionale, evidenziando MTHFD2 e PRDX3 come biomarcatori di precisione per la terapia del cancro al seno mirata al redox. Per migliorare la chiarezza e fornire una panoramica completa della strategia analitica, un flusso di lavoro schematico che riassume i principali passaggi dello studio è presentato nella Figura 2. Il flusso di lavoro integra analisi differenziale dell'espressione genica, filtraggio genico mitocondriale, costruzione di reti di interazione proteina-proteina, validazione clinica tramite analisi ROC e caratterizzazione strutturale basata su nsSNP. Questo quadro a passo a passo evidenzia la progressione logica dall'elaborazione dei dati trascritomici all'identificazione dei biomarcatori e all'interpretazione funzionale.

figure-protocol-1
Figura 2. Flusso di lavoro integrativo a più fasi per l'identificazione e la validazione dei biomarcatori legati allo stress ossidativo mitocondriale nel cancro al seno HER2+ . Questo schema riassume la pipeline analitica impiegata nello studio. Per prima cosa, è stata effettuata un'analisi differenziale dell'espressione genica (DEG) su dataset RNA-seq (GSE231524 e GSE231525) per identificare geni significativamente alterati. Questi DEG sono stati intersecati con geni mitocondriali correlati allo stress ossidativo per ottenere MOS-DEG. Successivamente, è stata condotta un'analisi di interazione proteina-proteina (PPI) utilizzando STRING e Cytoscape per identificare geni hub e moduli funzionali. Successivamente, è stata applicata l'analisi della curva della caratteristica operativa del ricevitore (ROC) utilizzando la piattaforma ROCplotter per valutare le prestazioni predittive di geni selezionati in coorti cliniche. Infine, sono state effettuate analisi e modellazione strutturale degli SNP non sinonimi (nsSNP) per valutare il potenziale impatto funzionale e strutturale delle varianti chiave nei geni prioritari (MTHFD2 e PRDX3). Questo flusso di lavoro integrativo collega analisi trasscrittomiche, di rete, cliniche e strutturali per identificare potenziali biomarcatori e bersagli terapeutici. Clicca qui per visualizzare una versione più grande di questa figura.

Results

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

Analisi differenziale dell'espressione genica

È stata effettuata una profilazione differenziale dell'espressione per indagare le alterazioni trascrizionali associate alla progressione del cancro al seno HER2+ e alla resistenza alla terapia, utilizzando due dataset indipendenti di RNA-seq, GSE231524 e GSE231525. Nel primo dataset (GSE231524), sono stati inizialmente quantificati in totale 19.727 geni. Dopo la normalizzazione, il filtraggio e l'applicazione del modello di regressione aggiustata (ARM) per l'espressione differenziale, sono stati mantenuti 6.604 geni come espressi in modo significativo (Tabella Supplementare S1). Dopo la standardizzazione dei simboli genici, la rimozione dei duplicati e il perfezionamento delle annotazioni, sono stati finalizzati 6.300 geni unici per analisi a valle. I grafici vulcanici, i grafici MA e le stime di dispersione (Figura 3A-C) illustrano chiaramente la distribuzione di geni significativamente regolati al rialzo e al ribasso (aggiustato p < 0,05, |log₂FC| ≥ 1). Le stime di dispersione mostrano modelli di varianza ben adattati tra i conteggi medi normalizzati, indicando una normalizzazione robusta e un adattamento appropriato del modello nel flusso di lavoroDESeq2 45.

Analogamente, per il secondo dataset (GSE231525), è stato ottenuto un set iniziale di 18.372 geni. Dopo aver applicato la stessa pipeline di analisi di espressione differenziale basata su ARM, sono stati identificati 9.508 geni come espressi in modo significativo (Tabella Supplementare S2). Dopo il rinominamento, la rimozione dei duplicati e il filtro di controllo qualità, sono stati mantenuti 8.510 geni unici per ulteriori analisi comparative. Le visualizzazioni (Figura 3D-F) mostrano schemi coerenti di variazione dell'espressione genica tra i campioni, con cluster chiaramente definiti di geni sovraregolati e rialzati in condizioni sperimentali. I grafici MA e le stime di dispersione mostrano che i dati mostrano una varianza ben stabilizzata e nessuna influenza significativa degli outli, convalidando l'affidabilità delle analisi integrative avalle 46.

Insieme, queste analisi evidenziano la riproducibilità e l'integrità dei modelli di espressione genica tra i due dataset. Sia GSE231524 che GSE231525 hanno mostrato profili trascrizionali distinti coerenti con perturbazioni di segnalazione associate a HER2 e stress metabolico indotto dalla terapia. I dataset elaborati, ora armonizzati e controllati dalla qualità, costituiscono la base per l'identificazione dei geni legati allo stress ossidativo mitocondriale e per le successive analisi di arricchimento basate sureti 47.

figure-results-1
Figura 3. Analisi differenziale dell'espressione genica dei dataset HER2+ sul cancro al seno. Risultati per GSE231524 (A-C) (controllo vs. cancro al seno) e (D-F) per GSE231525 (controllo vs. knockdown DUSP6). (A,D) I grafici vulcanici mostrano geni significativamente alzati (rossi) e rialzati (blu) (padj. < 0,05, |log₂FC| ≥ 1). (B,E) I grafici MA illustrano la variazione log₂ del piegamento rispetto ai conteggi normalizzati medi, confermando la varianza stabile tra i campioni. (C,F) I grafici di dispersione mostrano tendenze di varianza adattate, validando la corretta normalizzazione in DESeq2. Insieme, i dataset dimostrano alterazioni trascrizionali coerenti e un adattamento robusto dei modelli adatto all'analisi a valle. Clicca qui per visualizzare una versione più grande di questa figura.

Identificazione dei geni differenzialmente espressi (MOS-DEG) legati allo stress ossidativo mitocondriale

Dopo l'analisi di espressione differenziale, i due dataset (GSE231524 e GSE231525) sono stati confrontati incrociati per identificare le comuni alterazioni trascrizionali associate alla resistenza alla terapia HER2 + per il cancro al seno. Per concentrarsi specificamente sulle vie metaboliche e legate allo stress ossidativo, entrambe le liste DEG sono state sovrapposte a un dataset curato di geni mitocondriali (MG) comprendente 1.137 geni ottenuti dai database MitoCarta3.0, KEGG Oxidative Phosphorylation e GO:0006979 (response to oxidative stress).

Il diagramma di Venn (Figura 4A) illustra la sovrapposizione tra i DEG provenienti da entrambi i dataset e dal set genico mitocondriale. Da questa intersezione sono stati identificati un totale di 262 geni sovrapposti designati come Geni Mitocondriali Oxidative Stress Related Differentially Expressed (MOS-DEG). Questi geni sovrapposti rappresentano una risposta mitocondriale convergente allo stress terapeutico mirato a HER2, integrando l'adattamento allo stress ossidativo, la riprogrammazione metabolica e l'omeostasi redox. In particolare, 2.706 DEG unici erano esclusivi per GSE231524, 4.870 per GSE231525, mentre 3.167 geni erano stati condivisi tra i due dataset. L'insieme sovrapposto di 262 geni di origine mitocondriale sottolinea la convergenza biologica tra segnalazione redox, metabolismo energetico e funzione mitocondriale nei fenotipi del cancro al seno resistente (Tabella Supplementare S3). Per caratterizzare ulteriormente questi MOS-DEG, è stata generata una mappa di calore di espressione per visualizzare la variazione trascrizionale nelle condizioni sperimentali (Figura 4B). Utilizzando RStudio (v4.3.2), il clustering gerarchico veniva eseguito tramite i pacchetti ComplexHeatmap (v2.18.0) e pheatmap (v1.0.12), mentre la normalizzazione e la scalabilità dei dati venivano ottenute tramite DESeq2 (v1.42.0) e ggplot2 (v3.5.0). La heatmap mostra i profili di espressione scalati in scala z dei 262 MOS-DEG su tutti i campioni, rivelando distinti schemi di clustering che differenziano fenotipi di controllo, tolleranti ai farmaci e resistenti.

In particolare, diversi geni associati alla respirazione mitocondriale e alla difesa dallo stress ossidativo, tra cui PRDX3, SOD2, NDUFA1, COX6C, ATP5ME e GPX1 , hanno mostrato una notevole regolazione al rialzo nei campioni resistenti e con DUSP6 knockdown, mentre regolatori metabolici come IDH2, ACLY e SDHA. ha mostrato modulazione variabile, indicando spostamenti dinamici nel metabolismo energetico mitocondriale. Questa riprogrammazione trascrizionale supporta l'ipotesi che le cellule resistenti a HER2+ si affidino all'adattamento allo stress ossidativo mitocondriale e alla plasticità metabolica per sopravvivere sotto pressione terapeutica. Nel complesso, l'integrazione dei set di geni mitocondriali con i risultati di espressione differenziale ha fornito un sottoinsieme mirato di geni funzionalmente rilevanti MOS-DEG che sono centrali per l'equilibrio redox, la fosforilazione ossidativa e la resilienza metabolica nelle cellule resistenti al cancro al seno resistenti. La heatmap delle espressioni conferma che questi geni formano una firma trascrizionale coerente associata all'adattamento alla terapia e al rimodellamento funzionale mitocondriale.

figure-results-2
Figura 4. Identificazione e profilazione delle espressioni dei MOS-DEG. (A) Diagramma di Venn che mostra la sovrapposizione tra i DEG di GSE231524, GSE231525 e 1.137 geni mitocondriali. L'intersezione identifica 262 MOS-DEG condivisi coinvolti nello stress ossidativo e nel metabolismo mitocondriale. (B) Mappa di calore che mostra i profili di espressione scalati secondo punteggi z dei 262 MOS-DEG tra campioni di controllo, tolleranti al farmaco e resistenti. La heatmap è stata generata in RStudio utilizzando i pacchetti ComplexHeatmap, pheatmap, ggplot2 e DESeq2, dimostrando un chiaro clustering tra condizioni sperimentali e evidenziando la regolazione all'alza dei principali regolatori dello stress ossidativo mitocondriale nei fenotipi resistenti. Clicca qui per visualizzare una versione più grande di questa figura.

Analisi dell'arricchimento della rete e dell'arricchimento delle vie di interazione proteina-proteina (PPI)

Un'analisi successiva di interazione proteina-proteina (PPI) utilizzando il database STRING ha rivelato una rete DEG (MOS-DEG) legata allo stress ossidativo mitocondriale densamente interconnessa, composta da 210 nodi e 951 spiatori, con un grado nodale medio di 9,06 e un coefficiente di clustering locale di 0,457 (Figura 5A). Il valore p di arricchimento PPI (< 1,0 × 10⁻16) ha indicato che la connettività osservata era significativamente superiore a quanto previsto per caso, riflettendo un paesaggio di interazione mitocondriale funzionalmente coerente. Le proteine hub core come COX6C, NDUFA10, ATP5F1, PRDX3 e SOD2 sono emerse come mediatrici centrali dell'omeostasi redox e della regolazione metabolica mitocondriale, sottolineando la loro importanza nel mantenere l'equilibrio ossidativo e la stabilità energetica durante lo stress indotto dalla terapia.

Per affinare la rete e identificare gli elementi regolatori più influenti, l'interactome MOS-DEG è stato importato in Cytoscape e analizzato utilizzando l'algoritmo CytoHubba MCC (Maximal Clique Centrality) (Figura 5B). La classifica ha rivelato i primi 50 MOS-DEG hub, che sono stati rianalizzati utilizzando STRING per l'arricchimento funzionale e il clustering di rete (Figura 5C,D). La sottorete risultante ha dimostrato una coesione funzionale eccezionalmente alta, comprendendo 369 interazioni osservate (atteso = 39), un grado medio del nodo di 14,76, un coefficiente di clustering locale di 0,698 e un valore p di arricchimento di 0,0. Queste metriche confermarono che l'organizzazione della rete non era casuale, ma rappresentava un'architettura molecolare strettamente regolata che integrava il metabolismo mitocondriale e la segnalazione dello stress ossidativo. L'analisi di clustering MCL ha rivelato tre moduli funzionali altamente connessi: uno corrispondente al metabolismo energetico centrale, inclusi i principali enzimi TCA cycle e fosforilazione ossidativa (SDHA, IDH2, ACO2, DLAT, UQCRC1, COX10); un secondo che rappresenta la macchina di traduzione mitocondriale (MRPL16, MRPL45, DAP3, LYRM7), che mantiene la sintesi delle proteine mitocondriali e l'integrità del complesso respiratorio; e un terzo che coinvolge il catabolismo degli amminoacidi e la regolazione redox (GLUD1, GLS2, PRODH, L2HGDH, ALDH18A1), responsabile del rifornimento degli intermediari TCA e del mantenimento dell'equilibrio NADH/FADH₂ necessario per il controllo redox cellulare. L'arricchimento funzionale ha indicato una forte sovrarappresentazione della localizzazione mitocondriale (FDR = 3,39 × 10⁻50), del metabolismo dell'acido carbossilico (FDR = 6,33 × 10⁻23) e della respirazione cellulare (FDR = 9,18 × 10⁻14), indicando che questi geni formano un asse integrato di stress bioenergetico-ossidativo che collega la fosforilazione ossidativa, la difesa antiossidante e il metabolismo degli amminoacidi.

In base alla topologia della rete e all'arricchimento funzionale, dieci geni regolatori master MOS sono stati dati priorità per una caratterizzazione successiva: PRDX3, MTHFD2, SDHA, NDUFV1, PDK1, ACLY, GLS2, GSR, DAP3 e LYRM7 (Figura 5E). L'analisi basata su STRINGs di questo sottoinsieme curato ha rivelato un nucleo di interazione altamente coeso composto da 13 associazioni dirette, con un grado medio del nodo di 2,6, un coefficiente di clustering di 0,843 e un valore p di arricchimento della rete di 3,3 × 10⁻8. Quasi tutte le proteine erano localizzate nel mitocondrio (9 su 10; FDR = 2,27 × 10⁻7) o matrice mitocondriale (7 su 10; FDR = 2,27 × 10⁻7). Le principali vie rappresentate da queste proteine includevano il metabolismo dell'acido dicarbossilico (SDHA, GLS2, MTHFD2, ACLY; FDR = 1,6 × 10⁻3), il complesso piruvato deidrogenasi (PDK1, ACLY; FDR = 3,9 × 10⁻3), e il ciclo TCA (SDHA, ACLY; FDR = 1,68 × 10⁻2). In parallelo, funzioni correlate al redox come l'attività ossidoreduttasi (GSR, SDHA, PRDX3, MTHFD2, NDUFV1; FDR = 1 × 10⁻3) e arricchimento di motivi flavoproteici (GSR, SDHA, NDUFV1; FDR = 3,9 × 10⁻3) sono stati significativamente arricchiti, confermando il ruolo della rete nella disintossicazione ROS e nella regolazione redox mitocondriale. Le interazioni più forti, incluse SDHA-NDUFV1 (punteggio = 0,999), SDHA-ACLY (0,964), DAP3-LYRM7 (0,678) e GSR-PRDX3 (0,661), hanno stabilito due sottoreti interconnesse: un modulo redox energetico (SDHA-NDUFV1-ACLY-GSR-PRDX3) che collega la fosforilazione ossidativa con la capacità antiossidante, e un modulo di traslazione-assemblaggio (DAP3-LYRM7) che integra la funzione del ribosoma mitocondriale con la biogenesi del complesso respiratorio III.

Insieme, questi dieci geni formano un nucleo mitocondriale coeso che integra il metabolismo energetico, il buffering redox e l'adattamento biosintetico. PRDX3 e GSR costituiscono il braccio antiossidante che protegge l'ambiente mitocondriale, mentre MTHFD2 supporta la rigenerazione del NADPH e il metabolismo di un carbonio essenziali per la sopravvivenza proliferativa. SDHA e NDUFV1 ancorano il sistema di trasporto elettronico, collegando il flusso di TCA alla produzione di ATP, mentre PDK1 e ACLY orchestrano il riconnessionamento metabolico che sostiene la crescita anabolica sotto stress. DAP3 e LYRM7 rappresentano stabilizzatori strutturali e traslazionali che preservano l'integrità mitocondriale. Questo quadro molecolare multilivello definisce un nucleo regolatorio bioenergetico-redox fondamentale per la resistenza alla terapia mirata a HER2. L'analisi integrativa sottolinea come il metabolismo ossidativo e l'adattamento redox vengano cooptati per preservare la funzionalità mitocondriale e la vitalità cellulare nei fenotipi resistenti del cancro al seno, rivelando potenziali obiettivi per l'intervento metabolico e la terapia di precisione (Tabella 1).

figure-results-3
Figura 5. Analisi di rete e priorità dei geni mitocondriali correlati allo stress ossidativo. (A) Rete PPI basata su STRINGS dei primi 210 MOS-DEG che illustra la densità complessiva di interazione. (B) Importazione della rete PPI in Cytoscape per visualizzazione e analisi topologiche. (C) Estrazione dei primi 50 MOS-DEG hub utilizzando l'algoritmo MCC di CytoHubba. (D) La rianalisi STRING dei primi 50 geni hub rivela tre principali moduli funzionali: metabolismo dell'energia centrale, traduzione mitocondriale e catabolisma/regolazione redox degli amminoacidi. (E) Visualizzazione basata su STRINGS dei 10 MOS-DEG più prioritizzati, rappresentando una rete ossido-metabolica altamente connessa (grado medio del nodo = 2,6; coefficiente di clustering = 0,843; Arricchimento PPI p = 3,3 × 10⁻8). Clicca qui per visualizzare una versione più grande di questa figura.

Tabella 1: Panel genico finale prioritizzato (Top 10 regolatori master MOS). Clicca qui per scaricare questa tabella.

Analisi dell'arricchimento funzionale dei 10 MOS-DEG principali

Per chiarire la rilevanza biologica e i meccanismi molecolari associati ai 10 MOS-DEG più prioritari, sono state effettuate analisi di arricchimento della Gene Ontology (GO) e della Kyoto Encyclopedia of Genes and Genomes (KEGG). L'arricchimento GO è stato suddiviso in tre ontologie principali - Processo Biologico (BP), Componente Cellulare (CC) e Funzione Molecolare (MF) - per scoprire i loro ruoli biologici nel metabolismo ossidativo e nella regolazione mitocondriale.

L'analisi del Processo Biologico GO (BP) ha rivelato un arricchimento significativo nelle vie metaboliche e correlate al redox, inclusi i processi metabolici dell'acido dicarbossilico (GO:0043648; punteggio di arricchimento = 6,87; p = 1,33 × 10⁻7), processo biosintetico acetil-CoA (GO:0006085; arricchimento = 4,40), generazione di metaboliti precursori ed energia (GO:0006091; arricchimento = 4,06) e catena di trasporto elettronico (GO:0022900; arricchimento = 4,03). Altri processi biologici arricchiti includevano l'omeostasi redox cellulare e la risposta cellulare allo stress ossidativo, sottolineando il legame stretto tra fosforilazione ossidativa, equilibrio redox e riprogrammazione metabolica nella progressione tumorale. L'arricchimento della componente cellulare GO (CC) ha indicato una localizzazione predominante di questi MOS-DEG all'interno delle strutture mitocondriali, in particolare nella matrice mitocondriale (GO:0005759; p = 5,79 × 10⁻10), nella membrana interna mitocondriale, nel complesso ossidoreduttasi e nel complesso della catena respiratoria.

La presenza di geni come MTHFD2, NDUFV1, PRDX3, GSR e SDHA riflette il loro ruolo diretto nel trasporto elettronico e nei sistemi di fosforilazione ossidativa, supportandone l'importanza nella conversione dell'energia mitocondriale e nella segnalazione redox. L'analisi della funzione molecolare (MF) di GO ha evidenziato funzioni catalittiche e redox chiave, inclusa l'attività ossidoreduttasi, che agisce sul gruppo zolfo dei donatori, NAD(P) come accettore (GO:0016668; arricchimento = 4,68; p = 2,07 × 10⁻5), attività di trasferimento elettronico (GO:0009055; arricchimento = 4,43), attività antiossidante (GO:0016209; arricchimento = 3,02) e legame della flavina adenina dinucleotide (FAD) (GO:0050660; arricchimento = 3,03). L'arricchimento costante di PRDX3, GSR, MTHFD2 e SDHA. in molteplici funzioni correlate al redox supporta ulteriormente il loro coinvolgimento nel mantenimento dell'equilibrio ossidativo nei compartimenti mitocondriali. Collettivamente, questi risultati GO evidenziano il coinvolgimento centrale dei MOS-DEG nella fosforilazione ossidativa mitocondriale, nel ciclo redox mediato da NAD(P)H e nei meccanismi di difesa antiossidanti - processi essenziali per sostenere il metabolismo tumorale e l'adattamento allo stress ossidativo (Figura 6A-D).

figure-results-4
Figura 6. Analisi dell'arricchimento dell'ontologia genica dei primi 10 MOS-DEG. (A) Termini del processo biologico che mostrano un arricchimento significativo nel metabolismo ossidativo e nella generazione di energia. (B) Arricchimento dei componenti cellulari che indica localizzazione mitocondriale e associazione della catena respiratoria. (C) Arricchimento della funzione molecolare che evidenzia ossidoredutasi, trasferimento elettronico e attività antiossidante. (D) Grafico a barre che riassume i termini GO principali tra le categorie BP, CC e MF basato su punteggi di arricchimento e -log₁₀(p-valori). Clicca qui per visualizzare una versione più grande di questa figura.

Analisi dell'arricchimento delle vie KEGG

L'analisi delle vie KEGG ha fornito una prospettiva a livello di sistema complementare, rivelando che i primi 10 MOS-DEG erano significativamente arricchiti in diversi percorsi di metabolismo ossidativo e patologie associati a malattie (Figura 7A-E). Le vie più significativamente arricchite includevano il ciclo del citrato (ciclo TCA) (hsa00020; p = 0,0002; punteggio di arricchimento = 3,69), la cardiomiopatia diabetica (hsa05415; p = 0,0003), il metabolismo centrale del carbonio nel cancro (hsa05230; p = 0,0011) e la fosforilazione ossidativa (hsa00190; p = 0,0042). Inoltre, l'arricchimento di vie come la fegato grasso non alcolica (NAFLD), le specie chimiche cancerogenesi reattive all'ossigeno, il morbo di Parkinson e la malattia a prioni riflette l'ampia associazione di questi geni con danni ossidati e disfunzioni mitocondriali, caratteristiche comuni del cancro e della neurodegenerazione. Tra i geni che guidano questi arricchimenti, SDHA e NDUFV1 sono stati costantemente rappresentati attraverso la fosforilazione ossidativa, la disintossicazione ROS e le vie collegate al complesso mitocondriale I/II. MTHFD2 e GLS2 hanno contribuito al metabolismo a un carbonio e al flusso anaplerotico derivato dalla glutammina nel ciclo TCA, mentre GSR e PRDX3 hanno partecipato al ciclo redox del glutatione. Questi risultati dimostrano che la diafonia metabolico-ossidativa, mediata da questi MOS-DEG, è alla base sia della riprogrammazione energetica oncogenica sia della resilienza mitocondriale allo stress.

figure-results-5
Figura 7. Analisi dell'arricchimento delle vie KEGG dei MOS-DEG. (A) Diagramma di Sankey che collega i MOS-DEG ai loro percorsi KEGG arricchiti, mostrando sovrapposizioni nella fosforilazione ossidativa, nel ciclo TCA e nella riprogrammazione metabolica. (B-E) Grafici di rete e dot che illustrano le relazioni gene-percorso e i livelli di arricchimento tra vie metaboliche e di segnalazione correlate allo stress ossidativo. Le vie evidenziate includono il ciclo TCA, la fosforilazione ossidativa e il danno ossidativo correlato alla neurodegenerazione, confermando la regolazione dello stress ossidativo mitocondriale come asse funzionale centrale di questi geni. Clicca qui per visualizzare una versione più grande di questa figura.

Validazione clinica basata su ROC della MOS nel cancro al seno

È stata effettuata un'analisi delle caratteristiche operative del ricevitore (ROC) per valutare la capacità dei geni mitocondriali prioritari legati allo stress ossidativo di discriminare tra rispondenti alla chemioterapia e non rispondenti. Come mostrato nella Figura 8A-J, tutti i geni valutati hanno mostrato prestazioni discriminative limitate, con valori AUC che variano approssimativamente da 0,50 a 0,66.

In particolare, PRDX3, MTHFD2, SDHA e ACLY hanno mostrato una capacità discriminatoria relativamente superiore ma comunque modesta (AUC ~0,57-0,66), mentre geni come GSR, GLS2 e diversi geni correlati al trasporto elettronico hanno mostrato valori AUC vicini a 0,50, indicando una performance di classificazione quasi casuale. Tra il panel, ACLY ha mostrato il AUC più alto (~0,65), seguito da SDHA (~0,59) e MTHFD2 (~0,58), suggerendo solo una debole separazione tra gruppi di risponditori e non risponditori.

Sebbene siano state osservate differenze significative per diversi geni, le dimensioni dell'effetto erano piccole e le prestazioni ROC indicano una precisione predittiva limitata se considerate singolarmente. Questi risultati suggeriscono che i geni affetti dallo stress ossidativo mitocondriale da soli non siano sufficienti come biomarcatori predittivi autonomi per la risposta alla chemioterapia. Al contrario, possono contribuire con informazioni incrementali all'interno di un quadro predittivo più ampio multi-genico o multi-omico. Di conseguenza, questi risultati devono essere interpretati come esplorativi e generatori di ipotesi piuttosto che come indicativo di utilità clinica immediata (Figura 8).

figure-results-6
Figura 8. Validazione basata su ROCplotter dei regolatori principali legati allo stress ossidativo mitocondriale nel cancro al seno. (A-H) Analisi caratteristiche operative del ricevitore dei 10 regolatori principali MOS valutati: (A) PRDX3, (B) MTHFD2, (C) SDHA, (D) NDUFV1, (E) PDK1, (F) ACLY, (G) GLS2, (H) GSR, (I) LYRM7 e (J) DAP3. Ogni pannello mostra il valore AUC e le corrispondenti metriche statistiche ( p-valore ROC e p-valore di Mann-Whitney) che indicano la capacità discriminativa di ciascun gene di differenziare tra rispondenti alla chemioterapia e non rispondenti. Valori elevati di AUC (>0,55) indicano associazioni predittive da deboli a modeste tra espressione genica e risposta terapeutica. I risultati evidenziano ACLY e PDK1 come contributi predittivi moderati, seguiti da PRDX3, MTHFD2 e SDHA, mentre GSR e GLS2 mostrano contributi predittivi moderati all'omeostasi redox mitocondriale durante l'adattamento alla chemioterapia. Clicca qui per visualizzare una versione più grande di questa figura.

Profilazione differenziale delle espressioni dei MOS-DEG superiori

Per indagare il comportamento trascrizionale dei MOS-DEG durante la progressione del cancro al seno, è stata condotta un'analisi comparativa dell'espressione, che integra sia dati di RNA-Seq che dati di chip genetico derivati da The Cancer Genome Atlas (TCGA), Genotype-Tissue Expression (GTEx) e dataset MET500. Otto geni chiave sono stati analizzati tra tessuti mammari normali, tumorali e metastatici per valutare tendenze trascrizionali coerenti e identificare quelli più rilevanti per la tumorigeni e la metastasi.

È stato applicato un criterio di selezione rigoroso, definendo una significativa regolazione al rialzo come fold-change (FC) ≥ 1,3 per Tumore vs Normale (TvsN) e FC ≥ 1,5 per Metastatico vs Normale (MvsN) su entrambe le piattaforme. I geni che soddisfavano queste soglie in una direzione coerente erano considerati biologicamente rilevanti e prioritizzati per l'interpretazione funzionale. Come mostrato nella Figura 9A,B, l'analisi di espressione basata su RNA-Seq ha rivelato che GSR e MTHFD2 erano marcatamente sovraregolati sia nei tessuti tumorali che metastatici rispetto ai controlli normali. La GSR ha mostrato l'aumento più evidente (TvsN = 2,73; MvsN = 4,83), mentre MTHFD2 ha mostrato un'induzione sostanziale e costante (TvsN = 1,88; MvsN = 1,96). Questi risultati sono stati validati nel dataset dei chip genici (Figura 9C,D), dove la GSR ha nuovamente mostrato un'elevata espressione robusta (TvsN = 1,76; MvsN = 2,19) e MTHFD2 manteneva un'alta attivazione trascrizionale (TvsN = 2,03; MvsN = 2,55). La forte e riproducibile regolazione all'alza di questi due geni su piattaforme indipendenti sottolinea i loro ruoli centrali nella regolazione redox mitocondriale-GSR come enzima principale che mantiene l'equilibrio del glutatione e MTHFD2 come catalizzatore metabolico per la produzione di NADPH e il metabolismo a un carbonio.

È stata osservata un'elevazione moderata ma costante per PRDX3, che ha soddisfatto la soglia di inclusione di RNA-Seq (TvsN = 1,39; MvsN = 1,58) e ha mostrato un'espressione stabile nel dataset dei chip genici (TvsN = 1,02; MvsN = 1.12). Dal punto di vista funzionale, PRDX3 supporta la disintossicazione ROS mitocondriale e integra la GSR nel mantenimento dell'equilibrio ossidativo. ACLY dimostrata una regolazione al rialzo vicino alla soglia (RNA-Seq: TvsN = 1,24; MvsN = 1,28; Chip Genico: TvsN = 1.11; MvsN = 0,89), riflettendo il suo ruolo metabolico di accoppiamento tra fosforilazione ossidativa e biosintesi lipidica anabolica. Al contrario, PDK1, NDUFV1 e SDHA hanno mostrato variazioni minime o incoerenti nel cambiamento delle pieghe, suggerendo un'attività basale mitocondriale stabile con una risposta trascrizionale limitata allo stress oncogenico. GLS2, invece, ha mostrato un pattern di regolazione al ribasso costante e forte su entrambe le piattaforme (RNA-Seq: TvsN = 0,32; MvsN = 0,45; Chip genico: TvsN = 0,66; MvsN = 0,38), confermando il suo potenziale ruolo come soppressore metabolico la cui perdita può facilitare la progressione tumorale attraverso omeostasi redox mediata dalla glutamine compromessa (Tabella 2).

L'applicazione delle soglie stabilite ha permesso di dare priorità a quattro geni: GSR, MTHFD2, PRDX3 e ACLY come i regolatori più coerenti e biologicamente rilevanti dell'adattamento allo stress ossidativo mitocondriale nel cancro al seno. Tra questi, GSR e MTHFD2 sono emersi come i regolatori principali di prim'ordine, mostrando alta riproducibilità di espressione e un'importanza funzionale nella difesa redox e nella riprogrammazione metabolica. PRDX3 e ACLY. hanno formato lo strato regolatorio secondario, collegando la protezione antiossidante all'adattamento biosintetico. Insieme, questi geni delineano un asse regolatore redox mitocondriale-metabolico, essenziale per sostenere la sopravvivenza delle cellule tumorali, la resilienza ossidativa e la flessibilità metabolica durante la progressione e la metastasi tumorale (Figura 9A-D).

Tabella 2: Riepilogo di espressione cross-platform e priorità basata su soglie dei regolatori master MOS nel cancro al seno. Clicca qui per scaricare questa tabella.

figure-results-7
Figura 9. Profilazione comparativa dell'espressione dei MOS-DEG nel cancro al seno. (A,B) Analisi dell'espressione basata su RNA-Seq di otto geni chiave MOS SDHA, PRDX3, PDK1, NDUFV1, MTHFD2, GSR, GLS2 e ACLY su tessuti mammari normali (verdi), tumorali (rossi) e metastatici (grigi). I diagrammi a scatola (A) mostrano i livelli di espressione genica trasformati log₂, mentre i grafici di densità (B) illustrano le distribuzioni di probabilità tra le categorie campionarie. (C,D) I corrispondenti dati di espressione basati su chip genici, confermano tendenze di espressione costanti osservate nell'analisi RNA-Seq. MTHFD2 e GSR mostrano una forte regolazione all'alza specifica per tumori, PRDX3 mostra un'elevazione moderata, PDK1 e ACLY riflettono l'attivazione metabolica, e GLS2. dimostra una soppressione costante, evidenziando la riprogrammazione coordinata redox-metabolica delle vie mitocondriali durante la progressione del tumore al seno. Clicca qui per visualizzare una versione più grande di questa figura.

Valutazione prognostica dei MOS-DEG prioritizzati

Poiché l'analisi di sopravvivenza è stata condotta in una coorte più ampia di tumori al seno senza restrizioni allo stato HER2, questi riscontri prognostici devono essere interpretati come di supporto piuttosto che specifici per HER2. Per valutare il significato prognostico dei MOS-DEG identificati, sono state generate curve di sopravvivenza di Kaplan-Meier per valutare l'associazione tra espressione genica MOS e sopravvivenza senza recidiva (RFS) nelle pazienti con tumore al seno (Figura 10A-D). L'analisi ha incluso 4.929 pazienti con tumore al seno, valutando la sopravvivenza senza recidiva (RFS) basandosi sui livelli mediani di espressione di quattro MOS-DEG selezionati: MTHFD2 (201761_at), PRDX3 (209766_at), GSR (225609_at) e ACLY (201128_s_at).

Come illustrato nella Figura 10A-D, sono stati osservati distinti schemi prognostici tra questi MOS-DEG. MTHFD2 ha mostrato una forte associazione prognostica negativa (HR = 1,53; IC 95%: 1,39-1,70; log-rank p = 1,1×10⁻16), dove livelli elevati di espressione erano significativamente correlati con RFS più brevi, sottolineando il suo ruolo come regolatore metabolico oncogenico coinvolto nel metabolismo a un carbonio e nell'adattamento redox (Figura 10B). Al contrario, PRDX3 (209766_at) ha dimostrato un effetto protettivo significativo (HR = 0,73; IC 95%: 0,66-0,81; log-rank p = 7,7×10⁻10), dove un'espressione più elevata è stata collegata a RFS prolungato, sottolineandone la funzione come enzima antiossidante mitocondriale che mitiga lo stress ossidativo (Figura 10C). Al contrario, GSR (HR = 1,05; p = 0,50) e ACLY (HR = 1,02; p = 0,77.) non hanno mostrato associazioni significative con la sopravvivenza senza recidiva (Figura 10A,D), suggerendo un ruolo secondario e di supporto nel mantenimento dell'equilibrio redox e dell'omeostasi metabolica piuttosto che influenzare direttamente gli esiti clinici. Nel complesso, questi risultati identificano MTHFD2 come un MOS-DEG chiave a bassa prognostica che guida la proliferazione metabolica e lo squilibrio redox, mentre PRDX3 emerge come MOS-DEG protettivo che contribuisce alla stabilità redox e a una prognosi favorevole. Insieme, questi due geni rappresentano forze molecolari opposte all'interno del quadro dello stress ossidativo mitocondriale: MTHFD2 favorisce l'aggressività metabolica e PRDX3 rafforza i meccanismi di difesa antiossidanti nel cancro al seno (Figura 10A-D).

figure-results-8
Figura 10. Analisi di sopravvivenza di Kaplan-Meier dei MOS-DEG nel cancro al seno. (A) La GSR (225609_at) non mostra correlazione significativa con la sopravvivenza senza recidiva (HR = 1,05; p = 0,50). (B) MTHFD2 (201761_at) dimostra una forte associazione con una prognosi scadente, con un'alta espressione che prevede una riduzione della RFS (HR = 1,53; p = 1,1×10⁻16). (C) PRDX3 (209766_at) indica un'associazione protettiva, dove un'espressione più alta corrisponde a RFS più lunga (HR = 0,73; p = 7,7×10⁻10). (D) ACLY (201128_s_at) non mostra un effetto prognostico significativo (HR = 1,02; p = 0,77.). I gruppi ad alta espressione sono mostrati in rosso, mentre quelli a bassa espressione sono mostrati in nero. Le tracce trasversali rappresentano campioni censurati. Clicca qui per visualizzare una versione più grande di questa figura.

Caratterizzazione e priorità di MTHFD2 e PRDX3 da nsSNP

L'analisi del Predittore di Effetto Variante (VEP) di Ensembl sul trascrizione canonica MTHFD2-201 (ENST00000394053.7) ha rivelato un totale di 40 varianti non sinoniche. Tra queste, cinque varianti - rs1471336772, rs2103841302, rs1428567735, rs1694270227 e rs1694375712 - hanno mostrato forti evidenze di impatto funzionale deleterio su molteplici strumenti predittivi. Queste sostituzioni sono state costantemente predette come influenzanti sulla struttura e la funzione delle proteine su più strumenti computazionali, tra cui SIFT ≤ 0,05, PolyPhen-2 ≥ 0,85, valori CADD da 29 a 36, MetaLR da 0,73 a 0,86, Mutation Assessor > 3,5 e punteggi REVEL vicini a 0,99. La variante più dannosa, rs1471336772 (T>G), ha mostrato un punteggio CADD di 33, un punteggio PolyPhen-2 di 0,99 e un punteggio REVEL di 0,997, suggerendo una possibile destabilizzazione strutturale e un possibile deterioramento dell'attività catalitica dipendente da NADPH dell'enzima (Tabella Supplementare S4). La maggior parte delle varianti ad alto punteggio si trovava all'interno dei domini catalitici di legame NADP⁺ e metilentetraidrofolato deidrogenasi, che sono fondamentali per la regolazione redox e il metabolismo di un carbonio. Questi risultati suggeriscono che tali sostituzioni potrebbero alterare il flusso metabolico e l'equilibrio redox, e potrebbero essere associate a una riprogrammazione oncogenica nel cancro al seno.

Per PRDX3-201 (ENST00000298510.4), sono stati identificati 28 SNP non sinonimi, di cui cinque varianti - rs747786383, rs2133647474, rs761292643, rs377652956 e rs1847844616 - hanno mostrato profili costantemente dannosi. Queste varianti hanno soddisfatto molteplici soglie deleterie: SIFT ≤ 0,05, PolyPhen-2 ≥ 0,85, punteggi CADD tra 28 e 32, MetaLR da 0,43 a 0,99 e REVEL ≥ 0,9. La variante con il più alto impatto, rs747786383 (A>G), presentava CADD = 28, MetaLR = 0,993 e REVEL = 0,97, indicando un forte potenziale patogeno (Tabella Supplementare S5). Questa mutazione si verifica all'interno del dominio perossidasi dipendente da tioredossina, una regione essenziale per la riduzione del perossido di idrogeno e il mantenimento dell'omeostasi dello stress ossidativo mitocondriale. Le alterazioni in questo ambito possono ostacolare l'efficienza catalitica della perossidasi, compromettere le difese antiossidanti e aumentare la suscettibilità ai danni ossidativi. Un riassunto comparativo di entrambi i geni ha indicato che MTHFD2 e PRDX3 presentano vulnerabilità funzionali distinte ma complementari nel metabolismo ossidativo mitocondriale. Le varianti di MTHFD2 influenzano principalmente il ciclo redox enzimatico e la rigenerazione della NADPH, favorendo l'aggressività metabolica, mentre le varianti PRDX3 compromettono la disintossicazione mediata dalla perossidasi, riducendo la resilienza agli antiossidanti. Tra tutte le mutazioni, rs1471336772 in MTHFD2 e rs747786383 in PRDX3 sono stati identificati come gli nsSNP più patogeni in base ai loro punteggi cumulativi elevati nelle previsioni di CADD, REVEL e Mutation Evaluer. La Figura 11 fornisce una panoramica grafica dei profili comparativi di patogenicità delle due proteine, evidenziando i punteggi costantemente alti su SIFT, PolyPhen-2, CADD, MetaLR, REVEL e Mutation Assessor. Entrambi i geni hanno mostrato un forte potenziale deleterio, con MTHFD2 (CADD = 33, REVEL = 0,997) che indica la massima interruzione strutturale e PRDX3 (MetaLR = 0,99, REVEL = 0,97) che mostra un impatto funzionale comparabile sull'integrità del dominio antiossidante (Figura 11). Insieme, questi risultati rivelano che MTHFD2 e PRDX3 ospitano nsSNP altamente dannosi che potrebbero compromettere criticamente l'omeostasi redox mitocondriale e il metabolismo energetico, supportandone la potenziale rilevanza come geni correlati allo stress ossidativo e candidati bersagli terapeutici nella patogenesi del cancro al seno.

È stata effettuata una rivalutazione sistematica del framework di annotazione nsSNP per garantire la coerenza tra i punteggi quantitativi di patogenicità e le classificazioni categoriche tra tutte le varianti segnalate. In particolare, le discrepanze tra i punteggi CADD e le loro etichette qualitative sono state corrette applicando soglie di interpretazione standardizzate (CADD ≥20 come deleterio e ≥30 come altamente deleteri), garantendo che tutte le varianti prioritizzate riflettano vere sostituzioni ad alto impatto. Inoltre, gli identificatori varianti sono stati armonizzati con quelli riportati nei risultati primari per mantenere la coerenza tra i dati tabulati e l'interpretazione narrativa. Questo perfezionamento rafforza il rigore analitico dello studio e garantisce che gli nsSNP riportati costituiscano un insieme coerente e ad alta fiducia di varianti funzionalmente rilevanti, adatti per indagini strutturali e traslazionali a valle (Tabella 3).

figure-results-9
Figura 11. Punteggi comparativi di patogenicità nsSNP per MTHFD2 e PRDX3. Grafico a barre che mostra i punteggi predittivi aggregati di deleterietà per MTHFD2 (ENST00000394053.7) e PRDX3. (ENST00000298510.4) su sei strumenti computazionali: SIFT, PolyPhen-2, CADD, MetaLR, REL e Mutation Assessor. Punteggi più alti corrispondono a una maggiore probabilità di alterazione funzionale, indicando che entrambi i geni possiedono nsSNP altamente dannosi che possono compromettere il redox mitocondriale e l'integrità metabolica. Clicca qui per visualizzare una versione più grande di questa figura.

Tabella 3: Principali nsSNP deleteri previsti in MTHFD2 e PRDX3. La classe PolyPhen probabilmente è stata dannosa per tutti gli nsSNP. Clicca qui per scaricare questa tabella.

Analisi della struttura secondaria e modellazione 2D delle proteine MTHFD2 e PRDX3

Per interpretare ulteriormente il contesto strutturale e posizionale degli nsSNP deleteri, è stata effettuata la modellazione della struttura secondaria 2D delle proteine MTHFD2 (MTDC_HUMAN) e PRDX3 (PRDX3_HUMAN) utilizzando PSIPRED e NetSurfP 2.0. Queste analisi hanno fornito dettagli sugli elementi strutturali secondari, sulla propensione al disturbo residuo e sull'accessibilità relativa ai solventi (RSA) di ciascuna proteina, evidenziando l'effetto delle mutazioni patogeniche sul ripiegamento locale e sull'esposizione ai solventi.

Nella proteina MTHFD2 (Figura 12A), il modello 2D ha rivelato un pattern alternato di α-eliche (arancioni) e β-filamenti (viola) che formano il nucleo compatto delle regioni catalitiche e di legame con NADP⁺ dell'enzima. I residui deleteri identificati dallo screening nsSNP, P208R, A247E, D248G, G291V e G313D, erano prevalentemente localizzati in o vicino a regioni strutturate (eliche α e fogli β) con accessibilità a solventi da moderata ad elevata. Questi residui sono stati mappati all'interno di segmenti ben ordinati e a basso disordine, indicando una rigidità strutturale essenziale per mantenere la stabilità enzimatica e il legame dei cofattori. In particolare, A247E e D248G, posizionati in una breve curva α-elicoidale adiacente al sito attivo, mostravano un'elevata accessibilità relativa alla superficie (RSA ≥ 0,25), suggerendo che queste sostituzioni potrebbero influenzare direttamente le interazioni catalitiche superficiali. Analogamente, G291V e G313D, situati nella regione del foglio β vicino alla sacca NADP⁺, hanno mostrato un potenziale di distorsione locale dovuto alla perdita di flessibilità e all'aumento del volume della catena laterale, come riflesso nelle linee di disordine più spesse in queste regioni. La mutazione P208R si è verificata all'interno di una zona di transizione elicoidale a spirale, una regione che tipicamente richiede una rigidità precisa della spina dorsale, il che implica che la sostituzione della prolina con arginina possa introdurre instabilità locale e alterare la dinamica del ripiegamento. Collettivamente, questi dati indicano che i residui deleteri in MTHFD2 risiedono in siti strutturalmente vincolati ed esposti a solventi, dove anche sostituzioni minori possono compromettere la geometria catalitica e l'accoppiamento redox.

Nella proteina PRDX3 (Figura 12B), la mappa strutturale secondaria mostrava una piega conservata della tioredossina composta da α-eliche alternate e β-filamenti collegati da anelli a spirale flessibili. Le mutazioni critiche P70R, P101R, A218V e P230S sono state trovate in regioni ad anello accessibili con solventi o adiacenti a elementi strutturali secondari, riflettendo la loro potenziale influenza sull'accessibilità della cisteïna redox attiva e sulla stabilizzazione dei dimeri. Le varianti P70R e P101R si sono verificate vicino a bobine disordinate ed esposte a solventi, che possono compromettere la flessibilità dinamica necessaria per l'interazione della catalisi con perossidasi e tioredossina. D'altra parte, A218V e P230S sono state mappate all'interno delle transizioni ad anello elicoidali, regioni vitali per la commutazione conformazionale durante il ciclo catalitico. Questi residui hanno mostrato un'esposizione aumentata e un disordine ridotto, suggerendo che mutazioni in queste posizioni potrebbero rigidizzare gli elementi strutturali locali, limitando l'adattabilità conformazionale redox. Nel complesso, la topologia 2D ha indicato che le varianti deleterie di PRDX3 alterano principalmente la stabilità da loop-elice, l'esposizione al solvente e il disturbo locale, coerente con la prevista alterazione delle funzioni catalitiche e antiossidanti. L'analisi combinata dei modelli 2D MTHFD2 e PRDX3 ha rivelato che gli nsSNP patogeni si raggruppano in regioni che bilanciano rigidità e flessibilità, dove le perturbazioni nei legami o polarità dell'idrogeno possono avere effetti amplificati sulla funzione proteica. I residui interessati occupano siti strutturalmente conservati e funzionalmente esposti, confermando il loro potenziale di alterare la conformazione enzimatica e la regolazione redox mitocondriale.

figure-results-10
Figura 12. Struttura secondaria e relativa accessibilità superficiale dei siti nsSNP deleteri. (A) La topologia 2D di MTHFD2 (MTDC_HUMAN) che mostra α-eliche previste (arancione), β-filamenti (viola) e regioni disordinate (spessore della linea nera). Le scatole verticali rosse segnano residui deleteri (P208R, A247E, D248G, G291V e G313D), che si localizzano all'interno di regioni strutturate e moderatamente esposte a solventi vicino al sito catalitico. (B) La rappresentazione della struttura secondaria 2D di PRDX3 (PRDX3_HUMAN) che evidenzia α-eliche, β-fogli e regioni di bobine. I residui deleteri (P70R, P101R, A218V e P230S) sono racchiusi in un rivestimento rosso, occupando principalmente anelli accessibili ai solventi e interfacce elicoidali critici per l'attività redox. L'accessibilità relativa alla superficie è indicata in rosso (esposto) e nero (sepolto), mentre la propensione al disordine è rappresentata dallo spessore della linea. Insieme, i modelli rivelano che gli nsSNP associati alla malattia sono posizionati in domini funzionalmente sensibili e strutturalmente vincolati essenziali per l'attività enzimatica e l'equilibrio redox mitocondriale. Clicca qui per visualizzare una versione più grande di questa figura.

Impatto strutturale e funzionale dei nsSNP deleteri previsti

Per convalidare ulteriormente le implicazioni strutturali e meccanicistiche degli nsSNP prioritari identificati in MTHFD2 e PRDX3, è stata effettuata un'analisi computazionale basata sulla dinamica molecolare utilizzando server DynaMut e MutPred2. Questi strumenti hanno fornito approfondimenti complementari sulle alterazioni indotte da mutazioni nella flessibilità proteica, stabilità, accessibilità ai solventi e conformazione dei siti catalitici.

Per MTHFD2, cinque sostituzioni ad alta fiducia (A247E, D248G, P208R, G291V e G313D) hanno mostrato punteggi di MutPred2 ≥ 0,90, indicando un forte potenziale patogeno. La mappatura dei motivi funzionali ha rivelato che queste varianti si localizzavano all'interno o adiacenti a motivi PROSITE (PS00006, PS00008, PS00767) e alle regioni funzionali ELM (ELME000233, ELME000335) associate al legame NADP⁺ e alla funzione catalitica. Le mutazioni A247E e D248G, situate vicino alla tasca catalitica dell'enzima, hanno dimostrato una profonda interruzione dei siti di legame del metallo (p = 3,0×10⁻4-4,4×10⁻5) e interazioni di interfaccia ordinate alterate, essenziali per il riconoscimento enzima-substrato e la stabilità dei cofattori. Si prevedeva che queste sostituzioni avrebbero acquisito nuovi siti allosterici e catalitici (a D248 e I251) perdendo contemporaneamente funzionalità catalitica nativa, implicando uno spostamento conformazionale destabilizzante. Le varianti G291V e G313D hanno mostrato guadagno di siti allosterici (F295, G313) e una propensione transmembrana alterata, indicando possibili ripiegamenti errati e difetti di localizzazione subcellulari. È importante notare che entrambe le varianti erano associate a una riduzione della metilazione e a un aumento della flessibilità dell'anello, potenzialmente influendo sull'integrità strutturale dell'enzima. Analogamente, P208R (MutPred2 = 0,916) ha comportato un'alterazione dell'affinità di legame al DNA e un guadagno di una struttura elicoidale, suggerendo una rottura della stabilità inter-dominio e della coordinazione elettrostatica all'interno del solco di legame NADP⁺. Collettivamente, gli nsSNP di MTHFD2 convergono su meccanismi che coinvolgono la perturbazione del legame dei metalli, il guadagno di regolazione allosterica e la rottura del sito catalitico, suggerendo che possano compromettere l'attività enzimatica e la regolazione redox e i ruoli metabolici critici per la proliferazione e la resistenza delle cellule tumorali.

Per PRDX3, quattro sostituzioni principali P230S, A218V, P101R e P70R erano previste come funzionalmente dannose (MutPred2 ≥ 0,80). Queste varianti sono mappate all'interno di motivi conservati (ELME000053, ELME000085, ELME000146, ELME000137) corrispondenti al dominio della perossidasi dipendente dalla tioredossina. La mutazione P230S (MutPred2 = 0,836) era associata a un legame alterato del metallo (p = 1,2 × 10⁻3), a un aumento di legame disolfuro a C229 e alla perdita di un sito allosterico a W233, suggerendo interferenze con residui di cisteina redox attivi cruciali per la catalisi della perossidasi. La variante A218V ha portato alla perdita di accessibilità al solvente e al guadagno di un sito allosterico a R214, indicativo di una riduzione dell'esposizione catalitica e di una potenziale inattivazione redox. Inoltre, P101R e P70R hanno mostrato punteggi MutPred2 elevati (0,924-0,945) e hanno introdotto perturbazioni strutturali nel dominio N-terminale. Queste mutazioni causarono potenziale transmembrana alterato, aumento di conformazioni β-filamento e perdita dei siti di modifica post-traduzionale (formazione di solfatazione e pirrolidone), suggerendo collettivamente un ripiegamento e una stabilità redox compromessi. Nel complesso, le varianti di PRDX3 hanno mostrato un modello coerente di alterazione della coordinazione dei metalli, aumento del disordine e guadagno/perdita di siti catalitici, che potrebbero compromettere l'efficienza della perossidasi e indebolire i meccanismi di difesa antiossidanti mitocondriali. Queste perturbazioni strutturali, combinate con le previsioni deleterie delle analisi VEP, CADD e REVEL, indicano che sia MTHFD2 che PRDX3 ospitano nsSNP ad alto impatto che possono destabilizzare la conformazione proteica, disturbare l'architettura catalitica e alterare le interazioni molecolari essenziali per mantenere l'equilibrio redox. La convergenza di queste mutazioni dannose sui residui leganti e catalitici sottolinea il loro potenziale ruolo patogeno nel compromettere la regolazione dello stress ossidativo mitocondriale nel cancro al seno. È importante notare che questi risultati si basano su previsioni computazionali e richiedono una validazione sperimentale per confermarne la rilevanza biologica e funzionale (Tabella 4).

Tabella 4: Conseguenze funzionali e strutturali previste degli nsSNP deleteri in MTHFD2 e PRDX3 basate sulle analisi DynaMut e MutPred2. Clicca qui per scaricare questa tabella.

Visualizzazione strutturale e interpretazione a livello atomico di nsSNP deleteri in MTHFD2 e PRDX3

Per chiarire le conseguenze strutturali su scala atomica delle varianti non sinonimiche più deleterie, sono state effettuate visualizzazioni molecolari e modellazione strutturale 3D per MTHFD2 e PRDX3 utilizzando simulazioni PyMOL e DynaMut. Queste analisi miravano a identificare perturbazioni conformazionali, spostamenti di interazione residuo e riarrangiamenti catalitici derivanti da sostituzioni ad alto impatto. Per PRDX3, le mutazioni deleterie previste P230S, A218V, P101R e P70R sono state modellate all'interno del dominio della perossidasi dipendente da tioredossina. La proteina di tipo selvatico presentava una compatta α/β volte caratterizzata da un'estesa rete di legami a idrogeno che stabilizza i residui di cisteina catalitica. Tuttavia, l'introduzione di mutazioni ha indotto deviazioni strutturali evidenti localizzate vicino alle sacche di riconoscimento catalitico e substrato.

In particolare, la sostituzione P230S (Figura 13A,B) ha sostituito una prolina rigida e non polare con un residuo di serina polare. Questa sostituzione aumentò la flessibilità della catena laterale, introducendo un nuovo potenziale di legame a idrogeno e interrompendo la rigidità nativa del loop necessaria per la stabilità del dominio perossidasi. Il risultato è stato un aumento dell'accessibilità superficiale ai solventi e uno sviluppo parziale vicino al sito redox-attivo. Analogamente, A218V (Figura 13B) ha sostituito un piccolo residuo di alanina con una valina più massiccia, creando ostacole sterico nel nucleo idrofobo e potenzialmente disturbante accomodazione dei cofattori. Le mutazioni P101R e P70R (Figura 13C,D) hanno sostituito la prolina con residui di arginina, introducendo catene laterali cariche positivamente in regioni originariamente dominate da contatti non polari. Si prevede che queste alterazioni introducano cambiamenti elettrostatici e potenziali distorsioni del loop vicino al dominio N-terminale, che probabilmente interferiscono con l'aggancio della tioredossina e la stabilità della dimerizzazione. Collettivamente, queste previsioni strutturali suggeriscono che le varianti di PRDX3 possano mostrare una geometria alterata dell'interfaccia redox, un aumento del disordine e una riduzione dell'efficienza della perossidasi, compromettendo la capacità dell'enzima di neutralizzare il perossido di idrogeno e mantenere l'equilibrio ossidativo mitocondriale.

Per MTHFD2, le varianti modellate A247E, D248G, P208R, G291V e G313D erano distribuite tra i domini di legame NADP⁺ e catalitici, che sono fondamentali per il metabolismo a un carbonio e la rigenerazione del NADPH. La struttura di tipo selvatico ha rivelato una tasca catalitica fortemente compatta, coordinata da ioni metallici divalenti e interazioni di legami di idrogeno, essenziali per il legame del substrato folato. Al contrario, tutte le sostituzioni modellate introdussero squilibri di carica, polarità o dimensione che destabilizzavano queste regioni. La mutazione A247E (Figura 14B) ha introdotto un residuo di acido glutammico carico negativamente, disturbando la coordinazione del legame del metallo e l'equilibrio elettrostatico all'interno della cavità catalitica. Analogamente, D248G (Figura 14F) ha causato la perdita di un gruppo carbossilico acido aspartico, eliminando un contatto catalitico chiave e destabilizzando la struttura secondaria locale. La sostituzione del G291V (Figura 14A) ha introdotto un residuo valinico più ingombrante, causando scontri sterici e una parziale distorsione dell'anello adiacente alla tasca NADP⁺ .

La variante G313D (Figura 14C) ha introdotto un residuo carico negativamente in una regione tipicamente occupata da una piccola glicina, con conseguente alterazione dei pattern di legame a idrogeno e una riduzione della flessibilità all'interfaccia catalitica. Infine, P208R (Figura 14E) ha sostituito una prolina rigida con un'arginina carica positivamente, potenzialmente disturbando le interazioni interdominio e aumentando il disordine nella struttura elicoidale centrale della proteina. Si prevede che queste alterazioni combinate ridurranno significativamente la stabilità degli enzimi, comprometteranno la coordinazione degli ioni metallici e diminuiranno l'efficienza catalitica. Collettivamente, sia i mutanti MTHFD2 che PRDX3 mostrano una destabilizzazione localizzata all'interno di siti catalitici e redox funzionalmente conservati. Le varianti di MTHFD2 influenzano prevalentemente i residui di legame e catalitici di NADPH, compromettendo il ciclo metabolico redox, mentre le mutazioni di PRDX3 interferiscono con il legame della tioredossina e la formazione di disolfuro, indebolendo la capacità antiossidante mitocondriale. Questi risultati sottolineano che gli nsSNP deleteri contribuiscono alla destabilizzazione molecolare delle reti redox mitocondriali, potenzialmente guidando la riprogrammazione metabolica tumorale e la resistenza alla terapia.

figure-results-11
Figura 13. Modellazione strutturale degli nsSNP deleteri in PRDX3 (ENST00000298510.4). (A) Diagramma a nastro della struttura terziaria PRDX3 che evidenzia i siti di mutazione (verde) all'interno del dominio della perossidasi dipendente dalla tioredossina. (B) La sostituzione della prolina con la serina in posizione 230 e dell'alanina con la valina in posizione 218 induce rilassamento conformazionale e sviluppo locale nel circuito catalitico. (C,D) La sostituzione della prolina con arginina nelle posizioni 101 e 70 introduce cariche positive e interrompe l'impaccheggio elicoidale N-terminale. Ogni schema di mutazione mostra la transizione chimica dei residui interessati e l'orientamento alterato della catena laterale all'interno della struttura 3D. Gli effetti previsti includono un aumento dell'esposizione ai solventi, un riarrangiamento dei legami dell'idrogeno e una riduzione della stabilità della perossidasi. Clicca qui per visualizzare una versione più grande di questa figura.

figure-results-12
Figura 14. Visualizzazione strutturale degli nsSNP deleteri in MTHFD2 (ENST00000394053.7). (A) La struttura del monomero MTHFD2 che illustra le posizioni nsSNP ad alto impatto

Tabella supplementare S1. Elenco dei geni insieme ai relativi valori di espressione normalizzati e alle informazioni campionarie associate derivate dal dataset GSE231524, utilizzato per l'analisi a valle. Clicca qui per scaricare questo File.

Tabella supplementare S2. Elenco dei geni insieme ai relativi valori di espressione normalizzati e alle informazioni campionarie associate derivate dal dataset GSE231525, utilizzato per l'analisi a valle. Clicca qui per scaricare questo File.

Tabella supplementare S3. Elenco dei geni espressi differenzialmente (DEG) identificati dai 3-MOS-DEG, inclusi nomi genici, valori di cambiamento di piegamento e significatività statistica utilizzata per l'interpretazione a valle. Clicca qui per scaricare questo File.

Tabella supplementare S4. Varianti associate al trascritto MTHFD2-201, inclusi il tipo di variante, la posizione genomica e le informazioni di annotazione correlate utilizzate per l'analisi a valle. Clicca qui per scaricare questo File.

Tabella supplementare S5. Varianti associate al trascritto PRDX3-201, inclusi il tipo di variante, la posizione genomica e le informazioni di annotazione correlate utilizzate per l'analisi a valle. Clicca qui per scaricare questo File.

Discussion

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

Lo stress ossidativo mitocondriale è un segno distintivo dell'adattamento tumorale, che regola la sopravvivenza cellulare, la plasticità metabolica e la resistenza alla terapia. Il presente studio ha esplorato sistematicamente i geni differenzialmente espressi (MOS-DEG) legati allo stress ossidativo mitocondriale nel cancro al seno HER2+ integrando dati trascricromici, arricchimento funzionale, validazione clinica e analisi dettagliate in silico mutazionali e strutturali. L'integrazione dell'espressione differenziale con il profiling delle mutazioni ha fornito una comprensione multidimensionale di come la regolazione redox-metabolica si interseci con l'instabilità genomica. Tra i MOS-DEG identificati, MTHFD2 e PRDX3 sono emersi come determinanti mitocondriali fondamentali che mostrano funzioni distinte ma complementari nell'adattamento allo stress ossidativo, nella regolazione metabolica e nella rispostaterapeutica 48. L'identificazione di molteplici SNP deleterie non sinonime (nsSNP) all'interno di questi geni ha ulteriormente rivelato come le singole sostituzioni di amminoacidi potessero modulare l'attività enzimatica, il ripiegamento delle proteine e la resilienza mitocondriale nelle cellule tumorali al seno. È importante sottolineare che i risultati presentati in questo studio derivano da analisi computazionali integrative e in silico. e, pertanto, richiedono ulteriori convalidazioni sperimentali per confermarne la rilevanza biologica e clinica.

MTHFD2 come oncogene metabolico e fattore prognostico

MTHFD2 (Metilenetraidrofolato deidrogenasi 2) codifica per un enzima mitocondriale bifunzionale centrale nella via del metabolismo a un carbonio (OCM). Generando formatia e NADPH, MTHFD2 supporta la biosintesi dei nucleotidi e l'omeostasi redox—funzioni che diventano iperattive nelle cellule tumorali a rapida proliferazione. Sebbene in gran parte silenziosa nei tessuti adulti normali, MTHFD2 è riespressa in modo aberrante in oltre l'80% delle neoplasie, inclusi tumori al seno, renale, colorettale ed epatocellulari. Un'espressione elevata è fortemente correlata a scarsi risultati clinici e a un potenziale metastaticoaumentato 49.

In questo studio, MTHFD2 è stata costantemente aumentata sia nei tessuti tumorali che metastatici nei dataset RNA-seq e microarray, con l'analisi Kaplan–Meier che ne conferma l'associazione prognostica avversa (HR = 1,53, p = 1,1×10⁻16). Dal punto di vista funzionale, ciò è in linea con il suo ruolo nella rigenerazione del NADPH, essenziale per il rifornimento di glutatione e tioredossina che neutralizzano le specie reattive di ossigeno (ROS)50. Tale riprogrammazione metabolica aumenta la tolleranza allo stress ossidativo e sostiene la crescita anabolica, in particolare sotto pressione terapeutica come l'inibizione diHER2 51. Sebbene questo studio si concentri principalmente sulla resistenza alla terapia mirata a HER2, in particolare in relazione ad agenti come il lapatinib, l'analisi ROC è stata condotta utilizzando dataset associati alla risposta a "qualsiasi chemioterapia" per valutare la più ampia performance predittiva dei geni hub identificati. Questo approccio è stato impiegato come strategia secondaria di validazione per valutare la loro applicabilità clinica generale. Tuttavia, è importante notare che questi risultati non rappresentano esclusivamente la risposta alla terapia mirata a HER2 e, pertanto, le conclusioni riguardanti la resistenza specifica della terapia vengono interpretate con cautela. Sono necessari studi futuri che incorporino dataset specificamente collegati a trattamenti mirati a HER2 per convalidare ulteriormente questi risultati.

A livello genomico, l'analisi nsSNP ha rivelato diverse varianti altamente deleterie—in particolare rs1471336772 (G291V), rs2103841302 (G313D), rs1694270227 (P208R), rs1428567735 (A247E) e rs1694375712 (D248G), localizzate all'interno dei domini di legame NADP⁺ e catalitici. Queste mutazioni hanno mostrato costantemente SIFT ≤ 0,05, PolyPhen-2 ≥ 0,99 e valori CADD variabili da 29 a 36, suggerendo una grave perturbazione strutturale. La modellazione strutturale secondaria e 3D suggerisce che questi residui si trovano in regioni α-elicoidali o a β-filamento, critiche per la coordinazione catalitica e l'affinità concofattori 52. Le analisi di DynaMut e MutPred2 hanno ulteriormente indicato la perdita del potenziale di legame dei metalli, alterazione dei legami a idrogeno e ridotti cambiamenti nella stabilità proteica che possono compromettere l'attività enzimatica e il legame dei cofattori.

Curiosamente, sebbene tali varianti siano previste per destabilizzare la struttura enzimatica, possono paradossalmente attivare circuiti redox compensatori, permettendo alle cellule tumorali di deviare il flusso metabolico attraverso vie parallele come la biosintesi della serina o il ciclo folato mitocondriale. Questa adattabilità mutazionale sottolinea l'interazione dinamica tra instabilità enzimatica e resilienza metabolica nei mitocondritumorali 53. Collettivamente, MTHFD2 funziona come un oncogene metabolico la cui sovraespressione e varianti patogeniche rafforzano la plasticità redox e la resistenza ai farmaci, rendendolo un bersaglio terapeutico convincente per la terapia redox disruptiva.

PRDX3 come antiossidante mitocondriale e biomarcatore protettivo

PRDX3 (Perossiredossina 3) funge da perossidasi dipendente da tioredossina, responsabile della disintossicazione del perossido di idrogeno all'interno della matrice mitocondriale. Costituisce un meccanismo di difesa vitale, mantenendo l'equilibrio redox della fosforilazione ossidativa (OXPHOS) e proteggendo i complessi respiratori da lesioni ossidative. Nel cancro, la funzione di PRDX3 è a doppio sfaccetto: mentre la sovraespressione supporta la difesa antiossidante e la sopravvivenza sotto stress ossidativo, la sua perdita aumenta la disfunzione mitocondriale e l'apoptosi.

I nostri dati hanno rivelato che PRDX3 è moderatamente aumentata nei tumori e nei tessuti metastatici ed è significativamente associata a una prognosi favorevole (HR = 0,73, p = 7,7×10⁻10). Ciò suggerisce un ruolo protettivo in cui l'espressione potenziata di PRDX3 tampona l'accumulo di ROS mitocondriali, preserva l'omeostasi redox e mitiga i danni ossidanti durante lo stress oncogenico. Meccanicamente, PRDX3 interagisce con nodi di segnalazione come NF-κB e HIF-1α e modula i regolatori dell'apoptosi mitocondriale, inclusi BCL2 e AIFM1, collegando la regolazione ROS alla segnalazione disopravvivenza 54,55.

In particolare, il profiling nsSNP ha identificato diverse varianti deleterie tra cui rs747786383 (P230S), rs2133647474 (A218V), rs761292643 (P101R) e rs377652956 (P70R) all'interno del dominio conservato della perossina tioredossina. Queste sostituzioni erano previste come dannose da SIFT (≤0,05), PolyPhen-2 (≥0,99) e CADD (≥28). La modellizzazione strutturale e le simulazioni DynaMut hanno dimostrato che queste mutazioni interrompono i legami locali a idrogeno, aumentano l'esposizione ai solventi e distorcono il α/β volte essenziale per l'accessibilità della cisteina catalitica. In particolare, P230S e A218V inducono instabilità loop-elica e ostacoli sterici, mentre P70R e P101R introducono repulsione elettrostatica e destabilizzano l'impacchettamento elicoidale N-terminale. Queste alterazioni probabilmente compromettono l'efficienza della perossidasi e il legame della tioredossina, attenuando la capacità antiossidante diPRDX3-56.

Tali varianti potrebbero ridurre la difesa mitocondriale, favorendo l'accumulo di ROS e potenzialmente influenzando la risposta terapeutica in ambienti tumorali redox-dipendenti. Studi precedenti hanno collegato varianti deleterie di PRDX3 a tumori epatocellulari e cerebrali, supportando il loro ruolo più ampio nella vulnerabilità alle malattie ossidative. Nel contesto del cancro al seno, questi risultati evidenziano PRDX3 sia come biomarcatore protettivo sia come enzima antiossidante sensibile alle mutazioni, la cui disfunzione può predisporre le cellule a lesioni ossidative e stress metabolico.

Interpretazione integrativa: Asse redox mitocondriale–metabolico

Collettivamente, MTHFD2 e PRDX3 definiscono due bracci interconnessi dell'asse redox–metabolico mitocondriale. MTHFD2 supporta la produzione di NADPH e il metabolismo biosintetico, alimentando la resistenza allo stress ossidativo, mentre PRDX3 desintossizza ROS e protegge i componenti mitocondriali. La loro espressione e i loro modelli mutazionali suggeriscono un meccanismo di retroazione che la regolazione all'alto di MTHFD2 rigenera i cofattori redox, mentre PRDX3 neutralizza i ROS risultanti, formando una rete di difesa sincronizzata che consente una proliferazione sostenuta sotto stress57,58.

La scoperta di nsSNP deleteri all'interno di entrambi i geni introduce uno strato genetico in questo sistema regolatore. Le mutazioni nei residui catalitici o redox attivi potrebbero alterare l'equilibrio redox alterando la stabilità enzimatica e l'interazione dei cofattori, influenzando come le cellule tumorali si adattino allo stress ossidativo indotto dalla terapia. Questa interazione tra disregolazione trascrizionale e vulnerabilità strutturale sottolinea la necessità di una valutazione dei biomarcatori a doppio parametro—integrando il profiling espressivo con l'analisi mutazionale—per perfezionare le previsioni terapeutiche e la stratificazione del paziente.

Implicazioni cliniche e terapeutiche

Da un punto di vista clinico, MTHFD2 e PRDX3 rappresentano bersagli terapeutici complementari all'interno della rete di stress ossidativo mitocondriale. Attaccare MTHFD2 con inibitori a piccole molecole (ad esempio, DS18561882, LY345899) ha dimostrato efficacia nei modelli preclinici di cancro sopprimendo la generazione di NADPH, inducendo stress ossidativo e sinergizzando con inibitori di HER2 come lapatinib e trastuzumab. Al contrario, modulare l'espressione o l'attività di PRDX3 potrebbe essere sfruttata per regolare l'equilibrio redox sia per sensibilizzare le cellule tumorali agli agenti che inducono ROS sia per proteggere i tessuti normali da lesioni ossidative collaterali.

Per mantenere l'accuratezza analitica, abbiamo chiarito che le analisi di sopravvivenza sono state condotte in una coorte non stratificata di cancro al seno e che la validazione basata su ROC rifletteva una risposta chemioterapia generale piuttosto che una terapia mirata a HER2.

Questo approccio a doppio targeting, l'inibizione di MTHFD2, unita alla modulazione PRDX3, potrebbe rappresentare una strategia potenziale per interrompere i meccanismi di resistenza guidati dal redox mantenendo la funzione mitocondriale nelle cellule non maligne. Inoltre, lo screening per nsSNP deleteri in questi geni può guidare la progettazione terapeutica informata dal genotipo, prevedendo quali tumori sono più vulnerabili agli interventi basati su perturbazioni redox.

Per garantire coerenza e riproducibilità nell'interpretazione delle varianti, gli nsSNP prioritari identificati in MTHFD2 e PRDX3 sono stati armonizzati sistematicamente su tutti i livelli analitici, inclusi il filtraggio trascrittomico, il punteggio della patogenicità e la modellazione strutturale. I set finali di varianti rs1471336772, rs2103841302, rs1428567735, rs1694270227 e rs1694375712 per MTHFD2, e rs747786383, rs2133647474, rs761292643 e rs377652956 per PRDX3 rappresentano sostituzioni deleterie ad alta fiducia costantemente supportate da molteplici framework predittivi. Allineare la segnalazione basata su rsID con le corrispondenti sostituzioni di amminoacidi garantisce ulteriormente chiarezza interpretativa tra analisi genomiche e strutturali. Questa armonizzazione rafforza la validità interna dello studio e facilita la validazione sperimentale futura fornendo un quadro variante unificato e tracciabile.

Tutte le interpretazioni funzionali e meccanicistiche in questo studio si basano su previsioni computazionali e dovrebbero quindi essere considerate potative. Sebbene la bioinformatica integrativa e la modellazione strutturale forniscano forti prove sugli effetti potenziali degli nsSNP identificati in MTHFD2 e PRDX3, questi risultati non rappresentano meccanismi convalidati sperimentalmente. Di conseguenza, tutte le conclusioni riguardanti la disfunzione proteica, la disordinazione redox e la rilevanza terapeutica sono presentate come ipotesi predittive che richiedono ulteriore validazione sperimentale.

Limitazioni e direzioni future

Nonostante una robusta integrazione computazionale e multi-omica, devono essere riconosciute diverse limitazioni. Le analisi in questo studio si basano interamente su approcci in silico e computazionali senza una validazione sperimentale diretta. Pertanto, i risultati dovrebbero essere interpretati come predittivi e generatori di ipotesi piuttosto che definitivi. Saggi funzionali, come misurazioni dell'attività enzimatica, flusso redox mitocondriale e cristallografia strutturale, così come in vivo.sono necessari per confermare gli effetti deleteri previsti degli nsSNP. Inoltre, i dataset clinici mostrano un'eterogeneità intrinseca nella distribuzione dei sottotipi e nell'esposizione ai trattamenti, che può influenzare i profili di espressione genica. Inoltre, il presente studio si basa su un numero limitato di dataset trascrictomici, che possono influenzare la generalizzazione dei risultati. Sebbene due dataset indipendenti di RNA-seq siano stati analizzati e supportati da validazioni cliniche su larga scala, l'inclusione di ulteriori coorti indipendenti rafforzerebbe ulteriormente la robustezza e la riproducibilità dei risultati.

Le modifiche post-traduzionali critiche sia per la regolazione di MTHFD2 che per PRDX3 non sono state valutate, e le interazioni redox dinamiche nei sistemi viventi devono ancora essere verificate sperimentalmente. È importante sottolineare che i geni chiave identificati in questo studio, in particolare MTHFD2 e PRDX3, sono stati riportati in studi precedenti come svolgendo ruoli significativi nel metabolismo del cancro e nella regolazione redox, supportando la coerenza biologica dei nostri risultati tra diversi studi. Le ricerche future dovrebbero utilizzare la validazione multi-omica (proteomica, metabolomica e trascritomica a cellula singola) e simulazioni di dinamica molecolare per catturare l'impatto completo di queste varianti. Stabilire legami causali tra genotipo, funzione enzimatica e risposta terapeutica aumenterà il potenziale traslazionale di questi risultati. L'integrazione delle intuizioni mutazionali con la validazione sperimentale potrebbe infine consentire terapie redox basate sul genotipo, in cui inibitori del metabolismo mitocondriale e modulatori redox sono co-ottimizzati per superare la resistenza e migliorare gli esiti clinici nel cancro al seno HER2+ .

Disclosures

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

Gli autori non hanno conflitti di interesse da dichiarare. Strumenti di intelligenza artificiale, incluso ChatGPT (GPT-5) di OpenAI, sono stati utilizzati per migliorare la grammatica, la chiarezza e la formulazione scientifica del manoscritto. Tutte le analisi, interpretazioni e conclusioni sono state concepite e verificate dagli autori.

Contributi degli autori:

Xiaobo Jia ha concettualizzato e supervisionato lo studio, ha contribuito alla progettazione dello studio, all'interpretazione dei dati, alla stesura dei manoscritti e ha fornito la leadership complessiva del progetto. Hui Su ha contribuito all'acquisizione dei dati, all'analisi bioinformatica e all'interpretazione dei risultati trascrictomici. Jiaxin Zhang ha assistito nell'elaborazione dati, nell'analisi nsSNP, nella modellazione strutturale e nella preparazione delle figure. Zhao Liu contribuì all'analisi statistica, alla validazione dei risultati e alla revisione dei manoscritti. Tutti gli autori hanno esaminato e approvato la versione finale del manoscritto.

Materials

List of materials used in this article
NameCompanyCatalog NumberComments
AnnotationDbiBioconduttorev1.64.0Pacchetto di annotazione R utilizzato per la standardizzazione e l'annotazione dei simboli geni HGNC.
apeglmBioconduttoremetodo in DESeq2Metodo utilizzato per il ritiro a variazione di fold log2 nell'analisi di espressione differenziale.
BiobaseBioconduttorev2.62.0Pacchetto R utilizzato per accedere e gestire oggetti di espressione e metadati derivati da GEO.
CADDUniversità di Washington / Kircher LabStrumento webPunteggio combinato di depletion dipendente da annotazione utilizzato per la previsione della patogenicità degli nsSNP.
clusterProfilerBioconduttorev4.8.1Pacchetto R utilizzato per l'analisi di arricchimento GO e KEGG.
ComplexHeatmapBioconduttorev2.18.0Pacchetto R utilizzato per la generazione di heatmap e il clustering delle espressioni.
CytoscapeConsorzio CytoscapeSoftwarePiattaforma di visualizzazione di rete utilizzata con reti PPI derivate da STRING e priorità CytoHubba.
dbSNPNCBIDatabaseDatabase di varianti di popolazione utilizzato per la validazione incrociata di nsSNP prioritizzati.
DESeq2Bioconduttorev1.42.0Pacchetto R utilizzato per la normalizzazione, la modellazione della varianza e l'analisi differenziale dell'espressione.
dplyrCRAN / tidyversev1.1.3Pacchetto R utilizzato per la manipolazione dei dati e l'intersezione di insiemi genici.
DynaMutUniversità di Melbourne / BioSigServer webStrumento utilizzato per stimare le variazioni di stabilità e flessibilità associate alle mutazioni nelle proteine.
Vulcano PotenziatoBioconduttorev1.22.0Pacchetto R utilizzato per visualizzare i risultati di espressione differenziale come grafici vulcanici.
Ensembl Genome BrowserEMBL-EBI / EnsemblDatabaseFonte delle sequenze di trascrizione canoniche per MTHFD2 e PRDX3.
Predittore di Effetto Variante Ensembl (VEP)EMBL-EBI / EnsemblStrumento webStrumento utilizzato per annotare varianti di missense e integrare punteggi predittivi.
ExACBroad InstituteDatabaseDatabase a livello di popolazione utilizzato per la validazione incrociata di nsSNP.
Omnibus sull'Espressione Genica (GEO)NCBIDatabaseRepository utilizzato per recuperare dataset trascrittomici per l'analisi del cancro al seno HER2-positivo.
Ontologia genicaConsorzio di Ontologie GenicheVAI:0006979Risorsa ontologica utilizzata per recuperare geni legati allo stress ossidativo e per l'analisi dell'arricchimento.
GEOqueryBioconduttorev2.70.0Pacchetto R utilizzato per accedere alle matrici e ai metadati del conteggio GEO.
ggplot2CRAN / tidyversev3.5.0Pacchetto R utilizzato per la visualizzazione dei dati, il clustering di grafici e i risultati grafici.
ggraphCRANPacchetto RPacchetto R utilizzato per la visualizzazione di grafi e reti durante l'arricchimento e la rappresentazione dei percorsi.
gnomADBroad InstituteDatabaseDatabase delle varianti di popolazione utilizzato per verificare la frequenza e la distribuzione degli nsSNP prioritizzati.
GOplotCRANPacchetto RPacchetto R utilizzato per la visualizzazione di arricchimento GO, inclusi grafici di accordi e riassuntivi.
GSE231524NCBI GEOAccesso al tronoDataset RNA-seq utilizzato per l'analisi dei fenotipi BT474 parentali, tolleranti ai farmaci e resistenti.
GSE231525NCBI GEOAccesso al tronoDataset RNA-seq utilizzato per l'analisi del knockdown di DUSP6 nelle cellule di cancro al seno HER2-positive.
Umano MitoCarta3.0Broad InstituteDatabaseRisorsa genica mitocondriale curata utilizzata per definire insiemi genici mitocondriali.
Database Umano dei Geni dello Stress Ossidativo (HOSGDB)HOSGDBDatabaseDatabase utilizzato per recuperare geni legati allo stress ossidativo.
igraphCRANPacchetto RPacchetto R utilizzato per la rappresentazione della rete e la visualizzazione dei percorsi.
iMutant 3.0Università di Bologna / BiofoldServer webStrumento utilizzato per prevedere gli effetti delle mutazioni sulla stabilità delle proteine.
Kaplan– Meier PlotterKMplotStrumento webPiattaforma online utilizzata per l'analisi della sopravvivenza senza recidiva nelle coorti di cancro al seno.
KEGGUniversità di KyotoDatabaseDatabase delle vie utilizzate per l'analisi della fosforilazione ossidativa e dell'arricchimento delle vie.
KEGGRESTBioconduttorePacchetto RPacchetto utilizzato per recuperare e annotare le informazioni sui percorsi KEGG.
LapatinibNon specificato nel manoscritto1 & mu; Condizione di trattamento MInibitore mirato a HER2 utilizzato nei dataset sperimentali di origine per derivare fenotipi tolleranti/resistenti ai farmaci.
MetaLRIntegrato tramite Ensembl VEPPunteggioMetrica computazionale di patogenicità utilizzata per la prioritizzazione delle varianti.
MutPred2MutPredServer webStrumento utilizzato per prevedere le conseguenze funzionali delle sostituzioni di amminoacidi.
NetSurfP 3.0Università Tecnica della DanimarcaServer webStrumento utilizzato per la previsione della struttura secondaria e dell'accessibilità dei solventi.
org. Hs.eg.dbBioconduttorev3.18.0Pacchetto di annotazione del genoma umano utilizzato per la mappatura degli identificatori genici.
PathviewBioconduttorePacchetto RPacchetto utilizzato per mappare geni arricchiti sulle vie KEGG.
PheatmapCRANv1.0.12Pacchetto R utilizzato per il grafico di heatmap e la visualizzazione del clustering.
PolyPhen-2Harvard / Brigham and Women's HospitalStrumento webPredittore computazionale utilizzato per stimare l'impatto strutturale/funzionale delle sostituzioni degli amminoacidi.
Banca Dati Proteiche (PDB)RCSB PDBDatabaseFonte di strutture proteiche sperimentalmente risolte per MTHFD2 e PRDX3.
PSIPREDUniversity College Londonv3.2Server di previsione della struttura secondaria delle proteine utilizzato per l'analisi topologica 2D.
PyMOLSchrö Dinger / PyMOLv3.1Software di grafica molecolare utilizzato per visualizzare le strutture proteiche e i siti di mutazione.
FESTEGGIAIntegrato tramite Ensembl VEPPunteggioPunteggio di patogenicità dell'ensemble utilizzato per la priorità delle varianti missens.
ROCplotterROCplot.orgStrumento webPiattaforma online utilizzata per la validazione basata su ROC dell'espressione genica nelle coorti di risposta al cancro al seno.
RStudioIpotesiAmbiente v4.3.1/v4.3.2Ambiente di calcolo statistico utilizzato per flussi di lavoro trasscrittomici, di arricchimento e visualizzazione.
SEFISSOA*STARStrumento webStrumento predittivo utilizzato per classificare le sostituzioni di amminoacidi come tollerate o deleterie.
STRINGConsorzio STRINGDatabaseProteine– database di interazioni proteiche utilizzato per l'analisi di reti e l'identificazione dei geni hub.
TNM plotTNMplot.comStrumento webPiattaforma utilizzata per confrontare l'espressione genica tra tessuti mammari normali, tumorali e metastatici.
VennDiagramCRANv1.7.3Pacchetto R utilizzato per visualizzare la sovrapposizione tra DEG e set genici mitocondriali curati.

Reprints and Permissions

Request permission to reuse the text or figures of this JoVE article

Request Permission

Tags

Breast CancerHER2 PositiveMitochondrial Oxidative StressTranscriptomic AnalysisHub GenesSingle Nucleotide PolymorphismsDrug TargetsMTHFD2PRDX3RNA Sequencing

Related Articles