Research Article

Интегрированный биоинформатический анализ транскриптомических данных человека выделяет три ключевых диагностических и прогностических биомаркера при аденокарциноме лёгких

DOI:

10.3791/71214

June 30th, 2026

In This Article

Summary

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

В этом исследовании были выявлены диагностические и прогностические биомаркеры аденокарциномы легких с использованием транскриптомических данных TCGA-LUAD и GEO GSE115002. B3GNT3, FERMT1 и SPP1 были повышены регуляцией, что отличало опухоли от нормальной ткани. Эти гены связаны с эпителиально-мезенхимным переходом и иммуносупрессией. Номограмма, объединяющая экспрессию гена со стадией TNM, показала надёжную прогностическую ценность.

Abstract

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

Аденокарцинома лёгких (LUAD) является ведущей причиной смерти, связанной с раком, во всем мире. Несмотря на достижения в хирургии, таргетной терапии и иммунотерапии, 5-летняя выживаемость продвинутой LUAD остаётся ниже 20%, что указывает на острую необходимость надёжных молекулярных биомаркеров для раннего выявления и прогноза. В этом исследовании авторы выдвинули гипотезу, что три постоянно апрегуляционных гена могут служить эффективными диагностическими и прогностическими биомаркерами для LUAD. Авторы проанализировали транскриптомные данные из двух независимых когорт — TCGA-LUAD (535 опухолей, 59 нормальных образцов) и GSE115002 (52 опухоли, 52 совпадающих нормальных образца) — для скрининга дифференциально экспрессируемых генов. Три основных гена — B3GNT3, FERMT1 и SPP1 — постоянно экспрессировались в опухолях LUAD в обоих наборах данных. Эти гены показали отличную диагностическую эффективность: AUC выше 0,95 в TCGA-LUAD и высокая точность в GSE115002. Анализ выживаемости показал, что высокая экспрессия каждого гена существенно связана с более короткой общей и безболезненной выживаемостью, а многомерная регрессия Кокса подтвердила их независимую прогностическую ценность. Анализ функционального обогащения показал, что эти три гена участвуют в эпителиально-мезенхимальном переходе, ремоделировании внеклеточного матрикса и иммуносупрессии, все они тесно связаны с инвазией и метастазами LUAD. Авторы дополнительно создали прогностическую номограмму, объединив три гена и стадию TNM, достигнув индекса согласованности 0,743 и демонстрировав хорошую прогностическую эффективность. Эти результаты подтверждают, что B3GNT3, FERMT1 и SPP1 являются перспективными диагностическими и прогностическими биомаркерами для LUAD, поддерживая клиническое применение в стратификации и управлении рисками.

Introduction

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

Рак лёгких является основной причиной глобальной смертности от рака, на него пришлось примерно 1,8 миллиона смертей в 2020году. Аденокарцинома легких (LUAD) составляет почти 40% всех случаев ракалёгких 2. Несмотря на достижения в хирургии, таргетной терапии и иммунотерапии, 5-летняя выживаемость при прогрессирующем LUAD остаётся ниже 20%3,4. Надёжные молекулярные биомаркеры для раннего выявления и точного прогнозирования крайне необходимы. Высокопроизводительное секвенирование и публичные базы данных, такие как The Cancer Genome Atlas (TCGA) и Gene Expression Omnibus (GEO), обеспечивают систематическое транскриптомическое профилирование рака 5,6. Интегративная биоинформатика между когортами повышает надёжность обнаружения кандидатов побиомаркерам 5.

Многие гены и пути связаны с LUAD, включая пролиферацию клеток, сигнализацию EGFR и иммунный выход7. Однако немногие из них были переведены в клиническую практику. Модели риска, объединяющие генные сигнатуры и клиникопатологические признаки — особенно номограммы — повышают прогностическую точность вLUAD 8. Хотя B3GNT3, FERMT1 и SPP1 по отдельности связаны с прогрессированием рака, их совокупная диагностический, прогностический и иммунно-микроклиматический регуляторный ценность в LUAD не была систематически подтверждена в независимых когортах. Это исследование обеспечивает первый интегрированный кроссплатформенный анализ этих трёх генов в виде единой панели биомаркеров для LUAD с клинически применимой прогностической номограммой.

B3GNT3 кодирует гликозилтрансферазу, которая стабилизирует PD-L1 и способствует уходу отиммунитета 9,10. FERMT1 (kindlin-1) регулирует активацию интегрина и стимулирует метастазирование при немелкоклеточном раке лёгких (НМРЛ)11,12. SPP1 (остеопонтин) опосредует ремоделирование внеклеточного матрикса, эпителийно-мезенхимальный переход (EMT) и хеморезистентность 13,14,15. Гены, связанные с циркадными часами, также предсказывают прогноз и диагноз LUAD16, а половые различия в LUAD были выявлены с помощью мультиомических интегративных белковых сигнальныхсетей 17. B3GNT3 и SPP1 секретируются или локализованы мембранами, что подтверждает потенциальное использование в качестве минимально инвазивных биомаркеров. Эффективная классификация LUAD и идентификация биомаркеров также достигается с помощью перекрывающихся методов отборапризнаков 18, а мультиомические взаимодействия играют важную функциональную роль в прогрессировании ракалёгких 19. Митохондриальные генные сигнатуры, выявленные путём комплексной мультиомической интеграции, также имеют значение для прогноза LUAD и персонализированной терапии20. B3GNT3 и SPP1 секретируются или локализованы мембранами, что подтверждает потенциальное использование в качестве минимально инвазивных биомаркеров. Целью данного исследования было выявление устойчивых биомаркеров LUAD с помощью интегративной биоинформатики, оценка их диагностической и прогностической эффективности, изучение их биологических функций и иммунных ассоциаций, а также создание клинически полезной прогностической номограммы.

Protocol

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

1. Источники данных и предварительная обработка

  1. Обработка необработанных данных в R (версия 4.1.3; Windows 10 Pro).
  2. Для GSE115002 примените квантильную нормализацию с помощью лиммы (версия 3.52.3).
  3. Фильтровать гены с низкой экспрессией для TCGA: сохранять гены с CPM > 0,5 в ≥50% образцов.
  4. Фильтруйте гены с низкой экспрессией для GSE115002: сохраняйте гены со средним сигналом >50.
  5. log2Преобразовать значения выражения с псевдосчётом +1.
    ПРИМЕЧАНИЕ: Экспрессия генов LUAD и клинические данные были получены из TCGA-LUAD (версия 33.0, портал GDC, скачано 7 августа 2025 года) и GSE115002 (микрочип Agilent, GEO, скачано 7 августа 2025 года). TCGA-LUAD включал 535 опухолей и 59 нормальных образцов. GSE115002 включали 52 опухоли и 52 совпадающих с нормальными образцами.

2. Идентификация дифференциально экспрессированных генов

  1. Используйте DESeq2 (версия 1.36.0) для TCGA RNA-seq и limma (версия 3.52.3) для GSE115002 для анализа дифференциальных выражений. Вычислите скорректированные P-значения (FDR) с помощью метода Бенджамини–Хохберга.
  2. Для обеспечения сопоставимости между наборами данных используется единый |log₂FC| ≥ для обеих когорт был применён балл 1.0. DEGs были определены как FDR < 0.05 и |log₂FC| ≥ 1.0. Перекрывающиеся DEG были выявлены с помощью VennDiagram (версия 1.7.3). B3GNT3, FERMT1 и SPP1 были выбраны как кандидаты с последовательно повышенной регуляцией с известной значимостью для рака.

3. Оценка диагностической ценности

  1. Постройте ROC-кривые для каждого кандидата гена.
  2. Определите оптимальные значения срогового значения с помощью индекса Юдена.
  3. Рассчитайте AUC, чувствительность и специфичность для каждого гена.
  4. Постройте комбинированную диагностическую панель с использованием многомерной логистической регрессии.
    ПРИМЕЧАНИЕ: Для анализа ROC использовался пакет pROC версии 1.18.0. Функция glm с биномиальным семейством использовалась для построения диагностической модели.

4. Анализ выживаемости

  1. Стратифицировать пациентов на группы с высокой и низкой экспрессией с использованием медианы.
  2. Генерируйте кривые выживаемости Каплана–Мейера для каждого гена.
  3. Проведите тесты с логарифмическим рангом для сравнения различий в выживаемости.
  4. Проведите одномерный регрессионный анализ Кокса.
  5. Проведите многомерный регрессионный анализ Кокса.
  6. Включать клинические ковариаты в регрессионные модели.
  7. Проверьте предположение о пропорциональных рисках с помощью остаточных данных Шёнфельда.
  8. Рассчитайте трёхгенный рейтинг риска.
    ПРИМЕЧАНИЕ: использовались версии Survival v3.3.1 и survminer v0.4.9. Ковариаты включали возраст, пол, стадию Т, стадию N и стадию М. Оценка риска рассчитывалась следующим образом:
    Оценка риска = (0,328 × B3GNT3) + (0,331 × FERMT1) + (0,321 × SPP1). (1)

5. Обогащение множества генов и функциональная аннотация

  1. Проведите анализ обогащения GO с помощью DEG.
  2. Проведите анализ обогащения путей KEGG с помощью DEG.
  3. Провести анализ обогащения множеств генов (GSEA).
  4. Корреляция ранговых генов по Пирсону с экспрессией кандидатов генов.
  5. Определите значимые термины с помощью скорректированного P < 0,05.
    ПРИМЕЧАНИЕ: clusterProfiler v4.6.2 использовался для анализа GO и KEGG. FGSEA v1.22.0 и MSigDB Hallmark v7.5 использовались для GSEA.

6. Анализ корреляции и сети

ПРИМЕЧАНИЕ: Корреляция Пирсона использовалась для нормально распределённой экспрессии генов; Корреляция Спирмана для фракций иммунных клеток. Сети PPI генерировались с использованием STRING (версия 11.5, confidence > 0.7) и визуализировались в Cytoscape (версия 3.9.1). Иммунная инфильтрация оценивалась с помощью CIBERSORT (абсолютный режим, 100 перестановок). Секвенирование одноклеточной РНК показало наличие нишевых переходов в микросреде НМРЛ, что важно для анализа иммуннойинфильтрации 21,22, а интегративный одноклеточный анализ может дополнительно анализировать роль иммунных клеток, таких как клетки памяти CD8+, вLUAD 23,24,25.

7. Конструкция и валидация номограмм

ПРИМЕЧАНИЕ: Переменные для номограммы были выбраны на основе многомерной значимости Кокса (P < 0,05): стадия T, стадия N, B3GNT3, FERMT1 и SPP1. Номограмма была создана с использованием rms (версия 6.5.0). Внутренняя валидация использовала 1000 bootstrap reampling с заменой. Калибровочные кривые и анализ кривой принятия решения (DCA) проводились с использованием rmda (версия 1.7). Вычислительная среда включала R 4.1.3, Windows 10 Pro и Bioconductor 3.15. Рецепты для анализа доступны по адресу https://github.com/[redacted]/LUAD-biomarker-2025 по разумному запросу.

8. Статистический анализ

ПРИМЕЧАНИЕ: Все статистические тесты были двусторонними; P < 0,05 считался значимым.

Results

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

Глобальные изменения экспрессии генов в LUAD

Транскриптомические сравнения между тканями аденокарциномы легких и нормальными тканями лёгких выявили масштабные изменения экспрессии генов. На рисунке 1A показаны диаграммы вулканических генов дифференциально экспрессируемых в наборе данных TCGA-LUAD, а на рисунке 1B показаны гены из GSE115002 набора данных. В когорте TCGA-LUAD (рисунок 1A) 1865 генов были значительно повышены, а 1247 — понижены. В GSE115002 когорте (рисунок 1B) 645 генов были повышены, а 609 — понижены. Всего 421 ген был стабильно апрегуляцирован в обоих наборах данных. Среди этих перекрывающихся генов B3GNT3, FERMT1 и SPP1 отмечены на рисунках 1A и 1B как заметно переэкспрессированные в образцах опухоли. В TCGA-LUAD экспрессия B3GNT3 была увеличена примерно в 5 раз, FERMT1 — в 8 раз, а SPP1 — в 10 раз по сравнению с нормальными тканями. Аналогичная апрегуляция была подтверждена в GSE115002 году, при этом все три гена показали более чем двукратное повышение.

Диагностические показатели B3GNT3, FERMT1 и SPP1

Анализ кривой эксплуатационных характеристик приёмника использовался для оценки диагностических характеристик B3GNT3, FERMT1 и SPP1. На рисунке 2A показаны кривые ROC в когорте TCGA-LUAD, а на рисунке 2B — кривые GSE115002 когорты. Все три гена достигли высокой диагностической точности в обеих когортах. В когорте TCGA-LUAD (рисунок 2A) площадь под значениями кривой превысила 0,95 для всех маркеров. В независимой GSE115002 когорте (рисунок 2B) была зафиксирована аналогичная большая площадь под значениями кривой. Чувствительность и специфичность варьировались от 85% до 95% при оптимальных значениях порогового значения. Эти результаты подтверждают, что каждый ген обеспечивает отличное различие между опухолями и нормальными тканями.

Прогностическая значимость экспрессии B3GNT3, FERMT1 и SPP1

Кривые выживаемости Каплана–Мейера на рисунке 3 показывают, что высокая экспрессия каждого гена была существенно связана с более короткой общей выживаемостью в обеих когортах. Рисунки 3A–3C показывают общие кривые выживаемости для B3GNT3, FERMT1 и SPP1 в когорте TCGA-LUAD. Рисунки 3D–3F показывают соответствующие кривые в GSE115002 когорте. Пациенты с высокой экспрессией B3GNT3, FERMT1 или SPP1 демонстрировали снижение медианной выживаемости и более низкие показатели выживаемости за 5 лет. Многомерный регрессионный анализ подтвердил, что высокая экспрессия SPP1 остаётся независимым отрицательным прогностическим фактором. Повышенная экспрессия всех трёх генов также была связана с более короткой продолжительностью жизни без болезни. Последовательные тенденции в обеих когортах показывают, что гиперэкспрессия B3GNT3, FERMT1 и SPP1 предсказывает неблагоприятные клинические результаты при аденокарциноме лёгких.

Анализ функционального обогащения

Результаты анализа функционального обогащения приведены на рисунке 4. Рисунок 4A показывает обогащение GO и KEGG в когорте TCGA-LUAD, а рисунок 4B — обогащение в GSE115002 когорте. Апрегуляционные гены были сильно обогащены прогрессированием клеточного цикла, организацией внеклеточного матрикса, фокальной адгезией и онкогенной сигнализацией. Пониженные гены были связаны с нормальной эпителиальной дифференциацией и p53-сигнализацией. Эти наблюдения показывают, что три кандидатных гена участвуют в путях, способствующих пролиферации, инвазии и дисрегуляции иммунной системы при аденокарциноме лёгких.

Коэкспрессионные сети

Коэкспрессионные сети, связанные с B3GNT3, FERMT1 и SPP1, показаны на рисунке 5. Рисунок 5A показывает сеть в когорте TCGA-LUAD, а рисунок 5B — сеть из GSE115002 когорты. Узлы представляют гены, а рёбра — коэффициенты корреляции. Три ключевых гена объединяются с генами ремоделирования ЭКМ, регуляции иммунной системы и организации цитоскелета. Эти результаты свидетельствуют о том, что гиперэкспрессия этих трёх генов связана с иммуносупрессивной микросредой опухоли.

Производительность прогностической номограммы

Прогностическая номограмма представлена на рисунке 6. Модель была построена путём интеграции патологических T-стадий, патологических N стадий и уровней экспрессии B3GNT3, FERMT1 и SPP1 для прогнозирования общей выживаемости в LUAD за 1, 2 и 3 года. Для каждой переменной присваиваются очки, а общее количество очков соответствует прогнозируемой вероятности выживания. Модель достигла индекса согласованности 0,743, что свидетельствует о хорошей прогнозной эффективности. Калибровочные кривые показали близкое совпадение между предсказанными и реальными вероятностями выживания. Анализ кривой принятия решения подтвердил клиническую чистую пользу. Эта номограмма улучшает индивидуализированное прогнозирование выживаемости по сравнению с традиционной стадировкой TNM.

В итоге в данном исследовании выделяются B3GNT3, FERMT1 и SPP1 как ключевые молекулярные игроки патогенеза LUAD. Их сверхэкспрессия коррелирует с инвазивными фенотипами опухолей, стромальной ремоделировкой и уклонением от иммунитета. С помощью мультиомической интеграции мы демонстрируем совокупную ценность этих генов для диагностики, прогноза и стратификации пациентов. Будущие исследования должны изучить их прогностическую значимость для иммунотерапевтического ответа и оценить их потенциал как терапевтических целей в LUAD.

figure-results-1
Рисунок 1: Вулканические графики дифференциально экспрессируемых генов в опухоли LUAD по сравнению с нормальными тканями. (A) Набор данных TCGA-LUAD. (B) GSE115002 набор данных. Красный указывает на значительно повышенную регуляцию генов; синий означает понижение регуляции. B3GNT3, FERMT1 и SPP1 обозначены как стабильно повышенные. Пожалуйста, нажмите здесь, чтобы увидеть увеличенную версию этой фигуры.

figure-results-2
Рисунок 2: ROC-кривые для B3GNT3, FERMT1 и SPP1 при различии LUAD от нормальных тканей. (A) Когорта TCGA-LUAD. (B) GSE115002 когорта. Значения AUC демонстрируют высокую диагностическую точность. Пожалуйста, нажмите здесь, чтобы увидеть увеличенную версию этой фигуры.

figure-results-3
Рисунок 3: Общие кривые выживаемости Каплана-Мейера, стратифицированные уровнями экспрессии B3GNT3, FERMT1 и SPP1 . (A–C) Когорта TCGA-LUAD. (A) B3GNT3, (B) FERMT1, (C) SPP1. (D–F) GSE115002 когорту. (D) B3GNT3, (E) FERMT1, (F) SPP1. Высокая экспрессия каждого гена существенно связана с более короткой общей выживаемостью в обеих когортах. Значения HR и P предоставляются из лог-ранговых тестов. Пожалуйста, нажмите здесь, чтобы увидеть увеличенную версию этой фигуры.

figure-results-4
Рисунок 4: Анализ обогащения GO и KEGG DEGs коррелировал с тремя ключевыми генами. (A) Когорта TCGA-LUAD. (B) GSE115002 когорту. Термины обогащения включают биологический процесс (BP), клеточный компонент (CC), молекулярную функцию (MF) и пути KEGG. Апрегуляционные гены обогащаются пролиферацией, ремоделированием ECM и онкогенной сигнализацией. Пожалуйста, нажмите здесь, чтобы увидеть увеличенную версию этой фигуры.

figure-results-5
Рисунок 5: Коэкспрессионные сети генов, связанные с B3GNT3, FERMT1 и SPP1. (A) Когорта TCGA-LUAD. (B) GSE115002 когорта. Узлы представляют гены, а рёбра — коэффициенты корреляции. Три ключевых гена объединяются с генами ремоделирования ЭКМ, регуляции иммунной системы и организации цитоскелета. Пожалуйста, нажмите здесь, чтобы увидеть увеличенную версию этой фигуры.

figure-results-6
Рисунок 6: Прогностическая номограмма, интегрирующая патологическую T-стадию, патологическую N-стадию, B3GNT3, FERMT1 и SPP1 экспрессию для прогнозирования общей выживаемости в LUAD за 1, 2 и 3 года. Для каждой переменной присваиваются очки, а общее количество очков соответствует прогнозируемой вероятности выживания. Пожалуйста, нажмите здесь, чтобы увидеть увеличенную версию этой фигуры.

Discussion

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

Номограмма была построена с использованием многомерного регрессионного анализа Кокса на основе когорты TCGA-LUAD. Предикторы включают патологическую стадию Т, патологическую стадию N и статус экспрессии генов у B3GNT3, FERMT1 и SPP1 (классифицируются как Высокий и Низкий на основе медианной экспрессии). Для каждого пациента индивидуальные баллы по каждой переменной суммируются, чтобы получить значение «Total Points», которое соответствует оценочным общим вероятностям выживаемости за 1, 2 и 3 года. Более высокие общие показатели указывают на повышенный риск смертности. Этот инструмент обеспечивает индивидуальное прогнозирование выживаемости и помогает в стратификации рисков LUAD. Машинное обучение было использовано для выявления различных паттернов клеточной смерти в прогнозе и терапииLUAD 21,22,23, что может дополнительно оптимизировать нашу модель номограммы.

В этом исследовании были выявлены B3GNT3, FERMT1 и SPP1 как надёжные диагностические и прогностические биомаркеры в LUAD с использованием интегрированного биоинформатического анализа. Все три гена постоянно переэкспрессируются в опухоли, отличают опухоли от нормальной ткани с высокой точностью, предсказывают низкую выживаемость и регулируют пути, связанные с EMT, ремоделированием матрикса и уклонением от иммунитета. Комбинированная номограмма улучшает стратификацию риска за пределами стадии ТНМ. B3GNT3 способствует уклонению от иммунитета, стабилизируя PD-L1 посредствомгликозилирования 9,10. FERMT1 усиливает сигнализацию интегрина и подвижность клеток, вызывая инвазию иметастазирование 11,12. SPP1 служит секретируемым драйвером EMT, ангиогенеза и поляризации макрофаговM2 13,14,15. Вместе они определяют агрессивный подтип LUAD, характеризующийся инвазивностью и иммуносупрессией.

Предыдущие исследования сообщали о индивидуальных ролях B3GNT3, FERMT1 или SPP1 в LUAD. Это исследование стало первым, подтвердившим все три группы как единую панель независимых транскриптомных когорт, при этом диагностические и прогнозные результаты подтверждены как в данных TCGA, так и в GEO. Недавние исследования биомаркеров LUAD подтверждают ценность иммунно-ассоциированных генных сигнатур для прогноза и иммунотерапии. Недавние исследования с использованием интегрированной биоинформатики и машинного обучения выявили несколько генных сигнатур для диагностики и прогноза LUAD21,22. Эти подходы, аналогично нашей трёхгенной панели, подчеркивают важность биомаркеров, основанных на транскриптомах, в клинической стратификации.

Ремоделирование внеклеточной матрицы является ключевой особенностью агрессивного LUAD, и сигнатуры, связанные с ECM, были подтверждены как независимые прогностические факторы. Наши данные о том, что FERMT1 и SPP1 тесно связаны с фокальной адгезией и взаимодействием ECM–рецептор, дополнительно подтверждают критическую роль ремоделирования матрицы в прогрессировании LUAD. Подобно CHAF1B и связанным с убиквитином генным сигнатурам, описанным в междисциплинарной медицине (IMed)21,23, наши три гена тесно связаны с иммунной инфильтрацией и могут служить как прогностическими, так и предиктивными маркерами. Альтернативные стратегии идентификации биомаркеров LUAD включают секвенирование одноклеточной РНК, пространственную транскриптомику, отбор признаков на основе машинного обучения и протеомное профилированиеплазмы 24,25,26. Алгоритмы машинного обучения, такие как случайный лес или LASSO, могут дополнительно усовершенствовать выбор биомаркеров. Валидация в мокрой лаборатории с использованием qPCR, IHC и ELISA необходима для подтверждения клиническогоперевода 27,28,29,30.

Это исследование ограничено ретроспективным дизайном, зависимостью от публичных транскриптомных данных и отсутствием внешней клинической валидации. Валидация номограммы ограничивалась внутренним ресэмплингом bootstrap. Объёмные транскриптомические данные не могут определить экспрессию на клеточном уровне. Механистическая причинность требует функциональных экспериментов. Корреляции с иммунной инфильтрацией основаны на вычислительной деконволюции и должны интерпретироваться с осторожностью. Будущие исследования должны подтвердить эти биомаркеры в проспективных когортах с помощью IHC, qPCR и сывороточного ELISA. Одноклеточная и пространственная транскриптомика проясняют клеточные источники и пространственное распределение. Следует оценить прогностическую ценность иммунотерапии и ответа на таргетную терапию. Терапевтическое таргетирование B3GNT3, FERMT1 и SPP1 может предложить новые стратегии лечения LUAD.

Disclosures

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

Авторы не заявляют о конкурирующих интересах.

Acknowledgements

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

Эта работа была поддержана проектом на уровне университета Фуцзянского университета традиционной китайской медицины 2024 года (номер гранта: XB2024012), возглавляемым Юхуэй Линем из Аффилированной народной больницы Фуцзянского университета традиционной китайской медицины. и совместные фонды для инноваций в науке и технологиях, провинция Фуцзянь (грант No2025Y9530), возглавляемые Сяотин Чэнем из муниципальной больницы Цзиньцзяна (Шанхайская шестая народная больница, Фуцзянь).

Materials

List of materials used in this article
NameCompanyCatalog NumberComments
Publicly Available DatasetsTCGA-LUAD DatasetThe Cancer Genome Atlas (TCGA) Portal (https://portal.gdc.cancer.gov/); 535 LUAD tumor samples, 59 adjacent normal lung tissue samples (RNA-sequencing count/FPKM values + clinical data: survival, TNM staging)Transcriptomic and clinical data for differential expression, survival, and nomogram analysis; primary study cohort
GSE115002 DatasetGene Expression Omnibus (GEO) (https://www.ncbi.nlm.nih.gov/geo/query/acc.cgi?acc=GSE115002); Agilent microarray, 52 LUAD tumor tissues, 52 matched adjacent normal lung tissues (treatment-naïve primary tumors)Independent validation cohort for differential expression, diagnostic performance, and immune infiltration analysis
Bioinformatics Software & Programming EnvironmentR Programming LanguageVersion 4.1Core platform for all transcriptomic, statistical, and graphical analyses
R Packages (Differential Expression)DESeq2, limmaDESeq2: TCGA RNA-seq raw count differential expression analysis; limma: GSE115002 microarray normalization and differential expression analysis (Benjamini–Hochberg FDR correction)
R Packages (Diagnostic Analysis)pROCConstruction of ROC curves, calculation of AUC (95% CI), optimal cutoff determination (Youden’s index) for diagnostic performance assessment
R Packages (Survival Analysis)survival, survminerKaplan–Meier survival curve generation, log-rank test, univariate/multivariate Cox proportional hazards regression (HR + 95% CI); patient stratification by median gene expression
R Packages (Functional Enrichment)clusterProfiler, fgseaclusterProfiler: GO (BP/CC/MF) and KEGG pathway enrichment analysis (adjusted P < 0.05); fgsea: GSEA for MSigDB Hallmark/KEGG gene sets (FDR < 0.25)
R Packages (Nomogram Construction & Validation)rmsDevelopment of prognostic nomogram (integration of gene expression + TNM stage); Harrell’s C-index calculation, bootstrap resampling (1000 repetitions) for bias correction, calibration plot generation
R Packages (Statistical & Visualization)ggplot2, ComplexHeatmap, corrplotGeneration of volcano plots, bubble plots (enrichment), heatmaps (immune infiltration correlation), scatter plots (gene co-expression); Pearson/Spearman correlation analysis
Bioinformatics Databases & Tools (Network/Immune Analysis)STRING DatabaseConfidence score > 0.7Construction of protein–protein interaction (PPI) networks for B3GNT3/FERMT1/SPP1 and first-degree interactors
Cytoscape-Visualization of PPI and gene co-expression networks (edge weighting by correlation strength, hub gene identification)
Immune Deconvolution AlgorithmCIBERSORTEstimation of immune cell infiltration abundance (M2 macrophages, CD8+ T cells, neutrophils, NK cells, etc.) in LUAD samples; correlation with candidate gene expression
Other ToolsMicrosoft Office/LaTeX-Manuscript preparation, figure assembly, and table formatting; statistical result compilation

Reprints and Permissions

Request permission to reuse the text or figures of this JoVE article

Request Permission

Tags

Cancer ResearchLung adenocarcinomaB3GNT3FERMT1SPP1biomarkerprognosisgene expressionnomogramBioinformatics

Related Articles