$$\rightleftharpoonup{xx}$$
$$\longleftharp{xx}$$,
$$\longrightharp{xx}$$,
Предварительные данные qRT-PCR свидетельствуют о том, что мутант EWS/FLI под названием DAF со специфическими мутациями тирозина в аланин в повторяющейся и неупорядоченной области EWS сохранял способность активировать гены-мишени EWS/FLI, но не смог подавить критические гены-мишени23. Чтобы лучше понять взаимосвязь между этими остатками в домене EWS и функцией EWS/FLI, был использован протокол, описанный выше и описанный на рисунке 1. A673 Клетки саркомы Юинга были вирусно трансдуцированы шРНК, нацеленной на 3'UTR FLI1,что привело к истощению эндогенного EWS / FLI. После четырех дней отбора функция EWS/FLI была спасена с помощью вирусной трансдукции различных мутантных конструкций EWS/FLI с тегами 3XFLAG, с пустым вектором в качестве элемента управления без спасения. Нефункциональный мутант, не имеющий домена EWS, называемый Δ22, использовался в качестве отрицательного контроля, а EWS/FLI дикого типа, называемый wtEF, использовался в качестве положительного элемента управления(рисунок 2A). В качестве тестовой конструкции использовался DAF, хотя при желании можно использовать более одной тестовой конструкции. Клетки отбирали в течение дополнительных 10 дней, чтобы позволить конструктной экспрессии стабилизироваться, а затем собирали для РНК (со стадией удаления гДНК), белковых и колониеобразующих анализов. Были собраны четыре реплики, и на рисунке 2B-Dпоказаны репрезентативные qRT-PCR и западные пятна, показывающие эффективный нокдаун и спасение. Следует отметить, что DAF-спасенные клетки не смогли сформировать колонии, как показано на рисунке 2E,что свидетельствует о нарушении онкогенной трансформации.
После завершения реплицированной валидации и фенотипических анализов РНК была представлена в Институт геномной медицины в Национальной детской больнице для подготовки библиотеки и секвенирования следующего поколения с ~ 50 миллионами парных считываний 150 bp. Данные были возвращены в виде файлов fastq.gz. Низкокачественные чтения были вырезаны из этих файлов с помощью TrimGalore, а STAR использовался для выравнивания считываний с геномом человека hg19 и подсчета показаний на ген. hg19 использовался для целей совместимости с другими кураторскими наборами данных для EWS/FLI, используемыми в последующем анализе. Эти счетчики считывания были объединены в единую матрицу подсчета для всех выборок, первые 6 строк которой показаны на рисунке 3.
Первоначально подсчеты проводились через DESeq2 без пакетной нормализации, однако визуальный осмотр расстояния от образца до образца показал потенциальные смешанные эффекты пакетов, как показано красными стрелками на рисунке 4A. Это, вероятно, возникло из-за биологической изменчивости, вызванной прохождением клеток в культуре, и различий в обработке каждой партии. Нормализация пакетных эффектов была выполнена с помощью ComBat и обычно рекомендуется. Расстояния между выборкой и выборкой пакетных нормализованных данных показаны на рисунке 4B. После пакетной нормализации DESeq2 использовался для создания транскрипционных профилей для трех конструкций (wtEF, Δ22 и DAF) относительно базового уровня. Обратите внимание, что в то время как «родительские» клетки A673 (имитация нокдауна и имитация спасения, называемая здесь «iLuc») были включены в дифференциальный анализ, ссылкой для этого эксперимента являются клетки с EWS / FLI-истощенными, называемые ячейками iEF. Транскрипционный профиль может быть сгенерирован для эндогенного белка здесь путем сравнения образца iLuc с iEF, и это может представлять интерес для понимания того, как работает система спасения, но это не является целью этого конкретного анализа. Транскрипционные профили, генерируемые для мутантов, включают положительные (wtEF) и отрицательные (Δ22) элементы управления по отношению к iEF, так что они должны функционировать в качестве ориентиров для других мутантов. Это важно, так как положительный контроль в этом примере не полностью повторял функцию эндогенной EWS/FLI, как обсуждалось в других местах7,23.
Анализ главных компонентов (PCA) на рисунке 5 предполагает, что транскрипционный профиль DAF является промежуточным между wtEF и Δ22, подтверждая частичную функцию. Более того, иерархическая кластеризация 1000 наиболее изменчивых генов по образцам показала, что DAF не смог подавить гены-мишени EWS/FLI и лишь частично сохранил активность активации генов, как показано на рисунках 6A и S5. Анализ ToppGene показал, что классы генов, которые активирует DAF, функционально отличаются от тех МИШЕНЕЙ, активируемых EWS/FLI, где DAF не функционирует(рисунок 6B). Интересно, что функция активированных генов, спасенных wtEF, но не DAF, по-видимому, связана с транскрипционным контролем и регуляцией хроматина. Основываясь на результатах анализов формирования колоний, гены из этой подписи основного гена должны быть дополнительно проанализированы на предмет их роли в онкогенезе, опосредованном EWS / FLI. Важность EWS/FLI-опосредованной генной репрессии была ранее описана17.
Известно, что EWS/FLI обладает уникальным сродством связывания к GGAA-микроспутниковым повторяющимся элементам19,22,и что связывание на этих элементах приводит к последующей регуляции генов11,15,18,20,22. Эти микроспутники были охарактеризованы как связанные с активацией или репрессией, и либо проксимальные к (< 5 кб) СТШ, либо дистальные к (> 5 кб) КСС25. Кроме того, существуют EWS/FLI-регулируемые гены с высоким сродством (HA) ETS мотивами, близкими к TSS23. С целью дальнейшего анализа характеристик функции DAF и того, какие типы генов, активированных EWS/FLI, DAF смог спасти, была проанализирована дифференциальная экспрессия генов, связанных с этими различными классами. Интересно, что DAF был наиболее способен спасти гены, активированные GGAA-микроспутником, но не смог спасти активированные гены вблизи участка ГК, как показано на рисунке 7. Как видно из иерархической кластеризации, DAF не может спасти репрессии, опосредованные EWS / FLI, во всех классах мотивов. Эти данные свидетельствуют о том, что DAF сохраняет достаточные структурные особенности EWS для связывания и активации с GGAA-микроспутниками, как проксимальными, так и дистальными к TSS. Это, вероятно, возникает из-за неповрежденного домена SYGQ, который считается важным для активности EWS / FLI при повторах GGAA11. Эти данные также свидетельствуют о том, что специфические тирозины, мутировавшие в DAF, играют важную, но плохо изученную роль в регуляции генов, опосредованной EWS / FLI с сайтов HA, а также в репрессии генов, что подчеркивает важную область дальнейшего исследования.

Рисунок 1: Рабочий процесс. Описание пошаговой процедуры выполнения сопоставления структуры-функции с помощью транскриптомики. Ячейки были впервые подготовлены для выражения набора конструкций, необходимых для отображения структуры-функции. После экспрессии клетки собирали для РНК и белка и анализировали на коррелятивные фенотипы. Экспрессия конструкций была проверена, и этот процесс повторялся 3-4 раза для сбора независимых биологических реплик. Затем РНК была представлена для секвенирования следующего поколения (NGS). Когда данные были получены, данные были обрезаны по качеству, выровнены, и было рассчитано количество на расшифровку. Контролировались пакетные эффекты, а транскриптомные сигнатуры и дифференциальная экспрессия определялись с помощью DESeq2. Может быть включена иерархическая кластеризация и последующий анализ, интегрирующий другие наборы данных -omics и различный путь или функциональный анализ. Пожалуйста, нажмите здесь, чтобы просмотреть увеличенную версию этого рисунка.

Рисунок 2: Валидация выражения конструкций и корреляционных анализов. (A) Схема, изображающая конструкции, протестированные в этом примере. (B) Валидация нокдауна эндогенного EWS/FLI и экспрессии 3X-FLAG-помеченных конструкций иммуноблотом. (С,D) Валидация конструктивной активности в активированном гене-мишени EWS/FLI(C) NR0B1и(D)репрессированном гене-мишени TGFBR2с помощью qRT-PCR. Данные представлены в виде среднего +/- стандартного отклонения. P-значения были рассчитаны с помощью теста честной значимости Туки. * p < 0,05, ** p < 0,01, *** p < 0,005 (E) Подсчет колоний из анализов мягкого агара, выполненных для оценки преобразующей активности конструкций. P-значения были рассчитаны с помощью теста честной значимости Туки. * p < 0,05, ** p < 0,01, *** p < 0,005. Этот рисунок адаптирован из Theisen, et al.23Пожалуйста, нажмите здесь, чтобы просмотреть увеличенную версию этого рисунка.

Рисунок 3: Окончательные сопоставленные данные подсчета для анализа. Снимок экрана: первые 6 строк файла подсчета с подсчетом генов для всех образцов, подлежащих периодической нормализации и анализу. Пожалуйста, нажмите здесь, чтобы просмотреть увеличенную версию этого рисунка.

Рисунок 4: Тепловые карты расстояний от образца до образца. (A) График расстояния от образца до образца, показывающий кластеризацию выборки необработанных данных подсчета. Образцы, которые группируются как по партиям, так и по образцам, обозначаются красными стрелками. (B)График расстояния от образца до образца после пакетной нормализации с помощью ComBat. Здесь образцы из всех реплицируются вместе, независимо от пакета. Пожалуйста, нажмите здесь, чтобы просмотреть увеличенную версию этого рисунка.

Рисунок 5: Результаты анализа дифференциальных выражений. (A)График принципиального компонентного анализа (PCA) транскриптомных сигнатур, сгенерированных для всех образцов, показывает сильную кластеризацию внутри выборки и демонстрирует, что DAF является промежуточным между положительным (wtEF) и отрицательным (Δ22) контролем. (B) Вулканические графики, показывающие -log(p-значение), построенные на основе log2FoldChange для генов в каждой конструкции. Гены с скорректированным p-значением < 0,05 и |log2(FoldChange)| > 1 считаются значительными и показаны красным цветом. Панель 5B адаптирована из Theisen, et al.23Пожалуйста, нажмите здесь, чтобы просмотреть увеличенную версию этого рисунка.

Рисунок 6: Иерархическая кластеризация для идентификации классов генов. Иерархическаякластеризация 1000 наиболее изменчивых генов во всех конструкциях и базовая линия, iEF, показывает, что DAF частично спасает активацию генов, опосредованную EWS / FLI. (B)Генная онтология (молекулярная функция) результаты ToppGene показывают функциональное обогащение генов, активированных EWS / FLI, которые либо спасены, либо не спасены DAF. Панель 6B адаптирована из Theisen, et al.23Пожалуйста, нажмите здесь, чтобы просмотреть увеличенную версию этого рисунка.

Рисунок 7: Подробный анализ различных элементов реакции фактора транскрипции на различные конструкции: (A) Схема, изображающая обработку данных, используемую для создания панелей (B) и (C) путем включения других доступных наборов данных с транскриптомными профилями здесь. (В,В) Компиляция, показывающая спасение различных классов прямых EWS/FLI-(B) активированных и(C)подавленных целей. Включенные гены были только генами с обнаруживаемой дифференциальной экспрессией эндогенной EWS/FLI. На каждой круговой диаграмме серым цветом изображена часть генов, которые не спасены конструкцией. Красным цветом изображена часть генов, которые дифференциально активированы, а синим — часть генов, которые дифференциально подавлены. Этот рисунок адаптирован из Theisen, et al.23Пожалуйста, нажмите здесь, чтобы просмотреть увеличенную версию этого рисунка.
Рисунок S1: Загрузка файлов fastq.gz в среду HPC, обрезка и выравнивание. Пожалуйста, нажмите здесь, чтобы загрузить этот рисунок.
Рисунок S2: Сопоставление количества считываний между выборками и выполнение пакетной нормализации с помощью ComBat. Пожалуйста, нажмите здесь, чтобы загрузить этот рисунок.
Рисунок S3: Запуск DESeq2 и извлечение результатов дифференциального анализа выражений. Пожалуйста, нажмите здесь, чтобы загрузить этот рисунок.
Рисунок S4: Анализ выходных данных. Пожалуйста, нажмите здесь, чтобы загрузить этот рисунок.
Рисунок S5: Иерархическая кластеризация для идентификации классов генов: Иерархическая кластеризация 1000 наиболее изменчивых генов во всех конструкциях и базовая линия, iEF, отсортированная по k кластерам. В данном случае k=7, но этот параметр задается пользователем, как показано на рисунке S4D. Пожалуйста, нажмите здесь, чтобы загрузить этот рисунок.
Таблица S1: Список генов (идентификатор гена Ensembl) с кластерной аннотацией. Пожалуйста, нажмите здесь, чтобы загрузить эту таблицу.