Waiting
Login processing...

Trial ends in Request Full Access Tell Your Colleague About Jove
Click here for the English version

Biology

Выравнивание синхронизированных данных временных рядов с использованием характеризирующей модели синхронизации клеточного цикла для перекрестных сравнений

Published: June 9, 2023 doi: 10.3791/65466

Summary

Одна из проблем анализа синхронизированных экспериментов с временными рядами заключается в том, что эксперименты часто различаются по продолжительности восстановления после синхронности и периоду клеточного цикла. Таким образом, измерения из разных экспериментов не могут быть проанализированы в совокупности или легко сравниваться. Здесь мы описываем метод выравнивания экспериментов, позволяющий проводить фазовые сравнения.

Abstract

Исследование клеточного цикла часто зависит от синхронизации клеточных популяций для измерения различных параметров во временном ряду, когда клетки пересекают клеточный цикл. Однако даже в аналогичных условиях повторные эксперименты демонстрируют различия во времени, необходимом для восстановления после синхронности и прохождения клеточного цикла, что предотвращает прямые сравнения в каждый момент времени. Проблема сравнения динамических измерений в экспериментах усугубляется в мутантных популяциях или в альтернативных условиях роста, которые влияют на время восстановления синхронности и/или период клеточного цикла.

Ранее мы опубликовали параметрическую математическую модель под названием «Характеристика потери синхронизации клеточного цикла» (CLOCCS), которая отслеживает, как синхронные популяции клеток высвобождаются из синхронности и прогрессируют в клеточном цикле. Полученные параметры из модели затем могут быть использованы для преобразования экспериментальных точек времени из синхронизированных экспериментов с временными рядами в нормализованную шкалу времени (точки линии жизни). Вместо того, чтобы представлять время, прошедшее в минутах от начала эксперимента, шкала линии жизни представляет собой прогрессию от синхронности до входа в клеточный цикл, а затем через фазы клеточного цикла. Поскольку точки линии жизни соответствуют фазе средней клетки в синхронизированной популяции, эта нормализованная временная шкала позволяет проводить прямые сравнения между экспериментами, в том числе с различными периодами и временем восстановления. Кроме того, модель использовалась для согласования экспериментов по клеточному циклу между различными видами (например, Saccharomyces cerevisiae и Schizosaccharomyces pombe), что позволяет проводить прямое сравнение измерений клеточного цикла, что может выявить эволюционные сходства и различия.

Introduction

Измерения временных рядов, выполненные на синхронизированных популяциях клеток по мере их продвижения по клеточному циклу, являются стандартным методом исследования механизмов, контролирующих прогрессию клеточного цикла 1,2,3,4,5,6,7,8 . Возможность проводить сравнения между экспериментами по синхронизации/выпуску временных рядов жизненно важна для нашего понимания этих динамических процессов. Использование повторных экспериментов для подтверждения результатов может повысить уверенность в воспроизводимости выводов. Кроме того, сравнения между условиями окружающей среды, между мутантами и даже между видами могут раскрыть много новых идей о регуляции клеточного цикла. Однако межэкспериментальная вариабельность восстановления после синхронности и скорости прогрессирования клеточного цикла ухудшает способность проводить сравнения от момента времени к моменту времени между репликами или между экспериментами с измененным временем клеточного цикла. Из-за этих проблем реплики часто не включаются в полные временные ряды (например, Spellman et al.4). Когда собираются реплики для всех временных рядов, данные не могут быть проанализированы в совокупности, а для анализа используется одна реплика, а другие реплики часто сводятся к дополнительным цифрам (например, Orlando et al.8). Кроме того, трудно сравнивать эксперименты с различными характеристиками восстановления или прогрессирования клеточного цикла. Измерения меньших интервалов между интересующим событием и ориентиром клеточного цикла (например, появлением почек, вступлением в S-фазу или началом анафазы) могут помочь уменьшить количество ошибок, если эти знаковые события отслеживаются 1,2,3,9,10,11,12. Однако тонкие, но важные различия могут остаться незамеченными или скрытыми при использовании этих специальных методов. Наконец, одноклеточный анализ позволяет анализировать прогрессирование клеточного цикла, не полагаясь на синхронизацию или выравнивание13, хотя крупномасштабные измерения в одноклеточных исследованиях могут быть сложными и дорогостоящими.

Чтобы преодолеть эти трудности, мы разработали модель «Характеристика потери синхронизации клеточного цикла» (CLOCCS), чтобы помочь в анализе измерений временных рядов, сделанных на синхронизированных популяциях14,15. CLOCCS — это гибкая математическая модель, которая описывает распределение синхронизированных клеток по фазам клеточного цикла по мере того, как они освобождаются от синхронности и продвигаются по клеточному циклу. Структура процесса ветвления позволяет модели учитывать асимметричные качества материнских и дочерних клеток после деления, как это наблюдается у S. cerevisiae, но при этом по-прежнему полезна для организмов, которые делятся путем деления, таких как S. pombe. Модель может принимать входные данные из различных типов измерений для определения фазы клеточного цикла. Он может принимать данные фазы почкования, которые включают измерения процента отпочковавшихся клеток с течением времени, что позволяет оценить количество клеток за пределами фазы G114,15. Модель также может принимать проточные цитометрические данные, которые измеряют содержание ДНК, что позволяет оценить ориентировочные переходы от G1 к S, от S к G2 и от M к G115. Флуоресцентные морфологические маркеры также могут быть использованы для идентификации фазы клеточного цикла. Флуоресцентная маркировка миозиновых колец, ядер и тел веретенообразных полюсов (SPB) может быть использована для определения фазы клеточного цикла, и они были включены в модельCLOCCS 11; Однако эти измерения не будут описаны в этом протоколе. Кроме того, индекс септации использовался в качестве входных данных для моделирования данных из S. pombe14. Таким образом, модель может быть использована для анализа клеточного цикла в различных организмах и может быть дополнительно расширена.

CLOCCS - это параметрическая модель, которая позволяет сделать полный байесовский вывод о нескольких параметрах из входных данных (например, процент почкования, содержание ДНК). Эти параметры включают время восстановления после синхронии, продолжительность периода клеточного цикла (оценивается отдельно для материнских и дочерних клеток) и среднее положение клеток в клеточном цикле в каждый момент времени. Эти параметры представляют собой поведение средней клетки в популяции, что позволяет исследователю сопоставлять каждую временную точку с положением клеточного цикла, выраженным в виде точки спасательного круга. Преобразование в точки линии жизни зависит от параметров CLOCCS лямбда (λ) и mu0 (μ0)14,15. Параметр λ соответствует среднему периоду клеточного цикла материнских клеток. Однако из-за задержки мать-дочь14,15 это не средний период клеточного цикла всей популяции, включающий как материнские, так и дочерние клетки. CLOCCS дополнительно выводит параметр дельта (δ), который соответствует задержке матери и дочери и, таким образом, позволяет рассчитать средний период клеточного цикла всей популяции. Наконец, поскольку каждый эксперимент начинается после освобождения от синхронизации клеточного цикла, время, необходимое для восстановления после метода синхронизации, представлено параметром CLOCCS μ0. CLOCCS подгоняет модель под входные данные о фазе клеточного цикла, а затем выводит эти параметры с помощью алгоритма Монте-Карло со случайным блужданием цепи Маркова14,15. Сопоставляя несколько экспериментов с общей шкалой времени жизненного цикла клетки, можно проводить прямые фазовые сравнения между репликами или экспериментами, в которых время восстановления или периоды клеточного цикла не идентичны 8,14,15.

Поскольку синхронизированные популяции теряют синхронность с некоторой скоростью в течение временных рядов14,15,16,17, изменчивость скорости потери синхронности также может препятствовать количественным сравнениям между экспериментами. Определяя местоположение популяций и дисперсию в их распределении, CLOCCS учитывает различия в показателях потери синхронности. Этот мощный инструмент позволяет проводить конкретные и подробные сравнения между экспериментами, тем самым предоставляя возможность напрямую проводить релевантные сравнения не только между репликами, но и между условиями окружающей среды, мутантами и даже видами, которые имеют совершенно разные сроки клеточного цикла14,15.

В этой статье описывается метод, использующий CLOCCS для оценки параметров путем подгонки данных из экспериментов с синхронными временными рядами / выпуском, сопоставления данных с общей шкалой жизненного цикла, а затем проведения соответствующих сравнений между репликами или экспериментами. Выравнивание линии жизни позволяет проводить прямые фазовые сравнения в этих экспериментах, что позволяет агрегировать и сравнивать репликации, а также проводить более релевантные сравнения между экспериментами с разными сроками восстановления и периодами клеточного цикла.

Subscription Required. Please recommend JoVE to your librarian.

Protocol

1. Сбор фазы клеточного цикла и экспериментальных данных

  1. Синхронизируйте клетки по отношению к клеточному циклу, используя желаемый метод синхронизации (например, центробежную элютриацию, как описано в Leman et al.18, или остановку феромонов спаривания, как описано в Rosebrock 19; как Leman et al.18, так и Rosebrock 19 также включают способы высвобождения из синхронии). Начните отбор проб по всему временному ряду, убедившись, что временной ряд имеет длину не менее двух полных периодов клеточного цикла, и, в оптимальном варианте, соберите не менее 10 образцов за клеточный цикл. В каждый момент времени соберите образец для данных о фазе клеточного цикла (почкование или проточная цитометрия) и образец для экспериментальных данных, как описано ниже.
  2. Если вы используете данные о почковании в качестве данных о фазе клеточного цикла, соберите данные о почковании для выравнивания CLOCCS.
    1. Выборка по всему временному ряду. Для каждого момента времени собирайте клетки и фиксируйте их, смешивая 200 мкл ультразвуковой культуры клеток с 200 мкл фиксирующего раствора, как описано в Leman et al.18.
    2. Для стандартного почкования подсчитывайте не менее 200 клеток в каждый момент времени с помощью микроскопа с проходящим светом с 40-кратным объективом и гемоцитометра. Добавьте образец клеток из шага 1.2.1 в гемоцитометр и разбавьте, если плотность препятствует подсчету. Запишите количество отпочковавшихся и нераспустившихся клеток в каждый момент времени. Рассчитайте процент распустившихся ячеек и постройте график для каждого момента времени на кривой почкования.
      ПРИМЕЧАНИЕ: Существуют и другие методы уточнения информации о фазе клеточного цикла, но они не описаны в данном протоколе. Другие методы описаны в файле readme CLOCCS и в предыдущей работе11.
  3. При использовании данных о содержании проточной цитометрической ДНК в качестве данных о фазе клеточного цикла соберите данные окрашивания ДНК проточной цитометрии для выравнивания проточного цитометрического CLOCCS.
    1. Выборка по всему временному ряду. Для каждого момента времени соберите ячейки и исправьте их, как описано в Haase and Reed20.
    2. Окрашивают ДНК и анализируют с помощью стандартного проточного цитометрического анализа. Рекомендуемый протокол окрашивания для S. cerevisiae описан в Haase and Reed20.
  4. Соберите связанные омиксы или связанные экспериментальные данные. Стандартные транскриптомные данные собирают, как описано в Leman et al.18 и Kelliher et al.21,22. Убедитесь, что данные связаны с точками времени, содержащими данные о фазе клеточного цикла, чтобы обеспечить выравнивание по течению. Для оптимального выравнивания убедитесь, что каждый момент времени, содержащий экспериментальные данные, также имеет связанные с ним фазовые данные.
    ПРИМЕЧАНИЕ: Экспериментальные данные могут принимать различные формы. Традиционно мы используем метод выравнивания, описанный для выравнивания транскриптомных экспериментов временных рядов. Однако любой тип данных, связанных с временными точками, может быть выровнен (т. е. протеомика22).

2. Установка необходимого программного обеспечения

ПРИМЕЧАНИЕ: В этом разделе предполагается, что Conda, Java 19 и Git уже установлены (Таблица материалов).

  1. Загрузите репозиторий CLOCCS_alignment, введя в терминал следующую команду:
    git clone git clone https://gitlab.com/haase-lab-group/cloccs_alignment.git
  2. Создайте среду Conda с помощью файла conda_req.yml, введя следующую команду в терминал в папке, где был клонирован репозиторий CLOCCS_alignment:
    conda env create -f conda_req.yml

3. Использование CLOCCS для параметризации экспериментов

  1. Дважды щелкните файл cloccs_v2023.jar в папке CLOCCS в репозитории CLOCCS_alignment и дождитесь открытия графического интерфейса пользователя. Этот экран позволяет вводить параметры для запуска CLOCCS и отображает результаты после запуска.
  2. Введите общие настройки.
    1. Установите Sim Anneal, Burn In и Iterations , введя текст в соответствующие поля ввода текста. Sim Anneal (имитация отжига) определяет хорошие значения начальных параметров, Burn In ищет апостериорные моды, а заключительный этап позволяет сделать все апостериорные выводы. Более высокие значения увеличивают время выполнения, но также повышают точность.
    2. Введите условия эксперимента, указав температуру в градусах Цельсия и метод синхронизации с помощью текстового поля « Температура » и раскрывающегося меню «Синхронизация». Метод, соответственно.
    3. При необходимости настройте дополнительные параметры в меню «Дополнительные параметры». Расширенные настройки позволяют установить априоры для каждого из параметров («mu0», «sigma0», «sigmav», «lambda», «bud.start», «bud.end»).
      ПРИМЕЧАНИЕ: Более подробную информацию о дополнительных настройках можно найти в файле readme.txt в папке CLOCCS репозитория CLOCCS_alignment.
  3. Введите параметры для использования с подающими надежды данными.
    1. Выберите подходящий вариант из выпадающего меню « Тип модели ». Параметр по умолчанию «Бутон» предназначен для стандартной информации о почковании дрожжей.
      ПРИМЕЧАНИЕ: Другие более продвинутые параметры также существуют в выпадающем меню: Mutant для информации о почковании для мутантов, которые проходят несколько циклов почкования без деления, BudSSLSMR для информации о почковании и дополнительной информации о полюсе веретена и информации о кольцах миозина, а также BudNucDivNeck для информации о почковании и дополнительной информации о делении и ядре шейки почки. Эти расширенные параметры описаны в файле readme CLOCCS и в предыдущей работе11,14,15.
    2. Импортируйте данные с помощью панели «Импорт данных », введя текст в поля ввода текста или загрузив файл, нажав кнопку « Выбрать файл ». В первом столбце указываются моменты времени. В оставшихся двух столбцах указываются данные о почковании, и могут быть выбраны любые из следующих параметров: количество нераспустившихся ячеек (No Bud), количество отпочковавшихся ячеек (Bud) или общее количество ячеек (Total).
  4. Введите настройки для использования с проточными цитометрическими данными. Для каждого эксперимента выполните шаг 3.3 или 3.4.
    ПРИМЕЧАНИЕ: Проточные цитометрические данные и данные почкования можно использовать вместе. Хотя ранее мы описали их совместноевыполнение 15, для этого инструмента они должны быть запущены независимо друг от друга, а затем сравнены.
    1. Преобразуйте файлы .fcs в правильный входной формат CLOCCS для проточной цитометрии, следуя инструкциям в дополнительном файле 1 (также находится в репозитории CLOCCS_alignment как CLOCCS/flow_cytometry_conversion_instructions.txt).
    2. Выберите пункт «Поток» в раскрывающемся меню «Тип модели».
    3. Импортируйте данные с помощью панели «Импорт данных». Нажмите « Выбрать файл» и выберите файл, созданный на шаге 3.4.1.
    4. Выберите моменты времени, для которых должна быть построена проточная цитометрическая подгонка CLOCCS, выбрав моменты времени в поле «Время для примерки ».
  5. После того, как все входные данные будут выбраны для почкования или проточной цитометрии, нажмите кнопку «Применить », а затем нажмите кнопку «Образец » в верхней части экрана.
  6. Просмотрите кривую почкования или графики проточной цитометрии с прогнозируемыми соответствиями, выбрав вкладку «Прогнозируемые посадки ». Эта вкладка открывается по умолчанию сразу после предыдущего шага.
  7. Просмотрите гистограммы параметров для каждого параметра, выбрав вкладку «Гистограммы параметров », а затем выбрав вложенную вкладку, соответствующую интересующему параметру, из следующих вариантов: mu0, delta, sigma0, sigmav, lambda, bud.start, bud.end и т. д.
  8. Просмотрите график апостериорной оценки, выбрав вкладку «Задняя оценка ».
  9. Просмотрите настройки и измените их, выбрав вкладку « Настройки »; просмотреть журнал предыдущих запусков, выбрав вкладку Журнал .
  10. Получите параметры CLOCCS из подгонки, выбрав вкладку «Задние параметры ». Результирующая таблица будет иметь следующий вид: каждая строка состоит из параметра, причем последняя строка является апостериорной. Столбцы состоят из прогнозируемого параметра для среднего значения, нижнего доверительного интервала 2,5%, верхнего доверительного интервала 97,5% и коэффициента принятия.
    1. Запишите параметры, используемые для выравнивания для каждого эксперимента: время восстановления после синхронии (μ0) и средний период клеточного цикла материнских клеток (λ).
    2. Рассчитайте период клеточного цикла, вычислив среднее значение периода материнской клетки (λ) и периода дочерней клетки (λ + δ), где δзадержка, специфичная для дочерней клетки.
      ПРИМЕЧАНИЕ: Повторите раздел 3 со всеми экспериментами, которые будут включены в сравнения.

4. Преобразование точек времени в точки жизни с помощью функций преобразования Python и параметров CLOCCS

ПРИМЕЧАНИЕ: Для преобразования между точками времени и точками линии жизни требуются две формулыпреобразования 21. Реализация Python для преобразования и визуализации данных доступна в репозитории CLOCCS_alignment и описана ниже.

  1. Активируйте среду Conda, введя в терминал следующую команду: conda activate CLOCCS_alignment
  2. Откройте интерактивную записную книжку Python, введя в терминале следующую команду: jupyter notebook
  3. Создайте новую записную книжку Python в нужной папке.
    ПРИМЕЧАНИЕ: Пример записной книжки был включен для демонстрации стандартного использования и может быть найден в Alignment/JOVE_example.ipynb в репозитории выравнивания CLOCCS_.
  4. Импортируйте файл Python, содержащий функции выравнивания, выполнив следующую команду в первой ячейке:
    %run path_to_repo/cloccs_alignment/Alignment/utilities.py
    1. Замените путь к CLOCCS_alignment репозиторию на path_to_repo.
  5. При использовании данных о почковании в качестве данных фазы клеточного цикла импортируйте кадр данных, содержащий процент почкований в каждый момент времени, выполнив следующую команду в новой ячейке:
    budding_df = pd.read_csv("path_to_folder/budding_filename.tsv", sep ="\t", index_col=0)
    1. Подставьте соответствующий путь к файлу и имя файла. Если файл является файлом .csv, удалите sep ="\t"
  6. Если вы используете данные о почковании в качестве данных фазы клеточного цикла, выровняйте данные почкования по шкале времени точки жизни, введя следующую функцию в новую ячейку:
    aligned_budding_df = df_conversion_from_parameters(budding_df, временные точки, param_mu0, param_lambda)
    1. Для временных точек замените список временных точек, которые будут индексом budding_df кадра данных.
    2. Для param_mu0 и param_lambda замените эксперимент изученными параметрами из многообещающего запуска CLOCCS в разделе 3.
  7. При использовании данных проточной цитометрии импортируйте данные проточной цитометрии, выполнив следующую команду в новой ячейке:
    flow_samples = flow_cytometry_import(flow_input_folder)
    1. Для flow_input_folder подставьте соответствующий путь к папке, содержащей FCS-файлы проточной цитометрии.
  8. При использовании данных проточной цитометрии создайте таблицу преобразования между точками времени и точками линии жизни для каждого эксперимента, введя следующую команду в новую ячейку:
    flow_converter = convert_tp_to_ll(временные точки, param_mu0, param_lambda)
    1. Вместо временных точек замените список временных точек из данных проточной цитометрии.
    2. Для param_mu0 и param_lambda замените эксперимент изученными параметрами проточной цитометрии, выполненной CLOCCS в разделе 3.
  9. Импортируйте кадр данных, содержащий экспериментальные данные, в записную книжку, выполнив следующую команду в новой ячейке:
    data_df = pd.read_csv("path_to_folder/exp_data_filename.tsv", sep ="\t", index_col=0)
    1. Подставьте соответствующий путь к файлу и имя файла. Если файл является .csv файлом, удалите sep = "\t".
      ПРИМЕЧАНИЕ: Это можно сделать для любых табличных данных. Экспериментальные данные должны просто иметь временные точки в виде столбцов или индекса фрейма данных. Примеры данных можно найти в репозитории CLOCCS_alignment.
  10. Выровняйте экспериментальные данные по шкале времени точки жизни, введя следующую функцию в новую ячейку:
    lifeline_aligned_df = df_conversion_from_parameters(data_df, временные точки, param_mu0, param_lambda, интерполяция, нижняя часть, верхняя часть)
    1. Для временных точек замените список временных точек в качестве индекса или столбцов экспериментального data_df из предыдущего шага.
    2. Вместо param_mu0 и param_lambda заменить значения, полученные в разделе 3 из CLOCCS.
      ПРИМЕЧАНИЕ: Параметры могут быть получены из любого запуска CLOCCS, выполненного для любого из принятых типов данных фазы клеточного цикла.
    3. При необходимости замените интерполяцию на True или False или оставьте поле пустым (по умолчанию — False).
      ПРИМЕЧАНИЕ: Если задано значение False, данные не будут интерполироваться. Если задано значение True, точки линии жизни будут округлены и интерполированы, чтобы заполнить значения между точками линии жизни, так что в диапазоне точек линии жизни есть точка на целое число. Это позволяет лучше сравнивать наборы данных.
    4. При необходимости замените lowerll и upperll на None или целочисленные значения.
      ПРИМЕЧАНИЕ: Если задано значение «Нет», все точки линии жизни после интерполяции сохраняются. Когда указываются целые числа , данные усекаются так, что точки линии жизни варьируются от нижнего до верхнего. Это позволяет сравнивать наборы данных с разными нижними или верхними слоями.
  11. Загрузите набор данных, выровненный по линии жизни, введя следующую команду в новую ячейку: lifeline_aligned_df.to_csv("path_to_desired_location/name_of_file.tsv", sep = "\t")
  12. Повторите шаги 4.5-4.11 со всеми экспериментами, которые будут включены в сравнения.

5. Сравнение кривых почкования и данных проточной цитометрии

  1. Постройте почкующиеся кривые перед выравниванием с помощью функции служебных программ Python, введя следующую команду в новую ячейку:
    plot_budding_curves(list_of_budding_curves, list_for_legend = leg_list, point_type = str_type, title = str_title)
    1. Подставьте список, содержащий кадры данных всех желаемых кривых почку, для построения графика для list_of_budding_curves-[bud_df1, bud_df2, bud_df3].
    2. При желании замените список меток на условные обозначения - [Эксперимент 1, Эксперимент 2, Мутант] на leg_list. Если нет, исключите или замените Нет.
    3. Замените время на str_type.
    4. При необходимости замените str_title строковым заголовком Comparison Budding Curves . Если нет, замените Нет или исключите.
  2. Постройте кривые почкования после выравнивания с помощью функции служебных программ Python, следуя инструкциям на шаге 5.1, но со списком выровненных кривых, замененных на list_of_budding_curves, и с линией жизни вместо point_type вместо времени.
  3. Чтобы построить график данных проточной цитометрии, нанесите связанные данные из файлов .fcs в соответствующие точки линии жизни с помощью преобразователя, созданного на шаге 4.8.
  4. Преобразуйте точки линии жизни в фазу клеточного цикла с помощью таблицы преобразователя (таблица 1).
    ПРИМЕЧАНИЕ: Это также можно построить, следуя инструкциям в шаге 5.1, но с фазой для point_type вместо времени.

6. Сравнение экспериментальных данных

  1. Определите список генов, который будет нанесен на линейные графики, на основе литературной информации или генов, представляющих интерес для исследования.
  2. Используйте предоставленный plot_linegraph_comparison в файле служебных программ Python для выполнения сравнения линейных графиков с исходным, выровненным или выровненным и интерполированным кадром данных, введя следующую команду в новую ячейку:
    plot_linegraph_comparison(list_of_dfs, list_for_legend, genelist, point_type = str_type, title = str_title)
    1. Подставьте список кадров данных экспериментов, подлежащих сравнению, на list_of_dfs.
      ПРИМЕЧАНИЕ: Кадры данных могут быть невыровнены или выровнены; Однако соответствующие point_type должны быть введены на шаге 6.2.4.
    2. Замените список заголовков для каждого кадра данных в том же порядке, что и список кадров данных для list_for_legend.
    3. Замените список имен генов (которые должны быть включены в индекс кадров данных), которые будут нанесены на график для genelist.
    4. Замените тип точки на str_type. Используйте линию жизни (по умолчанию — шкала точки линии жизни) или фазу (шкала линии жизни фазы ячейки) для выровненных кадров данных на шаге 6.2.1 или время для невыровненных кадров данных на шаге 6.2.1.
    5. Замените str_title необязательным строковым заголовком.
  3. Определите список генов, которые будут включены в тепловую карту, используя литературу или алгоритмы для определения верхних периодических генов.
    ПРИМЕЧАНИЕ: Для правильного сравнения тепловых карт данные должны быть выровнены, интерполированы и скорректированы по временной шкале на шаге 6.2; Он должен иметь одинаковое начальное и конечное значение линии жизни для каждого эксперимента.
    1. Запустите алгоритмы периодичности для определения верхних периодических генов23,24 или используйте желаемые альтернативные методы для определения списка генов (т.е. результаты литературы).
    2. Импортируйте файл списка генов .csv или .tsv в записную книжку с помощью следующей команды в новой ячейке:
      sort_df = pd.read_csv("path_to_folder/sorting_filename.tsv", sep="\t", index_col=0)
    3. Подставьте соответствующий путь к файлу и имя файла. Если файл является файлом .csv, удалите sep="\t".
  4. Используйте предоставленную функцию plot_heatmap_comparison в файле служебных программ Python, чтобы выполнить сравнение тепловой карты на выровненном, интерполированном и выровненном по фазам кадре данных, введя следующую команду в новую ячейку:
    plot_heatmap_comparison(list_of_dfs, list_for_legend, genelist, title = str_title)
    1. Замените list_of_dfs списком выровненных кадров данных сравниваемых экспериментов.
    2. Замените список заголовков для каждого кадра данных в том же порядке, что и список кадров данных для list_for_legend.
    3. Замените список имен генов (которые должны быть включены в индекс кадров данных), которые будут нанесены на график для genelist.
    4. Замените str_title необязательным строковым заголовком.
      ПРИМЕЧАНИЕ: Первый кадр данных в списке - это тот, который будет использоваться для упорядочивания генов на тепловой карте. Гены будут упорядочены по максимуму в первом периоде для этого кадра данных, и тот же порядок будет использоваться для последующих кадров данных в списке.

Subscription Required. Please recommend JoVE to your librarian.

Representative Results

Этапы, описанные в приведенном выше протоколе и в рабочем процессе на рисунке 1 , были применены к пяти экспериментам с синхронизированными временными рядами с клеточным циклом, чтобы продемонстрировать два репрезентативных сравнения: между репликациями с различными методами синхронизации (спаривание феромона и центробежная элютриация18) и платформами секвенирования (секвенирование РНК [RNA-seq] и микрочип), а также в экспериментальных условиях. Было проведено несколько экспериментов с S. cerevisiae, и для каждого эксперимента были собраны фазы клеточного цикла и экспериментальные данные. Рабочий процесс включает в себя использование CLOCCS для параметризации различных экспериментов с синхронизацией/выпуском временных рядов, использование этих параметров для согласования экспериментов с общей сопоставимой шкалой спасательного круга, а затем использование этих выровненных экспериментов для двух репрезентативных сравнений.

Чтобы продемонстрировать репрезентативное сравнение реплик, мы выбрали три эксперимента, выполненных с одним и тем же штаммом и в одних и тех же экспериментальных условиях, называемых условием 1. Два из этих экспериментов были прямыми копиями друг друга, и оба были проанализированы с помощью анализа микрочипов и синхронизированы с помощью центробежной элютриации. Третий эксперимент был проанализирован с использованием анализа РНК-секвенирования и синхронизирован с помощью остановки феромонов при спаривании альфа-фактора. Чтобы продемонстрировать второе сравнение экспериментов с различными периодами клеточного цикла, эксперимент с РНК-секвенированием условия 1 (период клеточного цикла: 71 мин) сверху сравнивали с условием 2 (период клеточного цикла: 82 мин) и условием 3 (период клеточного цикла: 110 мин) (таблица 2). Для каждого эксперимента клетки выращивали в соответствующих условиях, синхронизировали, высвобождали, а затем отбирали образцы в течение двух или более периодов клеточного цикла. Данные почки и/или проточной цитометрии были собраны для получения информации о фазе клеточного цикла, а также были собраны транскриптомные данные либо микрочипов, либо транскриптомов временных рядов РНК-секвенирования, как описано в Leman et al.18 (Дополнительная таблица S1).

Для каждого эксперимента данные приняли формы, описанные на рисунке 2, где эксперимент с условием 2 представлен в качестве примера для демонстрации. Каждый набор данных имел кривую почкования, которая позволяла сделать вывод о фазе клеточного цикла. Эта кривая включала в себя процентное значение для каждого момента времени во временном ряду, которое затем было построено для получения кривой почкования, отображающей несколько колебаний клеточного цикла (рис. 2). Данные о фазах клеточного цикла также принимали форму данных окрашивания проточного цитометрического содержания ДНК для каждого момента времени во временном ряду. Были нанесены выбранные моменты времени для условия 2 (рис. 2). Файлы проточной цитометрии были объединены в единую таблицу, содержащую клетки в каждом логарифмическом бункере флуоресценции для каждого момента времени для ввода в CLOCCS с использованием функции flow_cytometry_CLOCCS_file_from_fcs в утилитах Python. Каждый набор данных также содержал экспериментальные данные. В этом случае данные представляли собой транскриптомные данные, и данные были организованы в ряды генов, каждый из которых имел значение для обилия РНК в каждый момент времени в эксперименте (рис. 2).

Мы продемонстрировали использование CLOCCS и преобразование в точки жизнестойкости для набора данных РНК-секвенирования состояния 2; Однако процесс был идентичен и для других экспериментов. Информация о побуждениях была введена в алгоритм CLOCCS, как описано в разделе протокола 3 и показано на рисунке 3A. Использовались значения по умолчанию для Sim Anneal, Burn In, Itations и Advanced Settings. Были выбраны соответствующие условия эксперимента. Для данных о почковании был использован тип модели «Bud». Результирующие подгонки почек CLOCCS были просмотрены, чтобы убедиться, что кривые почкования были правильно подогнаны, о чем свидетельствуют точки данных, накладывающие соответствующую кривую подгонки с небольшой полосой достоверности 95% (рис. 3B и дополнительный рисунок S1). Параметры μ0 и λ из таблицы задних параметров (рис. 3C) были записаны для использования в выравнивании. Данные проточной цитометрии для состояния 2 были отдельно введены в CLOCCS, как описано в разделе протокола 3. В настоящее время CLOCCS ожидает, что проточные цитометры будут производить 10-битные данные с 1,024 каналами; Однако современные проточные цитометры могут иметь больше каналов. Поскольку наш проточный цитометр выдает данные с более чем 1,024 каналами, данные были объединены в 1,024 ячейки. Используя данные фазы клеточного цикла проточной цитометрии, CLOCCS создает CLOCCS, подходящий для каждого выбранного момента времени (рис. 3D и дополнительный рисунок S2), и предоставляет таблицу задних параметров, аналогичную таблице задних параметров почкований на рисунке 3C. Параметры почкования, которые CLOCCS выполняет для каждого из других экспериментов, описаны в таблице 2, а параметры проточной цитометрии, которую выполняет CLOCCS, описаны в дополнительной таблице S2.

Для выравнивания линии жизни использовались параметры CLOCCS, соответствующие периоду клеточного цикла материнских клеток (λ) и времени восстановления (μ0). Важно отметить, что λ не обязательно представляет собой средний период клеточного цикла клеточной популяции. В тех случаях, когда клетки подвергаются полному делению, существует равное количество материнских и дочерних клеток, поэтому средний период клеточного цикла является средним между периодом клеточного цикла материнских клеток (λ) и периодом клеточного цикла дочерних клеток (λ + δ); В частности, дельта (δ) - это длина дочерней задержки. Это расчет, который мы использовали для периода клеточного цикла для каждого эксперимента (таблица 2). Для каждого эксперимента соответствующие параметры λ и μ0 затем использовались в функции преобразования df_conversion_from_parameters, предоставленной в файле утилит Python, как показано для условия 2 (рис. 4A). Для подающих надежды кривых данные не интерполировались. Однако для экспериментальных данных наборы данных, выровненные по линии жизни, были передискретизированы с использованием интерполяции, так что каждая точка линии жизни содержала интерполированные данные для улучшения построения графиков. Чтобы гарантировать, что наборы данных, выровненные по линии жизни, имеют одинаковый диапазон точек линии жизни, были установлены нижний и верхний пределы линии жизни, чтобы усечь данные в этих точках. Эти параметры lowerll и upperll были введены в функцию df_conversion_from_parameters, когда интерполяция была установлена в True. Для сравнения условий 1 они были установлены на 44 и 270 соответственно для всех наборов данных, а для сравнения условий окружающей среды они были установлены на 50 и 300 соответственно. Пример использования этих функций для выравнивания и сравнения можно увидеть в примере записной книжки Python JOVE_example.ipynb, а код, используемый для генерации рисунков, можно увидеть в записной книжке JOVE_Figures.ipynb в репозитории CLOCCS_alignment.

Это преобразование из точек времени в точки линии жизни зависит от двух формул21 (рис. 4А) с использованием μ0 (время восстановления) и λ (материнский период). Первая формула представляет собой формулу Equation 1фазы восстановления (рис. 4А). Эта формула используется только для временных точек в фазе восстановления, которая состоит из моментов времени до μ 0 включительно, посколькуμ 0 соответствует времени восстановления. Затем временные точки преобразуются в диапазон шкалы линии жизни, заканчивающийся 100 точками линии жизни (таблица 1), отмечая конец фазы восстановления и начало первого клеточного цикла. На этапе после восстановления используется вторая формула Equation 2 (рис. 4A), которая преобразует каждую последующую точку времени после восстановления в точку жизни после 100. Каждые последующие 100 точек линии жизни соответствуют новому клеточному циклу, причем первый цикл соответствует точкам линии жизни от 100 до 200, второй цикл соответствует точкам линии жизни от 200 до 300 и так далее (таблица 1). Преобразование из точек времени в точки линии жизни применяется к каждому набору данных индивидуально с использованием соответствующих параметров CLOCCS для этого набора данных. После того, как каждый набор данных преобразуется в масштаб линии жизни, фазы клеточного цикла выравниваются, что позволяет проводить сравнения по конкретным фазам между наборами данных.

В таблице 3 показано преобразование выбранных моментов времени в соответствующие точки линии жизни для репрезентативного преобразования набора данных Условия 2 с использованием параметров из зарождающегося прогона CLOCCS. Данные о почковании, собранные с помощью РНК-секвенирования состояния 2, были построены в виде кривой почкования, показывающей процент почкований с течением времени как для невыровненной временной шкалы в минутах (рис. 4B), так и для выровненной временной шкалы в точках линии жизни (рис. 4C) с использованием функции Python plot_budding_curves в блокноте Python. Точки линии жизни могут быть легко преобразованы в информацию об экспериментальной фазе и фазе клеточного цикла (таблица 1), а фаза восстановления и циклы с первого по третий клетки были соответствующим образом обозначены цветом вручную (рис. 4B, C). Поскольку каждая точка жизненного цикла соответствовала фазе клеточного цикла, отдельные графики проточной цитометрии могли быть помечены с помощью функций Python с использованием фазы клеточного цикла, определяемой выравниванием линии жизни. Эти фазы совпадали с фазами, определенными с помощью проточного цитометрического анализа для состояния 2. Данные проточной цитометрии, собранные для набора данных Condition 2, были нанесены на график для выбранных моментов времени и помечены с использованием фазы клеточного цикла, определенной на основе выравнивания линии жизни проточной цитометрии. В каждом случае данные соответствовали фазе, определенной выравниванием (рис. 4D).

Важно отметить, что уровень экспрессии каждого гена для каждого образца остается неизменным, но маркировка временных точек изменяется от времени в минутах до точек жизни. Однако преобразование не является линейным. Фаза восстановления, выделенная серым цветом, занимает более высокий процент экспериментального времени после того, как было выполнено преобразование в точки спасательного круга (рис. 4B, C). Преимущество шкалы спасательного круга заключается в том, что она позволяет получать подробную информацию о фазах и сравнивать фазы в экспериментах. Информация о фазе содержится в точках линии жизни, как описано выше и отображено в таблице 1. Кроме того, G1 содержится в первых 15,5 точках линии жизни каждого клеточного цикла, S — в следующих 20 точках линии жизни, а G2/M — в следующих 64,5 точках линии жизни (таблица 1). Однако это искусственно ограничивает время восстановления одним и тем же промежутком времени каждого последующего клеточного цикла, даже если фаза восстановления кажется очень короткой в исходной шкале временных моментов. Это не заслоняет сравнения, потому что фазы каждого эксперимента выровнены. В большинстве случаев более уместно сравнивать данные в точках, которые происходят на одной и той же экспериментальной и биологической фазе, а не в моментах времени, которые происходят в одно и то же время в минутах.

После того, как все эксперименты были преобразованы в выровненную шкалу линии жизни с использованием функций, предоставленных Python в файле утилит Python, их можно сравнивать. Здесь мы демонстрируем два распространенных сравнения между экспериментами: одно между репликами аналогичного эксперимента на разных платформах и методах синхронизации (рис. 5) и одно между различными экспериментальными условиями с изменяющейся продолжительностью периода (рис. 6 и рис. 7). Как описано выше, первое сравнение проводится между двумя элютриированными репликами микрочипов и одним экспериментом по РНК-секвенированию с синхронизированным альфа-фактором. До выравнивания две реплики микрочипов демонстрировали сходную синхронность и динамику клеточного цикла, но репликация микрочипа 2 условия 1 казалась немного запаздывающей (рис. 5A). Наиболее разительное различие было обнаружено при сравнении невыровненных наборов данных; Второй цикл РНК-секвенирования Condition 1, по-видимому, соответствовал первому циклу двух экспериментов с микрочипами. Различие, вероятно, было связано не с различными транскриптомными платформами, а с разными методами синхронизации. Клеточные популяции в экспериментах с микрочипами были синхронизированы центробежной элютриацией, в то время как популяция для эксперимента с РНК-секвенированием была синхронизирована с помощью обработки феромонами спаривания. Действительно, синхронизация со спаривающимся феромоном существенно сократила время восстановления по сравнению с элютриацией (рис. 5А и табл. 2).

Несмотря на очевидные различия между репликами при построении графика с точки зрения прошедшего времени, после выравнивания линии жизни кривые были почти идентичны, и стали возможными более подробные и релевантные сравнения между репликами (рис. 5B). Фаза восстановления была выровнена таким образом, чтобы каждый эксперимент начинался в одной и той же точке линии жизни, а изменения в периоде были нормализованы выравниванием линии жизни. Из-за выравнивания экспериментальные значения в одной и той же точке жизненного цикла для реплик происходили в одной и той же фазе клеточного цикла, что позволяет рассчитать экспериментальную дисперсию между репликами. Фазы восстановления и клеточного цикла помечены на рисунке 5B, чтобы предоставить дополнительную информацию о фазах клеточного цикла в каждом из экспериментов. Затем это выравнивание линии жизни может быть применено к экспериментальному набору данных (рис. 5C, D) с помощью функции Python, df_conversion_from_parameters предоставленной в файле утилиты, как описано выше.

На рисунке 5D транскриптомные данные были выровнены, и динамика экспрессии гена CDC20 была построена с использованием функции plot_linegraph_comparison Python в блокноте Python. До выравнивания казалось, что экспрессия первого пика экспериментов с микрочипами совпадает со вторым пиком эксперимента с РНК-секвенированием (рис. 5C); однако после выравнивания первые пики клеточного цикла каждого набора данных выровнялись правильно (рис. 5D). Кроме того, ширина пика экспериментов, по-видимому, различалась между набором данных RNA-seq и наборами данных микрочипов, но после выравнивания ширина пика была более выровненной (рис. 5C, D).

Второе сравнение проводится между экспериментами в разных условиях окружающей среды с разными периодами клеточного цикла (рис. 6). Как описано выше, здесь мы сравнили наборы данных S. cerevisiae в условии 1 с условием 2 и условием 3, которые соответствуют периодам клеточного цикла 71, 82 и 110 минут соответственно. Эти различия в периоде клеточного цикла вносили неопределенность при сравнении экспериментов до выравнивания фаз клеточного цикла, как показано на невыровненных кривых почкования. Различия в периодах видны на невыровненных кривых почкования (рис. 6А). Однако, когда они были выровнены по CLOCCS с использованием этого протокола, три кривые выглядели удивительно похожими, что делало возможным сравнение экспериментальных данных (рис. 6B).

С помощью параметров проточной цитометрии CLOCCS состояние 1 и состояние 2 были выровнены по общей шкале линии жизни, а гистограммы содержания ДНК были нанесены в состоянии 2 и в эквивалентных точках линии жизни в условии 1. Сравнивались проточные цитометрические измерения содержания ДНК в точках жизненного цикла (рис. 6C). Поскольку измерения содержания ДНК не были непрерывными и их было нелегко интерполировать, мы могли сравнивать только ближайшие точки жизненного цикла. Данные о фазе клеточного цикла для каждой сопоставимой точки жизненного цикла не были идентичны между двумя условиями (рис. 6C), что указывает на то, что соответствие CLOCCS и результирующие параметры, вероятно, были немного смещены для условия 1. Вероятно, это было связано с тем, что CLOCCS хуже соответствовал проточным цитометрическим данным для состояния 1 по сравнению с состоянием 2 (дополнительный рисунок 2). Однако выравнивание отклонилось только в одном образце и, таким образом, по-прежнему позволяет улучшить фазовые сравнения.

Затем выравнивание линии жизни почкований было применено к экспериментальным данным для экспериментов с РНК-секвенированием в Условии 1, Условии 2 и Условии 3 (рис. 7) с использованием параметров CLOCCS почки в функции df_conversion_from_parameters на экспериментальных данных. Транскриптомные данные были выровнены, и экспрессия гена гена CDC20 для каждого временного ряда была показана для трех экспериментов. До выравнивания динамика транскриптов CDC20 была неперекрывающейся (рис. 7A). После выравнивания первый и второй пики экспрессии гена CDC20 были гораздо более точно выровнены для всех трех наборов данных. После выравнивания стало ясно, что пики происходили в одной и той же фазе клеточного цикла, но формы кривых были разными (рис. 7B). Условие 3 имело более низкий и широкий первый пик по сравнению с двумя другими условиями, даже после учета различий в периоде клеточного цикла, предполагая, что эти различия, вероятно, были связаны с тестируемыми экспериментальными условиями (рис. 7B).

Также могут быть проведены крупномасштабные транскриптомные сравнения. Для этих сравнений было отобрано 278 генов путем запуска алгоритма периодичности JTK_CYCLE23 на каждом наборе данных и пересечения верхних периодических генов. Тем не менее, гены могут быть выбраны с использованием любого желаемого метода или из литературы. Эти гены были построены в одинаковом порядке для всех трех условий как для невыровненных (рис. 7C), так и для выровненных (рис. 7D) тепловых карт с использованием функции plot_heatmap_comparison Python в блокноте Python. Эти тепловые карты позволяют проводить сотни сравнений на уровне генов одновременно. Сравнения между невыровненными экспериментами могут быть сделаны в отношении изменения динамики кривой, времени пика по отношению к соседним генам, продолжительности периода и т. д. (рис. 7C). Однако детальные сравнения по конкретным фазам не могут быть сделаны, потому что временные точки не обязательно коррелируют с одной и той же фазой клеточного цикла в разных условиях. Хотя вторые циклы выглядели похожими после выравнивания, первые циклы были немного смещены между условиями (рис. 7D). Этот сдвиг может отражать тот факт, что информация о фазе клеточного цикла была более низкого качества для состояния 3. Тем не менее, согласование экспериментов для трех условий позволило улучшить фазовое сравнение. До выравнивания было неясно, произойдет ли первый пик экспрессии в каждом состоянии в одной и той же фазе клеточного цикла (рис. 7C); однако после выравнивания эксперименты можно было сравнивать в зависимости от фазы (рис. 7D). До выравнивания пики в состоянии 3 казались намного шире, чем в двух других условиях (рис. 7C); однако после выравнивания стало ясно, что пики в условии 3 имеют ту же ширину, что и другие условия при выравнивании (рис. 7D).

Эти репрезентативные результаты демонстрируют процесс использования CLOCCS для согласования экспериментов с общей шкалой времени. До выравнивания прямые сравнения временных точек часто не коррелируют с аналогичной фазой клеточного цикла. Преобразование прошедшего экспериментального времени в минутах в точки линии жизни, которые представляют фазу клеточного цикла, позволяет проводить фазовые и биологически значимые сравнения между экспериментами в одной и той же точке клеточного цикла.

Figure 1
Рисунок 1: Обзор рабочего процесса выравнивания спасательного круга CLOCCS. Экспериментальный рабочий процесс для выравнивания двух примеров наборов данных с помощью CLOCCS с последующим репрезентативным сравнением между наборами данных. Проиллюстрированы основные этапы протокола: сбор невыровненных фаз клеточного цикла и экспериментальных данных для каждого из наборов данных (шаг 1), использование CLOCCS для параметризации каждого набора данных (шаг 2 и шаг 3), выравнивание наборов данных с общей линией жизни (шаг 4) и, наконец, сравнение фазы клеточного цикла и экспериментальной динамики (шаг 5 и шаг 6). Невыровненные данные о фазе клеточного цикла вводятся в CLOCCS для предоставления изученных параметров, которые затем используются для выравнивания в соответствии с общей шкалой жизненного цикла. Затем эти выровненные наборы данных сравниваются. Аббревиатура: CLOCCS = характеризующая потерю синхронизации клеточного цикла. Пожалуйста, нажмите здесь, чтобы просмотреть увеличенную версию этого рисунка.

Figure 2
Рисунок 2: Формат фазы клеточного цикла и экспериментальные данные, необходимые для рабочего процесса. Данные, необходимые для рабочего процесса, состоят из двух основных компонентов: данных о фазах клеточного цикла и экспериментальных данных клеточного цикла. Данные о фазе клеточного цикла могут состоять из данных о почковании клеточного цикла или данных о содержании проточной цитометрической ДНК для каждого момента времени во временном ряду. Экспериментальные данные могут принимать различные формы, но в данном случае это транскриптомные данные, которые состоят из данных экспрессии генов для каждого гена для каждого момента времени во временном ряду. Пожалуйста, нажмите здесь, чтобы просмотреть увеличенную версию этого рисунка.

Figure 3
Рисунок 3: Пример результатов запуска CLOCCS на наборе данных клеточного цикла S. cerevisiae. (A) Снимок экрана графического пользовательского интерфейса CLOCCS с входными значениями и настройками, предоставленными для данных о почке в соответствии с условием 2. Вводятся время, количество непочковавшихся ячеек и количество отпочкованных ячеек, а также тип модели, итерации, условия и т. д. (B) Снимок экрана результирующего почкования CLOCCS, подходящего для условия 2, на вкладке «Прогнозируемое соответствие» результатов. Каждая точка данных имеет соответствующую полосу погрешности выборки, соответствующую 95% доверительным интервалам биномиальной пропорции данных (для каждого момента времени было подсчитано не менее 200 ячеек [от 204 до 295 ячеек]). Результирующая кривая подгонки почек показывает полосу достоверности для 95% доверительного интервала соответствия CLOCCS фиолетовым цветом. (C) Скриншот результирующей таблицы «Задние параметры» для зачаточного прогона CLOCCS в условии 2, состоящего из параметров CLOCCS в среднем, 2,5-процентном доверительном интервале и 97,5-процентном доверительном интервале. Также показаны апостериорные показатели и показатели принятия. (D) Скриншот проточной цитометрии CLOCCS подходит для состояния 2 через 70 мин и 150 мин. Пожалуйста, нажмите здесь, чтобы просмотреть увеличенную версию этого рисунка.

Figure 4
Рисунок 4: Пример процесса преобразования из точек времени в выровненные точки линии жизни для набора данных Condition 2. (A) Формулы преобразования, используемые для преобразования точек времени в точки линии жизни. Снимок экрана: функции Python в записной книжке Python для преобразования и построения порождающихся кривых. (B) Невыровненная кривая бутонизации условия 2, показывающая процент почкования для каждого момента времени в минутах. Фазы клеточного цикла и восстановления выделены следующим образом: восстановление (серый), первый клеточный цикл (синий), второй клеточный цикл (пурпурный) и третий клеточный цикл (лосось). (C) Выровненная кривая бутонизации состояния 2, показывающая тот же процент почкования, но нанесенная на шкалу, выровненную по линии жизни. Фазы клеточного цикла и восстановления выделены, как показано на панели C. (D) Выровненные графики проточной цитометрии для выбранных моментов времени из состояния 2, соответствующих различным фазам клеточного цикла на основе шкалы линии жизни: начало G1, начало S-фазы, начало G2/M и конец G2/M. Пожалуйста, нажмите здесь, чтобы просмотреть увеличенную версию этого рисунка.

Figure 5
Рисунок 5: Репрезентативные результаты для сравнения выровненных и невыровненных экспериментов по репликации условия 1. Сравнение реплик Условия 1: Условие 1 РНК-секвенирование (синий), Условие 1 микрочип 1 (фиолетовый) и Условие 1 микрочип 2 (серый). (A) Невыровненная кривая почкования для наборов данных условия 1. (B) Выровненная кривая почкования для наборов данных условия 1. Точки линии жизни были преобразованы в фазу клеточного цикла и имеют цветовую маркировку ниже оси X. (C) Невыровненная экспрессия генов репрезентативного гена CDC20 для наборов данных Condition 1. (D) Выровненная экспрессия репрезентативного гена CDC20 для наборов данных Condition 1. Пожалуйста, нажмите здесь, чтобы просмотреть увеличенную версию этого рисунка.

Figure 6
Рисунок 6: Репрезентативные результаты сравнения выровненных и невыровненных данных о фазах клеточного цикла в экспериментах с различными периодами. Сравнение данных о фазах клеточного цикла для наборов данных с тремя различными условиями окружающей среды и, таким образом, с тремя различными периодами клеточного цикла: условие 1 РНК-секвенирование (период клеточного цикла: 71 мин), условие 2 РНК-секвенирование (период клеточного цикла: 82 мин) и условие 3 РНК-секвенирование (период клеточного цикла: 110 мин). (A) Невыровненная кривая почкования для наборов данных. (B) Выровненная кривая почкования для наборов данных. (C) Гистограммы содержания проточной цитометрической ДНК для состояния 2 (верхний ряд) в сравнении с эквивалентными точками жизненного пути в условии 1 (нижний ряд). Пожалуйста, нажмите здесь, чтобы просмотреть увеличенную версию этого рисунка.

Figure 7
Рисунок 7: Репрезентативные результаты для сравнения выровненных и невыровненных транскриптомных данных в экспериментах с различными периодами. Сравнение транскриптомных данных, связанных с наборами данных на рисунке 6: Условие 1 РНК-секвенирование, Условие 2 и Условие 3. (A) Невыровненная экспрессия генов репрезентативного гена, CDC20, для наборов данных РНК-секвенирования состояния 1, условия 2 и условия 3. (B) Выровненная экспрессия генов CDC20 для наборов данных. (C) Невыровненная тепловая карта периодических генов верхнего клеточного цикла в том же порядке для каждого набора данных. (D) Тепловые карты, выровненные по линии жизни одних и тех же периодических генов клеточного цикла из панели C в том же порядке. Пунктирные фиолетовые линии соответствуют точкам линии жизни 100 и 200. Пожалуйста, нажмите здесь, чтобы просмотреть увеличенную версию этого рисунка.

Таблица 1: Точка жизненного цикла для преобразования фазы клеточного цикла. Ключ преобразования между шкалой точек линии жизни и соответствующей фазой в эксперименте. Точки линии жизни 0-100 соответствуют восстановлению от синхронии. Каждые последующие 100 точек линии жизни соответствуют новому клеточному циклу, причем первые 15,5 точек линии жизни соответствуют G1, следующие 20 соответствуют S-фазе, а остальные точки линии жизни соответствуют G2/M. Пожалуйста, нажмите здесь, чтобы загрузить эту таблицу.

Таблица 2: Параметры CLOCCS для почек. Результирующие параметры CLOCCS «лямбда» и «мю0» для каждого эксперимента получены из репрезентативных результатов. Кроме того, для каждого эксперимента показана дочерняя задержка «Дельта» и рассчитанный период клеточного цикла. Пожалуйста, нажмите здесь, чтобы загрузить эту таблицу.

Таблица 3: Таблица преобразования, показывающая преобразование между моментами времени в минутах и соответствующими точками жизненного цикла для условия 2. Пожалуйста, нажмите здесь, чтобы загрузить эту таблицу.

Дополнительный рисунок S1: Бутонизация CLOCCS подходит для условий 1 и 3. Снимок экрана результирующего почкования CLOCCS подходит для (A) данных о почковании РНК в условии 1, (B) данных о почковании микрочипа 1 в условии 1, (C) данных о почковании микрочипа 2 в условии 1 и для (D) данных о почковании в условии 3. Почки CLOCCS, подходящие для состояния 2, можно увидеть на рисунке 3B. Доверительный диапазон 95% и полосы погрешности выборки описаны в документацииCLOCCS 14,15 и на рисунке 3. Для каждого момента времени для каждого временного ряда было подсчитано около 200 ячеек. Пожалуйста, нажмите здесь, чтобы загрузить этот файл.

Дополнительный рисунок S2: Проточная цитометрия CLOCCS подходит для состояния 1 и условия 2. Скриншот проточной цитометрии CLOCCS подходит для образцов, показанных на рисунке 6C для состояния 2 (верхний ряд: A-D) и условия 1 (нижний ряд: E, F). Пожалуйста, нажмите здесь, чтобы загрузить этот файл.

Дополнительный рисунок S3: Чувствительность выравнивания к изменениям параметров CLOCCS. Сравнение выравнивания набора данных РНК-секвенирования условия 1 с использованием вариаций (A-C) параметров CLOCCS λ и μ0 в пределах доверительного интервала соответствия CLOCCS и (D,E) с большими вариациями параметров. Сравнение среднего значения с доверительными значениями 2,5% и 97,5%, выведенными в таблице параметров CLOCCS для (A) параметра μ0, (B) параметра λ и (C) для обоих параметров μ0 и λ. (D) Сопоставление выравнивания с использованием среднего значения для μ0 и больших вариаций параметра μ0 (от 200% до 0,25% от μ0). (E) Сопоставление выравнивания с использованием среднего значения λ и значительных вариаций параметра λ (от 200% до 0,25% от λ). Пожалуйста, нажмите здесь, чтобы загрузить этот файл.

Дополнительная таблица S1: Описание сбора данных для каждого эксперимента. Для каждого эксперимента в этой таблице приведено описание данных почкования, данных проточной цитометрии, транскриптомных данных и метода синхронизации. Пожалуйста, нажмите здесь, чтобы загрузить этот файл.

Дополнительная таблица S2: Параметры CLOCCS из проточных цитометрических прогонов CLOCCS. Параметры CLOCCS «mu0» и «лямбда» для проточной цитометрии состояния 1 и условия 2 выполняется CLOCCS. Пожалуйста, нажмите здесь, чтобы загрузить этот файл.

Дополнительный файл 1: Инструкции по преобразованию проточных цитометрических данных во входной формат CLOCCS. Для использования CLOCCS с проточно-цитометрическими данными требуется определенный формат ввода. Этот файл содержит более подробные инструкции относительно шага протокола 3.4.1, чтобы объяснить, как использовать служебные функции Python для выполнения этого преобразования. Пожалуйста, нажмите здесь, чтобы загрузить этот файл.

Subscription Required. Please recommend JoVE to your librarian.

Discussion

В данной работе представлен метод более точной и количественной оценки данных экспериментов временных рядов на синхронизированных популяциях клеток. Метод использует изученные параметры из CLOCCS, байесовской модели вывода, которая использует входные данные о фазе клеточного цикла, такие как данные о почковании и данные о содержании проточной цитометрической ДНК, для параметризации каждого эксперимента14,15. CLOCCS использует входные данные о фазе клеточного цикла, чтобы вывести параметры для каждого эксперимента, которые затем используются для согласования с общей шкалой жизненного цикла. Преобразование нескольких экспериментов с синхронизацией/выпуском временных рядов в единую шкалу времени, выровненную по линии жизни, позволяет проводить фазовые и релевантные сравнения между экспериментами и агрегировать несколько повторных экспериментов, которые ранее были трудными или невозможными.

Критические шаги этого протокола включают сбор данных, запуск CLOCCS, выравнивание наборов данных и сравнение наборов данных. Во-первых, необходимо собрать данные для использования в этом протоколе. Данные должны состоять как из экспериментальных данных, содержащих информацию по интересующему вопросу (т.е. транскриптомные данные, данные об экспрессии генов, протеомные данные), так и из данных о фазе клеточного цикла, содержащих информацию о фазе клеточного цикла (т.е. данные о почковании, данные о содержании проточной цитометрической ДНК). Затем данные о фазе клеточного цикла могут быть использованы в CLOCCS для сбора информации о параметрах для каждого эксперимента. Параметры μ0 (продолжительность фазы восстановления) и λ (период цикла материнской клетки) используются для преобразования временных точек в точки линии жизни. Выравнивание точек линии жизни позволяет напрямую сравнивать выровненные временные ряды.

Одним из ограничений метода является то, что правильное выравнивание зависит от определения хорошего соответствия данным. Достижение наилучшего соответствия CLOCCS зависит от качества данных о фазе клеточного цикла и использования правильных входных настроек для эксперимента в CLOCCS. Соответствие данным фазы клеточного цикла определяет точность изученных параметров и, таким образом, сильно влияет на точность выравнивания, поскольку зависит от использования этих параметров. Поскольку значительные изменения параметров в значительной степени повлияют на выравнивание, эти изменения остаются минимальными в пределах доверительного интервала, указанного в выходных данных CLOCCS (дополнительный рисунок S3). Важно отметить, что эта чувствительность к изменениям параметров также позволяет согласовывать наборы данных с различными временными интервалами клеточного цикла.

Точность подгонки CLOCCS может быть определена с помощью результирующей кривой подгонки CLOCCS и соответствующих полос погрешностей и полосы погрешностей (рис. 3B, D, дополнительный рисунок S1 и дополнительный рисунок S2). На вкладке «Подгонка CLOCCS» показаны исходные точки данных, а также кривая подгонки CLOCCS с доверительной полосой, соответствующей доверительному интервалу подгонки CLOCCS, и полосами погрешностей, соответствующими 95%-ному доверительному интервалу данных по биномиальной пропорции, поскольку предполагается, что подсчеты являются независимыми биномиальными случайными величинами14. Например, доверительные полосы на данных о почковании измеряют достоверность доли почкующихся клеток для данного образца.

Один из методов определения качества соответствия CLOCCS включает определение того, перекрываются ли полосы погрешностей данных с полосой доверительного интервала соответствия CLOCCS. Другим показателем является широта 95% доверительного диапазона соответствия CLOCCS. Как правило, ширина полосы уменьшается с увеличением качества посадки. Признаком плохого выравнивания является то, что фаза клеточного цикла исходных данных не совпадает с фазой клеточного цикла, выведенной из выравнивания. Каждое выравнивание можно перепроверить, убедившись, что для каждого момента времени фаза, указанная в информационных данных о фазе клеточного цикла, совпадает с фазой клеточного цикла, назначенной выравниванием.

Плохая посадка CLOCCS или плохое выравнивание могут быть результатом некачественных данных о фазах клеточного цикла. Высококачественные данные о бутонизации будут иметь очень низкий процент бутонизации сразу после ареста и очень высокий процент бутонизации на первом пике. Последующие пики и впадины потеряют синхронность, но должны быть отчетливыми и равномерно распределенными. Поскольку точки линии жизни представляют собой среднюю фазу клеточного цикла популяции, плохая синхронизация также может препятствовать правильному выравниванию. Высококачественные данные о содержании проточной цитометрической ДНК будут иметь отчетливые пики 1C и 2C для каждого момента времени, соответствующего соответствующей фазе клеточного цикла. Кроме того, недостаточные данные о фазах клеточного цикла создают проблемы с идентификацией параметров. В случае получения достаточных данных параметры могут быть выведены и существенно не изменяются между прогонами CLOCCS. Однако параметры, описанные в этом протоколе (лямбда, дельта, мю0), не могут быть распутаны, если данные о фазе клеточного цикла содержат только один полный клеточный цикл. Чтобы улучшить оценку параметров, следует использовать достаточные и хорошо построенные данные клеточного цикла для CLOCCS14,15. Кроме того, модель CLOCCS использует априорную информацию, как описано в Orlando et al.15, но эта информация может быть скорректирована в соответствии с используемыми экспериментальными условиями.

Если качество данных о фазе клеточного цикла хорошее, то повторная настройка настроек CLOCCS может помочь добиться более точного соответствия. Например, количество выбранных итераций может быть увеличено для повышения точности. Подтверждение того, что в CLOCCS был выбран правильный метод синхронизации, также может быть полезным, поскольку остановка альфа-фактора связана с более коротким временем восстановления по сравнению с элютриацией.

Этот метод также ограничен с точки зрения типов данных о фазах клеточного цикла, поддерживаемых в настоящее время. Тем не менее, CLOCCS является гибким и может быть адаптирован для поддержки других типов данных. Например, CLOCCS ранее был адаптирован для поддержки флуоресцентной маркировки клеточного цикла тел веретенообразных полюсов, миозиновых колец и ядер11 для использования в качестве идентификаторов фаз клеточного цикла. Кроме того, стало возможным использование CLOCCS с видами, отличными от S. cerevisiae. CLOCCS принимает индексы септации в качестве маркера фазы клеточного цикла у S. pombe14, а также данные о содержании проточной цитометрической ДНК, которые легко собираются для многих видов15. Это позволяет сравнивать экспериментальные данные в одной и той же фазе клеточного цикла для двух совершенно разных видов и может дать представление об изменениях в клеточном цикле на протяжении всей эволюции.

Хотя с этим методом выравнивания линии жизни можно использовать только поддерживаемые формы данных о фазах клеточного цикла, этот метод не зависит от типа используемых экспериментальных данных временных рядов. В этом протоколе мы продемонстрировали его использование для выравнивания экспрессии генов отдельного гена, а также транскриптомных данных временных рядов для сотен генов в тандеме. Мы показали, что этот метод может быть использован для сравнения между платформами и, таким образом, для сравнения наборов данных RNA-seq и наборов данных микрочипов, взятых в аналогичных условиях. Мы также показали, что этот метод можно использовать для согласования наборов данных с различными методами синхронизации путем сравнения набора данных, который был элютриирован (микрочип условия 1), с набором данных, который был остановлен альфа-фактором (условие 1 RNA-seq). Ранее CLOCCS также использовался для выравнивания транскриптомных и временных рядов протеомных данных с использованием данныхфазы 22 почкующегося клеточного цикла, что позволяло проводить прямые сравнения между динамикой мРНК и динамикой соответствующего белка. CLOCCS также использовался для согласования данных временных рядов между видами, например, для выравнивания между S. cerevisiae и S. pombe14 и между первым циклом S. cerevisiae и патогенными дрожжами Cryptococcus neoformans21. Наконец, выравнивание CLOCCS в настоящее время специфично для данных временных рядов клеточных циклов и еще не адаптировано для использования с другими типами ритмических процессов. Одной из областей, где это представляло бы особый интерес, являются циркадные ритмы, где циркадное время (КТ) обычно используется для согласования экспериментов, хотя его реализация не применяется последовательно. Еще одна область, представляющая интерес, заключается в изучении ритмов развития, таких как ритмы малярийного паразита. Например, выравнивание штаммов Plasmodium falciparum с разными периодами, как описано в Smith et al.25, позволило бы проводить более подробные сравнения между штаммами. Выравнивание этих периодических процессов для сравнения позволило бы лучше понять эти важные ритмические биологические функции. Эти типы сравнений клеточных циклов стали возможными благодаря использованию CLOCCS для выравнивания линии жизни, как описано в этом протоколе.

Subscription Required. Please recommend JoVE to your librarian.

Disclosures

У авторов нет конфликтов интересов, которые необходимо раскрывать.

Acknowledgments

С. Кампионе и С. Хаазе были поддержаны финансированием Национального научного фонда (DMS-1839288) и Национальных институтов здравоохранения (5R01GM126555). Кроме того, авторы хотели бы поблагодарить Хуаруи Чжоу (Huarui Zhou) из Университета Дьюка за комментарии к рукописи и за бета-тестирование протокола. Мы также благодарим Фрэнсиса Мотту (Francis Motta) из Атлантического университета Флориды (Florida Atlantic University) и Джошуа Робинсона (Joshua Robinson) за помощь в работе с кодом Java.

Materials

Name Company Catalog Number Comments
2x PBS For Fixative Solution. Described in Leman 2014.
4% formaldehyde For Fixative Solution.
100% Ethanol For flow cytometry fixation. Described in Haase 2002.
CLOCCS https://gitlab.com/haase-lab-group/cloccs_alignment.git
Flow Cytometer For flow cytometry protocol.
Git https://git-scm.com/
Java 19 https://www.oracle.com/java/technologies/downloads/#java19
Microscope For counting cells and buds.
Miniconda https://docs.conda.io/en/latest/
Protease solution For flow cytometry protocol. Described in Haase 2002.
RNAse A solution For flow cytometry protocol. Described in Haase 2002.
SYTOX Green Nucleic Acid Stain Invitrogen S7020 For flow cytometry staining. Described in Haase 2002.
Tris pH 7.5

DOWNLOAD MATERIALS LIST

References

  1. Tyers, M., Tokiwa, G., Futcher, B. Comparison of the Saccharomyces cerevisiae G1 cyclins: Cln3 may be an upstream activator of Cln1, Cln2 and other cyclins. EMBO Journal. 12 (5), 1955-1968 (1993).
  2. Schwob, E., Nasmyth, K. CLB5 and CLB6, a new pair of B cyclins involved in DNA replication in Saccharomyces cerevisiae. Genes and Development. 7, 1160-1175 (1993).
  3. Polymenis, M., Schmidt, E. V. Coupling of cell division to cell growth by translational control of the G1 cyclin CLN3 in yeast. Genes and Development. 11 (19), 2522-2531 (1997).
  4. Spellman, P. T., et al. Comprehensive identification of cell cycle-regulated genes of the yeast Saccharomyces cerevisiae by microarray hybridization. Molecular Biology of the Cell. 9 (12), 3273-3297 (1998).
  5. Cho, R. J., et al. A genome-wide transcriptional analysis of the mitotic cell cycle. Molecular Cell. 2 (1), 65-73 (1998).
  6. Bar-Joseph, Z. Analyzing time series gene expression data. Bioinformatics. 20 (16), 2493-2503 (2004).
  7. Pramila, T., Wu, W., Miles, S., Noble, W. S., Breeden, L. L. The Forkhead transcription factor Hcm1 regulates chromosome segregation genes and fills the S-phase gap in the transcriptional circuitry of the cell cycle. Genes and Development. 20 (16), 2266-2278 (2006).
  8. Orlando, D. A., et al. Global control of cell-cycle transcription by coupled CDK and network oscillators. Nature. 453 (7197), 944-947 (2008).
  9. Nash, R., Tokiwa, G., Anand, S., Erickson, K., Futcher, A. B. The WHI1+ gene of Saccharomyces cerevisiae tethers cell division to cell size and is a cyclin homolog. EMBO Journal. 7 (13), 4335-4346 (1988).
  10. Basco, R. D., Segal, M. D., Reed, S. I. Negative regulation of G1 and G2 by S-phase cyclins of Saccharomyces cerevisiae. Molecular and Cellular Biology. 15 (9), 5030-5042 (1995).
  11. Mayhew, M. B., Robinson, J. W., Jung, B., Haase, S. B., Hartemink, A. J. A generalized model for multi-marker analysis of cell cycle progression in synchrony experiments. Bioinformatics. 27 (13), 295-303 (2011).
  12. Qu, Y., et al. Cell cycle inhibitor Whi5 records environmental information to coordinate growth and division in yeast. Cell Reports. 29 (4), 987-994 (2019).
  13. Di Talia, S., Skotheim, J. M., Bean, J. M., Siggia, E. D., Cross, F. R. The effects of molecular noise and size control on variability in the budding yeast cell cycle. Nature. 448 (7156), 947-951 (2007).
  14. Orlando, D. A., et al. A probabilistic model for cell cycle distributions in synchrony experiments. Cell Cycle. 6 (4), 478-488 (2007).
  15. Orlando, D. A., Iversen, E. S., Hartemink, A. J., Haase, S. B. A branching process model for flow cytometry and budding index measurements in cell synchrony experiments. Annals of Applied Statistics. 3 (4), 1521-1541 (2009).
  16. Duan, F., Zhang, H. Correcting the loss of cell-cycle synchrony in clustering analysis of microarray data using weights. Bioinformatics. 20 (11), 1766-1771 (2004).
  17. Darzynkiewicz, Z., Halicka, H. D., Zhao, H. Cell synchronization by inhibitors of DNA replication induces replication stress and DNA damage response: analysis by flow cytometry. Methods in Molecular Biology. 761, 85-96 (2011).
  18. Leman, A. R., Bristow, S. L., Haase, S. B. Analyzing transcription dynamics during the budding yeast cell cycle. Methods in Molecular Biology. 1170, 295-312 (2014).
  19. Rosebrock, A. P. Synchronization and arrest of the budding yeast cell cycle using chemical and genetic methods. Cold Spring Harbor Protocols. 2017 (1), (2017).
  20. Haase, S. B., Reed, S. I. Improved flow cytometric analysis of the budding yeast cell cycle. Cell Cycle. 1 (2), 132-136 (2002).
  21. Kelliher, C. M., Leman, A. R., Sierra, C. S., Haase, S. B. Investigating conservation of the cell-cycle-regulated transcriptional program in the fungal pathogen, Cryptococcus neoformans. PLoS Genetics. 12 (12), e1006453 (2016).
  22. Kelliher, C. M., et al. Layers of regulation of cell-cycle gene expression in the budding yeast Saccharomyces cerevisiae. Molecular Biology of the Cell. 29 (22), 2644-2655 (2018).
  23. Hughes, M. E., Hogenesch, J. B., Kornacker, K. JTK_CYCLE: An efficient nonparametric algorithm for detecting rhythmic components in genome-scale data sets. Journal of Biological Rhythms. 25 (5), 372-380 (2010).
  24. Deckard, A., Anafi, R. C., Hogenesch, J. B., Haase, S. B., Harer, J. Design and analysis of large-scale biological rhythm studies: A comparison of algorithms for detecting periodic signals in biological data. Bioinformatics. 29 (24), 3174-3180 (2013).
  25. Smith, L. M., et al. An intrinsic oscillator drives the blood stage cycle of the malaria parasite Plasmodium falciparum. Science. 368 (6492), 754-759 (2020).

Tags

В этом месяце в JoVE выпуск 196 Выравнивание временные ряды транскриптомика синхронизация клеточный цикл проточная цитометрия модели программное обеспечение
Выравнивание синхронизированных данных временных рядов с использованием характеризирующей модели синхронизации клеточного цикла для перекрестных сравнений
Play Video
PDF DOI DOWNLOAD MATERIALS LIST

Cite this Article

Campione, S. A., Kelliher, C. M.,More

Campione, S. A., Kelliher, C. M., Orlando, D. A., Tran, T. Q., Haase, S. B. Alignment of Synchronized Time-Series Data Using the Characterizing Loss of Cell Cycle Synchrony Model for Cross-Experiment Comparisons. J. Vis. Exp. (196), e65466, doi:10.3791/65466 (2023).

Less
Copy Citation Download Citation Reprints and Permissions
View Video

Get cutting-edge science videos from JoVE sent straight to your inbox every month.

Waiting X
Simple Hit Counter