Waiting
登录处理中...

Trial ends in Request Full Access Tell Your Colleague About Jove
Click here for the English version

Biology

Визуализатор присущей динамики, интерактивное приложение для оценки и визуализации выходных данных из конвейера вывода генной регуляторной сети

Published: December 7, 2021 doi: 10.3791/63084

Summary

Визуализатор Inherent Dynamics — это интерактивный пакет визуализации, который подключается к инструменту вывода регуляторной сети генов для расширенной, оптимизированной генерации функциональных сетевых моделей. Визуализатор может использоваться для принятия более обоснованных решений по параметризации инструмента вывода, тем самым повышая уверенность в полученных моделях.

Abstract

Разработка моделей генных регуляторных сетей является серьезной проблемой в системной биологии. Для решения этой проблемы было разработано несколько вычислительных инструментов и конвейеров, в том числе недавно разработанный конвейер Inherent Dynamics. Конвейер внутренней динамики состоит из нескольких ранее опубликованных инструментов, которые работают синергетически и связаны линейным образом, где выходные данные одного инструмента затем используются в качестве входных данных для следующего инструмента. Как и в случае с большинством вычислительных методов, каждый шаг конвейера Inherent Dynamics требует, чтобы пользователь делал выбор параметров, которые не имеют точного биологического определения. Этот выбор может существенно повлиять на модели генных регуляторных сетей, полученные в результате анализа. По этой причине способность визуализировать и исследовать последствия выбора различных параметров на каждом этапе может помочь повысить уверенность в выборе и результатах. Визуализатор Inherent Dynamics — это комплексный пакет визуализации, который упрощает процесс оценки выбора параметров с помощью интерактивного интерфейса в веб-браузере. Пользователь может отдельно изучить выходные данные каждого шага конвейера, внести интуитивно понятные изменения на основе визуальной информации и воспользоваться автоматическим созданием необходимых входных файлов для конвейера Inherent Dynamics. Визуализатор Inherent Dynamics обеспечивает беспрецедентный уровень доступа к очень сложному инструменту для обнаружения генных регуляторных сетей из транскриптомных данных временных рядов.

Introduction

Многие важные биологические процессы, такие как дифференцировка клеток и реакция окружающей среды, управляются наборами генов, которые взаимодействуют друг с другом в генной регуляторной сети (GRN). Эти GRN производят транскрипционную динамику, необходимую для активации и поддержания фенотипа, который они контролируют, поэтому идентификация компонентов и топологической структуры GRN является ключом к пониманию многих биологических процессов и функций. GRN может быть смоделирован как набор взаимодействующих генов и/или генных продуктов, описанных сетью, узлами которой являются гены, а края которой описывают направление и форму взаимодействия (например, активация/подавление транскрипции, посттрансляционная модификация и т.д.). 1. Затем взаимодействия могут быть выражены в виде параметризованных математических моделей, описывающих влияние регулирующего гена на выработку его цели (целей) 2,3,4. Вывод модели GRN требует как вывода структуры сети взаимодействия, так и оценки базовых параметров взаимодействия. Были разработаны различные методы вычислительного вывода, которые принимают данные экспрессии генов временных рядов и выводят модели GRN5. Недавно был разработан новый метод вывода GRN, называемый Inherent Dynamics Pipeline (IDP), который использует данные экспрессии генов временных рядов для получения моделей GRN с мечеными регуляторно-целевыми взаимодействиями, которые способны производить динамику, соответствующую наблюдаемой динамике в данных экспрессии генов6. IDP представляет собой набор инструментов, линейно связанных в конвейер и может быть разбит на три этапа: шаг Node Finding, который ранжирует гены на основе характеристик экспрессии генов, известных или подозреваемых в связи с функцией GRN7,8, шаг Edge Finding, который ранжирует попарные регуляторные отношения8, 9, и этап обнаружения сети, на котором получены модели GRN, способные производить наблюдаемую динамику10,11,12,13,14,15.

Как и большинство вычислительных методов, IDP требует набора заданных пользователем аргументов, которые определяют, как анализируются входные данные, и разные наборы аргументов могут давать разные результаты для одних и тех же данных. Например, несколько методов, включая IDP, содержат аргументы, которые применяют некоторое пороговое значение к данным, и увеличение/уменьшение этого порога между последовательными прогонами конкретного метода может привести к неодинаковым результатам между прогонами (см. Примечание 10: Методы сетевого вывода 5). Понимание того, как каждый аргумент может повлиять на анализ и последующие результаты, важно для достижения высокой уверенности в результатах. В отличие от большинства методов вывода GRN, IDP состоит из нескольких вычислительных инструментов, каждый из которых имеет свой собственный набор аргументов, которые пользователь должен указать, и каждый из которых имеет свои собственные результаты. В то время как IDP предоставляет обширную документацию о том, как параметризовать каждый инструмент, взаимозависимость каждого инструмента от результатов предыдущего шага затрудняет параметризацию всего конвейера без промежуточного анализа. Например, аргументы в шагах Edge и Network Finding, вероятно, будут основаны на предыдущих биологических знаниях, и поэтому будут зависеть от набора данных и / или организма. Для опрашивания промежуточных результатов потребуется базовое понимание программирования, а также глубокое понимание всех файлов результатов и их содержимого от ВПЛ.

Визуализатор внутренней динамики (IDV) — это интерактивный пакет визуализации, который запускается в окне браузера пользователя и предоставляет пользователям IDP возможность оценить влияние их выбора аргументов на результаты любого шага в IDP. IDV перемещается по сложной структуре каталогов, созданной IDP, и собирает необходимые данные для каждого шага и представляет данные в виде интуитивно понятных и интерактивных рисунков и таблиц для изучения пользователем. После изучения этих интерактивных дисплеев пользователь может создавать новые данные из шага IDP, которые могут быть основаны на более обоснованных решениях. Затем эти новые данные могут быть немедленно использованы на следующем соответствующем этапе ВПЛ. Кроме того, изучение данных может помочь определить, следует ли повторно запускать шаг IDP с скорректированными параметрами. IDV может улучшить использование IDP, а также сделать использование IDP более интуитивно понятным и доступным, что было продемонстрировано исследованием основного осциллятора GRN дрожжевого клеточного цикла. Следующий протокол включает результаты IDP от полностью параметризованного запуска IDP по сравнению с подходом, который включает IDV после выполнения каждого шага IDP, т. е. Node, Edge и Network Finding.

Subscription Required. Please recommend JoVE to your librarian.

Protocol

1. Установите IDP и IDV

ПРИМЕЧАНИЕ: В этом разделе предполагается, что docker, conda, pip и git уже установлены (Таблица материалов).

  1. В терминале введите команду: git clone https://gitlab.com/biochron/inherent_dynamics_pipeline.git.
  2. Следуйте инструкциям по установке в файле README IDP.
  3. В терминале введите команду: git clone https://gitlab.com/bertfordley/inherent_dynamics_visualizer.git.
    ПРИМЕЧАНИЕ: Клонирование IDV должно происходить за пределами каталога верхнего уровня IDP.
  4. Следуйте инструкциям по установке в файле README IDV.

2. Поиск узла

  1. Создайте новый файл конфигурации IDP, который параметризует шаг «Поиск узла».
    ПРИМЕЧАНИЕ: Все кавычки в следующих шагах не должны быть набраны. Кавычки используются здесь только в качестве разделителя между текстом протокола и тем, что должно быть напечатано.
    1. Добавьте основные аргументы IDP в файл конфигурации.
    2. Откройте новый текстовый файл в текстовом редакторе и введите "data_file =", "annotation_file =", "output_dir =", "num_proc =" и "IDVconnection = True" в отдельных строках.
    3. Для знака "data_file" после знака равенства введите путь к соответствующему файлу временных рядов и введите запятую после имени. Разделите все данные запятой, если используется более одного набора данных временных рядов. См. Дополнительный файл 1 и Дополнительный файл 2 для примера файлов экспрессии генов временных рядов.
    4. Введите путь и имя файла аннотации для "annotation_file" после знака равенства. Пример файла аннотации см. в дополнительном файле 3 .
    5. В поле "output_file" после знака равенства введите путь и имя папки, в которой будут сохранены результаты.
    6. После знака равенства для "num_proc" введите количество процессов, которые должен использовать IDP.
    7. Добавьте аргументы "Поиск узла" в файл конфигурации.
    8. В том же текстовом файле, что и на шаге 2.1.1, введите в указанном порядке "[dlxjtk_arguments]", "точки =" и "dlxjtk_cutoff =" на отдельных строках. Поместите их после основных аргументов.
    9. Для параметра "периоды" после знака равенства, если используется набор данных одноразовых рядов, введите каждую длину периода, разделенную запятыми. Для нескольких наборов данных временных рядов введите каждый набор длин периодов, как и раньше, но заключите квадратные скобки вокруг каждого набора и поставьте запятую между множествами.
    10. После знака равенства для "dlxjtk_cutoff" введите целое число, указывающее максимальное число генов, сохраняемых в gene_list_file вывода де Лихтенберга по JTK_CYCLE (DLxJTK) (Таблица 1).
      ПРИМЕЧАНИЕ: Настоятельно рекомендуется ознакомиться с разделами dlxjtk_arguments в файле README для МВУ, чтобы лучше понять каждый аргумент. Пример файла конфигурации с указанными аргументами Node Finding см. в дополнительном файле 4 .
  2. В терминале перейдите в каталог IDP с именем inherent_dynamics_pipeline.
  3. В терминале введите команду: conda activate dat2net
  4. Запустите IDP с помощью файла конфигурации, созданного на шаге 2.1, выполнив эту команду в терминале, где < имя файла конфигурации> — это имя файла: python src/dat2net.py < имя файла конфигурации>
  5. В терминале перейдите в каталог с именем inherent_dynamics_visualizer и введите команду: . /viz_results.sh
    ПРИМЕЧАНИЕ: укажу на каталог, используемый в качестве выходного каталога для IDP.
  6. В веб-браузере введите http://localhost:8050/ в качестве URL-адреса.
  7. Теперь, когда IDV открыт в браузере, перейдите на вкладку «Поиск узла» и выберите интересующую вас папку поиска узла из раскрывающегося меню.
  8. Вручную создайте новый список генов из таблицы списка генов в IDV, который будет использоваться для последующих шагов IDP.
    1. Чтобы расширить или сократить таблицу списка генов, нажмите на стрелки вверх или вниз или вручную введите целое число от 1 до 50 в поле рядом с экспрессией генов, ранжированных DLxJTK. Наверх:.
    2. В таблице списка генов нажмите на поле рядом с геном, чтобы просмотреть его профиль экспрессии генов в линейном графике. Может быть добавлено несколько генов.
    3. При необходимости укажите количество контейнеров одинакового размера для вычисления и упорядочивания генов по временному интервалу, содержащему их пиковую экспрессию, введя целое число в поле ввода над таблицей списка генов с меткой Входное целое число, чтобы разделить первый цикл на bins:.
      ПРИМЕЧАНИЕ: Этот параметр специфичен для колебательной динамики и может быть неприменим к другим типам динамики.
    4. Выберите параметр просмотра тепловой карты, щелкнув опцию в разделе «Упорядочить гены по: максимальный экспрессию первого цикла » (таблица 1), которая упорядочивает гены на основе времени пика экспрессии генов в первом цикле.
      ПРИМЕЧАНИЕ: DLxJTK Rank упорядочивает гены на основе ранжирования периодичности из алгоритма DLxJTK IDP.
    5. Нажмите кнопку Загрузить список генов , чтобы загрузить список генов в формат файла, необходимый для шага Edge Finding. Пример файла списка генов см. в дополнительном файле 5 .
  9. В редактируемой таблице аннотаций генов пометьте ген как мишень, регулятор или и то, и другое в файле аннотации для шага Edge Finding в новом запуске Edge Finding. Если ген является регулятором, пометьте ген как активатор, репрессор или и то, и другое.
    1. Чтобы пометить ген как активатор, нажмите на клетку в столбце tf_act и измените значение на 1. Чтобы пометить ген как репрессор, измените значение в столбце tf_rep на 1. Гену будет разрешено действовать как активатор и репрессор на шаге Edge Finding, установив значения как в столбцах tf_act, так и в столбцах tf_rep равными 1.
    2. Чтобы пометить ген как мишень, нажмите на ячейку в целевом столбце и измените значение на 1.
  10. Нажмите кнопку Загрузить примечание. Файл , чтобы загрузить файл аннотации в формат файла, необходимый для шага Edge Finding.

3. Поиск края

  1. Создайте новый файл конфигурации IDP, который параметризует шаг edge Finding.
    1. Добавьте основные аргументы IDP в файл конфигурации. Откройте новый текстовый файл в текстовом редакторе и повторите шаг 2.1.1.
    2. Добавьте аргументы Edge Finding в файл конфигурации.
    3. В том же текстовом файле, что и на шаге 3.1.1, введите в указанном порядке "[lempy_arguments]", "gene_list_file =", "[netgen_arguments]", "edge_score_column =", "edge_score_thresho =", "num_edges_for_list =", "seed_threshold =" и "num_edges_for_seed =" на отдельных строках. Они должны идти ниже основных аргументов.
    4. Для знака "gene_list_file" после знака равенства введите путь и имя файла списка генов, сгенерированного на шаге 2.8.5.
    5. В поле "edge_score_column" после знака "равный" введите "pld" или "norm_loss", чтобы указать, какой столбец фрейма данных из выходных данных lempy используется для фильтрации краев.
    6. Выберите «edge_score_threshold» или «num_edges_for_list» и удалите другой. Если выбран параметр «edge_score_threshold», введите число от 0 до 1. Это число будет использоваться для фильтрации краев на основе столбца, указанного на шаге 3.1.5.
      1. Если выбран параметр «num_edges_for_list», введите значение, равное или меньшее числа возможных ребер. Это число будет использоваться для фильтрации ребер на основе их ранжирования в столбце, указанном на шаге 3.1.5. Оставшиеся края будут использоваться для построения сетей в Network Finding.
    7. Выберите «seed_threshold» или «num_edges_for_seed» и удалите другой. Если был выбран параметр «seed_threshold», введите число от 0 до 1. Это число будет использоваться для фильтрации краев на основе столбца, указанного на шаге 3.1.5.
      1. Если был выбран параметр «num_edges_for_seed», введите значение, равное или меньшее числа возможных ребер. Это число будет использоваться для фильтрации ребер на основе их ранжирования в столбце, указанном на шаге 3.1.5. Оставшиеся края будут использоваться для построения начальной сети (таблица 1), используемой в поиске сети.
        ПРИМЕЧАНИЕ: Настоятельно рекомендуется ознакомиться с разделами lempy_arguments и netgen_arguments в файле README для ВПЛ, чтобы лучше понять каждый аргумент. Пример файла конфигурации с указанными аргументами поиска Edge см. в дополнительном файле 7 .
  2. Повторите шаги 2.2 и 2.3.
  3. Запустите IDP с помощью файла конфигурации, созданного на шаге 3.1, выполнив эту команду в терминале, где < имя файла конфигурации> — это имя файла: python src/dat2net.py < имя файла конфигурации>
  4. Если IDV все еще работает, остановите его, нажав Control C в окне терминала, чтобы остановить программу. Повторите шаги 2.5 и 2.6.
  5. Открыв IDV в браузере, перейдите на вкладку «Поиск края» и выберите интересующую папку поиска края из раскрывающегося меню.
    ПРИМЕЧАНИЕ: Если в Edge Finding используется несколько наборов данных, обязательно выберите последний набор данных, который использовался в анализе локального пограничного компьютера (LEM) (таблица 1). При выборе границ для начальной сети или пограничного списка на основе результатов LEM важно просмотреть данные последних временных рядов, перечисленные в файле конфигурации, поскольку эти выходные данные включают все предыдущие файлы данных в свой вывод о нормативных отношениях между узлами.
  6. Чтобы расширить или сократить таблицу краев, вручную введите целое число в поле ввода в разделе Число ребер:.
  7. При необходимости фильтруйте края по параметрам LEM ODE. Щелкните и перетащите указатель, чтобы переместить либо левую, либо правую сторону ползунка каждого параметра, чтобы удалить края из краевой таблицы, которые имеют параметры за пределами новых допустимых границ параметров.
  8. При необходимости создайте новую начальную сеть, если требуется создать сеть, отличную от той, которая предлагается МВУ. Пример начального сетевого файла см. в дополнительном файле 8 .
    1. Выберите Из Seed , чтобы выбрать начальную сеть, или Из выбора из раскрывающегося меню в разделе Сеть:.
    2. Отмените выделение/выделение краев из таблицы краев, установив соответствующие флажки рядом с каждым краем, чтобы удалить/добавить края из начальной сети.
  9. Нажмите кнопку Загрузить DSGRN NetSpec , чтобы загрузить начальную сеть в формате спецификации сети Динамические сигнатуры, генерируемые регулирующими сетями (DSGRN) (Таблица 1).
  10. Выберите дополнительные узлы и края для использования на шаге Поиск сети.
    1. Выберите края из краевой таблицы, установив соответствующие флажки для включения в файл списка краев, используемый в поиске сети.
    2. Щелкните Загрузить списки узлов и границ , чтобы загрузить файлы списка узлов и пограничного списка в формате, необходимом для их использования в поиске сети. Примеры файлов списка границ и узлов соответственно см. в дополнительном файле 9 и дополнительном файле 10 .
      ПРИМЕЧАНИЕ: Список узлов должен содержать все узлы в файле пограничного списка, поэтому IDV автоматически создает файл списка узлов на основе выбранных краев. Для просмотра краев в edge Finding доступны два варианта. Параметр Сводная таблица LEM представляет края в виде ранжированного списка из 25 лучших ребер. Таблица Top-Line LEM представляет края в сцепленном списке трех лучших ранжированных ребер для каждого возможного регулятора. Количество ребер, просматриваемых для каждого параметра, может быть скорректировано пользователем, изменив число в поле ввода Количество ребер .

4. Поиск сети

  1. Создайте новый файл конфигурации IDP, который параметризует шаг поиска сети.
    1. Добавьте основные аргументы IDP в файл конфигурации. Откройте новый текстовый файл в текстовом редакторе и повторите шаг 2.1.1.
    2. Добавьте аргументы поиска сети в файл конфигурации.
    3. В том же текстовом файле, что и на шаге 4.1.1, введите в указанном порядке "[netper_arguments]", "edge_list_file =", "node_list_file =", "seed_net_file =", "range_operations =", "numneighbors =", "maxparams =", "[[вероятности]]", "addNode =", "addEdge =", "removeNode =" и "removeEdge =" в отдельных строках под основными аргументами.
    4. Для "seed_net_file", "edge_list_file" и "node_list_file" после знака равенства введите путь и имя начального сетевого файла, а также файлов списка краев и узлов, созданных на шагах 3.9 и 3.10.2.
    5. После знака равенства вместо "range_operations" введите два числа, разделенные запятой. Первое и второе числа — это минимальное и максимальное количество добавлений или удалений узлов или ребер на сеть, произведенных соответственно.
    6. Для "numneighbors" после знака равенства введите число, представляющее количество сетей, которые нужно найти в поиске сети.
    7. Для параметра "maxparams" после знака равенства введите число, представляющее максимальное число параметров DSGRN для сети.
    8. Введите значения от 0 до 1 для каждого из этих аргументов: "addNode", "addEdge", "removeNode" и "removeEdge", после знака равенства. Числа должны быть равны 1.
      ПРИМЕЧАНИЕ: Настоятельно рекомендуется ознакомиться с разделами netper_arguments и netquery_arguments в файле README для ВПЛ, чтобы лучше понять каждый аргумент. Примеры файла конфигурации с указанными аргументами «Поиск сети» см. в дополнительном файле 11 и дополнительном файле 12.
  2. Повторите шаги 2.2 и 2.3.
  3. Запустите IDP с помощью файла конфигурации, созданного на шаге 4.1, выполнив эту команду в терминале, где < имя файла конфигурации> — это имя файла: python src/dat2net.py < имя файла конфигурации>
  4. Если IDV все еще работает, остановите его, нажав Control C в окне терминала, чтобы остановить программу. Повторите шаги 2.5 и 2.6.
  5. Открыв IDV в браузере, перейдите на вкладку «Поиск сети» и выберите интересующую вас папку поиска сети.
  6. Выберите сеть или набор сетей, чтобы создать таблицу распространенности границ (таблица 1) и просмотреть сети вместе с соответствующими результатами запроса.
    1. Для выбора сетей доступны два варианта: Вариант 1 - Ввод нижней и верхней границ результатов запроса путем ввода минимальных и максимальных значений во входные поля, соответствующие оси x и y графика. Вариант 2 - Щелкните и перетащите указатель мыши на точечную диаграмму, чтобы нарисовать поле вокруг сетей, которые будут включены. После ввода границ выделения или ввода нажмите кнопку Получить распространенность edge из выбранных сетей .
      ПРИМЕЧАНИЕ: Если было указано более одного запроса DSGRN, используйте переключатели, помеченные типом запроса, для переключения между результатами каждого запроса. То же самое относится, если было указано более одного эпсилона (уровень шума).
  7. Щелкните стрелки под краевой таблицей распространенности, чтобы перейти на следующую страницу таблицы. Нажмите Загрузить таблицу , чтобы загрузить таблицу распространенности периферии.
  8. Введите целое число во входное поле Сетевой индекс, чтобы отобразить одну сеть из выбора, сделанного на шаге 4.6. Нажмите загрузить DSGRN NetSpec , чтобы загрузить отображаемую сеть в формате спецификации сети DSGRN.
  9. Поиск сетей по сходству с заданным мотивом или интересующей сетью.
    1. Используйте флажки, соответствующие каждому краю, чтобы выбрать края, которые будут включены в сеть или мотив, используемый для анализа сходства. Нажмите кнопку Отправить , чтобы создать точечную диаграмму сходства для выбранного мотива или сети.
      ПРИМЕЧАНИЕ: Используйте стрелки в списке краев для сортировки по алфавиту, а стрелки под таблицей для перехода на следующую страницу таблицы.
    2. Щелкните и перетащите указатель мыши на точечную диаграмму, чтобы нарисовать поле вокруг сетей, которые должны быть включены, чтобы выбрать сеть или набор сетей, чтобы создать таблицу распространенности границ и просмотреть сети вместе с соответствующими результатами запроса.
      ПРИМЕЧАНИЕ: Если было указано более одного запроса DSGRN, используйте переключатели, помеченные типом запроса, для переключения между результатами каждого запроса. То же самое относится, если было указано более одного эпсилона (уровень шума).
    3. Повторите шаги 4.7 и 4.8, чтобы загрузить таблицу распространенности границ и отображаемую сеть для анализа сходства соответственно.

Subscription Required. Please recommend JoVE to your librarian.

Representative Results

Этапы, описанные текстуально выше и графически на рисунке 1, были применены к основному колеблющемуся GRN дрожжевого клеточного цикла, чтобы увидеть, возможно ли обнаружить функциональные модели GRN, которые способны производить динамику, наблюдаемую в данных экспрессии генов временных рядов, собранных в исследовании клеточного цикла дрожжей16. Чтобы проиллюстрировать, как IDV может прояснить и улучшить вывод IDP, результаты, после выполнения этого анализа двумя способами, были сопоставлены: 1) выполнение всех этапов IDP за один проход без IDV и 2) прохождение через IDP с помощью IDV, что позволяет корректировать промежуточные результаты как путем включения предыдущих биологических знаний, так и путем принятия уточненного выбора на основе результатов IDP. Хорошо изученный GRN клеточного цикла дрожжей, используемый в качестве примера, имеет многие из его регуляторных отношений, экспериментально проверенных. Если изучается другой и/или менее аннотированный организм или биологический процесс, выбор способа корректировки промежуточных результатов или параметров может быть другим. Чтобы проиллюстрировать один тип запроса, который может быть использован для оценки сетей, надежность каждой сети была измерена для поддержки стабильных колебаний и соответствия наблюдаемой транскрипционной динамике их узлов по параметрам модели.

Данные временных рядов экспрессии генов двух реплицированных рядов были взяты из Orlando 200816 и предварительно обработаны для удаления любой экспрессии генов, связанной с методом синхронизации клеточного цикла, примененным в оригинальном эксперименте (Дополнительный файл 1 и Дополнительный файл 2). Был создан файл аннотации, содержащий все гены в данных временных рядов, которые поддерживаются как связыванием ДНК, так и доказательствами экспрессии, обнаруженными в Yeastract17, и, таким образом, могут функционировать как регулятор в GRN. TOS4, PLM2 и NRM1 также были включены в качестве регуляторов, хотя в Yeastract не было обнаружено обоих типов доказательств, поскольку считается, что они важны для GRN дрожжевого ядра на основе доказательств в литературе18,19 (Дополнительный файл 3). Все регуляторы были помечены как активатор и репрессор, а также мишени.

IDP был сначала параметризован для выполнения всех этапов IDP, то есть Node, Edge и Network Finding. Был выбран набор аргументов, которые оказались подходящими на основе текущего понимания дрожжевого клеточного цикла GRN, небольшого набора генов, участвующих в тесно связанной сети (Дополнительный файл 4). Это понимание в основном повлияло на выбор Node и Edge Finding. Параметры вероятностей в Network Finding были основаны на предположении, что только истинные гены и регуляторные взаимодействия будут передаваться Network Finding. Этот полностью параметризованный запуск IDP дал результаты для node and Edge Finding (рисунок 2B, C), но в Network Finding не было обнаружено ни одной допустимой модели сетей (рисунок 2A, D). Допустимость модели объясняется в документации по коду модуля python dsgrn_net_gen 14, зависимости от IDP. Короче говоря, сети, которые содержат самопередавляющиеся края или имеют слишком много входов или выходов на одном узле, не могут быть запрошены программным обеспечением DSGRN (таблица 1). IDP приводит множество причин, по которым не могут быть найдены сети, допустимые по модели, и описывает шаги по устранению неполадок для решения проблемы (проблем). По сути, это включает в себя изменение параметров и/или входных файлов и повторный запуск соответствующего шага IDP, а также изучение результатов. IDV был использован, чтобы сделать этот процесс менее утомительным и трудоемким.

Результаты Node Finding были загружены в IDV для изучения генов, передаваемых на шаг Edge Finding IDP. Узлы, заданные IDP, являются верхними генами N, ранжированными DLxJTK (таблица 1), N указывается пользователем, однако этот список генов может не подходить для цели анализа. Без предварительных биологических знаний автоматический выбор узлов с использованием только оценок DLxJTK вернул ген с ограниченными доказательствами роли в клеточном цикле дрожжей (RME1), в то время как несколько известных регуляторов транскрипции клеточного цикла не были высоко оценены (рисунок 2B). Экспериментальные данные Yeastract были использованы для выбора из генов с самым высоким рейтингом DLxJTK с аннотацией клеточного цикла. Этими генами являются SWI4, YOX1, YHP1, HCM1, FKH2, NDD1 и SWI5. Их известные регуляторные отношения можно увидеть на рисунке 3. FKH2 не появляется в первой десятке генов (dlxjtk_cutoff был установлен на десять в дополнительном файле 4), ранжированном DLxJTK, поэтому список генов был расширен с использованием IDV до тех пор, пока не был найден FKH2 (рисунок 4). Некоторые из дополнительных генов в расширенном списке генов являются известными основными генами и были бы пропущены без изучения результатов Node Finding. В то время как более известные основные гены были найдены путем расширения списка генов вниз по ранжированному списку DLxJTK, основное внимание было уделено генам, представляющим интерес. Поэтому некоторые гены высокого ранга были отменены, в результате чего был составлен список генов (Дополнительный файл 5), содержащий семь генов (рисунок 4). На основе этих семи генов был создан новый файл аннотации (Дополнительный файл 6), каждый ген был помечен как мишень, а тип регулятора был указан с помощью Yeastract. Новый список генов и файл аннотации были загружены для последующего использования на следующем шаге IDP, Edge Finding. Без IDV процедура добавления и удаления генов из списка генов и файла аннотаций потребовала бы скромных навыков кодирования.

Новый конфигурационный файл IDP был параметризован только для шага Edge Finding (Дополнительный файл 7) с новым списком генов и файлом аннотаций. После завершения IDP с новым конфигурационным файлом результаты были загружены в IDV (рисунок 5A). Поскольку шаг «Поиск сети» стохастически выполняет поиск по сетевому пространству поставляемой ему семенной сети, обеспечение хорошей начальной сети может иметь важное значение. Хорошую семенную сеть можно рассматривать как ту, которая содержит истинные края. С помощью IDV и с использованием онлайн-баз данных, таких как Yeastract и Saccharomyces Genome Database (SGD)20, семенную сеть можно просматривать и корректировать, используя регуляторные отношения из LEM (таблица 1), которые имеют экспериментальные доказательства. Например, край YHP1 = tf_act (HCM1) был снят, потому что нет документальных доказательств этой связи (рисунок 5B) в Yeastract. Край SWI5 = tf_act(FKH2) был добавлен, так как есть документальные доказательства этой связи21. После того, как начальная сеть (таблица 1) была удовлетворительной, был загружен файл спецификации сети DSGRN для сети (дополнительный файл 8).

Без IDV существует более высокая вероятность того, что ребра, для которых нет экспериментальных доказательств, используемых для построения семенной сети. Как видно из рисунка 2C, начальная сеть, сгенерированная на шаге Edge Finding от непрерывного запуска IDP через каждый шаг, содержит ребро SWI4 = tf_rep (NDD1), которое не подтверждается экспериментальными данными в Yeastract, вероятно, потому, что NDD1, как известно, является транскрипционным активатором22. Эта информация не была закодирована в файле аннотации в режиме нон-стоп, что позволило всем регуляторам быть как активаторами, так и репрессорами.

С помощью IDV вручную курировалась начальная сеть, представляющая собой подсеть , показанную на рисунке 3, а остальные четыре края были помещены в пограничный список, используемый для выборки сетевого пространства (YHP1 = tf_act(SWI4), YOX1 = tf_act(SWI4), SWI4 = tf_rep(YOX1), SWI5 = tf_act(NDD1)). Выбор ребер на основе предварительных биологических знаний также может быть использован для построения списка краев; однако в этом случае были выбраны 20 верхних краев из представления сводной таблицы LEM (дополнительный файл 9). Файл списка узлов создается из выбранных краев автоматически (дополнительный файл 10). Параметры ODE из LEM также могут быть использованы для фильтрации ребер, если кто-то считает, что выведенные параметры в модели ODE не являются биологически реалистичными, но эта информация здесь не использовалась.

Затем новый файл конфигурации IDP был параметризован для шага Поиск сети с использованием трех новых файлов. Поскольку семенная сеть была создана с краями, хорошо подтвержденными экспериментальными данными, включение этих ребер во все сети было желательным. Таким образом, вероятности поиска сети были установлены таким образом, чтобы разрешить добавление, но не удаление узлов и ребер (Дополнительный файл 11). Параметр Network Finding numneighbors был настроен для поиска 2000 сетей. После запуска IDP на шаге Поиск сети было обнаружено 37 допустимых по модели сетей, в отличие от безостановочного запуска, который имел ноль. При загрузке результатов поиска сети в IDV 64% (24) из этих 37 сетей имели возможность стабильно колебаться (рисунок 6A). Из этих 24 сетей лучшими исполнителями были две сети, которые соответствовали данным на 50% от их стабильно колеблющихся параметров модели (рисунок 6B).

В таблице распространенности периферии (таблица 1) приведено в таблицу количество случаев появления края в выбранной коллекции сетей, что дает представление о его распространенности в высокопроизводительных сетях. Изучение таблицы распространенности периферии, полученной путем выбора двух предыдущих сетей на точечной диаграмме, показывает, что все начальные края сети присутствуют в каждой из двух сетей, как и ожидалось, наряду с двумя краями несемейной сети (рисунок 6B), SWI4 = tf_act (SWI5) и HCM1 = tf_rep (YHP1). Ни один из этих двух краев не имел доказательств, подтверждающих их в Yeastract. Поскольку был исследован такой небольшой объем сетевого пространства, поэтому трудно оценить важность ребер и узлов в создании наблюдаемой динамики.

Только 37 допустимых для модели сетей были найдены в Network Finding, хотя параметр numneighbors был установлен на 2000, что говорит о том, что поиск сети, возможно, был чрезмерно ограничен. Как описано в документации по модулю python dsgrn_net_gen в IDP, проблема может быть связана с начальной сетью, пограничным списком, списком узлов, выбором параметров поиска сети или их комбинацией. Для исследования использовались те же начальные сети, пограничный список и список узлов, что и раньше, но параметры поиска сети были изменены путем добавления возможности удаления краев во время создания сети (дополнительный файл 12). Загрузка новых результатов поиска сети в IDV показывает, что на этом этапе было обнаружено 612 сетей, причем 67% (411) этих сетей имеют способность стабильно колебаться (рисунок 7A). Интересно, что 13% (82) сетей, которые были способны к стабильной колебательной динамике, не были способны производить динамику, аналогичную той, которая видна в данных (рисунок 7B). Из 411 сетей 30% (124) продемонстрировали надежные соответствия данным (т.е. более 50% их стабильно колеблющихся параметров модели демонстрировали соответствие данных) (рисунок 7C).

Цифры распространенности краев, полученные в результате второго раунда поиска сетей, в настоящее время основаны на гораздо большем выборе сетей и могут более уверенно использоваться при оценке важности нормативных отношений в GRN. Например, HCM1 = tf_rep (YHP1) по-прежнему широко представлен в сетях, которые производят надежную динамику, предполагая, что эту связь стоит исследовать экспериментально (рисунок 7C). Дальнейшее изучение таблицы распространенности edge (на основе 124 сетей, упомянутых выше) показало, что края SWI4 = tf_rep(YOX1) и YOX1 = tf_act (SWI4) не имеют высокого рейтинга, но края SWI4 = tf_rep (YHP1) и YHP1 = tf_act (SWI4) имеют высокий рейтинг (рисунок 7C). Отрицательная обратная связь важна для получения колебательной динамики23 , и оба этих набора регуляторных отношений обеспечивают эту функцию в GRN на рисунке 3. Выяснение того, существует ли сеть, содержащая все четыре из этих ребер, может дать некоторое представление о том, почему они не часто существуют вместе в коллекции моделей GRN; однако переход по отдельным сетям был бы утомительным. Вместо этого часть «Анализ сходства» на странице «Поиск сети» использовалась для поиска сетей, которые могут содержать все четыре края (рисунок 7D). Изучение точечной диаграммы, которая показывает, насколько схожи сети 612 с мотивом этих четырех ребер по сравнению с процентом пространства параметров модели, которое соответствует наблюдаемой динамике, показывает, что только 0,65% (4) из 612 сетей содержат все четыре из этих ребер (рисунок 7D). Это наводит на мысль о проверяемой гипотезе о том, что только одна из двух петель отрицательной обратной связи необходима для сети такого размера для получения наблюдаемой динамики. Эта гипотеза может быть дополнительно исследована вычислительно путем репараметризации шагов IDP и более исчерпывающего поиска сетевого пространства или экспериментально, таких как нокауты генов. Все результаты этого анализа можно найти в дополнительном файле 13.

Figure 1
Рисунок 1: Обзор рабочих процессов IDP и IDV. В нижней строке показаны три основных этапа IDP: node, Edge и Network Finding. В верхней строке показаны основные этапы IDV и описаны различные способы взаимодействия пользователя с результатами. Темно-серые стрелки между ними показывают, как IDV и IDP могут работать синергетически, чтобы позволить пользователям принимать обоснованные решения для каждого шага IDP, с отдельными шагами IDP, обеспечивающими результаты для визуализации в IDV, отдельными шагами IDV, позволяющими вводить новые или скорректированные параметры и скорректированные результаты и входные данные для последующего шага IDP. Пожалуйста, нажмите здесь, чтобы просмотреть увеличенную версию этого рисунка.

Figure 2
Рисунок 2: Пример результатов последовательного выполнения каждого шага IDP без использования IDV между шагами. (A) Снимок экрана вывода терминала из последовательного выполнения каждого шага IDP. IDP был завершен, но на шаге Поиск сети не было обнаружено ни одной сети. (B) Каталог результатов поиска узла node_finding_20210705183301 (дополнительный файл 13), загруженный в IDV. Все гены в таблице списка генов были выбраны (красная стрелка), чтобы показать их соответствующие профили экспрессии в линейном графике и сгенерировать таблицу аннотаций. Таблица аннотаций была заполнена, чтобы отразить, как гены помечены в исходном файле аннотации (зеленая стрелка). (C) Каталог результатов поиска краев edge_finding_20210705183301 (дополнительный файл 13), загруженный в IDV. (D) Каталог результатов поиска сети network_finding_20210705183301 (дополнительный файл 13), загруженный в IDV. Страница Поиск сети не показывает никаких результатов, предполагая либо повторную метрику шага Поиска сети, либо переоценку шага Поиска узла или Края. Документация IDP содержит шаги по устранению неполадок, помогающие пользователю определить, что он может попробовать дальше. Пожалуйста, нажмите здесь, чтобы просмотреть увеличенную версию этого рисунка.

Figure 3
Рисунок 3: Дрожжевая модель GRN клеточного цикла. Набор известных регуляторов клеточного цикла дрожжей был выбран из SGD, а известные регуляторные отношения между генами были извлечены из Yeastract. Пожалуйста, нажмите здесь, чтобы просмотреть увеличенную версию этого рисунка.

Figure 4
Рисунок 4: Пример результатов поиска узла IDP в IDV. В IDV загружается каталог результатов поиска узла node_finding_20210705183301 (дополнительный файл 13). Скорректированные результаты после проверки кураторских онлайн-баз данных дрожжей. Таблица списка генов была расширена (желтая стрелка), чтобы найти оставшийся ген в модели GRN на рисунке 3 , и гены были отменены для удаления генов, не найденных в той же модели GRN (красная стрелка). Таблица аннотаций была заполнена на основе доказательств регуляции для каждого гена, найденного на Yeastract (зеленая стрелка). Новый список генов и файл аннотации были загружены путем выбора соответствующих кнопок загрузки (синие стрелки). Пожалуйста, нажмите здесь, чтобы просмотреть увеличенную версию этого рисунка.

Figure 5
Рисунок 5: Пример результатов IDP Edge Finding в IDV. В IDV загружается каталог результатов edge Finding edge_finding_20210701100152 (дополнительный файл 13). (A) Первоначальный результат, полученный ВПЛ. Выбран параметр раскрывающегося списка Сеть из Seed (красная стрелка) для просмотра начальной сети, созданной IDP, на основе аргументов в используемом файле конфигурации (Дополнительный файл 7). Выбранные гены в краевой таблице — это ребра, используемые в семенной сети. (B) Скорректированные результаты после проверки семенной сети на наличие краев, которые не содержат экспериментальных доказательств. Выбран раскрывающийся список Сеть из выделения (красная стрелка). Края были выбраны/отменены из таблицы краев (зеленая стрелка). Файлы начальной сети, пограничного списка и списка узлов были загружены нажатием соответствующих кнопок (желтые стрелки). Показанная краевая таблица относится к последним данным временных рядов, перечисленным в файле конфигурации two_wts_EdgeFinding_config.txt (дополнительный файл 7). При выборе границ для начальной сети или пограничного списка на основе результатов LEM важно просмотреть данные последних временных рядов, перечисленные в файле конфигурации, поскольку эти выходные данные включают все предыдущие файлы данных в свой вывод о нормативных отношениях между узлами. Пожалуйста, нажмите здесь, чтобы просмотреть увеличенную версию этого рисунка.

Figure 6
Рисунок 6: Пример результатов IDP Network Finding в IDV от использования конфигурационного файла IDP two_wts_NetFind_rd1_config.txt (Дополнительный файл 11). (A) Запрос Стабильный полный цикл был выбран (красная стрелка) для отображения соответствующих данных по оси Y в точечной диаграмме. Синие точки на точечной диаграмме представляют выбранные точки с помощью функции Box Select для точечной диаграммы. Пунктирное поле выделения было проиллюстрировано, чтобы показать, как выглядит выделение поля. (B) Минимальные и максимальные целые числа для осей Y и X были вручную введены в выбранные сети в этих границах (зеленая стрелка). После каждого выбора была нажата кнопка Получить распространенность edge из выбранных сетей (желтые стрелки) и были сгенерированы области Таблица распространенности edge и Выбранные прогнозируемые сети DSGRN. В сетевом индексе можно щелкнуть стрелки вверх и вниз для просмотра выбранных сетей (синие стрелки). Пожалуйста, нажмите здесь, чтобы просмотреть увеличенную версию этого рисунка.

Figure 7
Рисунок 7: Пример IDP Network Finding приводит к тому, что IDV использует конфигурационный файл IDP two_wts_NetFind_rd2_config.txt (Дополнительный файл 12). (А-С) Выбор сетей осуществлялся путем ввода значений в поля ввода min и max (красные стрелки). Кнопка Получить распространенность пограничного сервера из выбранных сетей была нажата для создания областей Таблица распространенности пограничных границ и Выбранные прогнозируемые сети DSGRN. (D) В таблице edge_list (желтая стрелка) были выбраны интересующие края и нажата кнопка «Отправить» (зеленая стрелка) для вычисления оценок сходства для построения в точечной диаграмме по выбранному запросу (синяя стрелка). Функция Box Select использовалась для выбора набора сетей (фиолетовая стрелка) для создания областей Edge Prevalence Table и Selected DSGRN Predicted Networks. Сетевой индекс был увеличен до 2 (оранжевая стрелка) для просмотра второй сети в выборе. Пожалуйста, нажмите здесь, чтобы просмотреть увеличенную версию этого рисунка.

Срок Этап трубопровода Определение
де Лихтенбург от JTK-CYCLE (DLxJTK) Поиск узлов Единая количественная мера как периодичности, так и силы регуляции, используемая для ранжирования генов. Объединяет ранее опубликованные метрики периодичности de Lichtenberg (DL) и JTK-CYCLE (JTK).
Максимальное выражение первого цикла Поиск узлов Максимальная экспрессия генов в течение первого цикла периодической экспрессии генов. Гены, упорядоченные по первому циклу максимальной экспрессии, будут упорядочены на основе точки времени от первого цикла, в которой они достигают своей максимальной экспрессии генов.
Локальный пограничный компьютер (LEM) Поиск кромок Байесовский метод сетевого вывода, который ранжирует потенциальные модели взаимодействия генов для идентификации наиболее вероятного регулятора (регуляторов) и способов регуляции (активации или вытеснения) данного гена-мишени с использованием данных экспрессии генов временных рядов.
Семенная сеть Поиск сети Первоначальное предположение о правдоподобной сети глобальных взаимодействий путем выбора лучших ребер LEM. Seed локализует область сетевого пространства, которая является сильно колебательной с высокой вероятностью демонстрации согласованности с предоставленными данными временных рядов.
Динамические сигнатуры, генерируемые регулирующими сетями (DSGRN) Поиск сети Пакет программного обеспечения для комплексного вычисления различных долгосрочных динамических поведений, которые может демонстрировать сеть.
Распространенность краев Поиск сети Процент сетей с наибольшим количеством баллов на этапе поиска сети, которые включают рассматриваемое преимущество. Оценка позволяет ранжировать ребра, которые имеют ненулевую распространенность.

Таблица 1: Определение терминов конвейера врожденной динамики и визуализатора врожденной динамики.

Дополнительный файл 1: Данные экспрессии генов временных рядов (репликация 1), взятые из Орландо, 200813. Пожалуйста, нажмите здесь, чтобы загрузить этот файл.

Дополнительный файл 2: Данные экспрессии генов временных рядов (Репликация 2), взятые из Орландо, 200813. Пожалуйста, нажмите здесь, чтобы загрузить этот файл.

Дополнительный файл 3: Файл аннотации, содержащий все гены, обнаруженные в Дополнительном файле 1 и Дополнительном файле 2. Пожалуйста, нажмите здесь, чтобы загрузить этот файл.

Дополнительный файл 4: Полностью параметризованный конфигурационный файл конвейера встроенной динамики. Пожалуйста, нажмите здесь, чтобы загрузить этот файл.

Дополнительный файл 5: Файл списка генов, загруженный со страницы «Поиск узлов» визуализатора присущей динамики. Пожалуйста, нажмите здесь, чтобы загрузить этот файл.

Дополнительный файл 6: файл аннотации, загруженный со страницы «Поиск узлов» визуализатора присущей динамики. Пожалуйста, нажмите здесь, чтобы загрузить этот файл.

Дополнительный файл 7: Конфигурационный файл конвейера Inherent Dynamics, параметризованный только для шага edge Finding. Пожалуйста, нажмите здесь, чтобы загрузить этот файл.

Дополнительный файл 8: Начальный сетевой файл, загруженный со страницы «Поиск края» визуализатора присущей динамики. Пожалуйста, нажмите здесь, чтобы загрузить этот файл.

Дополнительный файл 9: Файл списка edge, загруженный со страницы «Поиск края» визуализатора встроенной динамики. Пожалуйста, нажмите здесь, чтобы загрузить этот файл.

Дополнительный файл 10: файл списка узлов, загруженный со страницы «Поиск края» визуализатора присущей динамики. Пожалуйста, нажмите здесь, чтобы загрузить этот файл.

Дополнительный файл 11: Конфигурационный файл конвейера Inherent Dynamics, параметризованный только для шага поиска сети. Пожалуйста, нажмите здесь, чтобы загрузить этот файл.

Дополнительный файл 12: Обновленный файл конфигурации конвейера встроенной динамики (дополнительный файл 11), параметризованный только для шага поиска сети. Пожалуйста, нажмите здесь, чтобы загрузить этот файл.

Дополнительный файл 13: Справочник, содержащий результаты из раздела «Репрезентативные результаты». Пожалуйста, нажмите здесь, чтобы загрузить этот файл.

Subscription Required. Please recommend JoVE to your librarian.

Discussion

Вывод GRN является важной проблемой в системной биологии. IDP генерирует модельные GRN из данных экспрессии генов с использованием последовательности инструментов, которые используют данные все более сложными способами. Каждый шаг требует принятия решений о том, как обрабатывать данные и какие элементы (гены, функциональные взаимодействия) будут переданы следующему слою IDP. Влияние этих решений на результаты ВПЛ не столь очевидно. Чтобы помочь в этом отношении, IDV предоставляет полезную интерактивную визуализацию выходных данных из отдельных шагов инструментов вывода GRN в рамках IDP. IDV упрощает и облегчает процесс оценки результатов этих методов вычислительного вывода для ускорения экспериментов и информирования о выборе анализа, что, в свою очередь, позволит ускорить производство сетевых моделей и гипотез с высокой степенью достоверности. IDV также реализует функции, которые расширяют функциональность IDP, включая фильтрацию краев по выбору параметров LEM ODE, биннинг генов по времени их экспрессии и кластеризацию сетей на основе сходства с мотивом или сетью. Важно отметить, что IDV допускает ручное вмешательство между каждым шагом IDP, что позволяет пользователю легко интегрировать человеческие знания и предыдущую информацию из литературы способами, которые не могут быть легко автоматизированы. Наивный запуск IDP не будет изначально включать эту информацию, поэтому использование IDV повысит уверенность в результатах всякий раз, когда доступна информация, относящаяся к эксперименту. В целом, использование IDV в сочетании с IDP позволяет пользователям создавать сетевые гипотезы для биологических процессов с большей уверенностью, даже практически не зная истинного GRN.

В IDV есть три критических шага. Во-первых, это оценка результатов поиска узлов IDP в IDV. Страница IDV Node Finding может создать новый список генов и, при желании, файл аннотации генов. Курирование нового списка генов является критическим шагом, поскольку оно значительно сокращает потенциальное сетевое пространство, ограничивая, какие гены разрешено моделировать в качестве мишеней и / или регуляторов GRN. Кроме того, поскольку GRN в основном состоят из факторов транскрипции, наличие аннотаций генов значительно поможет в создании когерентных моделей GRN.

Следующим шагом является оценка результатов IDP Edge Finding в IDV. Курирование новой начальной сети является критически важным шагом, поскольку оно локализует область сетевого пространства, которая будет отобрана на этапе Поиск сети. Однако знание того, с чего начать, не всегда очевидно, поэтому рекомендуется использовать ребра, которые имеют некоторую форму экспериментальных доказательств, чтобы обеспечить уверенность в том, что вы начинаете в области сетевого пространства, которая содержит края с высокой степенью достоверности. Страница IDV Edge Finding позволяет легко собирать начальные сети и генерировать связанный файл спецификации сети DSGRN, а также списки узлов и краев.

Последним шагом является оценка результатов поиска сети IDP в IDV. Страница IDV Network Finding позволяет легко исследовать отобранные сети и связанные с ними оценки, которые оценивают способность сети производить наблюдаемую динамику. В то время как Node и Edge Finding всегда будут возвращать результаты (если из Node Finding передаются по крайней мере два гена), Network Finding может возвращать нулевые результаты. Поэтому знание того, нужны ли корректировки параметров, будет более очевидным в поиске сети, чем в поиске узлов и краев. Такие случаи, когда было обнаружено мало сетей или вообще не было найдено, могут быть результатом ограничений, наложенных на то, какие сети могут быть проанализированы. Этими ограничениями являются: 1) всегда ли сети тесно связаны, 2) минимальное и максимальное количество входных ребер для каждого узла, 3) вероятности добавления и удаления узлов и ребер и 4) количество добавок и удалений узлов и ребер. Если обнаружено мало или вообще не найдено допустимых для модели сетей, как показано на рисунке 2, то для руководства по репараметризации любого или всех этапов МВУ с последующей оценкой результатов в IDV рекомендуется ссылаться на документацию IDP.

Текущее ограничение этого подхода заключается в том, что страница Node Finding в основном сосредоточена на колебательной динамике, такой как те, которые наблюдаются в транскрипционных программах клеточного цикла и циркадных часов. В частности, шаг IDP Node Finding в настоящее время настроен на поиск генов, которые демонстрируют колебательную динамику в заданный период. По мере того, как IDP расширяется, включая анализы, которые могут количественно определять различные типы транскрипционной динамики, IDV также будет обновляться для поддержки визуализации и опроса этих других поведений. Размер сетей, которые ищутся и анализируются на этапе поиска сети, в настоящее время ограничен сетями меньшего размера, например, около 10 генов. Это необходимо, так как вычисления в масштабе DSGRN происходят комбинаторно. Другим ограничением является то, что изучение пространства параметров модели для выбранной сети невозможно в IDV. Однако файл спецификации сети DSGRN для данной сети можно загрузить, а динамику, связанную с каждым параметром модели, можно визуализировать на веб-сайте DSGRN Visualization (https://sites.math.rutgers.edu/~gameiro/dsgrn_viz/). Наконец, IDV был протестирован с использованием систем Linux (Ubuntu) и iOS (Big Sur). IDV был протестирован на Windows 10 с использованием подсистемы Windows для Linux (WSL), которая позволяет пользователям Windows 10 запускать Linux и IDV без необходимости использования другого компьютера, виртуальной машины или установки с двойной загрузкой. IDV в настоящее время не работает в собственной Windows.

Изучение GRN затруднено из-за присущей им сложности, а полезные инструменты вывода, такие как IDP, могут быть трудными для понимания и развертывания с уверенностью. IDV предоставляет метод для снижения сложности изучения GRN, выведенных с использованием IDP, одновременно облегчая включение дополнительной информации, выходящей за рамки динамики экспрессии генов. Использование IDV в сочетании с IDP, как описано здесь, позволит исследователям разрабатывать и анализировать функциональные модели хорошо изученных систем, таких как клеточный цикл человека. Кроме того, эти инструменты будут генерировать проверяемые гипотезы для менее понятных процессов, таких как цикл внутриэритроцитарного развития малярии, который, как предполагается, контролируется GRN24 , но для которого модель еще не предложена.

Subscription Required. Please recommend JoVE to your librarian.

Disclosures

Авторам нечего раскрывать.

Acknowledgments

Эта работа финансировалась грантом NIH R01 GM126555-01 и грантом NSF DMS-1839299.

Materials

Name Company Catalog Number Comments
Docker https://docs.docker.com/get-docker/
Git https://git-scm.com/
Inherent Dynamics Pipeline https://gitlab.com/biochron/inherent_dynamics_pipeline
Inherent Dynamics Visualizer https://gitlab.com/bertfordley/inherent_dynamics_visualizer
Miniconda https://docs.conda.io/en/latest/miniconda.html
Pip https://pip.pypa.io/en/stable/

DOWNLOAD MATERIALS LIST

References

  1. Karlebach, G., Shamir, R. Modelling and analysis of gene regulatory networks. Nature Reviews Molecular Cell Biology. 9 (10), 770-780 (2008).
  2. Aijö, T., Lähdesmäki, H. Learning gene regulatory networks from gene expression measurements using non-parametric molecular kinetics. Bioinformatics. 25 (22), 2937-2944 (2009).
  3. Huynh-Thu, V. A., Sanguinetti, G. Combining tree-based and dynamical systems for the inference of gene regulatory networks. Bioinformatics. 31 (10), 1614-1622 (2015).
  4. Oates, C. J., et al. Causal network inference using biochemical kinetics. Bioinformatics. 30 (17), 468-474 (2014).
  5. Marbach, D., et al. Wisdom of crowds for robust gene network inference. Nature Methods. 9 (8), 796-804 (2012).
  6. Inherent Dynamics Pipeline. , Available from: https://gitlab.com/biochron/inherent_dynamics_pipeline (2021).
  7. Motta, F. C., Moseley, R. C., Cummins, B., Deckard, A., Haase, S. B. Conservation of dynamic characteristics of transcriptional regulatory elements in periodic biological processes. bioRxiv. , (2020).
  8. LEMpy. , Available from: https://gitlab.com/biochron/lempy (2021).
  9. McGoff, K. A., et al. The local edge machine: inference of dynamic models of gene regulation. Genome Biology. 17, 214 (2016).
  10. Cummins, B., Gedeon, T., Harker, S., Mischaikow, K. Model rejection and parameter reduction via time series. SIAM Journal on Applied Dynamical Systems. 17 (2), 1589-1616 (2018).
  11. Cummins, B., Gedeon, T., Harker, S., Mischaikow, K. Database of Dynamic Signatures Generated by Regulatory Networks (DSGRN). Lecture Notes in Computer Science. (including Subseries Lecture Notes in Artificial Intelligence and Lecture Notes in Bioinformatics). , 300-308 (2017).
  12. Cummins, B., Gedeon, T., Harker, S., Mischaikow, K. DSGRN: Examining the dynamics of families of logical models. Frontiers in Physiology. 9. 9, 549 (2018).
  13. DSGRN. , Available from: https://github.com/marciogameiro/DSGRN (2021).
  14. Dsgm_Net_Gen. , Available from: https://github.com/breecummins/dsgrn_net_gen (2021).
  15. Dsgrn_Net_Query. , Available from: https://github.com/breecummins/dsgrn_net_query (2021).
  16. Orlando, D. A., et al. Global control of cell-cycle transcription by coupled CDK and network oscillators. Nature. 453 (7197), 944-947 (2008).
  17. Monteiro, P. T., et al. YEASTRACT+: a portal for cross-species comparative genomics of transcription regulation in yeasts. Nucleic Acids Research. 48 (1), 642-649 (2020).
  18. de Bruin, R. A. M., et al. Constraining G1-specific transcription to late G1 phase: The MBF-associated corepressor Nrm1 acts via negative feedback. Molecular Cell. 23 (4), 483-496 (2006).
  19. Horak, C. E., et al. Complex transcriptional circuitry at the G1/S transition in Saccharomyces cerevisiae. Genes & Development. 16 (23), 3017-3033 (2002).
  20. Cherry, J. M., et al. Saccharomyces genome database: The genomics resource of budding yeast. Nucleic Acids Research. 40, 700-705 (2012).
  21. Zhu, G., et al. Two yeast forkhead genes regulate the cell cycle and pseudohyphal growth. Nature. 406 (6791), 90-94 (2000).
  22. Loy, C. J., Lydall, D., Surana, U. NDD1, a high-dosage suppressor of cdc28-1N, is essential for expression of a subset of late-S-phase-specific genes in saccharomyces cerevisiae. Molecular and Cellular Biology. 19 (5), 3312-3327 (1999).
  23. Cho, C. Y., Kelliher, C. M., Hasse, S. B. The cell-cycle transcriptional network generates and transmits a pulse of transcription once each cell cycle. Cell Cycle. 18 (4), 363-378 (2019).
  24. Smith, L. M., et al. An intrinsic oscillator drives the blood stage cycle of the malaria parasite Plasmodium falciparum. Science. 368 (6492), 754-759 (2020).

Tags

Биология выпуск 178
Визуализатор присущей динамики, интерактивное приложение для оценки и визуализации выходных данных из конвейера вывода генной регуляторной сети
Play Video
PDF DOI DOWNLOAD MATERIALS LIST

Cite this Article

Moseley, R. C., Campione, S.,More

Moseley, R. C., Campione, S., Cummins, B., Motta, F., Haase, S. B. Inherent Dynamics Visualizer, an Interactive Application for Evaluating and Visualizing Outputs from a Gene Regulatory Network Inference Pipeline. J. Vis. Exp. (178), e63084, doi:10.3791/63084 (2021).

Less
Copy Citation Download Citation Reprints and Permissions
View Video

Get cutting-edge science videos from JoVE sent straight to your inbox every month.

Waiting X
Simple Hit Counter