Biology

Inherent Dynamics Visualizer, una aplicación interactiva para evaluar y visualizar los resultados de una canalización de inferencia de red reguladora de genes

Published: December 7, 2021 doi: 10.3791/63084

Robert C. Moseley¹, Sophia Campione¹, Bree Cummins², Francis Motta³, Steven B. Haase¹

¹Department of Biology, Duke University, ²Department of Mathematical Sciences, Montana State University, ³Department of Mathematical Sciences, Florida Atlantic University

Summary

Inherent Dynamics Visualizer es un paquete de visualización interactiva que se conecta a una herramienta de inferencia de red reguladora de genes para una generación mejorada y optimizada de modelos de red funcionales. El visualizador se puede utilizar para tomar decisiones más informadas para parametrizar la herramienta de inferencia, aumentando así la confianza en los modelos resultantes.

Abstract

El desarrollo de modelos de redes reguladoras de genes es un desafío importante en la biología de sistemas. Se han desarrollado varias herramientas computacionales y canalizaciones para abordar este desafío, incluida la recientemente desarrollada Inherent Dynamics Pipeline. Inherent Dynamics Pipeline consta de varias herramientas publicadas anteriormente que funcionan sinérgicamente y están conectadas de manera lineal, donde la salida de una herramienta se utiliza como entrada para la siguiente herramienta. Al igual que con la mayoría de las técnicas computacionales, cada paso de Inherent Dynamics Pipeline requiere que el usuario tome decisiones sobre parámetros que no tienen una definición biológica precisa. Estas opciones pueden afectar sustancialmente los modelos de red reguladora de genes producidos por el análisis. Por esta razón, la capacidad de visualizar y explorar las consecuencias de varias elecciones de parámetros en cada paso puede ayudar a aumentar la confianza en las elecciones y los resultados. Inherent Dynamics Visualizer es un paquete de visualización integral que agiliza el proceso de evaluación de opciones de parámetros a través de una interfaz interactiva dentro de un navegador web. El usuario puede examinar por separado la salida de cada paso de la canalización, realizar cambios intuitivos basados en información visual y beneficiarse de la producción automática de los archivos de entrada necesarios para la canalización de Inherent Dynamics. El Visualizador de Dinámica Inherente proporciona un nivel incomparable de acceso a una herramienta altamente intrincada para el descubrimiento de redes reguladoras de genes a partir de datos transcriptómicos de series temporales.

Introduction

Muchos procesos biológicos importantes, como la diferenciación celular y la respuesta ambiental, se rigen por conjuntos de genes que interactúan entre sí en una red reguladora de genes (GRN). Estos GRN producen la dinámica transcripcional necesaria para activar y mantener el fenotipo que controlan, por lo que identificar los componentes y la estructura topológica del GRN es clave para comprender muchos procesos y funciones biológicas. Un GRN puede ser modelado como un conjunto de genes que interactúan y/o productos genéticos descritos por una red cuyos nodos son los genes y cuyos bordes describen la dirección y la forma de interacción (por ejemplo, activación/represión de la transcripción, modificación post-traduccional, etc.) ¹. Las interacciones pueden expresarse entonces como modelos matemáticos parametrizados que describen el impacto que un gen regulador tiene en la producción de su(s) objetivo(s)^2,3,4. La inferencia de un modelo GRN requiere tanto una inferencia de la estructura de la red de interacción como la estimación de los parámetros de interacción subyacentes. Se han desarrollado una variedad de métodos de inferencia computacional que ingieren datos de expresión génica de series temporales y producen modelos ^GRN5. Recientemente, se desarrolló un nuevo método de inferencia GRN, llamado Inherent Dynamics Pipeline (IDP), que utiliza datos de expresión génica de series temporales para producir modelos GRN con interacciones regulador-objetivo etiquetadas que son capaces de producir dinámicas que coinciden con la dinámica observada en los datos de expresión ^génica6. El IDP es un conjunto de herramientas conectadas linealmente en una tubería y se puede dividir en tres pasos: un paso de búsqueda de nodos que clasifica los genes en función de las características de expresión génica conocidas o sospechadas que están relacionadas con la función del ^GRN7,8, un paso de búsqueda de bordes que clasifica las relaciones regulatorias por ^pares8^,⁹, y un paso de búsqueda de redes que produce modelos GRN que son capaces de producir la dinámica observada10,11,12,13,14,15.

Como la mayoría de los métodos computacionales, el IDP requiere un conjunto de argumentos especificados por el usuario que dictan cómo se analizan los datos de entrada, y diferentes conjuntos de argumentos pueden producir diferentes resultados en los mismos datos. Por ejemplo, varios métodos, incluido el IDP, contienen argumentos que aplican algún umbral a los datos, y aumentar/disminuir este umbral entre ejecuciones sucesivas del método en particular puede dar lugar a resultados disímiles entre ejecuciones (véase nota complementaria 10: Métodos de inferencia de red ^de5). Comprender cómo cada argumento puede afectar el análisis y los resultados posteriores es importante para lograr una alta confianza en los resultados. A diferencia de la mayoría de los métodos de inferencia GRN, el IDP consiste en múltiples herramientas computacionales, cada una con su propio conjunto de argumentos que un usuario debe especificar y cada una con sus propios resultados. Si bien el IDP proporciona una amplia documentación sobre cómo parametrizar cada herramienta, la interdependencia de cada herramienta en la salida del paso anterior hace que la parametrización de toda la tubería sin análisis intermedios sea un desafío. Por ejemplo, es probable que los argumentos en los pasos Edge y Network Finding estén informados por conocimientos biológicos previos, por lo que dependerán del conjunto de datos y / o del organismo. Para interrogar los resultados intermedios, se necesitaría una comprensión básica de la programación, así como una comprensión profunda de todos los archivos de resultados y su contenido del IDP.

Inherent Dynamics Visualizer (IDV) es un paquete de visualización interactiva que se ejecuta en la ventana del explorador de un usuario y proporciona una forma para que los usuarios del IDP evalúen el impacto de sus elecciones de argumentos en los resultados de cualquier paso del IDP. El IDV navega por una complicada estructura de directorios producida por el IDP y recopila los datos necesarios para cada paso y presenta los datos en figuras y tablas intuitivas e interactivas para que el usuario las explore. Después de explorar estas pantallas interactivas, el usuario puede producir nuevos datos a partir de un paso de IDP que puede basarse en decisiones más informadas. Estos nuevos datos se pueden utilizar inmediatamente en el siguiente paso respectivo del IDP. Además, la exploración de los datos puede ayudar a determinar si un paso de IDP debe volver a ejecutarse con parámetros ajustados. El IDV puede mejorar el uso del IDP, así como hacer que el uso del IDP sea más intuitivo y accesible, como se demuestra al investigar el oscilador central GRN del ciclo celular de la levadura. El siguiente protocolo incluye los resultados de IDP de una ejecución de IDP totalmente parametrizada frente a un enfoque que incorpora el IDV después de las ejecuciones de cada paso de IDP, es decir, Node, Edge y Network Finding.

Subscription Required. Please recommend JoVE to your librarian.

Protocol

1. Instale el IDP y el IDV

NOTA: En esta sección se supone que docker, conda, pip y git ya están instalados (Tabla de materiales).

En un terminal, ingrese el comando: git clone https://gitlab.com/biochron/inherent_dynamics_pipeline.git.
Siga las instrucciones de instalación del archivo README del IDP.
En un terminal, ingrese el comando: git clone https://gitlab.com/bertfordley/inherent_dynamics_visualizer.git.
NOTA: La clonación del IDV debe realizarse fuera del directorio de nivel superior del IDP.
Siga las instrucciones de instalación en el archivo README del IDV.

2. Búsqueda de nodos

Cree un nuevo archivo de configuración de IDP que parametrize el paso de búsqueda de nodos.
NOTA: No se deben escribir todas las comillas de los pasos siguientes. Las comillas solo se usan aquí como delimitador entre el texto del protocolo y lo que se va a escribir.
1. Agregue los principales argumentos de IDP al archivo de configuración.
2. Abra un nuevo archivo de texto en un editor de texto y escriba "data_file =", "annotation_file =", "output_dir =", "num_proc =" e "IDVconnection = True" en líneas individuales.
3. Para "data_file", después del signo igual a, escriba la ruta de acceso y el nombre del archivo de serie temporal respectivo y escriba una coma después del nombre. Separe cada dato por una coma, si se está utilizando más de un conjunto de datos de series temporales. Consulte el Archivo Suplementario 1 y el Archivo Suplementario 2 para obtener un ejemplo de archivos de expresión génica de series temporales.
4. Escriba la ruta de acceso y el nombre del archivo de anotación para "annotation_file", después del igual a firmar. Consulte archivo complementario 3 para ver un ejemplo de un archivo de anotación.
5. Para "output_file", después del signo igual a firmar, escriba la ruta y el nombre de la carpeta donde se guardarán los resultados.
6. Después del signo igual a, para "num_proc", escriba el número de procesos que debe usar el IDP.
7. Agregue argumentos de búsqueda de nodos al archivo de configuración.
8. En el mismo archivo de texto que en el paso 2.1.1, escriba el orden presentado "[dlxjtk_arguments]", "puntos =" y "dlxjtk_cutoff =" en líneas individuales. Colóquelos después de los argumentos principales.
9. Para "puntos", después del signo igual a, si se utiliza un conjunto de datos de serie de una sola vez, escriba cada longitud de período separada por comas. Para más de un conjunto de datos de series temporales, escriba cada conjunto de longitudes de período como antes, pero coloque corchetes alrededor de cada conjunto y coloque una coma entre los conjuntos.
10. Después del signo igual a, para "dlxjtk_cutoff", escriba un entero que especifique el número máximo de genes a retener en la salida gene_list_file de De Lichtenberg por JTK_CYCLE (DLxJTK) (Tabla 1).
  NOTA: Se recomienda encarecidamente revisar las secciones dlxjtk_arguments en el README de IDP para comprender mejor cada argumento. Consulte Archivo suplementario 4 para obtener un ejemplo de un archivo de configuración con los argumentos de búsqueda de nodos especificados.
En el terminal, vaya al directorio IDP, denominado inherent_dynamics_pipeline.
En el terminal, ingrese el comando: conda activate dat2net
Ejecute el IDP utilizando el archivo de configuración creado en el paso 2.1 ejecutando este comando en el terminal, donde es el nombre del archivo: python src/dat2net.py
En el terminal, vaya al directorio denominado inherent_dynamics_visualizer e introduzca el comando: . /viz_results.sh
Nota : apuntará al directorio utilizado como directorio de salida para el IDP.
En un navegador web, escriba http://localhost:8050/ como URL.
Con el IDV ahora abierto en el navegador, haga clic en la pestaña Búsqueda de nodos y seleccione la carpeta de búsqueda de nodos de interés en el menú desplegable.
Seleccionar manualmente una nueva lista de genes de la tabla de lista de genes en el IDV para usarla en los pasos posteriores de IDP.
1. Para ampliar o acortar la tabla de la lista de genes, haga clic en las flechas arriba o abajo o introduzca manualmente un entero entre 1 y 50 en el cuadro junto a Expresión génica de genes clasificados por DLxJTK. Arriba:.
2. En la tabla de la lista de genes, haga clic en el cuadro junto a un gen para ver su perfil de expresión génica en un gráfico de líneas. Se pueden agregar múltiples genes.
3. Opcionalmente, especifique el número de contenedores de igual tamaño para calcular y ordenar los genes por el intervalo de tiempo que contiene su expresión máxima, introduciendo un entero en el cuadro de entrada sobre la tabla de lista de genes etiquetada como Entero de entrada para dividir el primer ciclo en contenedores:.
  NOTA: Esta opción es específica de la dinámica oscilatoria y podría no ser aplicable a otros tipos de dinámica.
4. Seleccione una preferencia de visualización de mapa de calor haciendo clic en una opción en Ordenar genes por: Expresión máxima del primer ciclo (Tabla 1) que ordena los genes en función del momento del pico de expresión génica en el primer ciclo.
  NOTA: DLxJTK Rank ordena los genes en función de la clasificación de periodicidad del algoritmo DLxJTK del IDP.
5. Haga clic en el botón Descargar lista de genes para descargar la lista de genes en el formato de archivo necesario para el paso de búsqueda de bordes. Consulte el Archivo suplementario 5 para ver un ejemplo de un archivo de lista de genes.
En la tabla de anotación de genes editables, etiquete un gen como destino, regulador o ambos en el archivo de anotación para el paso Búsqueda de bordes en una nueva ejecución de búsqueda de bordes. Si un gen es un regulador, etiquete el gen como activador, represor o ambos.
1. Para etiquetar un gen como activador, haga clic en la celda en la columna tf_act y cambie el valor a 1. Para etiquetar un gen como represor, cambie el valor de la columna tf_rep a 1. Se permitirá que un gen actúe como activador y represor en el paso de búsqueda de bordes estableciendo los valores en las columnas tf_act y tf_rep en 1.
2. Para etiquetar un gen como objetivo, haga clic en la celda en la columna de destino y cambie el valor a 1.
Haga clic en el botón Descargar aviso. Archivo para descargar el archivo de anotación en el formato de archivo necesario para el paso de búsqueda de bordes.

3. Búsqueda de bordes

Cree un nuevo archivo de configuración de IDP que parametrize el paso de búsqueda perimetral.
1. Agregue los principales argumentos de IDP al archivo de configuración. Abra un nuevo archivo de texto en un editor de texto y repita el paso 2.1.1.
2. Agregue argumentos de búsqueda perimetral al archivo de configuración.
3. En el mismo archivo de texto que en el paso 3.1.1, escriba el orden presentado "[lempy_arguments]", "gene_list_file =", "[netgen_arguments]", "edge_score_column =", "edge_score_thresho =", "num_edges_for_list =", "seed_threshold =" y "num_edges_for_seed =" en líneas individuales. Estos deben ir por debajo de los argumentos principales.
4. Para "gene_list_file", después del signo igual a, escriba la ruta de acceso y el nombre del archivo de lista de genes generado en el paso 2.8.5.
5. Para "edge_score_column", después del signo igual a, ingrese "pld" o "norm_loss" para especificar qué columna de marco de datos de la salida lempy se utiliza para filtrar los bordes.
6. Seleccione "edge_score_threshold" o "num_edges_for_list" y elimine el otro. Si se seleccionó "edge_score_threshold", introduzca un número entre 0 y 1. Este número se utilizará para filtrar aristas en función de la columna especificada en el paso 3.1.5.
  1. Si se seleccionó "num_edges_for_list", introduzca un valor igual o inferior al número de aristas posibles. Este número se utilizará para filtrar las aristas en función de cómo se clasifican en la columna especificada en el paso 3.1.5. Los bordes sobrantes se utilizarán para construir redes en Network Finding.
7. Seleccione "seed_threshold" o "num_edges_for_seed" y elimine el otro. Si se seleccionó "seed_threshold", introduzca un número entre 0 y 1. Este número se utilizará para filtrar aristas en función de la columna especificada en el paso 3.1.5.
  1. Si se seleccionó "num_edges_for_seed", introduzca un valor igual o inferior al número de aristas posibles. Este número se utilizará para filtrar las aristas en función de cómo se clasifican en la columna especificada en el paso 3.1.5. Los bordes sobrantes se utilizarán para construir la red semilla (Tabla 1) utilizada en Network Finding.
    NOTA: Se recomienda encarecidamente revisar las secciones lempy_arguments y netgen_arguments en el README de IDP para comprender mejor cada argumento. Consulte Archivo suplementario 7 para obtener un ejemplo de un archivo de configuración con los argumentos de búsqueda de Edge especificados.
Repita los pasos 2.2 y 2.3.
Ejecute el IDP utilizando el archivo de configuración creado en el paso 3.1 ejecutando este comando en el terminal, donde es el nombre del archivo: python src/dat2net.py
Si el IDV todavía se está ejecutando, deténgalo presionando Control C en la ventana del terminal para detener el programa. Repita los pasos 2.5 y 2.6.
Con el IDV abierto en el navegador, haga clic en la pestaña Edge Finding y seleccione la carpeta de búsqueda de borde de interés en el menú desplegable.
NOTA: Si se utilizan varios conjuntos de datos en la búsqueda perimetral, asegúrese de seleccionar el último conjunto de datos que se utilizó en el análisis de máquina perimetral local (LEM) (tabla 1). Al seleccionar bordes para la red semilla o la lista de bordes basada en los resultados de LEM, es importante observar los últimos datos de series temporales enumerados en el archivo de configuración, ya que esta salida incorpora todos los archivos de datos anteriores en su inferencia de relaciones reglamentarias entre nodos.
Para ampliar o acortar la tabla de bordes, introduzca manualmente un entero en el cuadro de entrada en Número de aristas:.
Opcionalmente, filtre los bordes en los parámetros LEM ODE. Haga clic y arrastre para mover el lado izquierdo o el lado derecho del control deslizante de cada parámetro para eliminar los bordes de la tabla de bordes que tienen parámetros fuera de sus nuevos límites de parámetros permitidos.
Opcionalmente, cree una nueva red semilla si se desea una red semilla diferente a la propuesta por el IDP. Consulte el archivo suplementario 8 para ver un ejemplo de un archivo de red semilla.
1. Seleccione Desde semilla para seleccionar la red semilla o Desde selección en el menú desplegable en Red:.
2. Anule la selección o selección de aristas de la tabla de aristas haciendo clic en las casillas de verificación correspondientes adyacentes a cada arista para quitar o agregar aristas de la red semilla.
Haga clic en el botón Descargar DSGRN NetSpec para descargar la red semilla en el formato de especificación de red Firmas dinámicas generadas por redes reguladoras (DSGRN) (Tabla 1).
Seleccione nodos y bordes adicionales que se utilizarán en el paso Búsqueda de red.
1. Seleccione bordes de la tabla de bordes haciendo clic en las casillas de verificación correspondientes para incluirlas en el archivo de lista de bordes utilizado en Búsqueda de redes.
2. Haga clic en Descargar listas de nodos y bordes para descargar la lista de nodos y los archivos de lista de bordes en el formato requerido para su uso en network Finding. Consulte Archivo suplementario 9 y Archivo suplementario 10 para ver ejemplos de archivos de lista de bordes y nodos, respectivamente.
  NOTA: La lista de nodos debe contener todos los nodos del archivo de lista de bordes, por lo que el IDV crea automáticamente el archivo de lista de nodos en función de los bordes seleccionados. Hay dos opciones disponibles para ver los bordes en Edge Finding. La opción Tabla de resumen de LEM presenta las aristas como una lista clasificada de las 25 aristas principales. La tabla LEM de primera línea presenta las aristas en una lista concatenada de las tres aristas principales clasificadas para cada posible regulador. El usuario puede ajustar el número de aristas vistas para cada opción cambiando el número en el cuadro de entrada Número de aristas .

4. Búsqueda de redes

Cree un nuevo archivo de configuración de IDP que parametrize el paso Búsqueda de red.
1. Agregue los principales argumentos de IDP al archivo de configuración. Abra un nuevo archivo de texto en un editor de texto y repita el paso 2.1.1.
2. Agregue argumentos de búsqueda de red al archivo de configuración.
3. En el mismo archivo de texto que en el paso 4.1.1, escriba el orden presentado "[netper_arguments]", "edge_list_file =", "node_list_file =", "seed_net_file =", "range_operations =", "numneighbors =", "maxparams =", "[[probabilidades]]", "addNode =", "addEdge =", "removeNode =" y "removeEdge =" en líneas individuales, debajo de los argumentos principales.
4. Para "seed_net_file", "edge_list_file" y "node_list_file", después del signo igual, escriba la ruta y el nombre del archivo de red semilla y los archivos de lista de bordes y nodos generados en los pasos 3.9 y 3.10.2.
5. Después del signo igual a, para "range_operations", escriba dos números separados por una coma. El primer y segundo número son el número mínimo y el número máximo de adición o eliminación de nodos o bordes por red realizada, respectivamente.
6. Para "numneighbors", después del igual a firmar, ingrese un número que represente cuántas redes encontrar en Búsqueda de redes.
7. Para "maxparams", después del igual a signo, introduzca un número que represente el número máximo de parámetros DSGRN para permitir una red.
8. Introduzca valores entre 0 y 1 para cada uno de estos argumentos: "addNode", "addEdge", "removeNode" y "removeEdge", después del signo igual a. Los números deben sumar a 1.
  NOTA: Se recomienda encarecidamente revisar las secciones netper_arguments y netquery_arguments en el README de IDP para obtener una mejor comprensión de cada argumento. Consulte archivo complementario 11 y archivo complementario 12 para ver ejemplos de un archivo de configuración con los argumentos de búsqueda de red especificados.
Repita los pasos 2.2 y 2.3.
Ejecute el IDP utilizando el archivo de configuración creado en el paso 4.1 ejecutando este comando en el terminal, donde es el nombre del archivo: python src/dat2net.py
Si el IDV todavía se está ejecutando, deténgalo presionando Control C en la ventana del terminal para detener el programa. Repita los pasos 2.5 y 2.6.
Con el IDV abierto en el navegador, haga clic en la pestaña Búsqueda de red y seleccione la carpeta de búsqueda de red de interés.
Seleccione una red o un conjunto de redes para generar una tabla de prevalencia perimetral (Tabla 1) y para ver las redes junto con sus respectivos resultados de consulta.
1. Hay dos opciones disponibles para seleccionar redes: Opción 1 - Introducir límites inferior y superior en los resultados de la consulta introduciendo valores mínimos y máximos en los cuadros de entrada correspondientes al eje x y al eje y de la gráfica. Opción 2 - Haga clic y arrastre sobre el diagrama de dispersión para dibujar un cuadro alrededor de las redes que se incluirán. Después de introducir los límites de selección o entrada, pulse el botón Obtener prevalencia de borde de redes seleccionadas .
  Nota : si se especificó más de una consulta DSGRN, utilice los botones de opción etiquetados con el tipo de consulta para cambiar entre los resultados de cada consulta. Lo mismo se aplica si se especificó más de un épsilon (nivel de ruido).
Haga clic en las flechas situadas debajo de la tabla de prevalencia de bordes para pasar a la página siguiente de la tabla. Presione Descargar tabla para descargar la tabla de prevalencia de bordes.
Introduzca un entero en el cuadro de entrada Índice de red para mostrar una única red de la selección realizada en el paso 4.6. Haga clic en Descargar DSGRN NetSpec para descargar la red mostrada en el formato de especificación de red DSGRN.
Busque en las redes la similitud con un motivo específico o una red de interés.
1. Utilice las casillas de verificación correspondientes a cada arista para seleccionar las aristas que se incluirán en la red o el motivo utilizado para el análisis de similitud. Haga clic en Enviar para crear el diagrama de dispersión de similitud para el motivo o la red seleccionados.
  NOTA: Utilice las flechas de la lista de bordes para ordenar alfabéticamente y las flechas debajo de la tabla para pasar a la página siguiente de la tabla.
2. Haga clic y arrastre sobre el diagrama de dispersión para dibujar un cuadro alrededor de las redes que se incluirán para seleccionar una red o un conjunto de redes para generar una tabla de prevalencia de borde y ver las redes junto con sus respectivos resultados de consulta.
  Nota : si se especificó más de una consulta DSGRN, utilice los botones de opción etiquetados con el tipo de consulta para cambiar entre los resultados de cada consulta. Lo mismo se aplica si se especificó más de un épsilon (nivel de ruido).
3. Repita los pasos 4.7 y 4.8 para descargar la tabla de prevalencia de borde y la red mostrada para el análisis de similitud, respectivamente.

Subscription Required. Please recommend JoVE to your librarian.

Representative Results

Los pasos descritos textualmente anteriormente y gráficamente en la Figura 1 se aplicaron al NÚCLEO oscilante GRN del ciclo celular de la levadura para ver si es posible descubrir modelos funcionales de GRN que sean capaces de producir la dinámica observada en los datos de expresión génica de series temporales recopilados en un estudio del ciclo celular de la ^levadura16. Para ilustrar cómo el IDV puede aclarar y mejorar la producción de IDP, los resultados, después de realizar este análisis de dos maneras, se compararon: 1) ejecutar todos los pasos del IDP en una sola pasada sin el IDV y 2) pasar por el IDP con la ayuda del IDV, lo que permite el ajuste de los resultados intermedios tanto mediante la incorporación de conocimientos biológicos previos como mediante la toma de decisiones refinadas basadas en los resultados de IDP. El bien estudiado GRN del ciclo celular de levadura utilizado como ejemplo tiene muchas de sus relaciones regulatorias verificadas experimentalmente. Si se está estudiando un organismo o proceso biológico diferente y/o menos anotado, las opciones sobre cómo se ajustan los resultados o parámetros intermedios pueden ser diferentes. Para ilustrar un tipo de consulta que se puede utilizar para evaluar redes, se midió la robustez de cada red para admitir oscilaciones estables y hacer coincidir la dinámica transcripcional observada de sus nodos a través de los parámetros del modelo.

Los datos de series temporales de expresión génica de dos series replicadas se tomaron de Orlando 200816 y se preprocesaron para eliminar cualquier expresión génica asociada con el método de sincronización del ciclo celular aplicado en el experimento original (Archivo suplementario 1 y Archivo suplementario 2). Se creó un archivo de anotación que contiene todos los genes en los datos de la serie temporal que están respaldados por la unión al ADN y la evidencia de expresión que se encuentran en ^Yeastract17 y, por lo tanto, podrían funcionar como un regulador en un GRN. TOS4, PLM2 y NRM1 también se incluyeron como reguladores, a pesar de que no se encontró que en Yeastract tuvieran ambos tipos de evidencia, porque se cree que son importantes para el núcleo de levadura GRN basado en la evidencia en la ^{literatura18,19} (Archivo Suplementario 3). Todos los reguladores fueron etiquetados como activadores y represores, así como objetivos.

El IDP se parametrizó por primera vez para ejecutarse a través de todos los pasos del IDP, es decir, Node, Edge y Network Finding. Se seleccionó un conjunto de argumentos que parecían apropiados en función de la comprensión actual del ciclo celular de la levadura GRN, un pequeño conjunto de genes que participan en una red fuertemente conectada (Archivo suplementario 4). Esta comprensión influyó principalmente en las opciones de búsqueda de nodos y bordes. Los parámetros de probabilidad en Network Finding se basaron en la suposición de que solo los genes verdaderos y las interacciones reguladoras se transmitirían a Network Finding. Esta ejecución totalmente parametrizada del IDP produjo resultados para node and Edge Finding (Figura 2B, C), sin embargo, en Network Finding no se descubrieron redes admisibles para el modelo (Figura 2A, D). La admisibilidad del modelo se explica en la documentación de código del módulo python dsgrn_net_gen ¹⁴, una dependencia del IDP. Brevemente, las redes que contienen bordes auto-reprimidos o tienen demasiadas entradas o salidas en un solo nodo no son consultables por el software DSGRN (Tabla 1). El IDP da muchas razones por las que es posible que no se encuentren redes admisibles para el modelo y describe los pasos de solución de problemas para resolver los problemas. Esencialmente, esto implica cambiar los parámetros y / o archivos de entrada y volver a ejecutar el paso respectivo de IDP, y examinar los resultados. El IDV se utilizó para hacer que este proceso fuera menos tedioso y lento.

Los resultados de Node Finding se cargaron en el IDV para examinar los genes que se pasan al paso Edge Finding del IDP. Los nodos dados por IDP son los principales genes N según la clasificación de DLxJTK (Tabla 1), N especificado por el usuario, sin embargo, esta lista de genes puede no ser apropiada para el objetivo del análisis. Sin conocimiento biológico previo, la selección automática de nodos utilizando solo puntuaciones DLxJTK devolvió un gen con evidencia limitada de un papel en el ciclo celular de la levadura (RME1), mientras que algunos reguladores transcripcionales conocidos del ciclo celular no estaban altamente clasificados (Figura 2B). La evidencia experimental de Yeastract se utilizó para seleccionar entre los genes de mayor rango por DLxJTK aquellos con anotación del ciclo celular. Estos genes son SWI4, YOX1, YHP1, HCM1, FKH2, NDD1 y SWI5. Sus relaciones regulatorias conocidas se pueden ver en la Figura 3. FKH2 no aparece en los diez genes principales (dlxjtk_cutoff se estableció en diez en el Archivo Suplementario 4) según la clasificación de DLxJTK, por lo que la lista de genes se amplió utilizando el IDV hasta que se encontró FKH2 (Figura 4). Varios de los genes adicionales en la lista extendida de genes son genes centrales conocidos y se habrían pasado por alto sin investigar los resultados de Node Finding. Si bien se han encontrado genes centrales más conocidos al extender la lista de genes hacia abajo en la lista clasificada DLxJTK, el enfoque se mantuvo en los genes de interés. Por lo tanto, algunos genes de alto rango fueron desseleccionados, lo que resultó en una lista de genes (Archivo Suplementario 5) que contenía siete genes (Figura 4). Se creó un nuevo archivo de anotación (Archivo Suplementario 6) basado en estos siete genes, cada gen se etiquetó como un objetivo y el tipo de regulador se especificó utilizando Yeastract. La nueva lista de genes y el archivo de anotación se descargaron para su uso posterior en el siguiente paso de IDP, Edge Finding. Sin el IDV, el procedimiento de agregar y eliminar genes de la lista de genes y el archivo de anotación requeriría habilidades de codificación modestas.

Se parametrizó un nuevo archivo de configuración de IDP solo para el paso Edge Finding (Archivo suplementario 7), con la nueva lista de genes y el archivo de anotación. Después de completar el IDP con el nuevo archivo de configuración, los resultados se cargaron en el IDV (Figura 5A). A medida que el paso búsqueda de redes busca estocásticamente alrededor del espacio de red de la red semilla que se le suministra, proporcionar una buena red de semillas puede ser importante. Una buena red de semillas se puede considerar como una que contiene bordes verdaderos. Con el IDV y utilizando bases de datos en línea como Yeastract y Saccharomyces Genome Database (SGD)²⁰, la red de semillas se puede ver y ajustar utilizando las relaciones regulatorias de LEM (Tabla 1) que tienen evidencia experimental. Como ejemplo, el borde YHP1 = tf_act(HCM1) fue desseleccionado porque no hay evidencia documentada de esta relación (Figura 5B) en Yeastract. Se agregó la arista SWI5 = tf_act(FKH2) ya que existe evidencia documentada de esta ^relación21. Una vez que la red semilla (Tabla 1) fue satisfactoria, se descargó el archivo de especificación de red DSGRN para la red (Archivo Suplementario 8).

Sin el IDV, hay una mayor probabilidad de bordes para los cuales no hay evidencia experimental que se utilice para construir la red de semillas. Como se puede ver en la Figura 2C, la red semilla generada en el paso Edge Finding desde la ejecución del IDP sin parar a través de cada paso contiene un borde, SWI4 = tf_rep(NDD1), que no está respaldado por evidencia experimental en Yeastract, probablemente porque se sabe que NDD1 es un activador transcripcional22. Esta información no se codificó en el archivo de anotación en la ejecución ininterrumpida, lo que permitió que todos los reguladores fueran tanto activadores como represores.

Usando el IDV, se seleccionó manualmente una red semilla que es una subred de la Figura 3, y las cuatro aristas restantes se colocaron en la lista de bordes utilizada para muestrear el espacio de red (YHP1 = tf_act (SWI4), YOX1 = tf_act (SWI4), SWI4 = tf_rep (YOX1), SWI5 = tf_act (NDD1)). La selección de bordes basados en el conocimiento biológico previo también se puede utilizar para construir la lista de bordes; sin embargo, en este caso, se seleccionaron las 20 aristas principales de la vista Tabla de resumen LEM (Archivo suplementario 9). El archivo de lista de nodos se crea automáticamente a partir de los bordes seleccionados (Archivo complementario 10). Los parámetros ODE de LEM también se pueden usar para filtrar bordes si se cree que los parámetros inferidos en el modelo ODE no son biológicamente realistas, pero esta información no se usó aquí.

A continuación, se parametrizó un nuevo archivo de configuración de IDP para el paso Búsqueda de red utilizando los tres nuevos archivos. Como la red semilla se creó con bordes bien respaldados por evidencia experimental, se deseaba la inclusión de estos bordes en todas las redes. Por lo tanto, las probabilidades de búsqueda de red se establecieron para permitir la adición, pero no la eliminación de nodos y bordes (Archivo suplementario 11). El parámetro Network Finding numneighbors se estableció para buscar 2.000 redes. Después de ejecutar el IDP, se encontraron 37 redes admisibles para el modelo en el paso Búsqueda de red, a diferencia de la ejecución ininterrumpida que tenía cero. Cargando los resultados de Network Finding en el IDV, el 64% (24) de estas 37 redes tenían la capacidad de oscilar de manera estable (Figura 6A). De estas 24 redes, las de mejor desempeño fueron dos redes que coincidieron con los datos en el 50% de sus parámetros de modelo de oscilación estable (Figura 6B).

La Tabla de prevalencia de borde (Tabla 1) tabula el número de veces que se produce un borde en una colección seleccionada de redes, dando una indicación de su prevalencia en redes de alto rendimiento. El examen de la tabla de prevalencia de bordes producida al seleccionar las dos redes anteriores en el diagrama de dispersión revela que todos los bordes de red semilla están presentes en cada una de las dos redes, como se esperaba, junto con dos bordes de red no semilla (Figura 6B), SWI4 = tf_act (SWI5) y HCM1 = tf_rep (YHP1). Ninguno de estos dos bordes tenía evidencia que los apoyara en Yeastract. Como se exploró una cantidad tan pequeña de espacio de red, por lo que es difícil evaluar la importancia de los bordes y nodos en la producción de la dinámica observada.

Solo se encontraron 37 redes admisibles para el modelo en Network Finding a pesar de que el parámetro numneighbors se estableció en 2,000, lo que sugiere que la búsqueda en la red puede haber sido indebidamente limitada. Como se describe en la documentación para el módulo python dsgrn_net_gen en el IDP, el problema podría estar relacionado con la red semilla, la lista de bordes, la lista de nodos, las opciones de parámetros de búsqueda de red o alguna combinación de estos. Para investigar, se usaron la misma red semilla, lista de bordes y lista de nodos que antes, pero los parámetros de búsqueda de redes se modificaron al agregar la capacidad de eliminar bordes durante la generación de la red (Archivo suplementario 12). La carga de los nuevos resultados de Búsqueda de redes en el IDV muestra que se encontraron 612 redes en este paso, con el 67% (411) de estas redes que tienen la capacidad de oscilar de manera estable (Figura 7A). Curiosamente, el 13% (82) de las redes que eran capaces de una dinámica oscilatoria estable no eran capaces de producir dinámicas similares a las observadas en los datos (Figura 7B). De las 411 redes, el 30% (124) exhibieron coincidencias robustas con los datos (es decir, más del 50% de sus parámetros de modelos oscilantes estables exhibieron una coincidencia de datos) (Figura 7C).

Los números de prevalencia de borde generados por la segunda ronda de búsqueda de redes ahora se basan en una selección mucho mayor de redes y se pueden usar con más confianza para evaluar la importancia de una relación regulatoria en un GRN. Por ejemplo, HCM1 = tf_rep (YHP1) todavía está altamente representado en redes que producen dinámicas robustas, lo que sugiere que esta relación podría valer la pena investigarla experimentalmente (Figura 7C). Un examen más detallado de la Tabla de Prevalencia de Bordes (basada en las 124 redes mencionadas anteriormente) reveló que los bordes SWI4 = tf_rep(YOX1) y YOX1 = tf_act(SWI4) no están altamente clasificados, pero los bordes SWI4 = tf_rep(YHP1) e YHP1 = tf_act(SWI4) están altamente clasificados (Figura 7C). La retroalimentación negativa es importante para producir dinámicas ^{oscilatorias23} y ambos conjuntos de relaciones reguladoras proporcionan esta función en el GRN de la Figura 3. Encontrar si existe una red que contenga estos cuatro bordes podría proporcionar una idea de por qué estos no existen con frecuencia juntos en la colección de modelos GRN; sin embargo, hacer clic a través de redes individuales sería tedioso. En su lugar, se utilizó la parte de análisis de similitud de la página Búsqueda de redes para buscar redes que pueden contener los cuatro bordes (Figura 7D). El examen del diagrama de dispersión que muestra cuán similares son las 612 redes a un motivo de estas cuatro aristas frente al porcentaje del espacio de parámetros del modelo que coincide con la dinámica observada revela que solo el 0,65% (4) de las 612 redes contienen las cuatro aristas (Figura 7D). Esto sugiere una hipótesis comprobable de que solo se necesita uno de los dos bucles de retroalimentación negativa para que una red de este tamaño produzca la dinámica observada. Esta hipótesis puede investigarse más a fondo computacionalmente mediante la reparametrización de los pasos de IDP y una búsqueda más exhaustiva del espacio de red o experimentalmente, como los knockouts de genes. Todos los resultados de este análisis se pueden encontrar en el Archivo Suplementario 13.

Figura 1: Información general sobre el flujo de trabajo de IDP e IDV. La fila inferior muestra los tres pasos principales del IDP: Nodo, Borde y Búsqueda de red. La fila superior muestra los pasos principales del IDV y describe varias formas en que un usuario puede interactuar con los resultados. Las flechas grises oscuras entre los dos representan cómo el IDV y el IDP pueden trabajar sinérgicamente para permitir a los usuarios tomar decisiones informadas para cada paso del IDP, con pasos individuales de IDP que proporcionan resultados para las visualizaciones en el IDV, pasos IDV individuales que permiten la entrada de parámetros nuevos o ajustados y resultados y entradas ajustados para el paso IDP posterior. Haga clic aquí para ver una versión más grande de esta figura.

Figura 2: Ejemplo de resultados de ejecutar cada paso del IDP consecutivamente sin usar el IDV entre pasos. (A) Una captura de pantalla de la salida del terminal al ejecutar cada paso del IDP consecutivamente. El IDP se ejecutó hasta su finalización, pero no se encontraron redes durante el paso de búsqueda de redes. (B) Directorio de resultados de búsqueda de nodos node_finding_20210705183301 (Archivo suplementario 13) cargado en el IDV. Se seleccionaron todos los genes de la tabla de lista de genes (flecha roja) para mostrar sus respectivos perfiles de expresión en el gráfico de líneas y generar una tabla de anotaciones. La tabla de anotaciones se rellenó para reflejar cómo se etiquetan los genes en el archivo de anotación original (flecha verde). (C) Directorio de resultados de Edge Finding edge_finding_20210705183301 (Archivo suplementario 13) cargado en el IDV. (D) Directorio de resultados de búsqueda de red network_finding_20210705183301 (Archivo suplementario 13) cargado en el IDV. La página Búsqueda de red no muestra resultados, lo que sugiere que es necesario reparar el paso búsqueda de red o reevaluar el paso búsqueda de nodos o bordes. La documentación de IDP contiene pasos de solución de problemas para ayudar al usuario a determinar qué podría probar a continuación. Haga clic aquí para ver una versión más grande de esta figura.

Figura 3: Un modelo GRN del ciclo celular de la levadura. Se seleccionó un conjunto de reguladores conocidos del ciclo celular de la levadura a partir de SGD y se extrajeron las relaciones reguladoras conocidas entre los genes de Yeastract. Haga clic aquí para ver una versión más grande de esta figura.

Figura 4: Ejemplo de resultados de búsqueda de nodos IDP en el IDV. Cargado en el IDV está el directorio de resultados de búsqueda de nodos node_finding_20210705183301 (archivo complementario 13). Los resultados ajustados después de inspeccionar las bases de datos de levadura en línea seleccionadas. La tabla de lista de genes se amplió (flecha amarilla) para encontrar el gen restante en el modelo GRN de la Figura 3 y los genes se deseleccionaron para eliminar genes que no se encuentran en el mismo modelo GRN (flecha roja). La tabla de anotaciones se completó en base a la evidencia de regulación para cada gen encontrado en Yeastract (flecha verde). La nueva lista de genes y el archivo de anotación se descargaron seleccionando sus respectivos botones de descarga (flechas azules). Haga clic aquí para ver una versión más grande de esta figura.

Figura 5: Ejemplo de resultados de búsqueda perimetral de IDP en el IDV. Cargado en el IDV está el directorio de resultados de Edge Finding edge_finding_20210701100152 (Archivo suplementario 13). (A) El resultado inicial producido por el IDP. Se seleccionó la opción desplegable Red de semilla (flecha roja) para ver la red semilla producida por el IDP en función de los argumentos del archivo de configuración utilizado (archivo complementario 7). Los genes seleccionados en la tabla de bordes son los bordes utilizados en la red de semillas. (B) Los resultados ajustados después de inspeccionar la red de semillas en busca de bordes que no contengan evidencia experimental. Se seleccionó la opción desplegable Red Desde selección (flecha roja). Las aristas se seleccionaron/anularon de selección de la tabla de aristas (flecha verde). Los archivos de red semilla, lista de bordes y lista de nodos se descargaron haciendo clic en sus respectivos botones (flechas amarillas). La tabla de borde que se muestra es para los últimos datos de series temporales que se enumeran en el archivo de configuración two_wts_EdgeFinding_config.txt (archivo complementario 7). Al seleccionar bordes para la red semilla o la lista de bordes basada en los resultados de LEM, es importante observar los últimos datos de series temporales enumerados en el archivo de configuración, ya que esta salida incorpora todos los archivos de datos anteriores en su inferencia de relaciones reglamentarias entre nodos. Haga clic aquí para ver una versión más grande de esta figura.

Figura 6: Ejemplo de búsqueda de red de IDP Que da como resultado el IDV mediante el uso del archivo de configuración de IDP two_wts_NetFind_rd1_config.txt (archivo complementario 11). (A) Se seleccionó la consulta Ciclo completo estable (flecha roja) para mostrar los datos respectivos en el eje y en el gráfico de dispersión. Los puntos azules del gráfico de dispersión representan los puntos seleccionados mediante la función Seleccionar cuadro para el gráfico de dispersión. El cuadro de selección punteado se ilustró para mostrar cómo se ve la selección de cuadro. (B) Los enteros min y max para el eje y y el eje x se introdujeron manualmente en redes seleccionadas dentro de estos límites (flecha verde). Después de cada selección, se hizo clic en el botón Obtener prevalencia de borde de redes seleccionadas (flechas amarillas) y se generaron las áreas Tabla de prevalencia de borde y Redes predichas DSGRN seleccionadas. En el Índice de red, se puede hacer clic en las flechas hacia arriba y hacia abajo para explorar las redes seleccionadas (flechas azules). Haga clic aquí para ver una versión más grande de esta figura.

Figura 7: Ejemplo de búsqueda de red de IDP Que da como resultado el IDV mediante el uso del archivo de configuración de IDP two_wts_NetFind_rd2_config.txt (archivo complementario 12). (A-C) La selección de redes se realizó introduciendo valores en los cuadros de entrada mín y máx (flechas rojas). Se hizo clic en el botón Obtener prevalencia de borde de redes seleccionadas para generar las áreas Tabla de prevalencia de borde y Redes predichas de DSGRN seleccionadas. (D) Se seleccionaron bordes de interés en la tabla de edge_list (flecha amarilla) y se hizo clic en el botón Enviar (flecha verde) para calcular las puntuaciones de similitud para trazar en el gráfico de dispersión con respecto a la consulta seleccionada (flecha azul). La función Box Select se utilizó para seleccionar un conjunto de redes (flecha púrpura) para generar las áreas Edge Prevalence Table y Selected DSGRN Predicted Networks. El índice de red se aumentó a 2 (flecha naranja) para ver la segunda red de la selección. Haga clic aquí para ver una versión más grande de esta figura.

Término	Paso de la canalización	Definición
de Lichtenburg por JTK-CYCLE (DLxJTK)	Búsqueda de nodos	Una sola medida cuantitativa de la periodicidad y la fuerza de regulación utilizada para clasificar los genes. Combina métricas de periodicidad publicadas previamente de Lichtenberg (DL) y JTK-CYCLE (JTK).
Expresión máxima del primer ciclo	Búsqueda de nodos	La máxima expresión génica durante el primer ciclo de expresión génica periódica. Los genes ordenados por First Cycle Max Expression se ordenarán en función del punto de tiempo desde el primer ciclo en el que alcanzan su máxima expresión génica.
La máquina perimetral local (LEM)	Búsqueda de bordes	Un método de inferencia de red bayesiana que clasifica modelos potenciales de interacciones genéticas para identificar los reguladores más probables y los modos de regulación (activación o represión) de un gen objetivo dado utilizando datos de expresión génica de series temporales.
Red de Semillas	Búsqueda de redes	Una suposición inicial de una red plausible de interacciones globales seleccionando los bordes LEM mejor clasificados. La semilla localiza una región del espacio de red que es altamente oscilatoria con una alta probabilidad de mostrar consistencia con los datos de series temporales proporcionados.
Firmas dinámicas generadas por redes regulatorias (DSGRN)	Búsqueda de redes	Un paquete de software para calcular de manera integral la variedad de comportamientos dinámicos a largo plazo que una red puede exhibir.
Prevalencia de borde	Búsqueda de redes	El porcentaje de redes de mayor puntuación del paso de búsqueda de red que incluye el borde en cuestión. La puntuación permite una clasificación de las aristas que tienen una prevalencia distinta de cero.

Tabla 1: Definición de los términos Inherent Dynamics Pipeline y Inherent Dynamics Visualizer.

Archivo suplementario 1: Datos de expresión génica de series temporales (Replicación 1) tomados de Orlando, 200813. Haga clic aquí para descargar este archivo.

Archivo suplementario 2: Datos de expresión génica de series temporales (Replicación 2) tomados de Orlando, 200813. Haga clic aquí para descargar este archivo.

Archivo Suplementario 3: Archivo de anotación que contiene todos los genes que se encuentran en el Archivo Suplementario 1 y el Archivo Suplementario 2. Haga clic aquí para descargar este archivo.

Archivo suplementario 4: Archivo de configuración de Inherent Dynamics Pipeline totalmente parametrizado. Haga clic aquí para descargar este archivo.

Archivo suplementario 5: archivo de lista de genes descargado de la página Búsqueda de nodos del Visualizador de dinámica inherente. Haga clic aquí para descargar este archivo.

Archivo suplementario 6: archivo de anotación descargado de la página Búsqueda de nodos del Visualizador de Inherent Dynamics. Haga clic aquí para descargar este archivo.

Archivo suplementario 7: Archivo de configuración de Inherent Dynamics Pipeline parametrizado solo para el paso de búsqueda perimetral. Haga clic aquí para descargar este archivo.

Archivo suplementario 8: archivo de red semilla descargado de la página Búsqueda perimetral del Visualizador de Dinámica Inherente. Haga clic aquí para descargar este archivo.

Archivo suplementario 9: archivo de lista de bordes descargado de la página búsqueda de bordes del Visualizador de Dinámica inherente. Haga clic aquí para descargar este archivo.

Archivo suplementario 10: archivo de lista de nodos descargado de la página Búsqueda de bordes del Visualizador de Dinámica inherente. Haga clic aquí para descargar este archivo.

Archivo suplementario 11: Archivo de configuración de Inherent Dynamics Pipeline parametrizado solo para el paso Búsqueda de red. Haga clic aquí para descargar este archivo.

Archivo suplementario 12: archivo de configuración actualizado de Inherent Dynamics Pipeline (archivo complementario 11) parametrizado solo para el paso búsqueda de red. Haga clic aquí para descargar este archivo.

Archivo Complementario 13: Directorio que contiene los resultados de la sección Resultados Representativos. Haga clic aquí para descargar este archivo.

Subscription Required. Please recommend JoVE to your librarian.

Discussion

La inferencia de GRN es un desafío importante en biología de sistemas. El IDP genera GRN modelo a partir de datos de expresión génica utilizando una secuencia de herramientas que utilizan los datos de maneras cada vez más complejas. Cada paso requiere decisiones sobre cómo procesar los datos y qué elementos (genes, interacciones funcionales) se pasarán a la siguiente capa del IDP. Los impactos de estas decisiones en los resultados de los desplazados internos no son tan obvios. Para ayudar en este sentido, el IDV proporciona visualizaciones interactivas útiles de los resultados de los pasos individuales de las herramientas de inferencia GRN dentro del IDP. El IDV agiliza y facilita el proceso de evaluación de los resultados de estos métodos de inferencia computacional para acelerar la experimentación e informar las opciones de análisis, lo que a su vez permitirá la producción acelerada de modelos e hipótesis de red de alta confianza. El IDV también implementa características que amplían la funcionalidad del IDP, incluido el filtrado de bordes por opciones de parámetros LEM ODE, la agrupación de genes por su tiempo de expresión y la agrupación de redes basadas en la similitud con un motivo o red. Es importante destacar que el IDV permite intervenciones manuales entre cada paso de IDP, lo que permite al usuario incorporar fácilmente el conocimiento humano y la información previa de la literatura de maneras que no se pueden automatizar fácilmente. Una ejecución ingenua del IDP no incorporará de forma nativa esta información, por lo que el uso del IDV aumentará la confianza en los resultados siempre que se disponga de información específica para el experimento. En general, el uso del IDV junto con el IDP permite a los usuarios crear hipótesis de red para procesos biológicos con mayor confianza, incluso con poco o ningún conocimiento del verdadero GRN.

Hay tres pasos críticos en el IDV. El primero es evaluar los resultados de la búsqueda de nodos IDP en el IDV. La página de búsqueda de nodos de IDV puede producir una nueva lista de genes y, si se desea, un archivo de anotación de genes. Curar una nueva lista de genes es un paso crítico, ya que reduce en gran medida el espacio potencial de la red al limitar qué genes se les permite modelar como objetivos y / o reguladores de GRN. Además, como los GRN se componen principalmente de factores de transcripción, tener anotaciones genéticas ayudará en gran medida a crear modelos GRN coherentes.

El siguiente paso es evaluar los resultados de IDP Edge Finding en el IDV. La curaduría de una nueva red semilla es un paso crítico, ya que localiza la región del espacio de red que se muestreará en el paso Búsqueda de red. Sin embargo, saber por dónde empezar no siempre es obvio, por lo que se recomienda usar bordes que tengan algún tipo de evidencia experimental para proporcionar confianza de que uno está comenzando en una región del espacio de red que contiene bordes de alta confianza. La página Edge Finding del IDV permite un fácil ensamblaje de redes semilla y genera el archivo de especificación de red DSGRN asociado, así como listas de nodos y bordes.

El último paso es evaluar los resultados de la búsqueda de redes de desplazados internos en el IDV. La página de búsqueda de redes de IDV permite una fácil exploración de las redes muestreadas y sus puntuaciones asociadas que estiman la capacidad de la red para producir la dinámica observada. Mientras que Node y Edge Finding siempre devolverán resultados (si al menos dos genes se transmiten de Node Finding), Network Finding puede devolver cero resultados. Por lo tanto, saber si se necesitan ajustes en los parámetros será más obvio en la búsqueda de redes que en la búsqueda de nodos y bordes. Tales ocurrencias de pocas o ninguna red encontrada podrían ser el resultado de restricciones impuestas sobre qué redes se pueden analizar. Estas restricciones son: 1) si las redes están siempre fuertemente conectadas o no, 2) el número mínimo y máximo de bordes de entrada a cada nodo, 3) las probabilidades de agregar y eliminar nodos y bordes, y 4) el número de adiciones y eliminaciones de nodos y bordes permitidos. Si se encuentran pocas o ninguna red admisible para el modelo, como en la Figura 2, se recomienda consultar la documentación del IDP para obtener orientación sobre la reparametrización de cualquiera o todos los pasos del IDP con la evaluación posterior de los resultados en el IDV.

Una limitación actual de este enfoque es que la página de búsqueda de nodos se centra principalmente en la dinámica oscilatoria, como las que se ven en los programas transcripcionales del ciclo celular y el reloj circadiano. En particular, el paso de búsqueda de nodos IDP está configurado actualmente para buscar genes que exhiban dinámica oscilatoria en un período específico. A medida que el IDP se expande para incluir análisis que pueden cuantificar diferentes tipos de dinámicas transcripcionales, también se actualizará el IDV para apoyar la visualización e interrogación de estos otros comportamientos. El tamaño de las redes buscadas y analizadas en el paso búsqueda de redes se limita actualmente a redes de menor tamaño, por ejemplo, alrededor de 10 genes. Esto es una necesidad ya que los cálculos en la escala DSGRN ocurren combinatoriamente. Otra limitación es que la exploración del espacio de parámetros del modelo para una red seleccionada no es posible en el IDV. Sin embargo, el archivo de especificación de red DSGRN para una red determinada se puede descargar y la dinámica asociada con cada parámetro del modelo se puede visualizar en el sitio web de visualización DSGRN (https://sites.math.rutgers.edu/~gameiro/dsgrn_viz/). Por último, el IDV ha sido probado utilizando sistemas Linux (Ubuntu) e iOS (Big Sur). El IDV se ha probado en Windows 10 utilizando el subsistema de Windows para Linux (WSL), que permite a los usuarios de Windows 10 ejecutar Linux y el IDV sin la necesidad de una computadora diferente, una máquina virtual o una configuración de arranque dual. IDV no se ejecuta actualmente en Windows nativo.

Estudiar grN es difícil debido a su complejidad inherente y las herramientas de inferencia útiles como el IDP pueden ser difíciles de entender e implementar con confianza. El IDV proporciona un método para reducir la complejidad del estudio de grN inferidos utilizando el IDP al tiempo que facilita la inclusión de información adicional más allá de la dinámica de expresión génica. El uso del IDV junto con el IDP como se describe aquí permitirá a los investigadores desarrollar y analizar modelos funcionales de sistemas bien estudiados, como el ciclo celular humano. Además, estas herramientas generarán hipótesis comprobables para procesos menos comprendidos, como el ciclo de desarrollo intraeritrocítico de la malaria, que se sospecha que está controlado por un ^GRN24 pero para el que aún no se ha propuesto un modelo.

Subscription Required. Please recommend JoVE to your librarian.

Disclosures

Los autores no tienen nada que revelar.

Acknowledgments

Este trabajo fue financiado por la subvención R01 GM126555-01 de los NIH y la subvención DMS-1839299 de la NSF.

Materials

Name	Company	Catalog Number	Comments
Docker			https://docs.docker.com/get-docker/
Git			https://git-scm.com/
Inherent Dynamics Pipeline			https://gitlab.com/biochron/inherent_dynamics_pipeline
Inherent Dynamics Visualizer			https://gitlab.com/bertfordley/inherent_dynamics_visualizer
Miniconda			https://docs.conda.io/en/latest/miniconda.html
Pip			https://pip.pypa.io/en/stable/

DOWNLOAD MATERIALS LIST

References

Karlebach, G., Shamir, R. Modelling and analysis of gene regulatory networks. Nature Reviews Molecular Cell Biology. 9 (10), 770-780 (2008).
Aijö, T., Lähdesmäki, H. Learning gene regulatory networks from gene expression measurements using non-parametric molecular kinetics. Bioinformatics. 25 (22), 2937-2944 (2009).
Huynh-Thu, V. A., Sanguinetti, G. Combining tree-based and dynamical systems for the inference of gene regulatory networks. Bioinformatics. 31 (10), 1614-1622 (2015).
Oates, C. J., et al. Causal network inference using biochemical kinetics. Bioinformatics. 30 (17), 468-474 (2014).
Marbach, D., et al. Wisdom of crowds for robust gene network inference. Nature Methods. 9 (8), 796-804 (2012).
Inherent Dynamics Pipeline. , Available from: https://gitlab.com/biochron/inherent_dynamics_pipeline (2021).
Motta, F. C., Moseley, R. C., Cummins, B., Deckard, A., Haase, S. B. Conservation of dynamic characteristics of transcriptional regulatory elements in periodic biological processes. bioRxiv. , (2020).
LEMpy. , Available from: https://gitlab.com/biochron/lempy (2021).
McGoff, K. A., et al. The local edge machine: inference of dynamic models of gene regulation. Genome Biology. 17, 214 (2016).
Cummins, B., Gedeon, T., Harker, S., Mischaikow, K. Model rejection and parameter reduction via time series. SIAM Journal on Applied Dynamical Systems. 17 (2), 1589-1616 (2018).
Cummins, B., Gedeon, T., Harker, S., Mischaikow, K. Database of Dynamic Signatures Generated by Regulatory Networks (DSGRN). Lecture Notes in Computer Science. (including Subseries Lecture Notes in Artificial Intelligence and Lecture Notes in Bioinformatics). , 300-308 (2017).
Cummins, B., Gedeon, T., Harker, S., Mischaikow, K. DSGRN: Examining the dynamics of families of logical models. Frontiers in Physiology. 9. 9, 549 (2018).
DSGRN. , Available from: https://github.com/marciogameiro/DSGRN (2021).
Dsgm_Net_Gen. , Available from: https://github.com/breecummins/dsgrn_net_gen (2021).
Dsgrn_Net_Query. , Available from: https://github.com/breecummins/dsgrn_net_query (2021).
Orlando, D. A., et al. Global control of cell-cycle transcription by coupled CDK and network oscillators. Nature. 453 (7197), 944-947 (2008).
Monteiro, P. T., et al. YEASTRACT+: a portal for cross-species comparative genomics of transcription regulation in yeasts. Nucleic Acids Research. 48 (1), 642-649 (2020).
de Bruin, R. A. M., et al. Constraining G1-specific transcription to late G1 phase: The MBF-associated corepressor Nrm1 acts via negative feedback. Molecular Cell. 23 (4), 483-496 (2006).
Horak, C. E., et al. Complex transcriptional circuitry at the G1/S transition in Saccharomyces cerevisiae. Genes & Development. 16 (23), 3017-3033 (2002).
Cherry, J. M., et al. Saccharomyces genome database: The genomics resource of budding yeast. Nucleic Acids Research. 40, 700-705 (2012).
Zhu, G., et al. Two yeast forkhead genes regulate the cell cycle and pseudohyphal growth. Nature. 406 (6791), 90-94 (2000).
Loy, C. J., Lydall, D., Surana, U. NDD1, a high-dosage suppressor of cdc28-1N, is essential for expression of a subset of late-S-phase-specific genes in saccharomyces cerevisiae. Molecular and Cellular Biology. 19 (5), 3312-3327 (1999).
Cho, C. Y., Kelliher, C. M., Hasse, S. B. The cell-cycle transcriptional network generates and transmits a pulse of transcription once each cell cycle. Cell Cycle. 18 (4), 363-378 (2019).
Smith, L. M., et al. An intrinsic oscillator drives the blood stage cycle of the malaria parasite Plasmodium falciparum. Science. 368 (6492), 754-759 (2020).

Biology

Inherent Dynamics Visualizer, una aplicación interactiva para evaluar y visualizar los resultados de una canalización de inferencia de red reguladora de genes

Summary

Abstract

Introduction

Protocol

Representative Results

Discussion

Disclosures

Acknowledgments

Materials

References

Tags

Cite this Article

Summary

Abstract

Introduction

Protocol

Representative Results

Discussion

Disclosures

Acknowledgments

Materials

References

Tags

Cite this Article

Get cutting-edge science videos from JoVE sent straight to your inbox every month.