Biology

Visualizador de dinâmica inerente, um aplicativo interativo para avaliar e visualizar saídas de um pipeline de inferência de rede de regulação genética

Published: December 7, 2021 doi: 10.3791/63084

Summary

O Inerente Dynamics Visualizer é um pacote de visualização interativo que se conecta a uma ferramenta de inferência de rede de regulação genética para uma geração aprimorada e simplificada de modelos de rede funcionais. O visualizador pode ser usado para tomar decisões mais informadas para a parametrização da ferramenta de inferência, aumentando assim a confiança nos modelos resultantes.

Abstract

Desenvolver modelos de rede de regulação genética é um grande desafio na biologia de sistemas. Várias ferramentas computacionais e pipelines foram desenvolvidos para enfrentar esse desafio, incluindo o recém-desenvolvido Inerente Dynamics Pipeline. O Inerente Dynamics Pipeline consiste em várias ferramentas publicadas anteriormente que funcionam sinergicamente e estão conectadas de forma linear, onde a saída de uma ferramenta é então usada como entrada para a seguinte ferramenta. Como na maioria das técnicas computacionais, cada passo do Pipeline de Dinâmica Inerente exige que o usuário faça escolhas sobre parâmetros que não têm uma definição biológica precisa. Essas escolhas podem impactar substancialmente os modelos de rede de regulação genética produzidos pela análise. Por essa razão, a capacidade de visualizar e explorar as consequências de várias escolhas de parâmetros a cada passo pode ajudar a aumentar a confiança nas escolhas e nos resultados. O Inerente Dynamics Visualizer é um pacote de visualização abrangente que agiliza o processo de avaliação de opções de parâmetros através de uma interface interativa dentro de um navegador da Web. O usuário pode examinar separadamente a saída de cada etapa do pipeline, fazer alterações intuitivas com base em informações visuais e se beneficiar da produção automática de arquivos de entrada necessários para o Pipeline Dinâmico Inerente. O Visualizador de Dinâmica Inerente fornece um nível incomparável de acesso a uma ferramenta altamente complexa para a descoberta de redes de regulação genética a partir de dados transcriômicos de séries temporais.

Introduction

Muitos processos biológicos importantes, como diferenciação celular e resposta ambiental, são regidos por conjuntos de genes que interagem entre si em uma rede de regulação genética (GRN). Essas GRNs produzem a dinâmica transcricional necessária para ativar e manter o fenótipo que controlam, por isso identificar os componentes e a estrutura topológica do GRN é fundamental para entender muitos processos e funções biológicas. Um GRN pode ser modelado como um conjunto de genes e/ou produtos genéticos interativos descritos por uma rede cujos nós são os genes e cujas bordas descrevem a direção e a forma de interação (por exemplo, ativação/repressão da transcrição, modificação pós-translacional, etc.) ¹. As interações podem então ser expressas como modelos matemáticos parametrizados descrevendo o impacto que um gene regulador tem na produção de seu alvo(s)^2,3,4. A inferência de um modelo GRN requer tanto uma inferência da estrutura da rede de interação quanto a estimativa dos parâmetros de interação subjacentes. Uma variedade de métodos de inferência computacional foram desenvolvidos que ingerem dados de expressão genética de séries temporândias e modelos GRN de ^saída5. Recentemente, foi desenvolvido um novo método de inferência GRN, chamado Desindo o Inerente Dynamics Pipeline (IDP), que utiliza dados de expressão genética de séries temporâneas para produzir modelos GRN com interações rotuladas de alvo de regulador capazes de produzir dinâmicas que correspondam à dinâmica observada nos dados de expressão ^genética6. O IDP é um conjunto de ferramentas conectadas linearmente em um pipeline e pode ser dividido em três etapas: um passo de busca de nó que classifica genes com base em características de expressão genética conhecidas ou suspeitas de estarem relacionadas à função do ^GRN7,8, uma etapa de Edge Finding que classifica relacionamentos regulatórios em ^pares8^,⁹, e uma etapa de Busca de Rede que produz modelos GRN capazes de produzir a dinâmica observada10,11,12,13,14,15.

Como a maioria dos métodos computacionais, o IDP requer um conjunto de argumentos especificados pelo usuário que ditam a forma como os dados de entrada são analisados, e diferentes conjuntos de argumentos podem produzir resultados diferentes nos mesmos dados. Por exemplo, vários métodos, incluindo o IDP, contêm argumentos que aplicam algum limite nos dados, e aumentar/diminuir esse limiar entre sucessivas corridas do método específico pode resultar em resultados diferentes entre as corridas (ver Suplemento Nota 10: Métodos de inferência de rede ^de5). Entender como cada argumento pode impactar a análise e os resultados subsequentes é importante para alcançar alta confiança nos resultados. Ao contrário da maioria dos métodos de inferência GRN, o IDP consiste em múltiplas ferramentas computacionais, cada uma tendo seu próprio conjunto de argumentos que um usuário deve especificar e cada um tendo seus próprios resultados. Embora o IDP forneça uma extensa documentação sobre como parametrizar cada ferramenta, a interdependência de cada ferramenta na saída da etapa anterior torna a parametrização de todo o gasoduto sem análises intermediárias desafiadoras. Por exemplo, os argumentos nas etapas de Edge e Network Finding provavelmente serão informados por conhecimento biológico prévio, e por isso dependerão do conjunto de dados e/ou do organismo. Para interrogar resultados intermediários, seria necessário uma compreensão básica da programação, bem como uma compreensão profunda de todos os arquivos de resultados e seus conteúdos do IDP.

O Inerente Dynamics Visualizer (IDV) é um pacote de visualização interativo que é executado na janela do navegador do usuário e fornece uma maneira de os usuários do IDP avaliarem o impacto de suas escolhas de argumento nos resultados de qualquer etapa do IDP. O IDV navega por uma estrutura de diretório complicada produzida pelo IDP e reúne os dados necessários para cada etapa e apresenta os dados em figuras e tabelas intuitivas e interativas para o usuário explorar. Depois de explorar esses displays interativos, o usuário pode produzir novos dados a partir de uma etapa do IDP que pode ser baseada em decisões mais informadas. Esses novos dados podem então ser imediatamente utilizados na próxima etapa do IDP. Além disso, a exploração dos dados pode ajudar a determinar se uma etapa do IDP deve ser reexecutada com parâmetros ajustados. O IDV pode melhorar o uso do IDP, bem como tornar o uso do IDP mais intuitivo e acessível, como demonstrado pela investigação do oscilador principal GRN do ciclo celular de levedura. O protocolo a seguir inclui os resultados do IDP de uma corrida IDP totalmente parametrizada versus uma abordagem que incorpora o IDV após execuções de cada etapa do IDP, ou seja, Node, Edge e Network Finding.

Subscription Required. Please recommend JoVE to your librarian.

Protocol

1. Instale o IDP e o IDV

NOTA: Esta seção pressupõe que docker, conda, pip e git já estão instalados (Tabela de materiais).

Em um terminal, entre no comando: o clone git https://gitlab.com/biochron/inherent_dynamics_pipeline.git.
Siga as instruções de instalação no arquivo README do IDP.
Em um terminal, entre no comando: https://gitlab.com/bertfordley/inherent_dynamics_visualizer.git do clone git.
NOTA: A clonagem do IDV deve acontecer fora do diretório de alto nível do IDP.
Siga as instruções de instalação no arquivo README do IDV.

2. Node encontrar

Crie um novo arquivo de configuração IDP que parametriza a etapa de busca de nó.
NOTA: Todas as aspas nas seguintes etapas não devem ser digitar. As aspas são usadas apenas aqui como um delimitador entre o texto do protocolo e o que deve ser digitado.
1. Adicione os principais argumentos do IDP ao arquivo de configuração.
2. Abra um novo arquivo de texto em um editor de texto e digite "data_file =", "annotation_file =", "output_dir =", "num_proc =" e "IDVconnection = True" em linhas individuais.
3. Para "data_file", após o sinal igual ao sinal, digite o caminho e o nome do respectivo arquivo da série temporal e digite uma círio após o nome. Separe cada dado por uma círgula, se mais de um conjunto de dados de séries de tempo estiver sendo usado. Consulte o Arquivo Suplementar 1 e o Arquivo Suplementar 2 para um exemplo de arquivos de expressão genética de séries tempo;
4. Digite o caminho e o nome do arquivo de anotação para "annotation_file", após o sinal igual ao sinal. Consulte o Arquivo Suplementar 3 para obter um exemplo de um arquivo de anotação.
5. Para "output_file", após o sinal igual, digite o caminho e o nome da pasta onde os resultados serão salvos.
6. Após o sinal igual ao sinal, para "num_proc", digite o número de processos que o IDP deve utilizar.
7. Adicionar argumentos de localização de nó ao arquivo de configuração.
8. No mesmo arquivo de texto da etapa 2.1.1, digite o pedido apresentado "[dlxjtk_arguments]", "períodos =" e "dlxjtk_cutoff =" em linhas individuais. Coloque-os depois dos argumentos principais.
9. Para "períodos", após o sinal igual ao sinal, se for usado um conjunto de dados de série única, digite cada período separado por írgulas. Para mais de um conjunto de dados de séries de tempo, digite cada conjunto de comprimentos de período como antes, mas coloque suportes quadrados em torno de cada conjunto e coloque uma círia entre os conjuntos.
10. Após o sinal igual ao sinal, para "dlxjtk_cutoff", digite um inteiro especificando o número máximo de genes a reter na saída gene_list_file por de Lichtenberg por JTK_CYCLE (DLxJTK) (Tabela 1).
  NOTA: É altamente recomendável revisar as seções de dlxjtk_arguments no IDP README para obter uma melhor compreensão de cada argumento. Consulte o Arquivo Suplementar 4 para obter um exemplo de um arquivo de configuração com os argumentos de localização de nó especificados.
No terminal, mude-se para o diretório do IDP, chamado inherent_dynamics_pipeline.
No terminal, entre no comando: conda ative dat2net
Execute o IDP usando o arquivo de configuração criado na etapa 2.1 executando este comando no terminal, onde é o nome do arquivo: python src/dat2net.py
No terminal, mova-se para o diretório chamado inherent_dynamics_visualizer e entre no comando: . /viz_results.sh
NOTA: apontará para o diretório usado como diretório de saída para o IDP.
Em um navegador da Web, digite http://localhost:8050/ como a URL.
Com o IDV agora aberto no navegador, clique na guia Node Finding e selecione a pasta de localização de nó do menu suspenso.
Faça a curadoria manual de uma nova lista genética da tabela de lista de genes no IDV a ser usada para etapas subsequentes do IDP.
1. Para estender ou encurtar a tabela da lista genética, clique nas setas para cima ou para baixo ou digite manualmente em um inteiro entre 1 e 50 na caixa ao lado da expressão genética de genes classificados por DLxJTK. Top:.
2. Na tabela da lista de genes, clique na caixa ao lado de um gene para visualizar seu perfil de expressão genética em um gráfico de linha. Múltiplos genes podem ser adicionados.
3. Especificar opcionalmente o número de caixas de tamanho igual para calcular e encomendar genes pelo intervalo de tempo contendo sua expressão de pico, inserindo um inteiro na caixa de entrada acima da tabela de lista genética rotulada Entrada inteiro para dividir o primeiro ciclo em lixeiras:.
  NOTA: Esta opção é específica para dinâmica oscilatória e pode não ser aplicável a outros tipos de dinâmica.
4. Selecione uma preferência de visualização do mapa de calor clicando em uma opção sob Orders Genes By: First Cycle Max Expression (Tabela 1) que ordena genes com base no tempo do pico de expressão genética no primeiro ciclo.
  NOTA: DLxJTK Rank ordena genes com base no ranking de periodicidade do algoritmo DLxJTK do IDP.
5. Clique no botão Lista de genes de download para baixar a lista genética no formato de arquivo necessário para a etapa de Busca de borda. Consulte o Arquivo Suplementar 5 para obter um exemplo de um arquivo de lista genética.
Na Tabela de Anotação de Genes Editáveis, rotule um gene como um alvo, um regulador ou ambos no arquivo de anotação para o passo de descoberta de borda em uma nova execução de Edge Finding. Se um gene é um regulador, rotule o gene como um ativador, repressor ou ambos.
1. Para rotular um gene como ativador, clique na célula na coluna tf_act e altere o valor para 1. Para rotular um gene como repressor, altere o valor na coluna tf_rep para 1. Um gene poderá agir como um ativador e um repressor no passo de Descoberta de Borda, definindo os valores nas colunas tf_act e tf_rep para 1.
2. Para rotular um gene como um alvo, clique na célula na coluna de destino e altere o valor para 1.
Clique no botão Baixar Umnot. Arquive para baixar o arquivo de anotação no formato de arquivo necessário para a etapa de Configuração de borda.

3. Descoberta de borda

Crie um novo arquivo de configuração IDP que parametrize a etapa de Busca de borda.
1. Adicione os principais argumentos do IDP ao arquivo de configuração. Abra um novo arquivo de texto em um editor de texto e repita a etapa 2.1.1.
2. Adicione argumentos de busca de borda ao arquivo de configuração.
3. No mesmo arquivo de texto da etapa 3.1.1, digite o pedido apresentado "[lempy_arguments]", "gene_list_file =", "[netgen_arguments]", "edge_score_column =", "edge_score_thresho =", "num_edges_for_list =", "seed_threshold =" e "num_edges_for_seed =" em linhas individuais. Estes devem ir abaixo dos argumentos principais.
4. Para "gene_list_file", após o sinal igual ao sinal, digite o caminho e o nome do arquivo da lista genética gerado na etapa 2.8.5.
5. Para "edge_score_column", após o sinal igual ao sinal, digite "pld" ou "norm_loss" para especificar qual coluna de quadro de dados da saída lempy é usada para filtrar as bordas.
6. Selecione "edge_score_threshold" ou "num_edges_for_list", e exclua o outro. Se "edge_score_threshold" for selecionado, digite um número entre 0 e 1. Este número será usado para filtrar bordas com base na coluna especificada na etapa 3.1.5.
  1. Se "num_edges_for_list" for selecionado, digite um valor igual ou inferior ao número de bordas possíveis. Este número será usado para filtrar as bordas com base em como elas são classificadas na coluna especificada na etapa 3.1.5. As bordas que sobrarão serão usadas para construir redes em Network Finding.
7. Selecione "seed_threshold" ou "num_edges_for_seed" e exclua o outro. Se "seed_threshold" for selecionado, digite um número entre 0 e 1. Este número será usado para filtrar bordas com base na coluna especificada na etapa 3.1.5.
  1. Se "num_edges_for_seed" for selecionado, digite um valor igual ou inferior ao número de bordas possíveis. Este número será usado para filtrar as bordas com base em como elas são classificadas na coluna especificada na etapa 3.1.5. As bordas que sobrarão serão usadas para construir a rede de sementes (Tabela 1) usada na Busca de Rede.
    NOTA: É altamente recomendável revisar as seções lempy_arguments e netgen_arguments no IDP README para obter uma melhor compreensão de cada argumento. Consulte o Arquivo Suplementar 7 para obter um exemplo de um arquivo de configuração com os argumentos de localização do Edge especificados.
Repita as etapas 2.2 e 2.3.
Execute o IDP usando o arquivo de configuração criado na etapa 3.1 executando este comando no terminal, onde é o nome do arquivo: python src/dat2net.py
Se o IDV ainda estiver funcionando, pare pressionando o Controle C na janela do terminal para parar o programa. Repita as etapas 2.5 e 2.6.
Com o IDV aberto no navegador, clique na guia Edge Finding e selecione a pasta de localização de borda do menu suspenso.
NOTA: Se vários conjuntos de dados forem usados no Edge Finding, certifique-se de selecionar o último conjunto de dados que foi usado na análise LEM (Local Edge Machine, máquina de borda local) (Tabela 1). É importante ao selecionar bordas para a rede de sementes ou lista de bordas com base nos resultados do LEM para olhar os dados da última série de tempo listados no arquivo de configuração, pois esta saída incorpora todos os arquivos de dados anteriores em sua inferência de relações regulatórias entre nós.
Para estender ou encurtar a tabela de borda, digite manualmente um inteiro na caixa de entrada em Número de Bordas:.
Filtrar opcionais bordas nos parâmetros LEM ODE. Clique e arraste para mover o lado esquerdo ou o lado direito do controle deslizante de cada parâmetro para remover bordas da tabela de borda que têm parâmetros fora de seus novos limites de parâmetro permitidos.
Opcionalmente, crie uma nova rede de sementes se uma rede de sementes diferente da proposta pelo IDP. Consulte o Arquivo Suplementar 8 para um exemplo de um arquivo de rede de sementes.
1. Selecione "Sementes " para selecionar a rede de sementes ou a seleção no menu suspenso em Rede:.
2. Desmarque/selecione bordas da tabela de borda clicando nas caixas de seleção correspondentes adjacentes a cada borda para remover/adicionar bordas da rede de sementes.
Clique no botão Baixar DSGRN NetSpec para baixar a rede de sementes no formato de especificação de rede Dynamic Signatures Generated by Regulatory Networks (DSGRN) (Tabela 1).
Selecione os nódulos e bordas adicionais a serem usados na etapa de busca de rede.
1. Selecione bordas da tabela de borda clicando nas caixas de seleção correspondentes para incluir no arquivo da lista de bordas usado na Localização de rede.
2. Clique em Download Node e Edge Lists para baixar a lista de dados e arquivos da lista de bordas no formato necessário para seu uso na Busca de Rede. Consulte Arquivo Suplementar 9 e Arquivo Suplementar 10 para exemplos de arquivos de lista de borda e nó, respectivamente.
  NOTA: A lista de nós deve conter todos os nós no arquivo da lista de bordas, para que o IDV crie automaticamente o arquivo de lista de nó com base nas bordas selecionadas. Duas opções estão disponíveis para visualizar as bordas em Edge Finding. A opção Tabela de Resumo LEM apresenta as bordas como uma lista classificada das 25 principais bordas. Top-Line LEM Table apresenta as bordas em uma lista concatenada das três principais bordas classificadas para cada possível regulador. O número de bordas visualizadas para cada opção pode ser ajustado pelo usuário alterando o número na caixa de entrada Número de Bordas .

4. Descoberta de rede

Crie um novo arquivo de configuração IDP que parametrize a etapa de busca de rede.
1. Adicione os principais argumentos do IDP ao arquivo de configuração. Abra um novo arquivo de texto em um editor de texto e repita a etapa 2.1.1.
2. Adicione argumentos de localização de rede ao arquivo de configuração.
3. No mesmo arquivo de texto da etapa 4.1.1, digitar na ordem apresentada "[netper_arguments]", "edge_list_file =", "node_list_file =", "seed_net_file =", "range_operations =", "numneighbors =", "maxparams =", "[probabilidades]",", "addNode =", "addEdge =", "removeNode =" e "removeEdge =" em linhas individuais, abaixo dos principais argumentos.
4. Para "seed_net_file", "edge_list_file" e "node_list_file", após o sinal igual, digite o caminho e o nome do arquivo de rede de sementes e os arquivos de lista de borda e nó gerados nas etapas 3.9 e 3.10.2.
5. Após o sinal igual, para "range_operations", números tipo dois separados por uma círgula. O primeiro e o segundo números são o mínimo e o número máximo de adição ou remoção de nós ou bordas por rede feita, respectivamente.
6. Para "numneighbors", após o sinal igual a assinar, digite um número que represente quantas redes encontrar em Network Finding.
7. Para "maxparams", após o sinal igual ao sinal, digite um número que represente o número máximo de parâmetros DSGRN para permitir uma rede.
8. Digite valores entre 0 e 1 para cada um desses argumentos: "addNode", "addEdge", "removeNode" e "removeEdge", após o sinal igual. Os números devem ser somado a 1.
  NOTA: É altamente recomendável revisar as seções netper_arguments e netquery_arguments no IDP README para obter uma melhor compreensão de cada argumento. Consulte o Arquivo Suplementar 11 e o Arquivo Suplementar 12 para exemplos de um arquivo de configuração com os argumentos de localização de rede especificados.
Repita as etapas 2.2 e 2.3.
Execute o IDP usando o arquivo de configuração criado na etapa 4.1 executando este comando no terminal, onde é o nome do arquivo: python src/dat2net.py
Se o IDV ainda estiver funcionando, pare pressionando o Controle C na janela do terminal para parar o programa. Repita as etapas 2.5 e 2.6.
Com o IDV aberto no navegador, clique na guia 'Localização de rede ' e selecione a pasta de localização de rede de interesse.
Selecione uma rede ou conjunto de redes para gerar uma tabela de prevalência de borda (Tabela 1) e para visualizar as redes juntamente com seus respectivos resultados de consulta.
1. Duas opções estão disponíveis para selecionar redes: Opção 1 - Entrada de limites inferiores e superiores nos resultados de consulta, inserindo valores mínimos e máximos nas caixas de entrada correspondentes ao eixo x e eixo y da parcela. Opção 2 - Clique e arraste sobre a dispersão para desenhar uma caixa ao redor das redes a serem incluídas. Após a entrada dos limites de seleção ou entrada, pressione o botão Obter prevalência de borda das redes selecionadas .
  NOTA: Se mais de uma consulta DSGRN for especificada, use os botões de rádio rotulados com o tipo de consulta para alternar entre os resultados de cada consulta. O mesmo se aplica se mais de um epsilon (nível de ruído) for especificado.
Clique nas setas abaixo da tabela de prevalência de borda para mover-se para a próxima página da tabela. Pressione tabela de download para baixar a tabela de prevalência de borda.
Insira um inteiro na caixa de entrada do Índice de Rede para exibir uma única rede da seleção feita na etapa 4.6. Clique em Baixar DSGRN NetSpec para baixar a rede exibida no formato de especificação de rede DSGRN.
Pesquise redes de similaridade a um motivo especificado ou rede de interesse.
1. Use as caixas de seleção correspondentes a cada borda para selecionar bordas a serem incluídas na rede ou motivo utilizado para a análise de similaridade. Clique em Enviar para criar a dispersão de semelhança para o motivo ou rede selecionado.
  NOTA: Use as setas na lista de bordas para classificar alfabeticamente e as setas abaixo da tabela para passar para a próxima página da tabela.
2. Clique e arraste sobre a tabela de dispersão para desenhar uma caixa ao redor das redes a serem incluídas para selecionar uma rede ou conjunto de redes para gerar uma tabela de prevalência de borda e visualizar as redes juntamente com seus respectivos resultados de consulta.
  NOTA: Se mais de uma consulta DSGRN for especificada, use os botões de rádio rotulados com o tipo de consulta para alternar entre os resultados de cada consulta. O mesmo se aplica se mais de um epsilon (nível de ruído) for especificado.
3. Repita as etapas 4.7 e 4.8 para baixar a tabela de prevalência de borda e a rede exibida para a análise de similaridade, respectivamente.

Subscription Required. Please recommend JoVE to your librarian.

Representative Results

As etapas descritas textuicamente acima e graficamente na Figura 1 foram aplicadas ao GRN oscilante central do ciclo celular de levedura para ver se é possível descobrir modelos GRN funcionais capazes de produzir a dinâmica observada em dados de expressão genética de séries tempoarânses coletados em um estudo de ciclo de células de levedura16. Para ilustrar como o IDV pode esclarecer e melhorar a saída do IDP, os resultados, após a realização desta análise de duas formas, foram comparados: 1) executar todas as etapas do IDP em um passe sem o IDV e 2) passando pelo IDP com o auxílio do IDV, que permite o ajuste de resultados intermediários tanto pela incorporação de conhecimento biológico prévio quanto pela realização de escolhas refinadas baseadas nas saídas de IDP. O bem estudado GRN do ciclo celular de levedura usado como exemplo tem muitas de suas relações regulatórias verificadas experimentalmente. Se um organismo diferente e/ou menos anotado ou processo biológico estiver sendo estudado, as escolhas sobre como os resultados ou parâmetros intermediários são ajustados podem ser diferentes. Para ilustrar um tipo de consulta que pode ser usada para avaliar redes, a robustez de cada rede foi medida para suportar oscilações estáveis e corresponder à dinâmica transcricional observada de seus nós entre parâmetros de modelo.

Os dados da série temporal de expressão genética de duas séries de replicação foram retirados de Orlando 200816 e pré-processados para remover qualquer expressão genética associada ao método de sincronização do ciclo celular aplicado no experimento original (Arquivo Suplementar 1 e Arquivo Suplementar 2). Um arquivo de anotação foi criado contendo todos os genes nos dados da série temporal que são suportados por evidências de vinculação de DNA e expressão encontradas em ^Yeastract17 e, portanto, poderia funcionar como um regulador em um GRN. TOS4, PLM2 e NRM1 também foram incluídos como reguladores, embora não tenham sido encontrados em Leveastract para ter ambos os tipos de evidência, pois acredita-se que sejam importantes para o núcleo de levedura GRN com base em evidências na ^{literatura18,19} (Arquivo Suplementar 3). Todos os reguladores foram rotulados como um ativador e repressor, bem como alvos.

O IDP foi primeiro parametrizado para executar todas as etapas do IDP, que é Node, Edge e Network Finding. Um conjunto de argumentos foi selecionado que parecia apropriado com base no entendimento atual do GRN do ciclo celular de levedura, um pequeno conjunto de genes participantes de uma rede fortemente conectada (Arquivo Suplementar 4). Esse entendimento influenciou principalmente as escolhas de Node e Edge Finding. Os parâmetros de probabilidades no Network Finding baseavam-se no pressuposto de que apenas genes verdadeiros e interações regulatórias seriam passados para o Network Finding. Esta execução totalmente parametrizada do IDP produziu resultados para Node e Edge Finding (Figura 2B,C), mas na Rede não foram descobertas redes de modelo admissível (Figura 2A,D). A admissibilidade do modelo é explicada na documentação de código do módulo python dsgrn_net_gen ¹⁴, uma dependência do IDP. Resumidamente, redes que contêm bordas auto-reprimidas ou têm entradas ou saídas demais em um único nó não são consultadas pelo software DSGRN (Tabela 1). O IDP dá muitas razões pelas quais redes admissíveis de modelos podem não ser encontradas e descreve etapas de solução de problemas para resolver os problemas. Essencialmente, isso envolve alterar parâmetros e/ou arquivos de entrada e reexister a respectiva etapa de IDP e examinar resultados. O IDV foi usado para tornar esse processo menos tedioso e demorado.

Os resultados do Node Finding foram carregados no IDV para examinar os genes que estão sendo passados para a etapa de Edge Finding do IDP. Os nós dados pelo IDP são os principais genes N classificados por DLxJTK (Tabela 1), sendo N especificados pelo usuário, no entanto, esta lista genética pode não ser apropriada para o objetivo da análise. Sem conhecimento biológico prévio, a seleção automática de nós usando apenas escores DLxJTK retornou um gene com evidência limitada de um papel no ciclo celular de levedura (RME1), enquanto alguns reguladores transcricionais conhecidos do ciclo celular não estavam altamente classificados (Figura 2B). As evidências experimentais de levedura foram usadas para selecionar entre os genes mais bem classificados por DLxJTK aqueles com anotação do ciclo celular. Estes genes são SWI4, YOX1, YHP1, HCM1, FKH2, NDD1 e SWI5. Suas relações regulatórias conhecidas podem ser vistas na Figura 3. FKH2 não aparece nos dez primeiros genes (dlxjtk_cutoff foi definido para dez no Arquivo Suplementar 4) como classificado pelo DLxJTK, de modo que a lista genética foi estendida usando o IDV até que FKH2 foi encontrado (Figura 4). Vários dos genes adicionais na lista de genes estendidos são genes principais conhecidos e teriam sido perdidos sem investigar os resultados do Node Finding. Embora genes centrais mais conhecidos tenham sido encontrados estendendo a lista genética para baixo da lista classificada pelo DLxJTK, o foco foi mantido nos genes de interesse. Portanto, alguns genes de alto escalão foram desselecionados, resultando em uma lista genética (Arquivo Suplementar 5) contendo sete genes (Figura 4). Um novo arquivo de anotação foi criado (Arquivo Suplementar 6) com base nesses sete genes, cada gene foi rotulado como um alvo, e o tipo de regulador foi especificado usando Yeastract. A nova lista genética e o arquivo de anotação foram baixados para uso subsequente na próxima etapa do IDP, Edge Finding. Sem o IDV, o procedimento de adição e remoção de genes da lista genética e arquivo de anotação exigiria habilidades modestas de codificação.

Um novo arquivo de configuração IDP foi parametrizado apenas para a etapa de Configuração do Edge (Arquivo Suplementar 7), com a nova lista genética e arquivo de anotação. Após a conclusão do IDP com o novo arquivo de configuração, os resultados foram carregados no IDV (Figura 5A). À medida que a etapa de Busca de Rede é pesquisa estochasticamente em torno do espaço de rede da rede de sementes fornecida a ela, fornecer uma boa rede de sementes pode ser importante. Uma boa rede de sementes pode ser pensada como aquela que contém bordas verdadeiras. Com o IDV e o uso de bancos de dados on-line como o Yeastract e o Saccharomyces Genome Database (SGD)²⁰, a rede de sementes pode ser visualizada e ajustada usando as relações regulatórias do LEM (Tabela 1) que possuem evidências experimentais. Como exemplo, a borda YHP1 = tf_act(HCM1) foi dessemendada porque não há evidência documentada dessa relação (Figura 5B) em Yeastract. A borda SWI5 = tf_act(FKH2) foi adicionada, pois há evidências documentadas dessa ^relação21. Uma vez que a rede de sementes (Tabela 1) foi satisfatória, o arquivo de especificação de rede DSGRN para a rede foi baixado (Arquivo Suplementar 8).

Sem o IDV, há uma maior chance de bordas para as quais não há evidências experimentais sendo usadas para construir a rede de sementes. Como pode ser visto na Figura 2C, a rede de sementes gerada no passo de busca de borda de executar o IDP sem parar através de cada etapa contém uma borda, SWI4 = tf_rep(NDD1), que não é suportada por evidências experimentais em Yeastract, provavelmente porque o NDD1 é conhecido por ser um ativador transcricional22. Essas informações não foram codificadas no arquivo de anotação na execução sem parar, o que permitiu que todos os reguladores fossem ativadores e repressores.

Utilizando o IDV, uma rede de sementes foi curada manualmente que é uma sub-rede da Figura 3, e as quatro bordas restantes foram colocadas na lista de bordas utilizadas para o espaço de rede amostral (YHP1 = tf_act(SWI4), YOX1 = tf_act(SWI4), SWI4 = tf_rep(YOX1), SWI5 = tf_act(NDD1)). A seleção de bordas com base em conhecimentos biológicos prévios também pode ser usada para construir a lista de bordas; no entanto, neste caso, as 20 principais bordas da exibição da Tabela de Resumo LEM foram selecionadas (Arquivo Suplementar 9). O arquivo da lista de nó é criado a partir das bordas selecionadas automaticamente (Arquivo Suplementar 10). Os parâmetros ODE do LEM também podem ser usados para filtrar bordas se acreditarmos que os parâmetros inferidos no modelo ODE não são biologicamente realistas, mas essas informações não foram utilizadas aqui.

Em seguida, um novo arquivo de configuração IDP foi parametrizado para a etapa de busca de rede usando os três novos arquivos. Como a rede de sementes foi criada com bordas bem apoiadas por evidências experimentais, a inclusão dessas bordas em todas as redes foi desejada. Assim, foram definidas as probabilidades de localização da rede para permitir a adição, mas não a remoção de nós e bordas (Arquivo Suplementar 11). O parâmetro de localização de rede foi definido para procurar por 2.000 redes. Após a execução do IDP, 37 redes de modelo admissíveis foram encontradas na etapa de Busca de Rede, em oposição à execução sem parar que não tinha zero. Carregando os resultados de Localização de Rede no IDV, 64% (24) dessas 37 redes tinham capacidade de oscilar de forma estável (Figura 6A). Dessas 24 redes, as melhores foram duas redes que corresponderam aos dados em 50% de seus parâmetros de modelo oscilantes (Figura 6B).

A Tabela de Prevalência de Borda (Tabela 1) tabula o número de vezes que uma borda ocorre em uma coleção selecionada de redes, indicando sua prevalência em redes de alto desempenho. Examinar a Tabela de Prevalência de Borda produzida pela seleção das duas redes anteriores no gráfico de dispersão revela que todas as bordas de rede de sementes estão presentes em cada uma das duas redes, como esperado, juntamente com duas bordas de rede não-sementes (Figura 6B), SWI4 = tf_act(SWI5) e HCM1 = tf_rep(YHP1). Nenhuma dessas duas bordas tinha provas que os sustentavam em Yeastract. Como uma pequena quantidade de espaço de rede foi explorada, por isso é difícil avaliar a importância de bordas e nódulos na produção da dinâmica observada.

Apenas 37 redes de modelo admissíveis foram encontradas no Network Finding, embora os parâmetros numneighbors tenham sido definidos como 2.000, o que sugere que a pesquisa na rede pode ter sido indevidamente limitada. Conforme descrito na documentação do módulo python dsgrn_net_gen no IDP, o problema pode estar relacionado à rede de sementes, lista de bordas, lista de nó, opções de parâmetros de Localização de Rede ou alguma combinação destes. Para investigar, a mesma rede de sementes, lista de bordas e lista de nó como antes foram usados, mas os parâmetros de Busca de Rede foram alterados adicionando a capacidade de remover bordas durante a geração de rede (Arquivo Suplementar 12). O carregamento dos novos resultados de Localização de Rede no IDV mostra que 612 redes foram encontradas nesta etapa, com 67% (411) dessas redes tendo capacidade de oscilar (Figura 7A). Curiosamente, 13% (82) das redes capazes de dinâmica oscilatória estável não foram capazes de produzir dinâmicas semelhantes às observadas nos dados (Figura 7B). Das 411 redes, 30% (124) apresentaram correspondências robustas aos dados (ou seja, mais de 50% de seus parâmetros de modelo oscilantes apresentavam correspondência de dados) (Figura 7C).

Os números de prevalência de borda gerados pela segunda rodada de Network Finding são agora baseados em uma seleção muito maior de redes e podem ser mais confiantes na avaliação da importância de uma relação regulatória em um GRN. Por exemplo, o HCM1 = tf_rep(YHP1) ainda é altamente representado em redes que produzem dinâmicas robustas, sugerindo que essa relação poderia valer a pena investigar experimentalmente (Figura 7C). Um exame mais aprofundado da Tabela de Prevalência de Borda (com base nas 124 redes mencionadas acima) revelou que as bordas SWI4 = tf_rep(YOX1) e YOX1 = tf_act(SWI4) não são altamente classificadas, mas as bordas SWI4 = tf_rep(YHP1) e YHP1 = tf_act(SWI4) são altamente classificadas (Figura 7C). O feedback negativo é importante para a produção de dinâmicas ^{oscilatórias23} e ambos os conjuntos de relações regulatórias fornecem essa função na GRN na Figura 3. Descobrir se existe uma rede que contenha todas essas quatro bordas poderia fornecer alguma visão sobre por que elas não existem frequentemente juntas na coleção de modelos GRN; no entanto, clicar através de redes individuais seria tedioso. Em vez disso, a parte de Análise de Similaridade da página De busca de rede foi usada para procurar redes que possam conter todas as quatro bordas (Figura 7D). Examinar o gráfico de dispersão que mostra o quão semelhantes as redes 612 são a um motivo dessas quatro bordas versus a porcentagem do espaço do parâmetro do modelo que corresponde à dinâmica observada revela que apenas 0,65% (4) das 612 redes contêm todas as quatro bordas (Figura 7D). Isso sugere uma hipótese testável de que apenas um dos dois loops de feedback negativos é necessário para uma rede deste tamanho produzir a dinâmica observada. Essa hipótese pode ser ainda mais investigada computacionalmente por reparameterização de etapas do IDP e uma busca mais exaustiva do espaço de rede ou experimentalmente, como nocautes genéticos. Todos os resultados desta análise podem ser encontrados no Arquivo Suplementar 13.

Figura 1: Visão geral do fluxo de trabalho do IDP e do IDV. A linha inferior mostra os três principais passos do IDP: Node, Edge e Network Finding. A linha superior mostra os principais passos do IDV e descreve várias maneiras pelas quais um usuário pode interagir com os resultados. As setas cinza escura entre os dois descrevem como o IDV e o IDP podem funcionar sinergicamente para permitir que os usuários tossem decisões informadas para cada etapa do IDP, com etapas individuais do IDP fornecendo resultados para as visualizações no IDV, etapas individuais de IDV permitindo a entrada de parâmetros novos ou ajustados e resultados ajustados e entradas para a etapa subsequente do IDP. Clique aqui para ver uma versão maior desta figura.

Figura 2: Exemplo de resultados de executar cada etapa do IDP consecutivamente sem usar o IDV entre etapas. (A) Uma captura de tela da saída do terminal de executar cada passo do IDP consecutivamente. O IDP correu para a conclusão, mas zero redes foram encontradas durante a etapa de Busca de Rede. (B) Nó Encontrar o diretório de resultados node_finding_20210705183301 (Arquivo Suplementar 13) carregado no IDV. Todos os genes na tabela de lista de genes foram selecionados (seta vermelha) para mostrar seus respectivos perfis de expressão no gráfico de linha e para gerar uma tabela de anotação. A tabela de anotação foi preenchida para refletir como os genes são rotulados no arquivo de anotação original (arqueiro verde). (C) Diretório de resultados de resultados de edge Finding edge_finding_20210705183301 (Arquivo Suplementar 13) carregado no IDV. (D) Diretório de resultados de localização de rede network_finding_20210705183301 (Arquivo Suplementar 13) carregado no IDV. A página 'Localização de rede' não mostra resultados, sugerindo que a reparameterização da etapa de Localização da Rede ou a reavaliação da etapa de Node ou Edge Finding são necessárias. A documentação do IDP contém etapas de solução de problemas para ajudar o usuário a determinar o que eles podem tentar a seguir. Clique aqui para ver uma versão maior desta figura.

Figura 3: Um modelo GRN de ciclo de células de levedura. Um conjunto de reguladores conhecidos do ciclo celular de levedura foram selecionados a partir de SGD e as relações regulatórias conhecidas entre genes foram extraídas da Levedura. Clique aqui para ver uma versão maior desta figura.

Figura 4: Exemplo de node do IDP Encontrar resultados no IDV. Carregado no IDV é o diretório de resultados de Node Finding node_finding_20210705183301 (Arquivo Suplementar 13). Os resultados ajustados após a inspeção de bancos de dados de levedura on-line curados. A tabela da lista genética foi estendida (seta amarela) para encontrar o gene restante no modelo GRN da Figura 3 e os genes foram dessespecionados para remover genes não encontrados no mesmo modelo GRN (seta vermelha). A tabela de anotação foi preenchida com base em evidências de regulação para cada gene encontrado em Yeastract (arqueiro verde). A nova lista genética e o arquivo de anotação foram baixados selecionando seus respectivos botões de download (setas azuis). Clique aqui para ver uma versão maior desta figura.

Figura 5: Exemplo de IDP Edge Finding resulta no IDV. Carregado no IDV está o diretório de resultados do Edge Finding edge_finding_20210701100152 (Arquivo Suplementar 13). (A) O resultado inicial produzido pelo IDP. A opção de dropdown de rede Da Seed foi selecionada (seta vermelha) para visualizar a rede de sementes produzida pelo IDP com base nos argumentos do arquivo de configuração usado (Arquivo Suplementar 7). Os genes selecionados na tabela de borda são as bordas usadas na rede de sementes. (B) Os resultados ajustados após a inspeção da rede de sementes em busca de bordas que não contenham evidências experimentais. A opção de retirada de rede Da Seleção foi selecionada (seta vermelha). As bordas foram selecionadas/desmarcadas da tabela de borda (arqueiro verde). Os arquivos da rede de sementes, lista de bordas e lista de nó foram baixados clicando em seus respectivos botões (setas amarelas). A tabela de borda mostrada é para os dados da série da última vez, conforme listado no arquivo de configuração two_wts_EdgeFinding_config.txt (Arquivo Suplementar 7). É importante ao selecionar bordas para a rede de sementes ou lista de bordas com base nos resultados do LEM para olhar os dados da última série de tempo listados no arquivo de configuração, pois esta saída incorpora todos os arquivos de dados anteriores em sua inferência de relações regulatórias entre nós. Clique aqui para ver uma versão maior desta figura.

Figura 6: Exemplo de IDP Network Finding resulta no IDV de usar o arquivo de configuração IDP two_wts_NetFind_rd1_config.txt (Arquivo Suplementar 11). (A) O ciclo completo estável de consulta foi selecionado (seta vermelha) para exibir os respectivos dados no eixo y no gráfico de dispersão. Os pontos azuis no plot de dispersão representam pontos selecionados usando a função Box Select para o plot de dispersão. A caixa de seleção pontilhada foi ilustrada para mostrar como é a seleção da caixa. (B) Os inteiros min e max para o eixo y e o eixo x foram inseridos manualmente em redes selecionadas dentro desses limites (arqueiro verde). Após cada seleção, foi clicado o botão Get Edge Prevalence from Selected Networks (setas amarelas) e as áreas de Prevalência de Borda e Redes Preditas DSGRN Selecionadas. No Índice de rede, setas para cima e para baixo podem ser clicadas para navegar nas redes selecionadas (setas azuis). Clique aqui para ver uma versão maior desta figura.

Figura 7: Exemplo de localização de rede IDP resulta no IDV do uso de two_wts_NetFind_rd2_config.txt de arquivo de configuração IDP (Arquivo Suplementar 12). (A-C) A seleção das redes foi realizada por meio da entrada de valores nas caixas de entrada mínima e máxima (setas vermelhas). O botão Get Edge Prevalence from Selected Networks foi clicado para gerar a Tabela de Prevalência de Borda e as áreas de Redes Preditos DSGRN selecionadas. (D) As bordas de interesse foram selecionadas na tabela edge_list (seta amarela) e o botão Enviar (arqueiro verde) foi clicado para calcular pontuações de similaridade para traçar no gráfico de dispersão contra a consulta selecionada (seta azul). A função Box Select foi usada para selecionar um conjunto de redes (seta roxa) para gerar a Tabela de Prevalência de Borda e as áreas de Redes Predidas DSGRN selecionadas. O Índice de Rede foi aumentado para 2 (seta laranja) para visualizar a segunda rede na seleção. Clique aqui para ver uma versão maior desta figura.

Prazo	Passo do gasoduto	Definição
de Lichtenburg por JTK-CYCLE (DLxJTK)	Descoberta de nó	Uma única medida quantitativa de periodicidade e força de regulação usada para classificar genes. Combina métricas de periodicidade publicadas anteriormente de Lichtenberg (DL) e JTK-CYCLE (JTK).
Expressão máxima do primeiro ciclo	Descoberta de nó	A expressão genética máxima durante o primeiro ciclo de expressão genética periódica. Os genes ordenados pela Expressão Máxima do Primeiro Ciclo serão ordenados com base no ponto de tempo do primeiro ciclo em que atingem sua expressão genética máxima.
A Máquina de Borda Local (LEM)	Descoberta de borda	Um método de inferência de rede bayesiana que classifica modelos potenciais de interações genéticas para identificar os mais prováveis reguladores e modos de regulação (ativação ou repressão) de um determinado gene alvo usando dados de expressão genética de séries temporais.
Rede de Sementes	Descoberta de rede	Um palpite inicial em uma rede plausível de interações globais selecionando as bordas lem mais bem classificadas. A semente localiza uma região de espaço de rede altamente oscilante com uma alta probabilidade de mostrar consistência com os dados da série temporal fornecida.
Assinaturas dinâmicas geradas por redes reguladoras (DSGRN)	Descoberta de rede	Um pacote de software para calcular de forma abrangente a variedade de comportamentos dinâmicos de longo prazo que uma rede pode exibir.
Prevalência de borda	Descoberta de rede	A porcentagem de redes de pontuação superior da etapa de localização de rede que incluem a borda em questão. A pontuação permite um ranking de bordas que têm prevalência de não zero.

Tabela 1: Definição dos termos de Pipeline de Dinâmica Inerente e Visualizador de Dinâmica Inerente.

Arquivo Suplementar 1: Dados de expressão genética da série time (Replicar 1) retirados de Orlando, 200813. Clique aqui para baixar este Arquivo.

Arquivo Suplementar 2: Dados de expressão genética da série time (Replicar 2) retirados de Orlando, 200813. Clique aqui para baixar este Arquivo.

Arquivo suplementar 3: Arquivo de anotação contendo todos os genes encontrados no Arquivo Suplementar 1 e Arquivo Suplementar 2. Clique aqui para baixar este Arquivo.

Arquivo suplementar 4: Arquivo de configuração de pipeline de dinâmica inerente totalmente parametrizado. Clique aqui para baixar este Arquivo.

Arquivo Suplementar 5: Arquivo de lista genética baixado da página Node Finding do Visualizador de Dinâmica Inerente. Clique aqui para baixar este Arquivo.

Arquivo Suplementar 6: Arquivo de anotação baixado da página Node Finding do Visualizador de Dinâmica Inerente. Clique aqui para baixar este Arquivo.

Arquivo suplementar 7: Arquivo de configuração do pipeline de dinâmica inerente parametrizado apenas para a etapa de configuração de borda. Clique aqui para baixar este Arquivo.

Arquivo Suplementar 8: Arquivo de rede de sementes baixado da página Edge Finding do Visualizador de Dinâmica Inerente. Clique aqui para baixar este Arquivo.

Arquivo Suplementar 9: Arquivo da lista de borda baixado da página Edge Finding do Visualizador de Dinâmica Inerente. Clique aqui para baixar este Arquivo.

Arquivo Suplementar 10: Arquivo de lista de nó baixado da página Edge Finding do Visualizador de Dinâmica Inerente. Clique aqui para baixar este Arquivo.

Arquivo Suplementar 11: Arquivo de configuração do pipeline de dinâmica inerente parametrizado apenas para a etapa de localização de rede. Clique aqui para baixar este Arquivo.

Arquivo suplementar 12: Arquivo de configuração de pipeline de dinâmica inerente atualizado (Arquivo Suplementar 11) parametrizado apenas para a etapa de localização de rede. Clique aqui para baixar este Arquivo.

Arquivo Suplementar 13: Diretório contendo os resultados da seção Resultados Representativos. Clique aqui para baixar este Arquivo.

Subscription Required. Please recommend JoVE to your librarian.

Discussion

A inferência das GRNs é um desafio importante na biologia dos sistemas. O IDP gera GRNs modelo a partir de dados de expressão genética usando uma sequência de ferramentas que utilizam os dados de maneiras cada vez mais complexas. Cada etapa requer decisões sobre como processar os dados e quais elementos (genes, interações funcionais) serão passados para a próxima camada do IDP. Os impactos dessas decisões sobre os resultados do IDP não são tão óbvios. Para ajudar nesse sentido, o IDV fornece visualizações interativas úteis das saídas a partir de etapas individuais das ferramentas de inferência GRN dentro do IDP. O IDV agiliza e facilita o processo de avaliação dos resultados desses métodos computacionais de inferência para acelerar a experimentação e informar as escolhas de análise, o que, por sua vez, permitirá a produção acelerada de modelos e hipóteses de rede de alta confiança. O IDV também implementa recursos que se expandem na funcionalidade do IDP, incluindo filtragem de bordas por opções de parâmetros LEM ODE, binning de genes pelo seu tempo de expressão e redes de clustering baseadas em similaridade a um motivo ou rede. É importante ressaltar que o IDV permite intervenções manuais entre cada etapa do IDP, o que permite ao usuário incorporar facilmente conhecimento humano e informações prévias da literatura de maneiras que não podem ser facilmente automatizadas. Uma execução ingênua do IDP não incorporará nativamente essas informações, de modo que o uso do IDV aumentará a confiança nos resultados sempre que informações específicas do experimento estiverm disponíveis. No geral, o uso do IDV em conjunto com o IDP permite que os usuários criem hipóteses de rede para processos biológicos com maior confiança, mesmo com pouco ou nenhum conhecimento do verdadeiro GRN.

Há três passos críticos no IDV. O primeiro é avaliar os resultados do IDP Node Finding no IDV. A página de busca de nó do IDV pode produzir uma nova lista genética e, se desejar, um arquivo de anotação genética. A curadoria de uma nova lista genética é um passo crítico, pois reduz consideravelmente o espaço potencial da rede limitando quais genes podem ser modelados como alvos e/ou reguladores grn. Além disso, como os GRNs são compostos principalmente por fatores de transcrição, ter anotações genéticas ajudará muito na criação de modelos GRN coerentes.

O próximo passo é avaliar os resultados do IDP Edge Finding no IDV. A curadoria de uma nova rede de sementes é um passo crítico, pois localiza a região do espaço de rede que será amostrada na etapa de Busca de Rede. No entanto, saber por onde começar nem sempre é óbvio, por isso é recomendável usar bordas que tenham alguma forma de evidência experimental para fornecer confiança de que se está começando em uma região de espaço de rede que contém bordas de alta confiança. A página Edge Finding do IDV permite a fácil montagem de redes de sementes e gera o arquivo de especificação de rede DSGRN associado, bem como listas de nó e borda.

A última etapa é avaliar os resultados de Localização de Rede IDP no IDV. A página de Busca de Rede do IDV permite a fácil exploração de redes amostradas e seus escores associados que estimam a capacidade da rede de produzir a dinâmica observada. Enquanto o Node e o Edge Finding sempre retornarão os resultados (se pelo menos dois genes forem transmitidos a partir do Node Finding), o Network Finding pode retornar zero resultados. Portanto, saber se ajustes nos parâmetros serão necessários será mais óbvio no Network Finding do que no Node e Edge Finding. Tais ocorrências de poucas ou nenhuma rede encontradas podem ser resultado de restrições colocadas em quais redes podem ser analisadas. Essas restrições são: 1) se as redes estão sempre fortemente conectadas, 2) o mínimo e o número máximo de bordas de entrada para cada nó, 3) as probabilidades de adicionar e remover nós e bordas, e 4) o número de adições e remoções de nós e bordas permitidas. Se forem encontradas poucas ou nenhuma rede de modelo admissível, como na Figura 2, recomenda-se, então, referindo-se à documentação do IDP para orientação sobre a reparameterização de qualquer ou todas as etapas do IDP com avaliação subsequente dos resultados no IDV.

Uma limitação atual dessa abordagem é que a página Node Finding é focada principalmente em dinâmicas oscilatórias, como as vistas nos programas transcricionais do ciclo celular e do relógio circadiano. Em particular, a etapa de Localização do Nó do IDP está atualmente configurada para procurar genes que exibem dinâmicas oscilatórias em um período especificado. À medida que o IDP se expande para incluir análises que podem quantificar diferentes tipos de dinâmica transcricional, o IDV também será atualizado para apoiar a visualização e interrogatório desses outros comportamentos. O tamanho das redes pesquisadas e analisadas na etapa de Busca de Rede está atualmente limitado a redes de menor porte, por exemplo, em torno de 10 genes. Esta é uma necessidade, pois os cálculos na escala DSGRN ocorrem de forma combinatória. Outra limitação é que a exploração do espaço de parâmetros de modelo para uma rede selecionada não é possível no IDV. No entanto, o arquivo de especificação de rede DSGRN para uma determinada rede pode ser baixado e a dinâmica associada a cada parâmetro de modelo pode ser visualizada no site de visualização do DSGRN (https://sites.math.rutgers.edu/~gameiro/dsgrn_viz/). Por fim, o IDV foi testado usando sistemas Linux (Ubuntu) e iOS (Big Sur). O IDV foi testado no Windows 10 usando o Windows Subsystem for Linux (WSL), que permite que os usuários do Windows 10 executem o Linux e o IDV sem a necessidade de um computador diferente, uma máquina virtual ou uma configuração de inicialização dupla. O IDV não é executado atualmente no Windows nativo.

Estudar GRNs é difícil devido à sua complexidade inerente e ferramentas úteis de inferência, como o IDP, pode ser difícil de entender e implantar com confiança. O IDV fornece um método para reduzir a complexidade do estudo de GRNs inferidas usando o IDP, ao mesmo tempo em que facilita a inclusão de informações adicionais além da dinâmica da expressão genética. O uso do IDV em conjunto com o IDP como descrito aqui capacitará os pesquisadores a desenvolver e analisar modelos funcionais de sistemas bem estudados, como o ciclo celular humano. Além disso, essas ferramentas gerarão hipóteses testáveis para processos menos compreendidos, como o ciclo de desenvolvimento intra-eritrócitico da malária, que se suspeita ser controlado por um ^GRN24 , mas para o qual um modelo ainda está para ser proposto.

Subscription Required. Please recommend JoVE to your librarian.

Disclosures

Os autores não têm nada a revelar.

Acknowledgments

Este trabalho foi financiado pela concessão do NIH R01 GM126555-01 e subvenção NSF DMS-1839299.

Materials

Name	Company	Catalog Number	Comments
Docker			https://docs.docker.com/get-docker/
Git			https://git-scm.com/
Inherent Dynamics Pipeline			https://gitlab.com/biochron/inherent_dynamics_pipeline
Inherent Dynamics Visualizer			https://gitlab.com/bertfordley/inherent_dynamics_visualizer
Miniconda			https://docs.conda.io/en/latest/miniconda.html
Pip			https://pip.pypa.io/en/stable/

DOWNLOAD MATERIALS LIST

References

Karlebach, G., Shamir, R. Modelling and analysis of gene regulatory networks. Nature Reviews Molecular Cell Biology. 9 (10), 770-780 (2008).
Aijö, T., Lähdesmäki, H. Learning gene regulatory networks from gene expression measurements using non-parametric molecular kinetics. Bioinformatics. 25 (22), 2937-2944 (2009).
Huynh-Thu, V. A., Sanguinetti, G. Combining tree-based and dynamical systems for the inference of gene regulatory networks. Bioinformatics. 31 (10), 1614-1622 (2015).
Oates, C. J., et al. Causal network inference using biochemical kinetics. Bioinformatics. 30 (17), 468-474 (2014).
Marbach, D., et al. Wisdom of crowds for robust gene network inference. Nature Methods. 9 (8), 796-804 (2012).
Inherent Dynamics Pipeline. , Available from: https://gitlab.com/biochron/inherent_dynamics_pipeline (2021).
Motta, F. C., Moseley, R. C., Cummins, B., Deckard, A., Haase, S. B. Conservation of dynamic characteristics of transcriptional regulatory elements in periodic biological processes. bioRxiv. , (2020).
LEMpy. , Available from: https://gitlab.com/biochron/lempy (2021).
McGoff, K. A., et al. The local edge machine: inference of dynamic models of gene regulation. Genome Biology. 17, 214 (2016).
Cummins, B., Gedeon, T., Harker, S., Mischaikow, K. Model rejection and parameter reduction via time series. SIAM Journal on Applied Dynamical Systems. 17 (2), 1589-1616 (2018).
Cummins, B., Gedeon, T., Harker, S., Mischaikow, K. Database of Dynamic Signatures Generated by Regulatory Networks (DSGRN). Lecture Notes in Computer Science. (including Subseries Lecture Notes in Artificial Intelligence and Lecture Notes in Bioinformatics). , 300-308 (2017).
Cummins, B., Gedeon, T., Harker, S., Mischaikow, K. DSGRN: Examining the dynamics of families of logical models. Frontiers in Physiology. 9. 9, 549 (2018).
DSGRN. , Available from: https://github.com/marciogameiro/DSGRN (2021).
Dsgm_Net_Gen. , Available from: https://github.com/breecummins/dsgrn_net_gen (2021).
Dsgrn_Net_Query. , Available from: https://github.com/breecummins/dsgrn_net_query (2021).
Orlando, D. A., et al. Global control of cell-cycle transcription by coupled CDK and network oscillators. Nature. 453 (7197), 944-947 (2008).
Monteiro, P. T., et al. YEASTRACT+: a portal for cross-species comparative genomics of transcription regulation in yeasts. Nucleic Acids Research. 48 (1), 642-649 (2020).
de Bruin, R. A. M., et al. Constraining G1-specific transcription to late G1 phase: The MBF-associated corepressor Nrm1 acts via negative feedback. Molecular Cell. 23 (4), 483-496 (2006).
Horak, C. E., et al. Complex transcriptional circuitry at the G1/S transition in Saccharomyces cerevisiae. Genes & Development. 16 (23), 3017-3033 (2002).
Cherry, J. M., et al. Saccharomyces genome database: The genomics resource of budding yeast. Nucleic Acids Research. 40, 700-705 (2012).
Zhu, G., et al. Two yeast forkhead genes regulate the cell cycle and pseudohyphal growth. Nature. 406 (6791), 90-94 (2000).
Loy, C. J., Lydall, D., Surana, U. NDD1, a high-dosage suppressor of cdc28-1N, is essential for expression of a subset of late-S-phase-specific genes in saccharomyces cerevisiae. Molecular and Cellular Biology. 19 (5), 3312-3327 (1999).
Cho, C. Y., Kelliher, C. M., Hasse, S. B. The cell-cycle transcriptional network generates and transmits a pulse of transcription once each cell cycle. Cell Cycle. 18 (4), 363-378 (2019).
Smith, L. M., et al. An intrinsic oscillator drives the blood stage cycle of the malaria parasite Plasmodium falciparum. Science. 368 (6492), 754-759 (2020).

Biology

Visualizador de dinâmica inerente, um aplicativo interativo para avaliar e visualizar saídas de um pipeline de inferência de rede de regulação genética

Summary

Abstract

Introduction

Protocol

Representative Results

Discussion

Disclosures

Acknowledgments

Materials

References

Tags

Cite this Article

Summary

Abstract

Introduction

Protocol

Representative Results

Discussion

Disclosures

Acknowledgments

Materials

References

Tags

Cite this Article

Get cutting-edge science videos from JoVE sent straight to your inbox every month.