Waiting
Login processing...

Trial ends in Request Full Access Tell Your Colleague About Jove
Click here for the English version

Biology

Inherent Dynamics Visualizer, et interaktivt program til evaluering og visualisering af output fra en Genregulerende Netværksslutningspipeline

Published: December 7, 2021 doi: 10.3791/63084

Summary

Inherent Dynamics Visualizer er en interaktiv visualiseringspakke, der opretter forbindelse til et genregulerende netværksslutningsværktøj til forbedret, strømlinet generation af funktionelle netværksmodeller. Visualizeren kan bruges til at træffe mere informerede beslutninger om parameterisering af slutningsværktøjet og dermed øge tilliden til de resulterende modeller.

Abstract

Udvikling af genregulerende netværksmodeller er en stor udfordring inden for systembiologi. Flere beregningsværktøjer og pipelines er blevet udviklet til at tackle denne udfordring, herunder den nyudviklede Inherent Dynamics Pipeline. Inherent Dynamics Pipeline består af flere tidligere publicerede værktøjer, der arbejder synergistisk og er forbundet lineært, hvor output fra ét værktøj så bruges som input til følgende værktøj. Som med de fleste beregningsteknikker kræver hvert trin i Inherent Dynamics Pipeline, at brugeren træffer valg om parametre, der ikke har en præcis biologisk definition. Disse valg kan i væsentlig grad påvirke genregulerende netværksmodeller, der produceres af analysen. Af denne grund kan evnen til at visualisere og udforske konsekvenserne af forskellige parametervalg på hvert trin hjælpe med at øge tilliden til valgene og resultaterne. Inherent Dynamics Visualizer er en omfattende visualiseringspakke, der strømliner processen med at evaluere parametervalg via en interaktiv grænseflade i en webbrowser. Brugeren kan separat undersøge outputtet fra hvert trin i pipelinen, foretage intuitive ændringer baseret på visuel information og drage fordel af den automatiske produktion af nødvendige inputfiler til Inherent Dynamics Pipeline. Inherent Dynamics Visualizer giver et uovertruffen niveau af adgang til et meget indviklet værktøj til opdagelse af genregulerende netværk fra tidsserie transkriptomiske data.

Introduction

Mange vigtige biologiske processer, såsom celledifferentiering og miljørespons, styres af sæt gener, der interagerer med hinanden i et genregulerende netværk (GRN). Disse GRN'er producerer den transkriptionelle dynamik, der er nødvendig for at aktivere og vedligeholde den fænotype, de kontrollerer, så identifikation af KOMPONENTERNE og den topologiske struktur i GRN er nøglen til at forstå mange biologiske processer og funktioner. Et GRN kan modelleres som et sæt interagerende gener og/eller genprodukter beskrevet af et netværk, hvis noder er generne, og hvis kanter beskriver retningen og formen for interaktion (f.eks. aktivering/undertrykkelse af transkription, posttranslationel modifikation osv.) 1. Interaktioner kan derefter udtrykkes som parameteriserede matematiske modeller, der beskriver den indvirkning, et regulerende gen har på produktionen af dets mål (er) 2,3,4. Slutning af en GRN-model kræver både en slutning af interaktionsnetværkets struktur og estimering af de underliggende interaktionsparametre. Der er udviklet en række beregningsmæssige slutningsmetoder, der indtager tidsserie-genekspressionsdata og output GRN-modeller5. For nylig blev der udviklet en ny GRN-slutningsmetode, kaldet Inherent Dynamics Pipeline (IDP), der bruger tidsserie-genekspressionsdata til at producere GRN-modeller med mærkede regulator-mål-interaktioner, der er i stand til at producere dynamik, der matcher den observerede dynamik i genekspressionsdataene6. IDP er en række værktøjer, der er forbundet lineært i en pipeline og kan opdeles i tre trin: et Node Finding-trin, der rangerer gener baseret på genekspressionsegenskaber, der er kendt eller mistænkt for at være relateret til funktionen af GRN7,8, et Edge Finding-trin, der rangerer parvise reguleringsforhold8, 9, og et Network Finding-trin, der producerer GRN-modeller, der er i stand til at producere den observerede dynamik10,11,12,13,14,15.

Som de fleste beregningsmetoder kræver IDP et sæt brugerspecificerede argumenter, der dikterer, hvordan inputdataene analyseres, og forskellige sæt argumenter kan producere forskellige resultater på de samme data. For eksempel indeholder flere metoder, herunder IDP, argumenter, der anvender en vis tærskel på dataene, og forøgelse/nedsættelse af denne tærskel mellem successive kørsler af den pågældende metode kan resultere i forskellige resultater mellem kørsler (se supplerende note 10: Netværksslutningsmetoder af5). At forstå, hvordan hvert argument kan påvirke analysen og efterfølgende resultater, er vigtigt for at opnå stor tillid til resultaterne. I modsætning til de fleste GRN-slutningsmetoder består IDP af flere beregningsværktøjer, der hver har sit eget sæt argumenter, som en bruger skal specificere, og hver har sine egne resultater. Mens IDP giver omfattende dokumentation for, hvordan man parameteriserer hvert værktøj, gør hvert værktøjs indbyrdes afhængighed af output fra det foregående trin parameterisering af hele rørledningen uden mellemliggende analyser udfordrende. For eksempel vil argumenter i Trinnene Edge og Network Finding sandsynligvis blive informeret af forudgående biologisk viden og vil derfor afhænge af datasættet og/eller organismen. For at forhøre mellemliggende resultater ville der være behov for en grundlæggende forståelse af programmering samt en dyb forståelse af alle resultatfilerne og deres indhold fra IDP.

IDV (Inherent Dynamics Visualizer) er en interaktiv visualiseringspakke, der kører i en brugers browservindue og giver brugere af IDP mulighed for at vurdere virkningen af deres argumentvalg på resultater fra ethvert trin i IDP'en. IDV navigerer i en kompliceret mappestruktur produceret af IDP og samler de nødvendige data for hvert trin og præsenterer dataene i intuitive og interaktive figurer og tabeller, som brugeren kan udforske. Efter at have udforsket disse interaktive skærme kan brugeren producere nye data fra et IDP-trin, der kan baseres på mere informerede beslutninger. Disse nye data kan derefter straks bruges i det næste respektive trin i IDP. Derudover kan udforskning af dataene hjælpe med at afgøre, om et IDP-trin skal køres igen med justerede parametre. IDV kan forbedre brugen af IDP samt gøre brugen af IDP mere intuitiv og tilgængelig, som det fremgår af at undersøge kerneoscillatoren GRN i gærcellecyklussen. Følgende protokol indeholder IDP-resultater fra en fuldt parameteriseret IDP-kørsel versus en tilgang, der inkorporerer IDV efter kørsler af hvert IDP-trin, dvs. Node, Edge og Network Finding.

Subscription Required. Please recommend JoVE to your librarian.

Protocol

1. Installer IDP og IDV

BEMÆRK: Dette afsnit forudsætter, at docker, conda, pip og git allerede er installeret (Tabel over materialer).

  1. Indtast kommandoen i en terminal: git-klon https://gitlab.com/biochron/inherent_dynamics_pipeline.git.
  2. Følg installationsvejledningen i IDP's README-fil.
  3. Indtast kommandoen i en terminal: git-klon https://gitlab.com/bertfordley/inherent_dynamics_visualizer.git.
    BEMÆRK: Kloning af IDV skal ske uden for IDP's øverste niveau.
  4. Følg installationsvejledningen i IDV's README-fil.

2. Node fund

  1. Opret en ny IDP-konfigurationsfil, der parametriserer trinnet Nodesøgning.
    BEMÆRK: Alle anførselstegn i følgende trin bør ikke skrives ud. Anførselstegnene bruges her kun som afgrænsning mellem protokolteksten og det, der skal skrives ud.
    1. Føj de vigtigste IDP-argumenter til konfigurationsfilen.
    2. Åbn en ny tekstfil i en teksteditor, og skriv "data_file =", "annotation_file =", "output_dir =", "num_proc =" og "IDVconnection = True" på individuelle linjer.
    3. For "data_file" skal du efter ligheden til tegnet skrive stien til og navnet på den respektive tidsseriefil og skrive et komma efter navnet. Adskil hver data med et komma, hvis der bruges mere end ét tidsseriedatasæt. Se Supplerende fil 1 og Supplerende fil 2 for et eksempel på tidsserie-genekspressionsfiler.
    4. Skriv stien til og navnet på anmærkningsfilen for "annotation_file" efter det lig med tegn. Se Supplerende fil 3 for et eksempel på en anmærkningsfil.
    5. For "output_file", efter det samme tegn, skriv stien til og navnet på den mappe, hvor resultaterne gemmes.
    6. Efter det lige til tegn, for "num_proc", skriv antallet af processer, som IDP skal bruge.
    7. Føj nodesøgningsargumenter til konfigurationsfilen.
    8. I den samme tekstfil som i trin 2.1.1 skal du indtaste den viste rækkefølge "[dlxjtk_arguments]", "perioder =" og "dlxjtk_cutoff =" på individuelle linjer. Placer disse efter hovedargumenterne.
    9. For "perioder", efter lighed med tegn, hvis der anvendes engangsseriedatasæt, skal du skrive hver periodelængde adskilt af kommaer. For mere end ét tidsseriedatasæt skal du skrive hvert sæt periodelængder som før, men placere firkantede parenteser omkring hvert sæt og placere et komma mellem sættene.
    10. Efter ligheden med tegnet, for "dlxjtk_cutoff", skriv et heltal, der angiver det maksimale antal gener, der skal bevares i gene_list_file output af de Lichtenberg ved JTK_CYCLE (DLxJTK) (tabel 1).
      BEMÆRK: Det anbefales stærkt at gennemgå de dlxjtk_arguments afsnit i IDP README for at få en bedre forståelse af hvert argument. Se Supplerende fil 4 for at få et eksempel på en konfigurationsfil med de angivne nodesøgningsargumenter.
  2. I terminalen skal du flytte ind i IDP-mappen, der hedder inherent_dynamics_pipeline.
  3. Indtast kommandoen i terminalen: conda activate dat2net
  4. Kør IDP'en ved hjælp af konfigurationsfilen, der blev oprettet i trin 2.1, ved at køre denne kommando i terminalen, hvor er navnet på filen: python src / dat2net.py
  5. I terminalen skal du flytte til den mappe, der hedder inherent_dynamics_visualizer, og indtaste kommandoen: . /viz_results.sh
    BEMÆRK: vil pege på den mappe, der bruges som outputmappe til IDP.
  6. Angiv http://localhost:8050/ som URL-adresse i en webbrowser.
  7. Når IDV nu er åben i browseren, skal du klikke på fanen Nodesøgning og vælge den nodesøgningsmappe, der er af interesse, i rullemenuen.
  8. Manuelt kuratere en ny genliste fra genlistetabellen i IDV'en, der skal bruges til efterfølgende IDP-trin.
    1. For at udvide eller forkorte genlistetabellen skal du klikke på pil op eller ned eller manuelt indtaste et heltal mellem 1 og 50 i feltet ud for Genekspression af DLxJTK-rangerede gener. Top:.
    2. I genlistetabellen skal du klikke på feltet ved siden af et gen for at se dets genekspressionsprofil i en linjegraf. Flere gener kan tilføjes.
    3. Angiv eventuelt antallet af lige store placeringer til beregning og rækkefølge af gener efter det tidsinterval, der indeholder deres maksimale ekspression, ved at indtaste et heltal i inputfeltet over genlistetabellen mærket Input heltal for at opdele den første cyklus i placeringer:.
      BEMÆRK: Denne indstilling er specifik for oscillerende dynamik og gælder muligvis ikke for andre typer dynamikker.
    4. Vælg en heatmap-visningspræference ved at klikke på en indstilling under Order Genes By: First Cycle Max Expression (tabel 1), som ordner gener baseret på tidspunktet for genekspressionstop i den første cyklus.
      BEMÆRK: DLxJTK Rank bestiller gener baseret på periodicitetsrangeringen fra DLxJTK-algoritmen til IDP.
    5. Klik på knappen Download genliste for at downloade genlisten til det filformat, der er nødvendigt for Edge Finding-trinnet. Se Supplerende fil 5 for et eksempel på en genlistefil.
  9. I tabellen Redigerbar genannotation skal du mærke et gen som et mål, en regulator eller begge dele i anmærkningsfilen for trinnet Edge Finding i en ny Edge Finding-kørsel. Hvis et gen er en regulator, skal du mærke genet som en aktivator, repressor eller begge dele.
    1. For at mærke et gen som en aktivator skal du klikke på cellen i kolonnen tf_act og ændre værdien til 1. Hvis du vil mærke et gen som en repressor, skal du ændre værdien i kolonnen tf_rep til 1. Et gen får lov til at fungere som både en aktivator og en repressor i Edge Finding-trinnet ved at indstille værdierne i både tf_act og tf_rep kolonner til 1.
    2. For at mærke et gen som et mål skal du klikke på cellen i målkolonnen og ændre værdien til 1.
  10. Klik på knappen Download annot.

3. Kantsøgning

  1. Opret en ny IDP-konfigurationsfil, der parametriserer trinnet Edge Finding.
    1. Føj de vigtigste IDP-argumenter til konfigurationsfilen. Åbn en ny tekstfil i en teksteditor, og gentag trin 2.1.1.
    2. Føj Edge Finding-argumenter til konfigurationsfilen.
    3. I den samme tekstfil som i trin 3.1.1 skal du indtaste den viste rækkefølge "[lempy_arguments]", "gene_list_file =", "[netgen_arguments]", "edge_score_column =", "edge_score_thresho =", "num_edges_for_list =", "seed_threshold =" og "num_edges_for_seed =" på individuelle linjer. Disse bør gå under hovedargumenterne.
    4. For "gene_list_file", efter ligheden med tegnet, skal du indtaste stien til og navnet på den genlistefil, der er genereret i trin 2.8.5.
    5. For "edge_score_column", efter lig med tegnet, skal du indtaste enten "pld" eller "norm_loss" for at angive, hvilken datarammekolonne fra lempy-output der bruges til at filtrere kanterne.
    6. Vælg enten "edge_score_threshold" eller "num_edges_for_list", og slet den anden. Hvis "edge_score_threshold" blev valgt, skal du indtaste et tal mellem 0 og 1. Dette tal bruges til at filtrere kanter baseret på den kolonne, der er angivet i trin 3.1.5.
      1. Hvis "num_edges_for_list" blev valgt, skal du indtaste en værdi, der er lig med eller mindre end antallet af mulige kanter. Dette tal bruges til at filtrere kanterne baseret på, hvordan de er rangeret i den kolonne, der er angivet i trin 3.1.5. De kanter, der er tilbage, vil blive brugt til at opbygge netværk i Netværkssøgning.
    7. Vælg enten "seed_threshold" eller "num_edges_for_seed" og slet den anden. Hvis "seed_threshold" blev valgt, skal du indtaste et tal mellem 0 og 1. Dette tal bruges til at filtrere kanter baseret på den kolonne, der er angivet i trin 3.1.5.
      1. Hvis "num_edges_for_seed" blev valgt, skal du indtaste en værdi, der er lig med eller mindre end antallet af mulige kanter. Dette tal bruges til at filtrere kanterne baseret på, hvordan de er rangeret i den kolonne, der er angivet i trin 3.1.5. De kanter, der er tilbage, vil blive brugt til at opbygge frønetværket (tabel 1), der bruges i Netværkssøgning.
        BEMÆRK: Det anbefales stærkt at gennemgå lempy_arguments og netgen_arguments afsnit i IDP README for at få en bedre forståelse af hvert argument. Se Supplerende fil 7 for at få et eksempel på en konfigurationsfil, hvor Edge-søgningsargumenterne er angivet.
  2. Gentag trin 2.2 og 2.3.
  3. Kør IDP'en ved hjælp af konfigurationsfilen, der er oprettet i trin 3.1, ved at køre denne kommando i terminalen, hvor er navnet på filen: python src / dat2net.py
  4. Hvis IDV'en stadig kører, skal du stoppe den ved at trykke på Kontrol C i terminalvinduet for at stoppe programmet. Gentag trin 2.5 og 2.6.
  5. Når IDV er åben i browseren, skal du klikke på fanen Edge Finding og vælge mappen med kantsøgning af interesse i rullemenuen.
    BEMÆRK: Hvis der bruges flere datasæt i Edge-søgning, skal du sørge for at vælge det sidste datasæt, der blev brugt i LEM-analysen (Local Edge Machine) (tabel 1). Det er vigtigt, når du vælger kanter til frønetværket eller kantlisten baseret på LEM-resultater, at se på de sidste tidsseriedata, der er angivet i konfigurationsfilen, da dette output inkorporerer alle tidligere datafiler i sin slutning af lovgivningsmæssige forhold mellem noder.
  6. Hvis du vil udvide eller forkorte kanttabellen, skal du manuelt indtaste et heltal i indtastningsfeltet under Antal kanter:.
  7. Filtrer eventuelt kanter på LEM ODE-parametrene. Klik og træk for at flytte enten venstre side eller højre side af hver parameters skyder for at fjerne kanter fra kanttabellen, der har parametre uden for deres nye tilladte parametergrænser.
  8. Opret eventuelt et nyt frønetværk, hvis der ønskes et andet frønetværk end det, der foreslås af IDP. Se Supplerende fil 8 for et eksempel på en frønetværksfil.
    1. Vælg enten Fra frø for at vælge frønetværket eller Fra valg i rullemenuen under Netværk:.
    2. Fravælg/vælg kanter fra kanttabellen ved at klikke på de tilsvarende afkrydsningsfelter ved siden af hver kant for at fjerne/tilføje kanter fra frønetværket.
  9. Klik på knappen Download DSGRN NetSpec for at downloade frønetværket i netværksspecifikationsformatet Dynamic Signatures Generated by Regulatory Networks (DSGRN) (tabel 1).
  10. Vælg yderligere noder og kanter, der skal bruges i trinnet Netværkssøgning.
    1. Vælg kanter fra kanttabellen ved at klikke på de tilsvarende afkrydsningsfelter, der skal medtages i den kantlistefil, der bruges i Netværkssøgning.
    2. Klik på Download node- og edge-lister for at downloade nodelisten og kantlistefilerne i det format, der kræves til deres brug i Netværkssøgning. Se Supplerende fil 9 og Supplerende fil 10 for eksempler på henholdsvis kant- og nodelistefiler.
      BEMÆRK: Nodelisten skal indeholde alle noderne i kantlistefilen, så IDV'en opretter automatisk nodelistefilen baseret på de valgte kanter. Der er to muligheder for visning af kanterne i Edge Finding. Indstillingen LEM-oversigtstabel præsenterer kanterne som en rangeret liste over de øverste 25 kanter. Top-Line LEM Table præsenterer kanterne i en sammenkædet liste over de tre øverste rangerede kanter for hver mulig regulator. Antallet af kanter, der vises for hver indstilling, kan justeres af brugeren ved at ændre nummeret i indtastningsfeltet Antal kanter .

4. Netværkssøgning

  1. Opret en ny IDP-konfigurationsfil, der parametriserer trinnet Netværkssøgning.
    1. Føj de vigtigste IDP-argumenter til konfigurationsfilen. Åbn en ny tekstfil i en teksteditor, og gentag trin 2.1.1.
    2. Føj argumenter for netværkssøgning til konfigurationsfilen.
    3. I den samme tekstfil som i trin 4.1.1 skal du indtaste den viste rækkefølge "[netper_arguments]", "edge_list_file =", "node_list_file =", "seed_net_file =", "range_operations =", "numneighbors =", "maxparams =", "[[sandsynligheder]]", "addNode =", "addEdge =", "removeNode =" og "removeEdge =" på individuelle linjer under hovedargumenterne.
    4. For "seed_net_file", "edge_list_file" og "node_list_file" skal du efter lighedstegnet angive stien til og navnet på frønetværksfilen og de kant- og nodelistefiler, der er genereret i trin 3.9 og 3.10.2.
    5. Efter lig med tegnet, for "range_operations", skriv to tal adskilt af et komma. Det første og andet tal er henholdsvis det mindste og det maksimale antal tilføjelser eller fjernelse af noder eller kanter pr. Netværk, der er lavet.
    6. For "numneighbors", efter lig med at underskrive, skal du indtaste et tal, der repræsenterer, hvor mange netværk der skal findes i Netværkssøgning.
    7. For "maxparamer", efter lig med tegn, skal du indtaste et tal, der repræsenterer det maksimale antal DSGRN-parametre for at muliggøre et netværk.
    8. Indtast værdier mellem 0 og 1 for hvert af disse argumenter: "addNode", "addEdge", "removeNode" og "removeEdge" efter ligheden med tegnet. Tallene skal summeres til 1.
      BEMÆRK: Det anbefales stærkt at gennemgå netper_arguments og netquery_arguments afsnit i IDP README for at få en bedre forståelse af hvert argument. Se Supplerende fil 11 og Supplerende fil 12 for eksempler på en konfigurationsfil med argumenterne Netværkssøgning angivet.
  2. Gentag trin 2.2 og 2.3.
  3. Kør IDP'en ved hjælp af konfigurationsfilen, der blev oprettet i trin 4.1, ved at køre denne kommando i terminalen, hvor er navnet på filen: python src / dat2net.py
  4. Hvis IDV'en stadig kører, skal du stoppe den ved at trykke på Kontrol C i terminalvinduet for at stoppe programmet. Gentag trin 2.5 og 2.6.
  5. Når IDV er åben i browseren, skal du klikke på fanen Netværkssøgning og vælge den netværkssøgningsmappe, der er af interesse.
  6. Vælg et netværk eller et sæt netværk for at generere en kantprævalenstabel (tabel 1) og for at få vist netværkene sammen med deres respektive forespørgselsresultater.
    1. Der er to muligheder for valg af netværk: Mulighed 1 - Indtast nedre og øvre grænser på forespørgselsresultater ved at indtaste minimums- og maksimumværdier i inputfelterne svarende til x-aksen og y-aksen i plottet. Mulighed 2 - Klik og træk over scatterplottet for at tegne en boks rundt om de netværk, der skal medtages. Når markerings- eller inputgrænser er indtastet, skal du trykke på knappen Hent kantprævalens fra valgte netværk .
      BEMÆRK: Hvis der er angivet mere end én DSGRN-forespørgsel, skal du bruge alternativknapperne mærket med forespørgselstypen til at skifte mellem hver forespørgsels resultater. Det samme gælder, hvis der er angivet mere end én epsilon (støjniveau).
  7. Klik på pilene under kantprævalenstabellen for at gå til næste side i tabellen. Tryk på Download tabel for at downloade kantprævalenstabellen.
  8. Indtast et heltal i inputfeltet Netværksindeks for at få vist et enkelt netværk fra det valg, der blev foretaget i trin 4.6. Klik på Download DSGRN NetSpec for at downloade det viste netværk i DSGRN-netværksspecifikationsformatet.
  9. Søg i netværk efter lighed med et bestemt motiv eller netværk af interesse.
    1. Brug de afkrydsningsfelter, der svarer til hver kant, til at vælge kanter, der skal medtages i netværket eller motivet, der bruges til lighedsanalysen. Klik på Send for at oprette lighedsspredningsplottet for det valgte motiv eller netværk.
      BEMÆRK: Brug pilene i kantlisten til at sortere alfabetisk og pilene under tabellen til at flytte til næste side i tabellen.
    2. Klik og træk over scatterplottet for at tegne en boks rundt om de netværk, der skal medtages, for at vælge et netværk eller et sæt netværk for at generere en kantprævalenstabel og for at se netværkene sammen med deres respektive forespørgselsresultater.
      BEMÆRK: Hvis der er angivet mere end én DSGRN-forespørgsel, skal du bruge alternativknapperne mærket med forespørgselstypen til at skifte mellem hver forespørgsels resultater. Det samme gælder, hvis der er angivet mere end én epsilon (støjniveau).
    3. Gentag trin 4.7 og 4.8 for at downloade henholdsvis kantprævalenstabellen og det viste netværk til lighedsanalysen.

Subscription Required. Please recommend JoVE to your librarian.

Representative Results

De trin, der er beskrevet tekstmæssigt ovenfor og grafisk i figur 1, blev anvendt på gærcellecyklussens kerneoscillerende GRN for at se, om det er muligt at opdage funktionelle GRN-modeller, der er i stand til at producere den dynamik, der er observeret i tidsserie-genekspressionsdata indsamlet i et gærcellecyklusstudie16. For at illustrere, hvordan IDV kan afklare og forbedre IDP-output, blev resultaterne efter at have udført denne analyse på to måder sammenlignet: 1) at køre alle trin i IDP i et pas uden IDV og 2) at træde gennem IDP ved hjælp af IDV, hvilket muliggør justering af mellemliggende resultater både ved at inkorporere forudgående biologisk viden og ved at træffe raffinerede valg baseret på IDP-output. Den velundersøgte gærcellecyklus GRN, der anvendes som et eksempel, har mange af sine lovgivningsmæssige forhold eksperimentelt verificeret. Hvis en anden og/eller mindre kommenteret organisme eller biologisk proces undersøges, kan valgene for, hvordan mellemliggende resultater eller parametre justeres, være forskellige. For at illustrere en type forespørgsel, der kan bruges til at vurdere netværk, blev robustheden af hvert netværk målt for at understøtte stabile svingninger og matche den observerede transkriptionsdynamik i deres noder på tværs af modelparametre.

Genekspressionstidsseriedata for to replikatserier blev taget fra Orlando 200816 og forbehandlet for at fjerne enhver genekspression forbundet med cellecyklussynkroniseringsmetoden, der blev anvendt i det oprindelige eksperiment (Supplerende fil 1 og supplerende fil 2). Der blev oprettet en anmærkningsfil, der indeholdt alle generne i tidsseriedataene, der understøttes af både DNA-bindings- og ekspressionsbeviser fundet i Yeastract17 og dermed kunne fungere som regulator i en GRN. TOS4, PLM2 og NRM1 blev også inkluderet som regulatorer, selvom de ikke blev fundet i Yeastract at have begge typer beviser, fordi de menes at være vigtige for gærkernen GRN baseret på beviser i litteraturen18,19 (Supplerende fil 3). Alle regulatorer blev mærket som både en aktivator og repressor samt mål.

IDP blev først parameteriseret til at køre gennem alle trin i IDP, det vil sige Node, Edge og Network Finding. Et sæt argumenter blev valgt, der syntes passende baseret på den nuværende forståelse af gærcellecyklussen GRN, et lille sæt gener, der deltager i et stærkt forbundet netværk (Supplemental File 4). Denne forståelse påvirkede for det meste Node- og Edge Finding-valgene. Sandsynlighedsparametrene i Network Finding var baseret på den antagelse, at kun sande gener og regulatoriske interaktioner ville blive videregivet til Network Finding. Denne fuldt parameteriserede kørsel af IDP gav resultater for Node og Edge Finding (figur 2B, C), men i Network Finding blev der ikke opdaget nogen modeltildøvende netværk (figur 2A, D). Modeltildængelighed forklares i kodedokumentationen til pythonmodulet dsgrn_net_gen 14, en afhængighed af IDP. Kort fortalt kan netværk, der indeholder selvtrykkende kanter eller har for mange indgange eller udgange på en enkelt node, ikke forespørges af DSGRN-softwaren (tabel 1). IDP giver mange grunde til, at modeltilbegåelige netværk muligvis ikke findes, og beskriver fejlfindingstrin for at løse problemet/problemerne. I det væsentlige indebærer dette at ændre parametre og / eller inputfiler og køre det respektive IDP-trin igen og undersøge resultaterne. IDV blev brugt til at gøre denne proces mindre kedelig og tidskrævende.

Node Finding-resultaterne blev indlæst i IDV for at undersøge de gener, der blev overført til Edge Finding-trinnet i IDP. De noder, der er givet af IDP, er de øverste N-gener som rangeret af DLxJTK (tabel 1), idet N er specificeret af brugeren, men denne genliste er muligvis ikke egnet til analysens mål. Uden forudgående biologisk viden returnerede automatisk udvælgelse af knuder ved hjælp af kun DLxJTK-score et gen med begrænset bevis for en rolle i gærcellecyklussen (RME1), mens nogle få kendte cellecyklustranskriptionsregulatorer ikke var højt rangeret (figur 2B). Yeastract eksperimentelle beviser blev brugt til at vælge blandt de højest rangerende gener af DLxJTK dem med cellecyklus annotation. Disse gener er SWI4, YOX1, YHP1, HCM1, FKH2, NDD1 og SWI5. Deres kendte reguleringsforhold kan ses i figur 3. FKH2 optræder ikke i de ti bedste gener (dlxjtk_cutoff blev sat til ti i Supplerende fil 4) som rangeret af DLxJTK, så genlisten blev udvidet ved hjælp af IDV, indtil FKH2 blev fundet (figur 4). Flere af de yderligere gener i den udvidede genliste er kendte kernegener og ville være gået glip af uden at undersøge Node Finding-resultaterne. Mens flere kendte kernegener er blevet fundet ved at udvide genlisten ned ad DLxJTK-ranglisten, blev fokus holdt på de gener, der var af interesse. Derfor blev nogle højtstående gener fravalgt, hvilket resulterede i en genliste (Supplerende fil 5) indeholdende syv gener (figur 4). En ny anmærkningsfil blev oprettet (Supplemental File 6) baseret på disse syv gener, hvert gen blev mærket som et mål, og regulatortypen blev specificeret ved hjælp af Yeastract. Den nye genliste og anmærkningsfil blev downloadet til efterfølgende brug i det næste IDP-trin, Edge Finding. Uden IDV ville proceduren med at tilføje og fjerne gener fra genlisten og annotationsfilen kræve beskedne kodningsevner.

En ny IDP-konfigurationsfil blev parameteriseret for kun Edge Finding-trinnet (Supplemental File 7) med den nye genliste og anmærkningsfil. Efter afslutningen af IDP med den nye konfigurationsfil blev resultaterne indlæst i IDV (figur 5A). Da Network Finding-trinnet søger stokastisk rundt i netværksrummet i det frønetværk, der leveres til det, kan det være vigtigt at give et godt frønetværk. Et godt frønetværk kan betragtes som et, der indeholder ægte kanter. Med IDV og ved hjælp af online databaser som Yeastract og Saccharomyces Genome Database (SGD)20 kan frønetværket ses og justeres ved hjælp af de lovgivningsmæssige forhold fra LEM (tabel 1), der har eksperimentel dokumentation. Som et eksempel blev kanten YHP1 = tf_act (HCM1) fravalgt, fordi der ikke er noget dokumenteret bevis for dette forhold (figur 5B) i gærract. Kanten SWI5 = tf_act (FKH2) blev tilføjet, da der er dokumenteret bevis for dette forhold21. Når frønetværket (tabel 1) var tilfredsstillende, blev DSGRN-netværksspecifikationsfilen for netværket downloadet (supplerende fil 8).

Uden IDV er der større chance for, at kanter, for hvilke der ikke er nogen eksperimentelle beviser, bruges til at konstruere frønetværket. Som det kan ses i figur 2C, indeholder frønetværket, der genereres i Edge Finding-trinnet fra at køre IDP nonstop gennem hvert trin, en kant, SWI4 = tf_rep (NDD1), der ikke understøttes af eksperimentelle beviser i Yeastract, sandsynligvis fordi NDD1 er kendt for at være en transkriptionsaktivator22. Disse oplysninger blev ikke kodet i anmærkningsfilen i non-stop-kørslen, hvilket gjorde det muligt for alle regulatorer at være både aktivatorer og undertrykkere.

Ved hjælp af IDV blev et frønetværk manuelt kurateret, der er et undernetværk af figur 3, og de resterende fire kanter blev placeret i kantlisten, der blev brugt til prøveudtagning af netværksrum (YHP1 = tf_act (SWI4), YOX1 = tf_act (SWI4), SWI4 = tf_rep (YOX1), SWI5 = tf_act (NDD1)). Valg af kanter baseret på forudgående biologisk viden kan også bruges til at opbygge kantlisten; I dette tilfælde blev de øverste 20 kanter fra LEM-oversigtstabellen dog valgt (Supplerende fil 9). Nodelistefilen oprettes automatisk fra de valgte kanter (Supplerende fil 10). ODE-parametrene fra LEM kan også bruges til at filtrere kanter, hvis man mener, at de udledte parametre i ODE-modellen ikke er biologisk realistiske, men disse oplysninger blev ikke brugt her.

Dernæst blev en ny IDP-konfigurationsfil parameteriseret for netværkssøgningstrinnet ved hjælp af de tre nye filer. Da frønetværket blev oprettet med kanter, der var godt understøttet af eksperimentelle beviser, blev inkluderingen af disse kanter i alle netværk ønsket. Således blev sandsynligheden for netværkssøgning indstillet til at tillade tilføjelsen, men ikke fjernelse af noder og kanter (supplerende fil 11). Parameteren Netværkssøgning numneighbors blev indstillet til at søge efter 2.000 netværk. Efter at have kørt IDP blev der fundet 37 modeltilstedelige netværk i trinnet Netværkssøgning i modsætning til non-stop-kørsel, der havde nul. Ved at indlæse resultaterne af netværkssøgningen i IDV havde 64 % (24) af disse 37 netværk kapacitet til stabilt at svinge (figur 6A). Af disse 24 netværk var de bedst præsterende to netværk, der matchede dataene ved 50% af deres stabilt oscillerende modelparametre (figur 6B).

Edge Prevalence Table (tabel 1) tabulerer antallet af gange, en kant forekommer i en udvalgt samling af netværk, hvilket giver en indikation af dens udbredelse i højtydende netværk. Undersøgelse af Edge Prevalence Table produceret ved at vælge de to foregående netværk i scatter plottet afslører, at alle frønetværkskanter er til stede i hvert af de to netværk, som forventet, sammen med to ikke-frø netværkskanter (figur 6B), SWI4 = tf_act (SWI5) og HCM1 = tf_rep (YHP1). Ingen af disse to kanter havde beviser, der støttede dem i Yeastract. Som sådan blev en lille mængde netværksplads udforsket, så det er svært at vurdere betydningen af kanter og knuder i produktionen af den observerede dynamik.

Kun 37 modeltildømte netværk blev fundet i Network Finding, selvom parameteren numneighbors var sat til 2.000, hvilket tyder på, at netværkssøgningen kan have været unødigt begrænset. Som beskrevet i dokumentationen til dsgrn_net_gen python-modulet i IDP'en kan problemet være relateret til frønetværket, kantlisten, nodelisten, parametervalg for netværkssøgning eller en kombination af disse. For at undersøge blev det samme frønetværk, kantliste og nodeliste som før brugt, men parametrene Netværkssøgning blev ændret ved at tilføje muligheden for at fjerne kanter under netværksgenerering (Supplerende fil 12). Indlæsning af de nye network finding-resultater i IDV viser, at der blev fundet 612 netværk i dette trin, hvor 67% (411) af disse netværk havde kapacitet til stabilt at svinge (figur 7A). Interessant nok var 13% (82) af de netværk, der var i stand til stabil oscillerende dynamik, ikke i stand til at producere dynamik svarende til dem, der ses i dataene (figur 7B). Af de 411 netværk udviste 30 % (124) robuste match til data (dvs. mere end 50 % af deres stabilt oscillerende modelparametre udviste et datamatch) (figur 7C).

De tal for kantprævalens, der genereres af anden runde af network finding, er nu baseret på et meget større udvalg af netværk og kan med større sikkerhed anvendes til at vurdere betydningen af et reguleringsforhold i et GRØNT.N.T. For eksempel er HCM1 = tf_rep (YHP1) stadig repræsenteret højt i netværk, der producerer robust dynamik, hvilket tyder på, at dette forhold kunne være værd at undersøge eksperimentelt (figur 7C). Yderligere undersøgelse af Edge Prevalence Table (baseret på de 124 netværk, der er nævnt ovenfor) afslørede, at kanterne SWI4 = tf_rep (YOX1) og YOX1 = tf_act (SWI4) ikke er højt rangeret, men kanterne SWI4 = tf_rep (YHP1) og YHP1 = tf_act (SWI4) er højt rangeret (figur 7C). Negativ feedback er vigtig for at frembringe oscillerende dynamik23 , og begge disse sæt af reguleringsforhold giver denne funktion i GRN i figur 3. At finde ud af, om der findes et netværk, der indeholder alle fire af disse kanter, kan give et indblik i, hvorfor disse ikke ofte findes sammen i samlingen af GRN-modeller; det ville dog være kedeligt at klikke gennem individuelle netværk. I stedet blev lighedsanalysedelen af siden Netværkssøgning brugt til at søge efter netværk, der kan indeholde alle fire kanter (figur 7D). Undersøgelse af spredningsplottet, der viser, hvor ens de 612 netværk ligner et motiv af disse fire kanter versus procentdelen af modelparameterrummet, der matcher den observerede dynamik, afslører, at kun 0,65% (4) af de 612 netværk indeholder alle fire af disse kanter (figur 7D). Dette antyder en testbar hypotese om, at kun en af de to negative feedback-sløjfer er nødvendig for, at et netværk af denne størrelse kan producere den observerede dynamik. Denne hypotese kan undersøges yderligere beregningsmæssigt ved reparameterisering af IDP-trin og en mere udtømmende søgning i netværksrum eller eksperimentelt, såsom genknockouts. Alle resultater fra denne analyse kan findes i Supplerende fil 13.

Figure 1
Figur 1: Oversigt over IDP- og IDV-arbejdsgange. Den nederste række viser de tre vigtigste trin i IDP: Node, Edge og Network Finding. Den øverste række viser de vigtigste trin i IDV og beskriver forskellige måder, hvorpå en bruger kan interagere med resultaterne. De mørkegrå pile mellem de to viser, hvordan IDV og IDP kan arbejde synergistisk for at give brugerne mulighed for at træffe informerede beslutninger for hvert trin i IDP, med individuelle IDP-trin, der giver resultater for visualiseringerne i IDV, individuelle IDV-trin, der giver mulighed for input af nye eller justerede parametre og justerede resultater og input til det efterfølgende IDP-trin. Klik her for at se en større version af denne figur.

Figure 2
Figur 2: Eksempel på resultater fra at køre hvert trin i IDP'en fortløbende uden at bruge IDV mellem trin. (A) Et skærmbillede af terminaludgangen fra at køre hvert IDP-trin fortløbende. IDP løb til færdiggørelse, men der blev fundet nul netværk under netværkssøgningstrinnet. (B) Node finding results directory node_finding_20210705183301 (Supplerende fil 13), der er indlæst i IDV'en. Alle generne i genlistetabellen blev valgt (rød pil) for at vise deres respektive ekspressionsprofiler i linjegrafen og for at generere en anmærkningstabel. Anmærkningstabellen blev udfyldt for at afspejle, hvordan generne er mærket i den oprindelige anmærkningsfil (grøn pil). (C) Edge Finding Results-edge_finding_20210705183301 (Supplerende fil 13) indlæst i IDV'en. (D) Netværkssøgning af resultatmappe network_finding_20210705183301 (supplerende fil 13), der er indlæst i IDV'en. Siden Netværkssøgning viser ingen resultater, hvilket tyder på, at der enten er behov for en reparameterisering af trinnet netværkssøgning eller en reevaluering af node- eller kantsøgningstrinnet. IDP-dokumentationen indeholder fejlfindingstrin for at hjælpe brugeren med at bestemme, hvad de kan prøve næste. Klik her for at se en større version af denne figur.

Figure 3
Figur 3: En gærcellecyklus GRN-model. Et sæt kendte gærcellecyklusregulatorer blev udvalgt fra SGD, og kendte regulatoriske forhold mellem gener blev ekstraheret fra gærract. Klik her for at se en større version af denne figur.

Figure 4
Figur 4: Eksempel på IDP Node Finding resultater i IDV. Indlæst i IDV er nodesøgningsresultatmappen node_finding_20210705183301 (supplerende fil 13). De justerede resultater efter inspektion af kuraterede online gærdatabaser. Genlistetabellen blev udvidet (gul pil) for at finde det resterende gen i GRN-modellen i figur 3 , og gener blev fravalgt for at fjerne gener, der ikke findes i den samme GRN-model (rød pil). Anmærkningstabellen blev udfyldt baseret på bevis for regulering for hvert gen, der blev fundet på Gærract (grøn pil). Den nye genliste og anmærkningsfil blev downloadet ved at vælge deres respektive downloadknapper (blå pile). Klik her for at se en større version af denne figur.

Figure 5
Figur 5: Eksempel på IDP Edge Finding-resultater i IDV. Indlæst i IDV er Edge Finding-resultatmappen edge_finding_20210701100152 (Supplerende fil 13). (A) Det oprindelige resultat som produceret af IDP. Rullemenuen Netværk Fra frø blev valgt (rød pil) for at få vist det frønetværk, der er produceret af IDP'en, baseret på argumenterne i den anvendte konfigurationsfil (Supplerende fil 7). De udvalgte gener i kantbordet er de kanter, der anvendes i frønetværket. B) De justerede resultater efter inspektion af frønettet for kanter, der ikke indeholder eksperimentel dokumentation. Rullemenuen Netværk Fra valg blev valgt (rød pil). Kanter blev valgt/fravalgt fra kanttabellen (grøn pil). Frønetværket, kantlisten og nodelistefilerne blev downloadet ved at klikke på deres respektive knapper (gule pile). Den viste kanttabel er for de seneste tidsseriedata som angivet i konfigurationsfilen two_wts_EdgeFinding_config.txt (Supplerende fil 7). Det er vigtigt, når du vælger kanter til frønetværket eller kantlisten baseret på LEM-resultater, at se på de sidste tidsseriedata, der er angivet i konfigurationsfilen, da dette output inkorporerer alle tidligere datafiler i sin slutning af lovgivningsmæssige forhold mellem noder. Klik her for at se en større version af denne figur.

Figure 6
Figur 6: Eksempel på IDP-netværkssøgning resulterer i IDV fra brug af IDP-konfigurationsfilen two_wts_NetFind_rd1_config.txt (Supplerende fil 11). (A) Forespørgslen Stabil fuld cyklus blev valgt (rød pil) for at få vist de respektive data på y-aksen i punktdiagrammet. Blå prikker i punktdiagrammet repræsenterer valgte punkter ved hjælp af funktionen Box Select for punktdiagrammet. Den prikkede markeringsboks blev illustreret for at vise, hvordan boksvalget ser ud. (B) Min. og maks. heltal for y-aksen og x-aksen blev manuelt indtastet i udvalgte netværk inden for disse grænser (grøn pil). Efter hvert valg blev der klikket på knappen Hent kantprævalens fra valgte netværk (gule pile), og områderne Edge Prevalence Table og Selected DSGRN Predicted Networks blev genereret. I netværksindekset kan der klikkes på pil op og pil ned for at gennemse de valgte netværk (blå pile). Klik her for at se en større version af denne figur.

Figure 7
Figur 7: Eksempel på IDP-netværkssøgning resulterer i IDV fra brug af IDP-konfigurationsfil two_wts_NetFind_rd2_config.txt (Supplerende fil 12). (A-C) Udvælgelsen af netværk blev udført ved at indtaste værdier i min og max inputbokse (røde pile). Knappen Hent kantprævalens fra valgte netværk blev klikket på for at generere Edge Prevalence Table og Selected DSGRN Predicted Networks områder. (D) Kanter af interesse blev valgt i tabellen edge_list (gul pil), og knappen Send (grøn pil) blev klikket på for at beregne lighedsscorer, der skal afbildes i punktdiagrammet mod den valgte forespørgsel (blå pil). Funktionen Box Select blev brugt til at vælge et sæt netværk (lilla pil) til at generere områderne Edge Prevalence Table og Selected DSGRN Predicted Networks. Netværksindekset blev øget til 2 (orange pil) for at se det andet netværk i markeringen. Klik her for at se en større version af denne figur.

Udtryk Pipeline Trin Definition
de Lichtenburg af JTK-CYCLE (DLxJTK) Søgning efter noder Et enkelt kvantitativt mål for både periodicitet og reguleringsstyrke bruges til at rangere gener. Kombinerer tidligere offentliggjorte periodicitetsmålinger de Lichtenberg (DL) og JTK-CYCLE (JTK).
Første cyklus maks. udtryk Søgning efter noder Den maksimale genekspression i den første cyklus af periodisk genekspression. Gener bestilt af First Cycle Max Expression vil blive ordnet ud fra tidspunktet fra den første cyklus, hvor de når deres maksimale genekspression.
Den lokale kantmaskine (LEM) Kantsøgning En Bayesiansk netværksslutningsmetode, der rangerer potentielle modeller af geninteraktioner for at identificere de mest sandsynlige regulatorer og reguleringsformer (aktivering eller undertrykkelse) af et givet målgen ved hjælp af tidsserie-genekspressionsdata.
Frø netværk Søgning efter netværk Et indledende gæt på et plausibelt netværk af globale interaktioner ved at vælge de bedst rangerede LEM-kanter. Frøet lokaliserer et område af netværksrummet, der er meget oscillerende med stor sandsynlighed for at vise overensstemmelse med de leverede tidsseriedata.
Dynamiske signaturer genereret af Lovgivningsmæssige netværk (DSGRN) Søgning efter netværk En softwarepakke til omfattende beregning af de mange forskellige langsigtede dynamiske adfærd, som et netværk kan udvise.
Kant udbredelse Søgning efter netværk Procentdelen af topscorende netværk fra netværkssøgningstrinnet, der inkluderer den pågældende kant. Scoren tillader en rangordning af kanter, der har en ikke-nul prævalens.

Tabel 1: Definition af Inherent Dynamics Pipeline og Inherent Dynamics Visualizer termer.

Supplerende fil 1: Tidsserie genekspressionsdata (replikat 1) taget fra Orlando, 200813. Klik her for at downloade denne fil.

Supplerende fil 2: Tidsserie genekspressionsdata (Replikat 2) taget fra Orlando, 200813. Klik her for at downloade denne fil.

Supplerende fil 3: Anmærkningsfil, der indeholder alle gener, der findes i supplerende fil 1 og supplerende fil 2. Klik her for at downloade denne fil.

Supplerende fil 4: Fuldt parameteriseret Inherent Dynamics Pipeline-konfigurationsfil. Klik her for at downloade denne fil.

Supplerende fil 5: Genlistefil, der er downloadet fra siden Nodesøgning i Inherent Dynamics Visualizer. Klik her for at downloade denne fil.

Supplerende fil 6: Anmærkningsfil, der er downloadet fra siden Nodesøgning i Inherent Dynamics Visualizer. Klik her for at downloade denne fil.

Supplerende fil 7: Iboende Dynamics Pipeline-konfigurationsfil, der er parameteriseret for kun Edge Finding-trinnet. Klik her for at downloade denne fil.

Supplerende fil 8: Seed-netværksfil, der er downloadet fra edge finding-siden i Inherent Dynamics Visualizer. Klik her for at downloade denne fil.

Supplerende fil 9: Edge-listefil, der er downloadet fra edgesøgningssiden i Inherent Dynamics Visualizer. Klik her for at downloade denne fil.

Supplerende fil 10: Nodelistefil, der er downloadet fra siden Edge Finding i Inherent Dynamics Visualizer. Klik her for at downloade denne fil.

Supplerende fil 11: Iboende Dynamics Pipeline-konfigurationsfil, der er parameteriseret for kun trinnet Netværkssøgning. Klik her for at downloade denne fil.

Supplerende fil 12: Opdateret iboende Dynamics Pipeline-konfigurationsfil (supplerende fil 11) parameteriseret for kun trinnet Netværkssøgning. Klik her for at downloade denne fil.

Supplerende fil 13: Mappe, der indeholder resultaterne fra afsnittet Repræsentative resultater. Klik her for at downloade denne fil.

Subscription Required. Please recommend JoVE to your librarian.

Discussion

Konklusionen af GRN'er er en vigtig udfordring i systembiologi. IDP genererer model GRN'er fra genekspressionsdata ved hjælp af en række værktøjer, der udnytter dataene på stadig mere komplekse måder. Hvert trin kræver beslutninger om, hvordan dataene skal behandles, og hvilke elementer (gener, funktionelle interaktioner) der overføres til det næste lag af IDP. Virkningerne af disse beslutninger på IDP-resultater er ikke så indlysende. For at hjælpe i denne henseende giver IDV nyttige interaktive visualiseringer af output fra individuelle trin i GRN-slutningsværktøjerne inden for IDP. IDV strømliner og letter processen med at evaluere resultaterne fra disse beregningsmæssige slutningsmetoder for at fremskynde eksperimenter og informere analysevalg, hvilket igen vil muliggøre en fremskyndet produktion af netværksmodeller og hypoteser med høj tillid. IDV implementerer også funktioner, der udvider IDP'ens funktionalitet, herunder filtrering af kanter ved hjælp af LEM ODE-parametervalg, binning af gener efter deres ekspressionstid og klyngenetværk baseret på lighed med et motiv eller netværk. Det er vigtigt, at IDV giver mulighed for manuelle indgreb mellem hvert IDP-trin, hvilket giver brugeren mulighed for nemt at indarbejde menneskelig viden og forudgående information fra litteraturen på måder, der ikke let kan automatiseres. En naiv kørsel af IDP vil ikke indbygget inkorporere disse oplysninger, så brugen af IDV vil øge tilliden til resultaterne, når der foreligger oplysninger, der er specifikke for eksperimentet. Samlet set giver brugen af IDV i forbindelse med IDP brugerne mulighed for at oprette netværkshypoteser for biologiske processer med større tillid, selv med ringe eller ingen viden om det sande GRN.

Der er tre kritiske trin i IDV. Den første er evaluering af IDP Node Finding-resultater i IDV. IDV's Node Finding-side kan producere en ny genliste og, hvis det ønskes, en genannotationsfil. Kuratering af en ny genliste er et kritisk skridt, da det i høj grad reducerer det potentielle netværksrum ved at begrænse, hvilke gener der må modelleres som GRN-mål og / eller regulatorer. Derudover, da GRN'er for det meste består af transkriptionsfaktorer, vil det at have genkommentarer i høj grad hjælpe med at skabe sammenhængende GRN-modeller.

Det næste trin er at evaluere IDP Edge Finding-resultater i IDV. Kuratering af et nyt frønetværk er et kritisk skridt, da det lokaliserer det område af netværksrummet, der vil blive samplet i trinnet Netværkssøgning. At vide, hvor man skal starte, er dog ikke altid indlysende, så det anbefales at bruge kanter, der har en form for eksperimentelle beviser for at give tillid til, at man starter i et område af netværksrum, der indeholder kanter med høj tillid. IDV's Edge Finding-side muliggør nem samling af frønetværk og genererer den tilknyttede DSGRN-netværksspecifikationsfil samt node- og kantlister.

Det sidste trin er at evaluere IDP Network Finding-resultater i IDV. IDV's Network Finding-side giver mulighed for nem udforskning af samplede netværk og deres tilhørende scorer, der estimerer netværkets kapacitet til at producere den observerede dynamik. Mens Node og Edge Finding altid returnerer resultater (hvis mindst to gener videregives fra Node Finding), kan Netværkssøgning returnere nul resultater. Derfor vil det være mere indlysende at vide, om der er behov for justeringer i parametre, i Network Finding end i Node og Edge Finding. Sådanne forekomster af få eller ingen netværk, der findes, kan være et resultat af begrænsninger på, hvilke netværk der kan analyseres. Disse begrænsninger er: 1) hvorvidt netværkene altid er stærkt forbundet eller ej, 2) det mindste og det maksimale antal indgangskanter til hver knude, 3) sandsynlighederne for at tilføje og fjerne noder og kanter og 4) antallet af tilføjelser og fjernelser af noder og kanter, der er tilladt. Hvis der findes få eller ingen modeltildængelige netværk, som i figur 2, anbefales det at henvise til IDP-dokumentationen til vejledning om reparameterisering af et eller alle trin i IDP med efterfølgende evaluering af resultaterne i IDV.

En aktuel begrænsning af denne tilgang er, at nodesøgningssiden for det meste er fokuseret på oscillerende dynamik, såsom dem, der ses i transkriptionsprogrammerne i cellecyklussen og døgnrytmeuret. Især er IDP Node Finding-trinnet i øjeblikket konfigureret til at søge efter gener, der udviser oscillerende dynamik i en bestemt periode. Efterhånden som IDP udvides til at omfatte analyser, der kan kvantificere forskellige typer transkriptionsdynamik, vil IDV også blive opdateret for at understøtte visualisering og forhør af disse andre adfærd. Størrelsen af netværk, der søges efter og analyseres i netværkssøgningstrinnet, er i øjeblikket begrænset til netværk af mindre størrelse, f.eks. omkring 10 gener. Dette er en nødvendighed, da beregninger i DSGRN-skalaen forekommer kombinatorisk. En anden begrænsning er, at det ikke er muligt at udforske modelparameterpladsen for et valgt netværk i IDV'en. DSGRN-netværksspecifikationsfilen for et givet netværk kan dog downloades, og den dynamik, der er knyttet til hver modelparameter, kan visualiseres på DSGRN Visualization-webstedet (https://sites.math.rutgers.edu/~gameiro/dsgrn_viz/). Endelig er IDV blevet testet ved hjælp af Linux (Ubuntu) og iOS (Big Sur) systemer. IDV er blevet testet på Windows 10 ved hjælp af Windows Subsystem for Linux (WSL), som giver Windows 10-brugere mulighed for at køre Linux og IDV uden behov for en anden computer, en virtuel maskine eller en dual-boot-opsætning. IDV kører i øjeblikket ikke på native Windows.

Det er vanskeligt at studere GRN'er på grund af deres iboende kompleksitet, og nyttige slutningsværktøjer som IDP kan være vanskelige at forstå og implementere med tillid. IDV giver en metode til at reducere kompleksiteten ved at studere GRN'er udledt ved hjælp af IDP og samtidig lette inkluderingen af yderligere information ud over genekspressionsdynamikken. Brug af IDV i forbindelse med IDP som beskrevet her vil give forskere mulighed for at udvikle og analysere funktionelle modeller af velundersøgte systemer, såsom den menneskelige cellecyklus. Desuden vil disse værktøjer generere testbare hypoteser for mindre forståede processer, såsom malaria intra-erytrocytisk udviklingscyklus, som mistænkes for at være kontrolleret af en GRN24 , men for hvilken en model endnu ikke er foreslået.

Subscription Required. Please recommend JoVE to your librarian.

Disclosures

Forfatterne har intet at afsløre.

Acknowledgments

Dette arbejde blev finansieret af NIH-bevillingen R01 GM126555-01 og NSF-bevillingen DMS-1839299.

Materials

Name Company Catalog Number Comments
Docker https://docs.docker.com/get-docker/
Git https://git-scm.com/
Inherent Dynamics Pipeline https://gitlab.com/biochron/inherent_dynamics_pipeline
Inherent Dynamics Visualizer https://gitlab.com/bertfordley/inherent_dynamics_visualizer
Miniconda https://docs.conda.io/en/latest/miniconda.html
Pip https://pip.pypa.io/en/stable/

DOWNLOAD MATERIALS LIST

References

  1. Karlebach, G., Shamir, R. Modelling and analysis of gene regulatory networks. Nature Reviews Molecular Cell Biology. 9 (10), 770-780 (2008).
  2. Aijö, T., Lähdesmäki, H. Learning gene regulatory networks from gene expression measurements using non-parametric molecular kinetics. Bioinformatics. 25 (22), 2937-2944 (2009).
  3. Huynh-Thu, V. A., Sanguinetti, G. Combining tree-based and dynamical systems for the inference of gene regulatory networks. Bioinformatics. 31 (10), 1614-1622 (2015).
  4. Oates, C. J., et al. Causal network inference using biochemical kinetics. Bioinformatics. 30 (17), 468-474 (2014).
  5. Marbach, D., et al. Wisdom of crowds for robust gene network inference. Nature Methods. 9 (8), 796-804 (2012).
  6. Inherent Dynamics Pipeline. , Available from: https://gitlab.com/biochron/inherent_dynamics_pipeline (2021).
  7. Motta, F. C., Moseley, R. C., Cummins, B., Deckard, A., Haase, S. B. Conservation of dynamic characteristics of transcriptional regulatory elements in periodic biological processes. bioRxiv. , (2020).
  8. LEMpy. , Available from: https://gitlab.com/biochron/lempy (2021).
  9. McGoff, K. A., et al. The local edge machine: inference of dynamic models of gene regulation. Genome Biology. 17, 214 (2016).
  10. Cummins, B., Gedeon, T., Harker, S., Mischaikow, K. Model rejection and parameter reduction via time series. SIAM Journal on Applied Dynamical Systems. 17 (2), 1589-1616 (2018).
  11. Cummins, B., Gedeon, T., Harker, S., Mischaikow, K. Database of Dynamic Signatures Generated by Regulatory Networks (DSGRN). Lecture Notes in Computer Science. (including Subseries Lecture Notes in Artificial Intelligence and Lecture Notes in Bioinformatics). , 300-308 (2017).
  12. Cummins, B., Gedeon, T., Harker, S., Mischaikow, K. DSGRN: Examining the dynamics of families of logical models. Frontiers in Physiology. 9. 9, 549 (2018).
  13. DSGRN. , Available from: https://github.com/marciogameiro/DSGRN (2021).
  14. Dsgm_Net_Gen. , Available from: https://github.com/breecummins/dsgrn_net_gen (2021).
  15. Dsgrn_Net_Query. , Available from: https://github.com/breecummins/dsgrn_net_query (2021).
  16. Orlando, D. A., et al. Global control of cell-cycle transcription by coupled CDK and network oscillators. Nature. 453 (7197), 944-947 (2008).
  17. Monteiro, P. T., et al. YEASTRACT+: a portal for cross-species comparative genomics of transcription regulation in yeasts. Nucleic Acids Research. 48 (1), 642-649 (2020).
  18. de Bruin, R. A. M., et al. Constraining G1-specific transcription to late G1 phase: The MBF-associated corepressor Nrm1 acts via negative feedback. Molecular Cell. 23 (4), 483-496 (2006).
  19. Horak, C. E., et al. Complex transcriptional circuitry at the G1/S transition in Saccharomyces cerevisiae. Genes & Development. 16 (23), 3017-3033 (2002).
  20. Cherry, J. M., et al. Saccharomyces genome database: The genomics resource of budding yeast. Nucleic Acids Research. 40, 700-705 (2012).
  21. Zhu, G., et al. Two yeast forkhead genes regulate the cell cycle and pseudohyphal growth. Nature. 406 (6791), 90-94 (2000).
  22. Loy, C. J., Lydall, D., Surana, U. NDD1, a high-dosage suppressor of cdc28-1N, is essential for expression of a subset of late-S-phase-specific genes in saccharomyces cerevisiae. Molecular and Cellular Biology. 19 (5), 3312-3327 (1999).
  23. Cho, C. Y., Kelliher, C. M., Hasse, S. B. The cell-cycle transcriptional network generates and transmits a pulse of transcription once each cell cycle. Cell Cycle. 18 (4), 363-378 (2019).
  24. Smith, L. M., et al. An intrinsic oscillator drives the blood stage cycle of the malaria parasite Plasmodium falciparum. Science. 368 (6492), 754-759 (2020).

Tags

Biologi udgave 178
Inherent Dynamics Visualizer, et interaktivt program til evaluering og visualisering af output fra en Genregulerende Netværksslutningspipeline
Play Video
PDF DOI DOWNLOAD MATERIALS LIST

Cite this Article

Moseley, R. C., Campione, S.,More

Moseley, R. C., Campione, S., Cummins, B., Motta, F., Haase, S. B. Inherent Dynamics Visualizer, an Interactive Application for Evaluating and Visualizing Outputs from a Gene Regulatory Network Inference Pipeline. J. Vis. Exp. (178), e63084, doi:10.3791/63084 (2021).

Less
Copy Citation Download Citation Reprints and Permissions
View Video

Get cutting-edge science videos from JoVE sent straight to your inbox every month.

Waiting X
Simple Hit Counter