Waiting
Login processing...

Trial ends in Request Full Access Tell Your Colleague About Jove
Click here for the English version

Biology

Inherent Dynamics Visualizer, en interaktiv applikation för utvärdering och visualisering av utgångar från en pipeline för genreglerande nätverk

Published: December 7, 2021 doi: 10.3791/63084

Summary

Inherent Dynamics Visualizer är ett interaktivt visualiseringspaket som ansluter till ett genreglerande nätverksingsverktyg för förbättrad, strömlinjeformad generering av funktionella nätverksmodeller. Visualizern kan användas för att fatta mer välgrundade beslut för att parametrisera härledningsverktyget, vilket ökar förtroendet för de resulterande modellerna.

Abstract

Att utveckla genreglerande nätverksmodeller är en stor utmaning inom systembiologi. Flera beräkningsverktyg och pipelines har utvecklats för att hantera denna utmaning, inklusive den nyutvecklade Inherent Dynamics Pipeline. Inherent Dynamics Pipeline består av flera tidigare publicerade verktyg som fungerar synergistiskt och är anslutna linjärt, där utgången av ett verktyg sedan används som indata för följande verktyg. Som med de flesta beräkningstekniker kräver varje steg i Inherent Dynamics Pipeline att användaren gör val om parametrar som inte har en exakt biologisk definition. Dessa val kan ha en betydande inverkan på genregleringsnätverksmodeller som produceras av analysen. Av denna anledning kan förmågan att visualisera och utforska konsekvenserna av olika parameterval i varje steg bidra till att öka förtroendet för valen och resultaten. Inherent Dynamics Visualizer är ett omfattande visualiseringspaket som effektiviserar processen att utvärdera parameterval genom ett interaktivt gränssnitt i en webbläsare. Användaren kan separat undersöka utdata för varje steg i pipelinen, göra intuitiva ändringar baserat på visuell information och dra nytta av automatisk produktion av nödvändiga indatafiler för Inherent Dynamics Pipeline. Inherent Dynamics Visualizer ger en oöverträffad nivå av tillgång till ett mycket invecklat verktyg för upptäckt av genreglerande nätverk från tidsserie transkriptomiska data.

Introduction

Många viktiga biologiska processer, såsom celldifferentiering och miljörespons, styrs av uppsättningar gener som interagerar med varandra i ett genregleringsnätverk (GRN). Dessa GRN producerar den transkriptionsdynamik som behövs för att aktivera och upprätthålla den fenotyp de kontrollerar, så att identifiera komponenterna och topologiska strukturen hos GRN är nyckeln till att förstå många biologiska processer och funktioner. Ett GRN kan modelleras som en uppsättning interagerande gener och/eller genprodukter som beskrivs av ett nätverk vars noder är generna och vars kanter beskriver interaktionens riktning och form (t.ex. aktivering/repression av transkription, postöversättningsmodifiering osv.) 1. Interaktioner kan sedan uttryckas som parametriserade matematiska modeller som beskriver den inverkan en reglerande gen har på produktionen av dess mål 2,3,4. Slutsatsen av en GRN-modell kräver både en slutsats om interaktionsnätverkets struktur och uppskattning av de underliggande interaktionsparametrarna. En mängd olika beräkningsinferensmetoder har utvecklats som intar tidsserie genuttrycksdata och utdata GRN-modeller5. Nyligen utvecklades en ny GRN-inferensmetod, kallad Inherent Dynamics Pipeline (IDP), som använder tidsseriegenuttrycksdata för att producera GRN-modeller med märkta regulator-målinteraktioner som kan producera dynamik som matchar den observerade dynamiken i genuttrycksdata6. IDP är en serie verktyg som är anslutna linjärt till en pipeline och kan delas upp i tre steg: ett nodsökningssteg som rangordnar gener baserat på genuttrycksegenskaper som är kända eller misstänks vara relaterade till grn7,8: s funktion, ett Edge Finding-steg som rangordnar parat regulatoriska relationer8, 9, och ett network finding-steg som producerar GRN-modeller som kan producera den observerade dynamiken10,11,12,13,14,15.

Liksom de flesta beräkningsmetoder kräver IDP en uppsättning användarspecificerade argument som dikterar hur indata analyseras, och olika uppsättningar argument kan ge olika resultat på samma data. Flera metoder, inklusive IDP, innehåller till exempel argument som tillämpar ett visst tröskelvärde på data, och om du ökar/minskar detta tröskelvärde mellan på varandra följande körningar av den aktuella metoden kan det leda till olika resultat mellan körningar (se Tillägg anmärkning 10: Nätverks slutferensmetoder för5). Att förstå hur varje argument kan påverka analysen och efterföljande resultat är viktigt för att uppnå högt förtroende för resultaten. Till skillnad från de flesta GRN-härledningsmetoder består IDP av flera beräkningsverktyg, var och en med sin egen uppsättning argument som en användare måste ange och var och en har sina egna resultat. Medan IDP tillhandahåller omfattande dokumentation om hur man parametriserar varje verktyg, gör det ömsesidiga beroendet för varje verktyg på utgången av föregående steg att parametrisera hela pipelinen utan mellanliggande analyser utmanande. Argumenten i edge- och nätverkssökningsstegen kommer till exempel sannolikt att informeras av tidigare biologisk kunskap, och beror därför på datauppsättningen och/eller organismen. För att förhöra mellanliggande resultat skulle det behövas en grundläggande förståelse för programmering, liksom en djup förståelse för alla resultatfiler och deras innehåll från IDP.

Inherent Dynamics Visualizer (IDV) är ett interaktivt visualiseringspaket som körs i en användares webbläsarfönster och ger användare av IDP ett sätt att bedöma effekten av deras argumentval på resultat från alla steg i IDP. IDV navigerar i en komplicerad katalogstruktur som produceras av IDP och samlar in nödvändiga data för varje steg och presenterar data i intuitiva och interaktiva figurer och tabeller som användaren kan utforska. När du har utforskat dessa interaktiva skärmar kan användaren producera nya data från ett IDP-steg som kan baseras på mer välgrundade beslut. Dessa nya data kan sedan omedelbart användas i nästa respektive steg i IDP. Dessutom kan utforskning av data hjälpa till att avgöra om ett IDP-steg ska köras igen med justerade parametrar. IDV kan förbättra användningen av IDP, samt göra användningen av IDP mer intuitiv och lättillgänglig, vilket framgår av att undersöka kärnan oscillator GRN i jästcellcykeln. Följande protokoll innehåller IDP-resultat från en fullständigt parametriserad IDP-körning jämfört med en metod som innehåller IDV efter körningar av varje IDP-steg, dvs. node, edge och nätverkssökning.

Subscription Required. Please recommend JoVE to your librarian.

Protocol

1. Installera IDP och IDV

OBS: Det här avsnittet förutsätter att docker, conda, pip och git redan är installerade (Tabell med material).

  1. I en terminal anger du kommandot: git clone https://gitlab.com/biochron/inherent_dynamics_pipeline.git.
  2. Följ installationsanvisningarna i IDP:s README-fil.
  3. I en terminal anger du kommandot: git clone https://gitlab.com/bertfordley/inherent_dynamics_visualizer.git.
    KLONing av IDV bör ske utanför IDP:s katalog på högsta nivå.
  4. Följ installationsanvisningarna i IDV:s README-fil.

2. Nodsökning

  1. Skapa en ny IDP-konfigurationsfil som parametriserar steget Nodsökning.
    Alla citattecken i följande steg ska inte skrivas ut. Citattecknen används endast här som avgränsare mellan protokolltexten och vad som ska skrivas ut.
    1. Lägg till de viktigaste IDP-argumenten i konfigurationsfilen.
    2. Öppna en ny textfil i en textredigerare och skriv "data_file =", "annotation_file =", "output_dir =", "num_proc =" och "IDVconnection = True" på enskilda rader.
    3. För "data_file" skriver du sökvägen till och namnet på respektive tidsseriefil efter tecknet och skriver ett kommatecken efter namnet. Separera varje data med ett kommatecken om mer än en data uppsättning tidsserier används. Se Kompletterande fil 1 och kompletterande fil 2 för ett exempel på tidsserie genuttrycksfiler.
    4. Skriv sökvägen till och namnet på anteckningsfilen för "annotation_file", efter likheten med tecknet. Mer än en anteckningsfil finns i Kompletterande fil 3 .
    5. För "output_file", efter likheten med tecknet, skriver du sökvägen till och namnet på mappen där resultaten sparas.
    6. Efter likheten med tecknet, för "num_proc", skriv antalet processer som IDP ska använda.
    7. Lägg till nodsökningsargument i konfigurationsfilen.
    8. I samma textfil som i steg 2.1.1 skriver du i den ordning som presenteras "[dlxjtk_arguments]", "periods =" och "dlxjtk_cutoff =" på enskilda rader. Placera dessa efter huvudargumenten.
    9. För "perioder", efter likheten med tecknet, om data uppsättningen en gång serie används, skriver du varje periodlängd avgränsad med kommatecken. För mer än en data uppsättning tids serier skriver du varje uppsättning periodlängder som tidigare men placerar hakparenteser runt varje uppsättning och placerar ett kommatecken mellan uppsättningarna.
    10. Efter likheten med tecknet, för "dlxjtk_cutoff", skriv ett heltal som anger det maximala antalet gener som ska behållas i gene_list_file utdata av de Lichtenberg av JTK_CYCLE (DLxJTK) (tabell 1).
      OBS: Det rekommenderas starkt att granska dlxjtk_arguments avsnitt i IDP README för att få en bättre förståelse för varje argument. Mer än en konfigurationsfil med de angivna argumenten för nodsökning finns i Kompletterande fil 4 .
  2. I terminalen flyttar du till IDP-katalogen med namnet inherent_dynamics_pipeline.
  3. I terminalen anger du kommandot: conda aktivera dat2net
  4. Kör IDP med hjälp av konfigurationsfilen som skapades i steg 2.1 genom att köra det här kommandot i terminalen, där är namnet på filen: python src/dat2net.py
  5. I terminalen flyttar du till katalogen med namnet inherent_dynamics_visualizer och anger kommandot: . /viz_results.sh
    OBS: pekar på katalogen som används som utdatakatalog för IDP.
  6. Ange http://localhost:8050/ som URL i en webbläsare.
  7. När IDV nu är öppet i webbläsaren klickar du på fliken Nodsökning och väljer den nodsökningsmapp som är av intresse på den nedrullningsbara menyn.
  8. Kurera manuellt en ny genlista från genlistetabellen i IDV som ska användas för efterföljande IDP-steg.
    1. För att utöka eller förkorta genlistetabellen klickar du på upp- eller nedpilarna eller anger manuellt i ett heltal mellan 1 och 50 i rutan bredvid Genuttryck av DLxJTK-rankade gener. Överst:.
    2. Klicka på rutan bredvid en gen i genlistetabellen och se dess genuttrycksprofil i ett linjediagram. Flera gener kan tillsättas.
    3. Ange valfritt antalet lika stora lagerplatser som ska beräkna och beställa gener efter tidsintervallet som innehåller deras topputtryck, genom att mata in ett heltal i indatarutan ovanför genlistetabellen märkt Indata heltal för att dela upp den första cykeln i lagerplatser:.
      Det här alternativet är specifikt för oscillatorisk dynamik och kanske inte är tillämpligt på andra typer av dynamik.
    4. Välj en inställningar för visning av värmekartor genom att klicka på ett alternativ under Beställ gener efter: Första cykelns maxuttryck (tabell 1) som beställer gener baserat på tiden för genuttryckstoppen i den första cykeln.
      OBS: DLxJTK Rank beställer gener baserat på periodicitetsrankningen från DLxJTK-algoritmen för IDP.
    5. Klicka på knappen Ladda ner genlista för att ladda ner genlistan till filformatet som behövs för edge finding-steget. Se Kompletterande fil 5 för ett exempel på en genlistefil.
  9. I den redigerbara genanteckningstabellen märker du en gen som ett mål, en regulator eller båda i anteckningsfilen för steget Edge Finding i en ny Edge Finding-körning. Om en gen är en regulator, märka genen som en aktivator, undertryckare eller båda.
    1. Om du vill märka en gen som aktivator klickar du på cellen i kolumnen tf_act och ändrar värdet till 1. Om du vill märka en gen som en undertryckare ändrar du värdet i kolumnen tf_rep till 1. En gen kommer att tillåtas fungera både som aktivator och undertryckare i edge finding-steget genom att ställa in värdena i både tf_act och tf_rep kolumner till 1.
    2. Om du vill märka en gen som ett mål klickar du på cellen i målkolumnen och ändrar värdet till 1.
  10. Klicka på knappen Ladda ned anteckningsfil för att ladda ner anteckningsfilen till det filformat som behövs för steget Kantsökning.

3. Kantsökning

  1. Skapa en ny IDP-konfigurationsfil som parametriserar steget Edge Finding.
    1. Lägg till de viktigaste IDP-argumenten i konfigurationsfilen. Öppna en ny textfil i en textredigerare och upprepa steg 2.1.1.
    2. Lägg till argument för edge finding i konfigurationsfilen.
    3. I samma textfil som i steg 3.1.1 skriver du i den ordning som presenteras "[lempy_arguments]", "gene_list_file =", "[netgen_arguments]", "edge_score_column =", "edge_score_thresho =", "num_edges_for_list =", "seed_threshold =" och "num_edges_for_seed =" på enskilda rader. Dessa bör ligga under huvudargumenten.
    4. För "gene_list_file" anger du sökvägen till och namnet på genlistefilen som genereras i steg 2.8.5 efter likheten med tecknet.
    5. För "edge_score_column", efter likheten med tecknet, anger du antingen "pld" eller "norm_loss" för att ange vilken dataramkolumn från lempy-utdata som används för att filtrera kanterna.
    6. Välj antingen "edge_score_threshold" eller "num_edges_for_list" och ta bort den andra. Om "edge_score_threshold" har valts anger du ett tal mellan 0 och 1. Det här talet används för att filtrera kanter baserat på den kolumn som anges i steg 3.1.5.
      1. Om "num_edges_for_list" har valts anger du ett värde som är lika med eller mindre än antalet möjliga kanter. Det här numret används för att filtrera kanterna baserat på hur de rangordnas i kolumnen som anges i steg 3.1.5. Kanterna som blir över används för att bygga nätverk i Nätverkssökning.
    7. Välj antingen "seed_threshold" eller "num_edges_for_seed" och ta bort den andra. Om "seed_threshold" har valts anger du ett tal mellan 0 och 1. Det här talet används för att filtrera kanter baserat på den kolumn som anges i steg 3.1.5.
      1. Om "num_edges_for_seed" har markerats anger du ett värde som är lika med eller mindre än antalet möjliga kanter. Det här numret används för att filtrera kanterna baserat på hur de rangordnas i kolumnen som anges i steg 3.1.5. Kanterna som blir över används för att bygga frönätverket (tabell 1) som används i Nätverkssökning.
        OBS: Det rekommenderas starkt att granska lempy_arguments och netgen_arguments avsnitt i IDP README för att få en bättre förståelse för varje argument. Mer än en konfigurationsfil med de angivna argumenten för edge-sökinställningar finns i Kompletterande fil 7 .
  2. Upprepa steg 2.2 och 2.3.
  3. Kör IDP med hjälp av konfigurationsfilen som skapades i steg 3.1 genom att köra det här kommandot i terminalen, där är namnet på filen: python src/dat2net.py
  4. Om IDV fortfarande körs stoppar du det genom att trycka på C i terminalfönstret för att stoppa programmet. Upprepa steg 2.5 och 2.6.
  5. När IDV är öppet i webbläsaren klickar du på fliken Edge Finding och väljer den kantsökningsmapp som är av intresse på rullgardinsmenyn.
    OBSERVERA: Om flera data uppsättningar används i Edge Finding, se till att välja den senaste data uppsättningen som användes i LEM-analysen (Local Edge Machine) (tabell 1). Det är viktigt när du väljer kanter för dirigerings nätverket eller kant listan baserat på LEM-resultat att titta på den senaste tids serie data som anges i konfigurations filen eftersom den här utdata innehåller alla föregående datafiler i dess härledning av reglerande relationer mellan noder.
  6. Om du vill förlänga eller förkorta kanttabellen anger du manuellt ett heltal i inmatningsrutan under Antal kanter:.
  7. Filtrera eventuellt kanter på LEM ODE-parametrarna. Klicka och dra om du vill flytta antingen vänster eller höger sida av varje parameters skjutreglage för att ta bort kanter från kanttabellen som har parametrar utanför de nya tillåtna parametergränsarna.
  8. Du kan också skapa ett nytt frönätverk om ett annat frönätverk önskas än det som föreslås av IDP. Mer information om en fil för ett frönätverk finns i Kompletterande fil 8 .
    1. Välj antingen Från frö för att välja utfrönätverket eller Från markering på den nedrullningsbara menyn under Nätverk:.
    2. Avmarkera/markera kanter från kanttabellen genom att klicka på motsvarande kryssrutor intill varje kant för att ta bort/lägga till kanter från frönätverket.
  9. Klicka på knappen Ladda ned DSGRN NetSpec för att ladda ner frönätverket i formatet Dynamiska signaturer som genereras av regulatoriska nätverk (DSGRN) (tabell 1).
  10. Välj ytterligare noder och kanter som ska användas i steget Nätverkssökning.
    1. Markera kanter från kanttabellen genom att klicka på motsvarande kryssrutor som ska inkluderas i kantlistefilen som används i Nätverkssökning.
    2. Klicka på Download Node och Edge Lists för att ladda ner nodlistan och kantlistefilerna i det format som krävs för att de ska kunna användas i Nätverkssökning. Se Kompletterande fil 9 och kompletterande fil 10 för exempel på edge respektive node list filer.
      Nodlistan måste innehålla alla noder i kantlistefilen, så IDV skapar automatiskt nodlistefilen baserat på de markerade kanterna. Det finns två alternativ för att visa kanterna i Edge Finding. Alternativet LEM-sammanfattningstabell visar kanterna som en rangordnad lista över de 25 översta kanterna. Top-Line LEM Table presenterar kanterna i en konkerad lista över de tre högst rankade kanterna för varje möjlig regulator. Antalet kanter som visas för varje alternativ kan justeras av användaren genom att ändra numret i inmatningsrutan Antal kanter .

4. Nätverksökning

  1. Skapa en ny IDP-konfigurationsfil som parametriserar steget Nätverkssökning.
    1. Lägg till de viktigaste IDP-argumenten i konfigurationsfilen. Öppna en ny textfil i en textredigerare och upprepa steg 2.1.1.
    2. Lägg till argument för nätverkssökning i konfigurationsfilen.
    3. I samma textfil som i steg 4.1.1 skriver du i den ordning som presenteras "[netper_arguments]", "edge_list_file =", "node_list_file =", "seed_net_file =", "range_operations =", "numneighbors =", "maxparams =", "[[sannolikheter]]", "addNode =", "addEdge =", "removeNode =" och "removeEdge =" på enskilda rader.
    4. För "seed_net_file", "edge_list_file" och "node_list_file" anger du sökvägen till och namnet på dirigeringsnätverksfilen och kant- och nodlistefilerna som genereras i steg 3.9 och 3.10.2.
    5. Efter likheten med tecknet, för "range_operations", skriv två nummer avgränsade med ett kommatecken. Det första och andra talet är det minsta och det maximala antalet tillägg eller borttagning av noder eller kanter per tillverkat nätverk.
    6. För "numneighbors", efter likheten med tecknet, anger du ett tal som representerar hur många nätverk som ska hittas i Nätverkssökning.
    7. För "maxparams" anger du efter likheten med tecknet ett tal som representerar det maximala antalet DSGRN-parametrar för att tillåta ett nätverk.
    8. Ange värden mellan 0 och 1 för vart och ett av dessa argument: "addNode", "addEdge", "removeNode" och "removeEdge", efter likheten med tecknet. Talen måste summeras till 1.
      OBS: Det rekommenderas starkt att granska netper_arguments och netquery_arguments avsnitt i IDP README för att få en bättre förståelse för varje argument. Mer information finns i Kompletterande fil 11 och Kompletterande fil 12 för exempel på en konfigurationsfil med de angivna argumenten för nätverkssökning.
  2. Upprepa steg 2.2 och 2.3.
  3. Kör IDP med hjälp av konfigurationsfilen som skapades i steg 4.1 genom att köra det här kommandot i terminalen, där är namnet på filen: python src/dat2net.py
  4. Om IDV fortfarande körs stoppar du det genom att trycka på C i terminalfönstret för att stoppa programmet. Upprepa steg 2.5 och 2.6.
  5. När IDV är öppet i webbläsaren klickar du på fliken Nätverkssökning och väljer den nätverkssökningsmapp som är av intresse.
  6. Välj ett nätverk eller en uppsättning nätverk för att generera en edge-prevalenstabell (tabell 1) och för att visa nätverken tillsammans med deras respektive frågeresultat.
    1. Två alternativ är tillgängliga för att välja nätverk: Alternativ 1 - Ange nedre och övre gränser för frågeresultat genom att mata in minimi- och maximivärden i inmatningsrutorna som motsvarar diagrammets x-axel och y-axel. Alternativ 2 - Klicka och dra över scatterplot för att rita en ruta runt de nätverk som ska inkluderas. När markerings- eller inmatningsgränser har angetts trycker du på knappen Hämta edgeprevalens från valda nätverk .
      Om mer än en DSGRN-fråga har angetts använder du alternativknapparna märkta med frågetypen för att växla mellan varje frågas resultat. Detsamma gäller om mer än en epsilon (bullernivå) har angetts.
  7. Klicka på pilarna under prevalenstabellen för kant för att gå till nästa sida i tabellen. Tryck på Download Table för att ladda ned kantprevalenstabellen.
  8. Mata in ett heltal i inmatningsrutan nätverksindex för att visa ett enda nätverk från valet som gjordes i steg 4.6. Klicka på Ladda ner DSGRN NetSpec för att ladda ner det visade nätverket i DSGRN-nätverksspecifikationsformatet.
  9. Sök i nätverk efter likhet med ett angivet motiv eller intressenätverk.
    1. Använd kryssrutorna som motsvarar varje kant för att markera kanter som ska ingå i nätverket eller motivet som används för likhetsanalysen. Klicka på Skicka för att skapa likhetsspridningen för det valda motivet eller nätverket.
      OBS: Använd pilarna i kantlistan för att sortera alfabetiskt och pilarna under tabellen för att gå till nästa sida i tabellen.
    2. Klicka och dra över scatterploten för att rita en ruta runt nätverken som ska inkluderas för att välja ett nätverk eller en uppsättning nätverk för att generera en edge-prevalenstabell och för att visa nätverken tillsammans med deras respektive frågeresultat.
      Om mer än en DSGRN-fråga har angetts använder du alternativknapparna märkta med frågetypen för att växla mellan varje frågas resultat. Detsamma gäller om mer än en epsilon (bullernivå) har angetts.
    3. Upprepa steg 4.7 och 4.8 för att ladda ned kantprevalenstabellen respektive det visade nätverket för likhetsanalysen.

Subscription Required. Please recommend JoVE to your librarian.

Representative Results

Stegen som beskrivs textmässigt ovan och grafiskt i figur 1 tillämpades på kärnan oscillerande GRN i jästcellcykeln för att se om det är möjligt att upptäcka funktionella GRN-modeller som kan producera den dynamik som observerats i tidsserie genuttrycksdata som samlats in i en jästcellcykelstudie16. För att illustrera hur IDV kan klargöra och förbättra IDP-produktionen jämfördes resultaten, efter att ha utfört denna analys på två sätt: 1) att köra alla steg i IDP i ett pass utan att IDV och 2) gå igenom IDP med hjälp av IDV, vilket möjliggör justering av mellanliggande resultat både genom att införliva tidigare biologiska kunskaper och genom att göra raffinerade val baserade på IDP-utgångar. Den välstuderade jästcellscykeln GRN som används som exempel har många av sina regulatoriska relationer experimentellt verifierade. Om en annan och/eller mindre kommenterad organism eller biologisk process studeras kan valen för hur mellanliggande resultat eller parametrar justeras vara olika. För att illustrera en typ av fråga som kan användas för att bedöma nätverk mättes robustheten i varje nätverk för att stödja stabila svängningar och matcha den observerade transkriptionsdynamiken för deras noder över modellparametrar.

Genuttryck tidsserie data av två replikera serier togs från Orlando 200816 och förbehandlas för att ta bort alla genuttryck som är associerade med cell-cykel synkroniseringsmetoden som tillämpas i det ursprungliga experimentet (Kompletterande fil 1 och kompletterande fil 2). En anteckningsfil skapades som innehåller alla gener i tidsseriedata som stöds av både DNA-bindning och uttrycksbevis som finns i Yeastract17 och därmed kan fungera som regulator i ett GRN. TOS4, PLM2 och NRM1 inkluderades också som tillsynsmyndigheter, även om de inte befanns i Yeastract att ha båda typerna av bevis, eftersom de tros vara viktiga för jästkärnan GRN baserat på bevis i litteraturen18,19 (Kompletterande fil 3). Alla regulatorer var märkta som både aktivator och tryckpressor samt mål.

IDP parameteriserades först för att köra igenom alla steg i IDP, det vill säga Node, Edge och Network Finding. En uppsättning argument valdes som verkade lämpliga baserat på den nuvarande förståelsen av jästcellcykeln GRN, en liten uppsättning gener som deltar i ett starkt anslutet nätverk (Kompletterande fil 4). Den här förståelsen påverkade främst nod- och edgesökningsvalen. Sannolikhetsparametrarna i Network Finding baserades på antagandet att endast sanna gener och regulatoriska interaktioner skulle överföras till Network Finding. Denna fullständigt parametriserade körning av IDP gav resultat för Node and Edge Finding (figur 2B,C), men i Network Finding upptäcktes inga modell tillåtliga nätverk (figur 2A,D). Modell tillåtlighet förklaras i kod dokumentationen för python-modulen dsgrn_net_gen 14, ett beroende av IDP. Kortfattat kan nätverk som innehåller självrepressande kanter eller har för många indata eller utdata vid en enda nod inte ifrågasättas av DSGRN-programvaran (tabell 1). IDP ger många orsaker till varför modell tillåtliga nätverk kanske inte hittas och beskriver felsökningssteg för att lösa problemet(erna). I huvudsak innebär detta att ändra parametrar och / eller indatafiler och köra om respektive IDP-steg och undersöka resultat. IDV användes för att göra denna process mindre tråkig och tidskrävande.

Nodsökningsresultaten laddades i IDV för att undersöka generna som skickas till Edge Finding-steget i IDP. Noderna som ges av IDP är de bästa N-generna som rangordnas av DLxJTK (tabell 1), N som anges av användaren, men denna genlista kanske inte är lämplig för analysens mål. Utan förkunskaper om biologisk biologiska rekommendationer returnerade automatiskt val av noder som endast använder DLxJTK-poäng en gen med begränsade bevis för en roll i jästcellscykeln (RME1), medan några kända transkriptionsregulatorer för cellcykeln inte var högt rankade (figur 2B). Jästract experimentella bevis användes för att välja bland de högst rankade generna av DLxJTK de med cell-cykel anteckning. Dessa gener är SWI4, YOX1, YHP1, HCM1, FKH2, NDD1 och SWI5. Deras kända regleringsförhållanden kan ses i figur 3. FKH2 förekommer inte i de tio bästa generna (dlxjtk_cutoff sattes till tio i kompletterande fil 4) som rankas av DLxJTK, så genlistan utökades med hjälp av IDV tills FKH2 hittades (figur 4). Flera av de ytterligare generna i den utökade genlistan är kända kärngener och skulle ha missats utan att undersöka nodsökningsresultaten. Medan mer kända kärngener har hittats genom att utöka genlistan ner på DLxJTK-rankade listan, hölls fokus på de gener som var av intresse. Därför avmarkerades vissa högt rankade gener, vilket resulterade i en genlista (Kompletterande fil 5) som innehåller sju gener (figur 4). En ny anteckningsfil skapades (Kompletterande fil 6) baserat på dessa sju gener, varje gen var märkt som ett mål och regulatortypen angavs med Yeastract. Den nya genlistan och anteckningsfilen laddades ner för efterföljande användning i nästa IDP-steg, Edge Finding. Utan IDV skulle förfarandet för att lägga till och ta bort gener från genlistan och anteckningsfilen kräva blygsamma kodningsfärdigheter.

En ny IDP-konfigurationsfil parameteriserades för bara Edge Finding-steget (Kompletterande fil 7), med den nya genlistan och anteckningsfilen. Efter slutförandet av IDP med den nya konfigurationsfilen laddades resultaten in i IDV (figur 5A). Eftersom steget Network Finding söker stochastically runt nätverksutrymmet i det frönätverk som levereras till det, kan det vara viktigt att tillhandahålla ett bra frönätverk. Ett bra frönätverk kan betraktas som ett som innehåller sanna kanter. Med IDV och med hjälp av onlinedatabaser som Yeastract och Saccharomyces Genome Database (SGD)20 kan frönätverket ses och justeras med hjälp av de regulatoriska relationerna från LEM (tabell 1) som har experimentella bevis. Som ett exempel valdes kanten YHP1 = tf_act(HCM1) bort eftersom det inte finns några dokumenterade bevis för detta förhållande (figur 5B) i Yeastract. Kanten SWI5 = tf_act(FKH2) lades till eftersom det finns dokumenterade bevis för detta förhållande21. När frönätverket (tabell 1) var tillfredsställande laddades filen DSGRN-nätverksspecifikationen för nätverket ned (kompletterande fil 8).

Utan IDV finns det en större risk för kanter för vilka det inte finns några experimentella bevis som används för att konstruera frönätet. Som framgår av figur 2C innehåller frönätverket som genereras i Edge Finding-steget från att köra IDP nonstop genom varje steg en kant, SWI4 = tf_rep(NDD1), som inte stöds av experimentella bevis i Yeastract, sannolikt eftersom NDD1 är känd för att vara en transkriptionsaktivator22. Den här informationen kodades inte i anteckningsfilen i non-stop-körningen, vilket gjorde det möjligt för alla tillsynsmyndigheter att vara både aktivatorer och undertryckare.

Med hjälp av IDV kurerades ett frönätverk manuellt som är ett undernät av figur 3, och de återstående fyra kanterna placerades i kantlistan som används för provtagning av nätverksutrymme (YHP1 = tf_act(SWI4), YOX1 = tf_act(SWI4), SWI4 = tf_rep(YOX1), SWI5 = tf_act(NDD1)). Att välja kanter baserat på tidigare biologiska kunskaper kan också användas för att bygga kantlistan; I det här fallet valdes dock de 20 översta kanterna från vyn LEM-sammanfattningstabell (Kompletterande fil 9). Nodlistefilen skapas automatiskt från de markerade kanterna (Kompletterande fil 10). ODE-parametrarna från LEM kan också användas för att filtrera kanter om man tror att de härledda parametrarna i ODE-modellen inte är biologiskt realistiska, men denna information användes inte här.

Därefter parametriserades en ny IDP-konfigurationsfil för steget Nätverkssökning med hjälp av de tre nya filerna. Eftersom frönätverket skapades med kanter som stöddes väl av experimentella bevis, önskades att dessa kanter inkluderades i alla nätverk. Således var nätverkssökningssannolikheterna inställda för att tillåta tillägget men inte borttagning av noder och kanter (Kompletterande fil 11). Parametern Network Finding numneighbors har ställts in för att söka efter 2 000 nätverk. Efter att ha kört IDP hittades 37 modell tillåtliga nätverk i steget Nätverkssökning, i motsats till den non-stop-körning som hade noll. Genom att läsa in resultaten av nätverksfyndet i IDV hade 64 % (24) av dessa 37 nät kapacitet att kraftigt svänga (figur 6A). Av dessa 24 nätverk var de bäst presterande två nätverk som matchade data på 50% av deras stabilt oscillerande modellparametrar (figur 6B).

Tabellen edgeprevalens (tabell 1) tabulerar antalet gånger en kant uppstår i en vald samling nätverk, vilket ger en indikation på dess förekomst i högpresterande nätverk. Att undersöka edgeprevalenstabellen som produceras genom att välja de två föregående nätverken i spridningsdiagrammet visar att alla frönätverkskanter finns i vart och ett av de två nätverken, som förväntat, tillsammans med två icke-frönätskanter (figur 6B), SWI4 = tf_act(SWI5) och HCM1 = tf_rep(YHP1). Ingen av dessa två kanter hade bevis som stödde dem i Yeastract. Eftersom en så liten mängd nätverksutrymme undersöktes så är det svårt att bedöma vikten av kanter och noder för att producera den observerade dynamiken.

Endast 37 modell tillåtliga nätverk hittades i Network Finding trots att parametern numneighbors var inställd på 2 000, vilket tyder på att nätverkssökningen kan ha varit otillbörligt begränsad. Som beskrivs i dokumentationen för dsgrn_net_gen python-modulen i IDP kan problemet vara relaterat till dirigerings nätverket, kant listan, nod listan, alternativet Nätverk hitta parameter eller någon kombination av dessa. För att undersöka användes samma frönätverk, kantlista och nodlista som tidigare, men parametrarna För nätverkssökning ändrades genom att lägga till möjligheten att ta bort kanter under nätverksgenerering (Kompletterande fil 12). Inläsningen av de nya resultaten av nätverkssökningen i IDV visar att 612 nätverk hittades i detta steg, där 67 % (411) av dessa nät har kapacitet att kraftigt svänga (figur 7A). Intressant nog kunde 13 % (82) av de nätverk som kunde stabilisera oscillatorisk dynamik inte skapa dynamik som liknar dem som ses i uppgifterna (figur 7B). Av de 411 nätverken uppvisade 30 % (124) robusta matchningar av data (dvs. mer än 50 % av deras stabilt oscillerande modellparametrar uppvisade en datamatchning) (figur 7C).

De kantprevalenstal som genereras av den andra omgången av Network Finding baseras nu på ett mycket större urval av nätverk och kan med större säkerhet användas för att bedöma vikten av ett regleringsförhållande i ett GRN. Till exempel är HCM1 = tf_rep(YHP1) fortfarande högt representerad i nätverk som producerar robust dynamik, vilket tyder på att detta förhållande kan vara värt att undersöka experimentellt (figur 7C). Ytterligare undersökning av Edge Prevalence Table (baserad på de 124 nätverk som nämns ovan) visade att kanterna SWI4 = tf_rep(YOX1) och YOX1 = tf_act(SWI4) ännu inte är högt rankade ännu kanterna SWI4 = tf_rep(YHP1) och YHP1 = tf_act(SWI4) är högt rankade (figur 7C). Negativ feedback är viktig för att producera oscillatorisk dynamik23 och båda dessa uppsättningar av regulatoriska relationer ger denna funktion i GRN i figur 3. Att hitta om det finns ett nätverk som innehåller alla fyra kanterna kan ge en viss inblick i varför dessa inte ofta finns tillsammans i samlingen av GRN-modeller. Att klicka igenom enskilda nätverk skulle dock vara tråkigt. I stället användes delen likhetsanalys på sidan Nätverkssökning för att söka efter nätverk som kan innehålla alla fyra kanterna (bild 7D). Att undersöka spridningsdiagrammet som visar hur lika de 612 nätverken är med ett motiv av dessa fyra kanter jämfört med procentandelen av modellparameterutrymmet som matchar den observerade dynamiken visar att endast 0,65 % (4) av de 612 nätverken innehåller alla fyra kanterna (figur 7D). Detta tyder på en testbar hypotes att endast en av de två negativa återkopplingsslingorna behövs för ett nätverk av denna storlek för att producera den observerade dynamiken. Denna hypotes kan undersökas ytterligare beräkningsmässigt genom reparameterisering av IDP-steg och en mer uttömmande sökning av nätverksutrymme eller experimentellt, såsom gen knockouts. Alla resultat från denna analys finns i Kompletterande fil 13.

Figure 1
Bild 1: Översikt över arbetsflödet IDP och IDV. Den nedre raden visar de tre viktigaste stegen i IDP: Node, Edge och Network Finding. Den översta raden visar de viktigaste stegen i IDV och beskriver olika sätt som en användare kan interagera med resultaten. De mörkgrå pilarna mellan de två visar hur IDV och IDP kan fungera synergistiskt för att göra det möjligt för användare att fatta välgrundade beslut för varje steg i IDP, med enskilda IDP-steg som ger resultat för visualiseringarna i IDV, enskilda IDV-steg som möjliggör inmatning av nya eller justerade parametrar och justerade resultat och indata för det efterföljande IDP-steget. Klicka här för att se en större version av den här figuren.

Figure 2
Bild 2: Exempel på resultat från att köra varje steg i IDP i följd utan att använda IDV mellan steg. (A) En skärmbild av terminalutgången från att köra varje IDP-steg i följd. IDP slutfördes, men inga nätverk hittades under steget Nätverkssökning. (B) Nodsökningsresultatkatalogen node_finding_20210705183301 (Kompletterande fil 13) som läses in i IDV. Alla gener i genlistetabellen valdes (röd pil) för att visa sina respektive uttrycksprofiler i linjediagrammet och för att generera en anteckningstabell. Anteckningstabellen fylldes i för att återspegla hur generna är märkta i den ursprungliga anteckningsfilen (grön pil). (C) Katalogen för edge finding-resultat edge_finding_20210705183301 (kompletterande fil 13) som läses in i IDV. (D) Katalogen för nätverkssökningsresultat network_finding_20210705183301 (kompletterande fil 13) som läses in i IDV. Sidan Nätverkssökning visar inga resultat, vilket tyder på att antingen reparameterisering av steget Nätverkssökning eller omvärdering av noden eller edgesökningssteget behövs. IDP-dokumentationen innehåller felsökningssteg för att hjälpa användaren att avgöra vad de kan prova härnäst. Klicka här för att se en större version av den här figuren.

Figure 3
Figur 3: En jästcellscykel GRN-modell. En uppsättning kända jästcellscykelregulatorer valdes från SGD och kända regulatoriska relationer mellan gener extraherades från Yeastract. Klicka här för att se en större version av den här figuren.

Figure 4
Bild 4: Exempel på IDP-nodsökning resulterar i IDV. Inläst i IDV är nodsökningsresultatkatalogen node_finding_20210705183301 (Kompletterande fil 13). De justerade resultaten efter inspektion av kuraterade online jästdatabaser. Gen list tabellen utökades (gul pil) för att hitta den återstående genen i GRN-modellen av figur 3 och gener avmarkerades för att ta bort gener som inte finns i samma GRN-modell (röd pil). Anteckningstabellen fylldes i baserat på bevis på reglering för varje gen som finns på Yeastract (grön pil). Den nya genlistan och anteckningsfilen laddades ner genom att välja deras respektive nedladdningsknappar (blå pilar). Klicka här för att se en större version av den här figuren.

Figure 5
Bild 5: Exempel på IDP Edge Finding-resultat i IDV. Inläst i IDV är edge finding resultat-katalogen edge_finding_20210701100152 (Kompletterande fil 13). A) Det ursprungliga resultatet av IDP. Alternativet Nätverks listning från frö valdes (röd pil) för att visa det frönätverk som produceras av IDP baserat på argumenten i den konfigurationsfil som används (kompletterande fil 7). De valda generna i kanttabellen är de kanter som används i frönätverket. B) De justerade resultaten efter inspektion av frönätet för kanter som inte innehåller experimentella bevis. Listrutan Nätverk från markering valdes (röd pil). Kanterna valdes/avmarkerades från kanttabellen (grön pil). Filfilerna för frönätverk, kantlista och nodlista hämtades genom att klicka på deras respektive knappar (gula pilar). Kanttabellen som visas är för sista gången seriedata som anges i konfigurationsfilen two_wts_EdgeFinding_config.txt (Kompletterande fil 7). Det är viktigt när du väljer kanter för dirigerings nätverket eller kant listan baserat på LEM-resultat att titta på den senaste tids serie data som anges i konfigurations filen eftersom den här utdata innehåller alla föregående datafiler i dess härledning av reglerande relationer mellan noder. Klicka här för att se en större version av den här figuren.

Figure 6
Bild 6: Exempel på IDP-nätverkssökning resulterar i att IDV används av IDP-konfigurationsfilen two_wts_NetFind_rd1_config.txt (Kompletterande fil 11). (A) Frågan Stabil fullständig cykel valdes (röd pil) för att visa respektive data på y-axeln i punktdiagrammet. Blå punkter i punktdiagrammet representerar markerade punkter med funktionen Välj ruta för punktdiagrammet. Den prickade markeringsrutan illustrerades för att visa hur lådmarkeringen ser ut. (B) Min- och max heltalen för y-axeln och x-axeln angavs manuellt till valda nätverk inom dessa gränser (grön pil). Efter varje val klickades knappen Hämta kantprevalens från valda nätverk (gula pilar) och områdena Edge Prevalence Table och Selected DSGRN Predicted Networks genererades. I nätverksindexet kan du klicka på upp- och nedpilar för att bläddra i de markerade nätverken (blå pilar). Klicka här för att se en större version av den här figuren.

Figure 7
Bild 7: Exempel på IDP-nätverkssökning resulterar i att IDV används av IDP-konfigurationsfilen two_wts_NetFind_rd2_config.txt (Kompletterande fil 12). (A-C) Valet av nätverk utfördes genom att ange värden i min- och maxinmatningsrutorna (röda pilar). Knappen Hämta edgeprevalens från valda nätverk klickades för att generera områdena Edge Prevalence Table och Selected DSGRN Predicted Networks. (D) Kanter av intresse valdes i tabellen edge_list (gul pil) och knappen Skicka (grön pil) klickades för att beräkna likhetspoäng för att rita i punktdiagrammet mot den valda frågan (blå pil). Funktionen Välj rutan användes för att välja en uppsättning nätverk (lila pil) för att generera områdena Edge Prevalence Table och Selected DSGRN Predicted Networks. Nätverksindexet höjdes till 2 (orange pil) för att visa det andra nätverket i urvalet. Klicka här för att se en större version av den här figuren.

Term Pipeline steg Definition
de Lichtenburg av JTK-CYCLE (DLxJTK) Nodsökning Ett enda kvantitativt mått på både periodicitet och regleringsstyrka som används för att rangordna gener. Kombinerar tidigare publicerade periodicitetsmått de Lichtenberg (DL) och JTK-CYCLE (JTK).
Max uttryck för första cykeln Nodsökning Det maximala genuttrycket under den första cykeln av periodiska genuttryck. Gener som beställs av First Cycle Max Expression kommer att beställas baserat på den tidpunkt från den första cykeln då de når sitt maximala genuttryck.
Den lokala kantmaskinen (LEM) Kantsökning En Bayesian nätverk inferens metod som rangordnar potentiella modeller av geninteraktioner för att identifiera den mest sannolika regulatorn och regleringssätten (aktivering eller förtryck) av en given målgen med hjälp av tidsserie genuttrycksdata.
Nätverk av utsäde Nätverkssökning En första gissning på ett troligt nätverk av globala interaktioner genom att välja de högst rankade LEM-kanterna. Fröet lokaliserar en region i nätverksutrymmet som är mycket oscillatorisk med stor sannolikhet att visa konsekvens med de angivna tidsseriedata.
Dynamiska signaturer som genereras av regulatoriska nätverk (DSGRN) Nätverkssökning Ett programpaket för omfattande beräkning av de olika långsiktiga dynamiska beteenden som ett nätverk kan uppvisa.
Kantprevalens Nätverkssökning Procentandelen toppbedömningsnätverk från nätverkets söksteg som inkluderar kanten i fråga. Poängen tillåter en rangordning av kanter som har en icke-nollprevalens.

Tabell 1: Definition av termer för inherent dynamics pipeline och inherent dynamics visualizer.

Kompletterande fil 1: Tidsserie genuttrycksdata (Replikera 1) tagna från Orlando, 200813. Klicka här för att ladda ner denna fil.

Kompletterande fil 2: Tidsserie genuttrycksdata (Replikera 2) tagna från Orlando, 200813. Klicka här för att ladda ner denna fil.

Kompletterande fil 3: Anteckningsfil som innehåller alla gener som finns i kompletterande fil 1 och kompletterande fil 2. Klicka här för att ladda ner den här filen.

Kompletterande fil 4: Fullständigt parametriserad konfigurationsfil för Inherent Dynamics Pipeline. Klicka här för att ladda ner den här filen.

Kompletterande fil 5: Gen listfil nedladdad från nodsökningssidan i Inherent Dynamics Visualizer. Klicka här för att ladda ner den här filen.

Kompletterande fil 6: Anteckningsfil hämtad från nodsökningssidan i Inherent Dynamics Visualizer. Klicka här för att ladda ner den här filen.

Kompletterande fil 7: Konfigurationsfil för Inherent Dynamics Pipeline parametriserad för bara edge-söksteget. Klicka här för att ladda ner den här filen.

Kompletterande fil 8: Frönätverksfil nedladdad från sidan Edge Finding i Inherent Dynamics Visualizer. Klicka här för att ladda ner den här filen.

Kompletterande fil 9: Edge listfil hämtad från sidan Edge Finding i Inherent Dynamics Visualizer. Klicka här för att ladda ner den här filen.

Kompletterande fil 10: Nodlistefil hämtad från sidan Edge Finding i Inherent Dynamics Visualizer. Klicka här för att ladda ner den här filen.

Kompletterande fil 11: Konfigurationsfil för Inherent Dynamics Pipeline parametriserad för bara steget Nätverkssökning. Klicka här för att ladda ner den här filen.

Kompletterande fil 12: Uppdaterad Inherent Dynamics Pipeline konfigurationsfil (Kompletterande fil 11) parametriseras för bara steget Nätverkssökning. Klicka här för att ladda ner den här filen.

Kompletterande fil 13: Katalog som innehåller resultaten från avsnittet Representativa resultat. Klicka här för att ladda ner den här filen.

Subscription Required. Please recommend JoVE to your librarian.

Discussion

Grns slutsatser är en viktig utmaning inom systembiologin. IDP genererar modell-GRN från genuttrycksdata med hjälp av en sekvens av verktyg som använder data på allt mer komplexa sätt. Varje steg kräver beslut om hur data ska bearbetas och vilka element (gener, funktionella interaktioner) som skickas till nästa lager av IDP. Effekterna av dessa beslut på IDP-resultaten är inte lika uppenbara. För att hjälpa till i detta avseende tillhandahåller IDV användbara interaktiva visualiseringar av utdata från enskilda steg i GRN-härledningsverktygen inom IDP. IDV effektiviserar och underlättar processen att utvärdera resultat från dessa beräkningsinferensmetoder för att påskynda experiment och informera analysval, vilket i sin tur kommer att möjliggöra snabbare produktion av modeller och hypoteser med högt förtroendenätverk. IDV implementerar också funktioner som utökar funktionaliteten i IDP, inklusive filtrering av kanter efter LEM ODE-parameterval, binning av gener efter deras uttryckstid och klusternätverk baserat på likhet med ett motiv eller nätverk. Viktigt är att IDV möjliggör manuella ingrepp mellan varje IDP-steg, vilket gör det möjligt för användaren att enkelt införliva mänsklig kunskap och förinformation från litteraturen på sätt som inte lätt kan automatiseras. En naiv körning av IDP kommer inte att införliva denna information, så användningen av IDV kommer att öka förtroendet för resultaten när information som är specifik för experimentet är tillgänglig. Sammantaget gör användningen av IDV tillsammans med IDP det möjligt för användare att skapa nätverkshypoteser för biologiska processer med större förtroende, även med liten eller ingen kunskap om det sanna GRN.

Det finns tre kritiska steg i IDV. Den första är att utvärdera IDP-nodsökningsresultat i IDV. IDV:s nodsökningssida kan producera en ny genlista och, om så önskas, en genanteckningsfil. Att kurera en ny genlista är ett kritiskt steg eftersom det kraftigt minskar det potentiella nätverksutrymmet genom att begränsa vilka gener som får modelleras som GRN-mål och/eller regulatorer. Dessutom, eftersom GRN mestadels består av transkriptionsfaktorer, kommer genanteckningar att i hög grad bidra till att skapa sammanhängande GRN-modeller.

Nästa steg är att utvärdera IDP Edge Finding-resultat i IDV. Att kurera ett nytt frönätverk är ett viktigt steg eftersom det lokaliserar den region med nätverksutrymme som ska tas med i steget Nätverkssökning. Men att veta var man ska börja är inte alltid uppenbart, så det rekommenderas att använda kanter som har någon form av experimentella bevis för att ge förtroende för att man börjar i en region med nätverksutrymme som innehåller höga förtroendekanter. IDV: s Edge Finding-sida möjliggör enkel montering av frönätverk och genererar tillhörande DSGRN-nätverksspecifikationsfil samt nod- och kantlistor.

Det sista steget är att utvärdera IDP-nätverkssökningsresultat i IDV. IDV:s sida för nätverkssökning gör det enkelt att utforska exempelnätverk och deras associerade poäng som uppskattar nätverkets kapacitet att producera den observerade dynamiken. Medan nod- och edgesökning alltid returnerar resultat (om minst två gener överförs från nodsökning), kan nätverkssökning returnera noll resultat. Därför är det mer uppenbart att veta om justeringar i parametrar behövs i Nätverkssökning än i Node och Edge Finding. Sådana händelser av få eller inga nätverk som hittas kan vara ett resultat av begränsningar som placeras på vilka nätverk som kan analyseras. Dessa begränsningar är: 1) huruvida nätverken alltid är starkt anslutna, 2) det minsta och maximala antalet inmatningskanter till varje nod, 3) sannolikheten för att lägga till och ta bort noder och kanter och 4) antalet tillägg och borttagningar av noder och kanter tillåtna. Om få eller inga modell godtagbara nätverk hittas, som i figur 2, rekommenderas hänvisning till IDP-dokumentationen för vägledning om reparameterisering av något eller alla steg i IDP med efterföljande utvärdering av resultaten i IDV.

En aktuell begränsning av den här metoden är att sidan Nodsökning mestadels är inriktad på oscillatorisk dynamik, till exempel de som ses i transkriptionsprogram för cellcykeln och dygnsrytmklockan. I synnerhet är steget IDP-nodsökning för närvarande konfigurerat för att söka efter gener som uppvisar oscillatorisk dynamik under en angiven period. När IDP expanderar till att omfatta analyser som kan kvantifiera olika typer av transkriptionsdynamik, kommer även IDV att uppdateras för att stödja visualisering och förhör av dessa andra beteenden. Storleken på nätverk som söks efter och analyseras i network finding-steget är för närvarande begränsade till nätverk av mindre storlek, t.ex. cirka 10 gener. Detta är en nödvändighet eftersom beräkningar i DSGRN-skalan sker kombinatiskt. En annan begränsning är att det inte är möjligt att utforska modellparameterutrymme för ett valt nätverk i IDV. DSGRN-nätverksspecifikationsfilen för ett visst nätverk kan dock laddas ner och dynamiken som är associerad med varje modellparameter kan visualiseras på webbplatsen DSGRN Visualization (https://sites.math.rutgers.edu/~gameiro/dsgrn_viz/). Slutligen har IDV testats med Linux (Ubuntu) och iOS (Big Sur) system. IDV har testats på Windows 10 med hjälp av Windows Subsystem for Linux (WSL), som gör det möjligt för Windows 10-användare att köra Linux och IDV utan att behöva en annan dator, en virtuell dator eller en installation med dubbla starter. IDV körs för närvarande inte på inbyggda Windows.

Att studera GRN är svårt på grund av deras inneboende komplexitet och användbara slutledningsverktyg som IDP kan vara svåra att förstå och distribuera med förtroende. IDV tillhandahåller en metod för att minska komplexiteten i att studera GRN som härleds med hjälp av IDP samtidigt som det underlättar införandet av ytterligare information utöver genuttrycksdynamiken. Att använda IDV i samband med IDP som beskrivs här kommer att ge forskare möjlighet att utveckla och analysera funktionella modeller av välstuderade system, såsom den mänskliga cellcykeln. Dessutom kommer dessa verktyg att generera testbara hypoteser för mindre förstådda processer, såsom malaria intra-erytrocytisk utvecklingscykel, som misstänks kontrolleras av en GRN24 men för vilken en modell ännu inte har föreslagits.

Subscription Required. Please recommend JoVE to your librarian.

Disclosures

Författarna har inget att avslöja.

Acknowledgments

Detta arbete finansierades av NIH-bidraget R01 GM126555-01 och NSF-bidrag DMS-1839299.

Materials

Name Company Catalog Number Comments
Docker https://docs.docker.com/get-docker/
Git https://git-scm.com/
Inherent Dynamics Pipeline https://gitlab.com/biochron/inherent_dynamics_pipeline
Inherent Dynamics Visualizer https://gitlab.com/bertfordley/inherent_dynamics_visualizer
Miniconda https://docs.conda.io/en/latest/miniconda.html
Pip https://pip.pypa.io/en/stable/

DOWNLOAD MATERIALS LIST

References

  1. Karlebach, G., Shamir, R. Modelling and analysis of gene regulatory networks. Nature Reviews Molecular Cell Biology. 9 (10), 770-780 (2008).
  2. Aijö, T., Lähdesmäki, H. Learning gene regulatory networks from gene expression measurements using non-parametric molecular kinetics. Bioinformatics. 25 (22), 2937-2944 (2009).
  3. Huynh-Thu, V. A., Sanguinetti, G. Combining tree-based and dynamical systems for the inference of gene regulatory networks. Bioinformatics. 31 (10), 1614-1622 (2015).
  4. Oates, C. J., et al. Causal network inference using biochemical kinetics. Bioinformatics. 30 (17), 468-474 (2014).
  5. Marbach, D., et al. Wisdom of crowds for robust gene network inference. Nature Methods. 9 (8), 796-804 (2012).
  6. Inherent Dynamics Pipeline. , Available from: https://gitlab.com/biochron/inherent_dynamics_pipeline (2021).
  7. Motta, F. C., Moseley, R. C., Cummins, B., Deckard, A., Haase, S. B. Conservation of dynamic characteristics of transcriptional regulatory elements in periodic biological processes. bioRxiv. , (2020).
  8. LEMpy. , Available from: https://gitlab.com/biochron/lempy (2021).
  9. McGoff, K. A., et al. The local edge machine: inference of dynamic models of gene regulation. Genome Biology. 17, 214 (2016).
  10. Cummins, B., Gedeon, T., Harker, S., Mischaikow, K. Model rejection and parameter reduction via time series. SIAM Journal on Applied Dynamical Systems. 17 (2), 1589-1616 (2018).
  11. Cummins, B., Gedeon, T., Harker, S., Mischaikow, K. Database of Dynamic Signatures Generated by Regulatory Networks (DSGRN). Lecture Notes in Computer Science. (including Subseries Lecture Notes in Artificial Intelligence and Lecture Notes in Bioinformatics). , 300-308 (2017).
  12. Cummins, B., Gedeon, T., Harker, S., Mischaikow, K. DSGRN: Examining the dynamics of families of logical models. Frontiers in Physiology. 9. 9, 549 (2018).
  13. DSGRN. , Available from: https://github.com/marciogameiro/DSGRN (2021).
  14. Dsgm_Net_Gen. , Available from: https://github.com/breecummins/dsgrn_net_gen (2021).
  15. Dsgrn_Net_Query. , Available from: https://github.com/breecummins/dsgrn_net_query (2021).
  16. Orlando, D. A., et al. Global control of cell-cycle transcription by coupled CDK and network oscillators. Nature. 453 (7197), 944-947 (2008).
  17. Monteiro, P. T., et al. YEASTRACT+: a portal for cross-species comparative genomics of transcription regulation in yeasts. Nucleic Acids Research. 48 (1), 642-649 (2020).
  18. de Bruin, R. A. M., et al. Constraining G1-specific transcription to late G1 phase: The MBF-associated corepressor Nrm1 acts via negative feedback. Molecular Cell. 23 (4), 483-496 (2006).
  19. Horak, C. E., et al. Complex transcriptional circuitry at the G1/S transition in Saccharomyces cerevisiae. Genes & Development. 16 (23), 3017-3033 (2002).
  20. Cherry, J. M., et al. Saccharomyces genome database: The genomics resource of budding yeast. Nucleic Acids Research. 40, 700-705 (2012).
  21. Zhu, G., et al. Two yeast forkhead genes regulate the cell cycle and pseudohyphal growth. Nature. 406 (6791), 90-94 (2000).
  22. Loy, C. J., Lydall, D., Surana, U. NDD1, a high-dosage suppressor of cdc28-1N, is essential for expression of a subset of late-S-phase-specific genes in saccharomyces cerevisiae. Molecular and Cellular Biology. 19 (5), 3312-3327 (1999).
  23. Cho, C. Y., Kelliher, C. M., Hasse, S. B. The cell-cycle transcriptional network generates and transmits a pulse of transcription once each cell cycle. Cell Cycle. 18 (4), 363-378 (2019).
  24. Smith, L. M., et al. An intrinsic oscillator drives the blood stage cycle of the malaria parasite Plasmodium falciparum. Science. 368 (6492), 754-759 (2020).

Tags

Biologi nummer 178
Inherent Dynamics Visualizer, en interaktiv applikation för utvärdering och visualisering av utgångar från en pipeline för genreglerande nätverk
Play Video
PDF DOI DOWNLOAD MATERIALS LIST

Cite this Article

Moseley, R. C., Campione, S.,More

Moseley, R. C., Campione, S., Cummins, B., Motta, F., Haase, S. B. Inherent Dynamics Visualizer, an Interactive Application for Evaluating and Visualizing Outputs from a Gene Regulatory Network Inference Pipeline. J. Vis. Exp. (178), e63084, doi:10.3791/63084 (2021).

Less
Copy Citation Download Citation Reprints and Permissions
View Video

Get cutting-edge science videos from JoVE sent straight to your inbox every month.

Waiting X
Simple Hit Counter