RESEARCH
Peer reviewed scientific video journal
Video encyclopedia of advanced research methods
Visualizing science through experiment videos
EDUCATION
Video textbooks for undergraduate courses
Visual demonstrations of key scientific experiments
BUSINESS
Video textbooks for business education
OTHERS
Interactive video based quizzes for formative assessments
Products
RESEARCH
JoVE Journal
Peer reviewed scientific video journal
JoVE Encyclopedia of Experiments
Video encyclopedia of advanced research methods
EDUCATION
JoVE Core
Video textbooks for undergraduates
JoVE Science Education
Visual demonstrations of key scientific experiments
JoVE Lab Manual
Videos of experiments for undergraduate lab courses
BUSINESS
JoVE Business
Video textbooks for business education
Solutions
Language
French
Menu
Menu
Menu
Menu
A subscription to JoVE is required to view this content. Sign in or start your free trial.
Research Article
Please note that some of the translations on this page are AI generated. Click here for the English version.
Erratum Notice
Important: There has been an erratum issued for this article. View Erratum Notice
Retraction Notice
The article Assisted Selection of Biomarkers by Linear Discriminant Analysis Effect Size (LEfSe) in Microbiome Data (10.3791/61715) has been retracted by the journal upon the authors' request due to a conflict regarding the data and methodology. View Retraction Notice
Inherent Dynamics Visualizer est un ensemble de visualisation interactif qui se connecte à un outil d’inférence de réseau de régulation génique pour une génération améliorée et rationalisée de modèles de réseau fonctionnels. Le visualiseur peut être utilisé pour prendre des décisions plus éclairées pour paramétrer l’outil d’inférence, augmentant ainsi la confiance dans les modèles résultants.
Le développement de modèles de réseaux de régulation génique est un défi majeur en biologie des systèmes. Plusieurs outils de calcul et pipelines ont été développés pour relever ce défi, y compris le nouveau pipeline Inherent Dynamics. Le pipeline Inherent Dynamics se compose de plusieurs outils précédemment publiés qui fonctionnent en synergie et sont connectés de manière linéaire, où la sortie d’un outil est ensuite utilisée comme entrée pour l’outil suivant. Comme pour la plupart des techniques de calcul, chaque étape du pipeline Inherent Dynamics nécessite que l’utilisateur fasse des choix sur des paramètres qui n’ont pas de définition biologique précise. Ces choix peuvent avoir un impact considérable sur les modèles de réseaux de régulation des gènes produits par l’analyse. Pour cette raison, la capacité de visualiser et d’explorer les conséquences de divers choix de paramètres à chaque étape peut aider à accroître la confiance dans les choix et les résultats. Inherent Dynamics Visualizer est un package de visualisation complet qui rationalise le processus d’évaluation des choix de paramètres via une interface interactive dans un navigateur Web. L’utilisateur peut examiner séparément la sortie de chaque étape du pipeline, apporter des modifications intuitives en fonction d’informations visuelles et bénéficier de la production automatique des fichiers d’entrée nécessaires pour le pipeline Inherent Dynamics. Le visualiseur Inherent Dynamics offre un niveau d’accès inégalé à un outil très complexe pour la découverte de réseaux de régulation génique à partir de données transcriptomiques de séries chronologiques.
De nombreux processus biologiques importants, tels que la différenciation cellulaire et la réponse environnementale, sont régis par des ensembles de gènes qui interagissent les uns avec les autres dans un réseau de régulation des gènes (GRN). Ces GRN produisent la dynamique transcriptionnelle nécessaire à l’activation et au maintien du phénotype qu’ils contrôlent, de sorte que l’identification des composants et de la structure topologique du GRN est essentielle pour comprendre de nombreux processus et fonctions biologiques. Un GRN peut être modélisé comme un ensemble de gènes en interaction et/ou de produits géniques décrits par un réseau dont les nœuds sont les gènes et dont les bords décrivent la direction et la forme de l’interaction (par exemple, activation/répression de la transcription, modification post-traductionnelle, etc.) 1. Les interactions peuvent ensuite être exprimées sous forme de modèles mathématiques paramétrés décrivant l’impact d’un gène régulateur sur la production de sa ou ses cibles 2,3,4. L’inférence d’un modèle GRN nécessite à la fois une inférence de la structure du réseau d’interaction et une estimation des paramètres d’interaction sous-jacents. Diverses méthodes d’inférence computationnelle ont été mises au point pour ingérer des données d’expression génique de séries chronologiques et produire des modèles GRN5. Récemment, une nouvelle méthode d’inférence GRN a été développée, appelée Inherent Dynamics Pipeline (IDP), qui utilise des données d’expression génique de séries chronologiques pour produire des modèles GRN avec des interactions régulateur-cible marquées capables de produire une dynamique qui correspond à la dynamique observée dans les données d’expression génique6. L’IDP est une suite d’outils connectés linéairement dans un pipeline et peut être décomposé en trois étapes : une étape de recherche de nœud qui classe les gènes en fonction des caractéristiques d’expression génique connues ou soupçonnées d’être liées à la fonction du GRN7,8, une étape de recherche de périphérie qui classe les relations réglementaires par paires8, 9, et une étape de recherche de réseau qui produit des modèles GRN capables de produire la dynamique observée10,11,12,13,14,15.
Comme la plupart des méthodes de calcul, l’IDP nécessite un ensemble d’arguments spécifiés par l’utilisateur qui dictent la façon dont les données d’entrée sont analysées, et différents ensembles d’arguments peuvent produire des résultats différents sur les mêmes données. Par exemple, plusieurs méthodes, y compris l’IDP, contiennent des arguments qui appliquent un certain seuil sur les données, et l’augmentation/diminution de ce seuil entre les exécutions successives de la méthode particulière peut entraîner des résultats différents entre les exécutions (voir la note supplémentaire 10 : Méthodes d’inférence réseau de5). Comprendre comment chaque argument peut avoir une incidence sur l’analyse et les résultats ultérieurs est important pour obtenir une grande confiance dans les résultats. Contrairement à la plupart des méthodes d’inférence GRN, l’IDP se compose de plusieurs outils de calcul, chacun ayant son propre ensemble d’arguments qu’un utilisateur doit spécifier et chacun ayant ses propres résultats. Bien que l’IDP fournisse une documentation complète sur la façon de paramétrer chaque outil, l’interdépendance de chaque outil sur la sortie de l’étape précédente rend difficile le paramétrage de l’ensemble du pipeline sans analyses intermédiaires. Par exemple, les arguments dans les étapes Edge et Network Finding sont susceptibles d’être éclairés par des connaissances biologiques antérieures, et dépendront donc de l’ensemble de données et / ou de l’organisme. Pour interroger les résultats intermédiaires, une compréhension de base de la programmation, ainsi qu’une compréhension approfondie de tous les fichiers de résultats et de leur contenu de l’IDP, seraient nécessaires.
L’Inherent Dynamics Visualizer (IDV) est un package de visualisation interactif qui s’exécute dans la fenêtre du navigateur d’un utilisateur et permet aux utilisateurs de l’IDP d’évaluer l’impact de leurs choix d’arguments sur les résultats de n’importe quelle étape de l’IDP. L’IDV navigue dans une structure de répertoires complexe produite par l’IDP et recueille les données nécessaires pour chaque étape et présente les données dans des figures et des tableaux intuitifs et interactifs que l’utilisateur peut explorer. Après avoir exploré ces écrans interactifs, l’utilisateur peut produire de nouvelles données à partir d’une étape IDP qui peuvent être basées sur des décisions plus éclairées. Ces nouvelles données peuvent ensuite être immédiatement utilisées à l’étape suivante de l’IDP. En outre, l’exploration des données peut aider à déterminer si une étape IDP doit être réexécutée avec des paramètres ajustés. L’IDV peut améliorer l’utilisation de l’IDP, ainsi que rendre l’utilisation de l’IDP plus intuitive et accessible, comme l’a démontré l’étude de l’oscillateur central GRN du cycle cellulaire de la levure. Le protocole suivant inclut les résultats IDP d’une exécution IDP entièrement paramétrée par rapport à une approche qui incorpore l’IDV après les exécutions de chaque étape IDP, c’est-à-dire Node, Edge et Network Finding.
1. Installez l’IDP et l’IDV
REMARQUE : cette section suppose que docker, conda, pip et git sont déjà installés (Tableau des matériaux).
2. Recherche de nœuds
3. Recherche de bord
4. Recherche de réseau
Les étapes décrites textuellement ci-dessus et graphiquement à la figure 1 ont été appliquées au GRN oscillant du noyau du cycle cellulaire de la levure pour voir s’il est possible de découvrir des modèles DE GRN fonctionnels capables de produire la dynamique observée dans les données d’expression génique de séries chronologiques recueillies dans une étude du cycle cellulaire de la levure16. Pour illustrer comment l’IDV peut clarifier et améliorer la production de PDI, les résultats, après avoir effectué cette analyse de deux façons, ont été comparés: 1) exécuter toutes les étapes de la PDI en un seul passage sans la VDI et 2) passer à travers la PDI à l’aide de la VDI, ce qui permet l’ajustement des résultats intermédiaires à la fois en incorporant les connaissances biologiques antérieures et en faisant des choix affinés en fonction des extrants de la PDI. Le GRN à cycle cellulaire de levure bien étudié utilisé comme exemple a beaucoup de ses relations de régulation vérifiées expérimentalement. Si un organisme ou un processus biologique différent ou moins annoté est à l’étude, les choix sur la façon dont les résultats ou les paramètres intermédiaires sont ajustés peuvent être différents. Pour illustrer un type de requête pouvant être utilisé pour évaluer les réseaux, la robustesse de chaque réseau a été mesurée pour prendre en charge des oscillations stables et faire correspondre la dynamique transcriptionnelle observée de leurs nœuds à travers les paramètres du modèle.
Les données des séries chronologiques d’expression génique de deux séries répliquées ont été tirées d’Orlando 200816 et prétraitées pour supprimer toute expression génique associée à la méthode de synchronisation du cycle cellulaire appliquée dans l’expérience originale (fichier supplémentaire 1 et fichier supplémentaire 2). Un fichier d’annotation a été créé contenant tous les gènes des données de séries chronologiques qui sont étayés à la fois par des preuves de liaison et d’expression de l’ADN trouvées dans Yeastract17 et pourraient donc fonctionner comme un régulateur dans un GRN. TOS4, PLM2 et NRM1 ont également été inclus en tant que régulateurs, même s’ils n’ont pas été trouvés dans Yeastract pour avoir les deux types de preuves, parce qu’ils sont considérés comme importants pour le GRN de base du noyau de levure sur la base des preuves dans la littérature18,19 (fichier supplémentaire 3). Tous les régulateurs ont été étiquetés à la fois comme activateur et répresseur ainsi que comme cibles.
L’IDP a d’abord été paramétré pour s’exécuter à travers toutes les étapes de l’IDP, c’est-à-dire Node, Edge et Network Finding. Un ensemble d’arguments a été sélectionné qui semblait approprié sur la base de la compréhension actuelle du cycle cellulaire de la levure GRN, un petit ensemble de gènes participant à un réseau fortement connecté (fichier supplémentaire 4). Cette compréhension a principalement influencé les choix de recherche de nœuds et d’edges. Les paramètres de probabilité dans network finding étaient basés sur l’hypothèse que seuls les vrais gènes et les interactions régulatrices seraient transmis à Network Finding. Cette exécution entièrement paramétrée de l’IDP a produit des résultats pour la recherche de nœuds et de bords (Figure 2B, C), mais dans la recherche de réseau, aucun réseau admissible au modèle n’a été découvert (Figure 2A, D). L’admissibilité du modèle est expliquée dans la documentation du code du module python dsgrn_net_gen 14, une dépendance de l’IDP. En bref, les réseaux qui contiennent des bords auto-répressifs ou qui ont trop d’entrées ou de sorties sur un seul nœud ne sont pas interrogeables par le logiciel DSGRN (Tableau 1). Le fournisseur d’identité donne de nombreuses raisons pour lesquelles les réseaux admissibles par modèle peuvent ne pas être trouvés et décrit les étapes de dépannage pour résoudre le ou les problèmes. Essentiellement, cela implique de modifier les paramètres et / ou les fichiers d’entrée et de réexécuter l’étape IDP respective et d’examiner les résultats. L’IDV a été utilisé pour rendre ce processus moins fastidieux et plus long.
Les résultats de la recherche de nœuds ont été chargés dans l’IDV pour examiner les gènes transmis à l’étape edge finding de l’IDP. Les nœuds donnés par IDP sont les principaux gènes N tels que classés par DLxJTK (Tableau 1), N étant spécifié par l’utilisateur, cependant, cette liste de gènes peut ne pas être appropriée pour l’objectif de l’analyse. Sans connaissances biologiques préalables, la sélection automatique des nœuds en utilisant uniquement les scores DLxJTK a renvoyé un gène avec des preuves limitées d’un rôle dans le cycle cellulaire de la levure (RME1), tandis que quelques régulateurs transcriptionnels connus du cycle cellulaire n’étaient pas très bien classés (Figure 2B). Les preuves expérimentales de Yeastract ont été utilisées pour sélectionner parmi les gènes les mieux classés par DLxJTK ceux avec une annotation de cycle cellulaire. Ces gènes sont SWI4, YOX1, YHP1, HCM1, FKH2, NDD1 et SWI5. Leurs relations réglementaires connues peuvent être illustrées à la figure 3. FKH2 n’apparaît pas dans les dix premiers gènes (dlxjtk_cutoff a été défini sur dix dans le fichier supplémentaire 4) classés par DLxJTK, de sorte que la liste des gènes a été étendue à l’aide de l’IDV jusqu’à ce que FKH2 soit trouvé (Figure 4). Plusieurs des gènes supplémentaires de la liste étendue des gènes sont des gènes de base connus et auraient été manqués sans étudier les résultats de la découverte de nœuds. Alors que des gènes de base plus connus ont été trouvés en étendant la liste des gènes vers le bas de la liste classée DLxJTK, l’accent a été mis sur les gènes d’intérêt. Par conséquent, certains gènes de haut rang ont été désélectionnés, ce qui a donné lieu à une liste de gènes (fichier supplémentaire 5) contenant sept gènes (figure 4). Un nouveau fichier d’annotation a été créé (fichier supplémentaire 6) basé sur ces sept gènes, chaque gène a été étiqueté comme cible et le type de régulateur a été spécifié à l’aide de Yeastract. La nouvelle liste de gènes et le nouveau fichier d’annotation ont été téléchargés pour une utilisation ultérieure à l’étape suivante de l’IDP, Edge Finding. Sans l’IDV, la procédure d’ajout et de suppression de gènes de la liste des gènes et du fichier d’annotation nécessiterait des compétences modestes en codage.
Un nouveau fichier de configuration IDP a été paramétré uniquement pour l’étape Edge Finding (fichier supplémentaire 7), avec la nouvelle liste de gènes et le nouveau fichier d’annotation. Une fois l’IDP terminé avec le nouveau fichier de configuration, les résultats ont été chargés dans l’IDV (Figure 5A). Comme l’étape de recherche de réseau recherche stochastiquement autour de l’espace réseau du réseau de semences qui lui est fourni, il peut être important de fournir un bon réseau de semences. Un bon réseau de semences peut être considéré comme un réseau qui contient de vrais bords. Avec l’IDV et en utilisant des bases de données en ligne telles que Yeastract et la base de données sur le génome de Saccharomyces (SGD)20, le réseau de semences peut être visualisé et ajusté en utilisant les relations de régulation de LEM (tableau 1) qui ont des preuves expérimentales. À titre d’exemple, l’arête YHP1 = tf_act(HCM1) a été désélectionnée parce qu’il n’y a aucune preuve documentée de cette relation (figure 5B) dans Yeastract. L’arête SWI5 = tf_act(FKH2) a été ajoutée car il existe des preuves documentées de cette relation21. Une fois que le réseau d’amorçage (tableau 1) était satisfaisant, le fichier de spécification du réseau DSGRN pour le réseau a été téléchargé (fichier supplémentaire 8).
Sans l’IDV, il y a une plus grande probabilité que des arêtes pour lesquelles il n’y a aucune preuve expérimentale soient utilisées pour construire le réseau de semences. Comme on peut le voir à la figure 2C, le réseau de semences généré à l’étape Edge Finding à partir de l’exécution ininterrompue de l’IDP à chaque étape contient une arête, SWI4 = tf_rep(NDD1), qui n’est pas étayée par des preuves expérimentales dans Yeastract, probablement parce que NDD1 est connu pour être un activateur transcriptionnel22. Ces informations n’étaient pas codées dans le fichier d’annotation lors de l’exécution non-stop, ce qui permettait à tous les régulateurs d’être à la fois des activateurs et des répresseurs.
À l’aide de l’IDV, un réseau de départ a été organisé manuellement qui est un sous-réseau de la figure 3, et les quatre arêtes restantes ont été placées dans la liste des arêtes utilisées pour l’échantillonnage de l’espace réseau (YHP1 = tf_act(SWI4), YOX1 = tf_act(SWI4), SWI4 = tf_rep(YOX1), SWI5 = tf_act(NDD1)). La sélection des arêtes en fonction des connaissances biologiques antérieures peut également être utilisée pour établir la liste des arêtes; toutefois, dans ce cas, les 20 premières arêtes de la vue Tableau récapitulatif LEM ont été sélectionnées (fichier supplémentaire 9). Le fichier de liste de nœuds est créé automatiquement à partir des arêtes sélectionnées (fichier supplémentaire 10). Les paramètres ODE de LEM peuvent également être utilisés pour filtrer les bords si l’on pense que les paramètres déduits dans le modèle ODE ne sont pas biologiquement réalistes, mais cette information n’a pas été utilisée ici.
Ensuite, un nouveau fichier de configuration IDP a été paramétré pour l’étape Recherche de réseau à l’aide des trois nouveaux fichiers. Comme le réseau de semences a été créé avec des bords bien étayés par des preuves expérimentales, l’inclusion de ces bords dans tous les réseaux était souhaitée. Ainsi, les probabilités de recherche de réseau ont été définies pour permettre l’ajout mais pas la suppression de nœuds et d’arêtes (fichier supplémentaire 11). Le paramètre Network Finding numneighbors a été défini pour rechercher 2 000 réseaux. Après l’exécution de l’IDP, 37 réseaux admissibles par le modèle ont été trouvés à l’étape Recherche de réseau, par opposition à l’exécution non-stop qui avait zéro. En chargeant les résultats de la recherche de réseau dans l’IDV, 64 % (24) de ces 37 réseaux avaient la capacité d’osciller de manière stable (Figure 6A). Parmi ces 24 réseaux, les plus performants étaient deux réseaux qui correspondaient aux données à 50 % de leurs paramètres de modèle oscillant de manière stable (figure 6B).
Le tableau de prévalence des bords (tableau 1) compile le nombre de fois qu’une périphérie se produit dans une collection sélectionnée de réseaux, ce qui donne une indication de sa prévalence dans les réseaux à haut rendement. L’examen du tableau de prévalence des bords produit en sélectionnant les deux réseaux précédents dans le nuage de points révèle que toutes les arêtes du réseau d’amorçage sont présentes dans chacun des deux réseaux, comme prévu, ainsi que deux bords de réseau non amorçaux (Figure 6B), SWI4 = tf_act (SWI5) et HCM1 = tf_rep (YHP1). Aucun de ces deux bords n’avait de preuves à l’appui dans Yeastract. En tant que telle, une petite quantité d’espace réseau a été explorée, il est donc difficile d’évaluer l’importance des bords et des nœuds dans la production de la dynamique observée.
Seuls 37 réseaux admissibles par modèle ont été trouvés dans Network Finding même si le paramètre numneighbors a été défini sur 2 000, ce qui suggère que la recherche sur le réseau a peut-être été indûment limitée. Comme décrit dans la documentation du module python dsgrn_net_gen dans l’IDP, le problème peut être lié au réseau d’amorçage, à la liste Edge, à la liste des nœuds, aux choix de paramètres de recherche de réseau ou à une combinaison de ceux-ci. Pour enquêter, le même réseau d’amorçage, la même liste de périphérie et la même liste de nœuds qu’auparavant ont été utilisés, mais les paramètres de recherche de réseau ont été modifiés en ajoutant la possibilité de supprimer les bords lors de la génération du réseau (fichier supplémentaire 12). Le chargement des nouveaux résultats de la recherche de réseau dans l’IDV montre que 612 réseaux ont été trouvés à cette étape, avec 67% (411) de ces réseaux ayant la capacité d’osciller de manière stable (Figure 7A). Fait intéressant, 13 % (82) des réseaux capables d’une dynamique oscillatoire stable n’étaient pas capables de produire une dynamique similaire à celles observées dans les données (figure 7B). Sur les 411 réseaux, 30 % (124) présentaient des correspondances robustes avec les données (c.-à-d. plus de 50 % de leurs paramètres de modèle oscillant de façon stable présentaient une correspondance de données) (figure 7C).
Les chiffres de prévalence de périphérie générés par la deuxième série de recherche de réseaux sont maintenant basés sur une sélection beaucoup plus large de réseaux et peuvent être utilisés avec plus de confiance pour évaluer l’importance d’une relation réglementaire dans un GRN. Par exemple, HCM1 = tf_rep (YHP1) est toujours très représenté dans les réseaux qui produisent une dynamique robuste, ce qui suggère que cette relation pourrait valoir la peine d’être étudiée expérimentalement (Figure 7C). Un examen plus approfondi du tableau de prévalence des bords (basé sur les 124 réseaux mentionnés ci-dessus) a révélé que les arêtes SWI4 = tf_rep (YOX1) et YOX1 = tf_act (SWI4) ne sont pas très bien classées, mais les arêtes SWI4 = tf_rep (YHP1) et YHP1 = tf_act (SWI4) sont très bien classées (Figure 7C). La rétroaction négative est importante pour produire une dynamique oscillatoire23 et ces deux ensembles de relations de régulation fournissent cette fonction dans le GRN de la figure 3. Déterminer s’il existe un réseau contenant ces quatre arêtes pourrait donner un aperçu des raisons pour lesquelles elles n’existent pas souvent ensemble dans la collection de modèles GRN; cependant, cliquer sur des réseaux individuels serait fastidieux. Au lieu de cela, la partie Analyse de similarité de la page Recherche de réseau a été utilisée pour rechercher des réseaux pouvant contenir les quatre arêtes (Figure 7D). L’examen du nuage de points qui montre à quel point les réseaux 612 sont similaires à un motif de ces quatre arêtes par rapport au pourcentage de l’espace des paramètres du modèle qui correspond à la dynamique observée révèle que seulement 0,65 % (4) des 612 réseaux contiennent ces quatre arêtes (Figure 7D). Cela suggère une hypothèse testable selon laquelle une seule des deux boucles de rétroaction négative est nécessaire pour qu’un réseau de cette taille produise la dynamique observée. Cette hypothèse peut être étudiée plus en détail par reparamétrisation des étapes IDP et une recherche plus exhaustive de l’espace réseau ou expérimentalement, comme les knockouts de gènes. Tous les résultats de cette analyse se trouvent dans le dossier supplémentaire 13.

Figure 1 : Vue d’ensemble du flux de travail IDP et IDV. La ligne du bas décrit les trois principales étapes de l’IDP : Node, Edge et Network Finding. La ligne supérieure représente les principales étapes de l’IDV et décrit les différentes façons dont un utilisateur peut interagir avec les résultats. Les flèches gris foncé entre les deux montrent comment l’IDV et l’IDP peuvent travailler en synergie pour permettre aux utilisateurs de prendre des décisions éclairées pour chaque étape de l’IDP, avec des étapes IDP individuelles fournissant des résultats pour les visualisations dans l’IDV, des étapes IDV individuelles permettant la saisie de paramètres nouveaux ou ajustés et des résultats et entrées ajustés pour l’étape IDP suivante. Veuillez cliquer ici pour voir une version agrandie de cette figure.

Figure 2 : Exemple de résultats de l’exécution consécutive de chaque étape de l’IDP sans utiliser l’IDV entre les étapes. (A) Capture d’écran de la sortie du terminal de l’exécution consécutive de chaque étape IDP. Le fournisseur d’identité a fonctionné jusqu’à son terme, mais aucun réseau n’a été trouvé au cours de l’étape de recherche de réseau. (B) Nœud Recherche de résultats répertoire node_finding_20210705183301 (fichier supplémentaire 13) chargé dans l’IDV. Tous les gènes du tableau de la liste des gènes ont été sélectionnés (flèche rouge) pour afficher leurs profils d’expression respectifs dans le graphique linéaire et pour générer un tableau d’annotation. Le tableau d’annotation a été rempli pour refléter la façon dont les gènes sont étiquetés dans le fichier d’annotation d’origine (flèche verte). (C) Le répertoire des résultats Edge Finding edge_finding_20210705183301 (fichier supplémentaire 13) chargé dans l’IDV. (D) Répertoire des résultats de la recherche réseau network_finding_20210705183301 (fichier supplémentaire 13) chargé dans l’IDV. La page Recherche de réseau n’affiche aucun résultat, suggérant que la reparamétisation de l’étape de recherche de réseau ou la réévaluation de l’étape de recherche de nœud ou de périphérie est nécessaire. La documentation IDP contient des étapes de dépannage pour aider l’utilisateur à déterminer ce qu’il pourrait essayer ensuite. Veuillez cliquer ici pour voir une version agrandie de cette figure.

Figure 3 : Un modèle GRN à cycle cellulaire de levure. Un ensemble de régulateurs connus du cycle cellulaire de la levure ont été sélectionnés à partir de SGD et les relations régulatrices connues entre les gènes ont été extraites de Yeastract. Veuillez cliquer ici pour voir une version agrandie de cette figure.

Figure 4 : Exemple de résultats de recherche de nœud IDP dans l’IDV. Le répertoire de résultats de recherche de nœuds node_finding_20210705183301 (fichier supplémentaire 13) est chargé dans l’IDV. Les résultats ajustés après l’inspection des bases de données de levure en ligne organisées. Le tableau de la liste des gènes a été étendu (flèche jaune) pour trouver le gène restant dans le modèle GRN de la figure 3 et les gènes ont été désélectionnés pour supprimer les gènes qui ne se trouvaient pas dans le même modèle GRN (flèche rouge). Le tableau d’annotation a été rempli en fonction des preuves de régulation pour chaque gène trouvé sur Yeastract (flèche verte). La nouvelle liste de gènes et le nouveau fichier d’annotation ont été téléchargés en sélectionnant leurs boutons de téléchargement respectifs (flèches bleues). Veuillez cliquer ici pour voir une version agrandie de cette figure.

Figure 5 : Exemple de résultats IDP Edge Finding dans l’IDV. Le répertoire de résultats Edge Finding edge_finding_20210701100152 (fichier supplémentaire 13) est chargé dans l’IDV. (A) Le résultat initial tel qu’il a été produit par le PDI. L’option déroulante Réseau à partir de l’amorçage a été sélectionnée (flèche rouge) pour afficher le réseau d’amorçage produit par l’IDP en fonction des arguments du fichier de configuration utilisé (fichier supplémentaire 7). Les gènes sélectionnés dans la table des arêtes sont les arêtes utilisées dans le réseau de semences. (B) Les résultats ajustés après inspection du réseau de semences à la recherche d’arêtes qui ne contiennent pas de preuves expérimentales. L’option déroulante Réseau à partir de la sélection a été sélectionnée (flèche rouge). Les arêtes ont été sélectionnées/désélectionnées dans le tableau des arêtes (flèche verte). Les fichiers de réseau d’amorçage, de liste de bord et de liste de nœuds ont été téléchargés en cliquant sur leurs boutons respectifs (flèches jaunes). La table Edge affichée concerne les dernières données de série chronologique répertoriées dans le fichier de configuration two_wts_EdgeFinding_config.txt (fichier supplémentaire 7). Lors de la sélection des arêtes pour le réseau d’amorçage ou la liste de périphérie en fonction des résultats LEM, il est important d’examiner les dernières données de série chronologique répertoriées dans le fichier de configuration, car cette sortie intègre tous les fichiers de données précédents dans son inférence des relations réglementaires entre les nœuds. Veuillez cliquer ici pour voir une version agrandie de cette figure.

Figure 6 : Exemple de résultats de recherche de réseau IDP dans l’IDV à partir de l’utilisation du fichier de configuration IDP two_wts_NetFind_rd1_config.txt (fichier supplémentaire 11). (A) La requête Cycle complet stable a été sélectionnée (flèche rouge) pour afficher les données respectives sur l’axe y dans le nuage de points. Les points bleus du nuage de points représentent les points sélectionnés à l’aide de la fonction Sélection de zone pour le nuage de points. La zone de sélection en pointillés a été illustrée pour montrer à quoi ressemble la sélection de la boîte. (B) Les entiers min et max de l’axe des y et de l’axe des x ont été saisis manuellement dans les réseaux sélectionnés à l’intérieur de ces limites (flèche verte). Après chaque sélection, le bouton Obtenir la prévalence edge à partir des réseaux sélectionnés (flèches jaunes) a été cliqué et les zones Edge Prevalence Table et Selected DSGRN Predicted Networks ont été générées. Dans l’index du réseau, vous pouvez cliquer sur les flèches haut et bas pour parcourir les réseaux sélectionnés (flèches bleues). Veuillez cliquer ici pour voir une version agrandie de cette figure.

Figure 7 : Exemple de résultats de recherche de réseau IDP dans l’IDV à partir de l’utilisation du fichier de configuration IDP two_wts_NetFind_rd2_config.txt (fichier supplémentaire 12). (A-C) La sélection des réseaux a été effectuée en entrant des valeurs dans les zones de saisie min et max (flèches rouges). Le bouton Obtenir la prévalence Edge à partir des réseaux sélectionnés a été cliqué pour générer les zones Edge Prevalence Table et Selected DSGRN Predicted Networks. (D) Les arêtes d’intérêt ont été sélectionnées dans le tableau edge_list (flèche jaune) et le bouton Soumettre (flèche verte) a été cliqué pour calculer les scores de similitude à tracer dans le nuage de points par rapport à la requête sélectionnée (flèche bleue). La fonction Box Select a été utilisée pour sélectionner un ensemble de réseaux (flèche violette) afin de générer les zones Edge Prevalence Table et Selected DSGRN Predicted Networks. L’index réseau a été augmenté à 2 (flèche orange) pour afficher le deuxième réseau de la sélection. Veuillez cliquer ici pour voir une version agrandie de cette figure.
| Terme | Étape du pipeline | Définition |
| de Lichtenburg par JTK-CYCLE (DLxJTK) | Recherche de nœuds | Une seule mesure quantitative de la périodicité et de la force de régulation utilisée pour classer les gènes. Combine les mesures de périodicité précédemment publiées de Lichtenberg (DL) et JTK-CYCLE (JTK). |
| Expression maximale du premier cycle | Recherche de nœuds | L’expression maximale des gènes au cours du premier cycle d’expression périodique des gènes. Les gènes ordonnés par First Cycle Max Expression seront ordonnés en fonction du point temporel du premier cycle auquel ils atteignent leur expression génique maximale. |
| L’ordinateur Edge local (LEM) | Recherche de bord | Méthode d’inférence de réseau bayésien qui classe les modèles potentiels d’interactions géniques pour identifier le ou les régulateurs et les modes de régulation (activation ou répression) les plus probables d’un gène cible donné à l’aide de données d’expression génique de séries chronologiques. |
| Réseau de semences | Recherche de réseau | Une première supposition d’un réseau plausible d’interactions mondiales en sélectionnant les bords LEM les mieux classés. La graine localise une région de l’espace réseau qui est très oscillatoire avec une forte probabilité de montrer une cohérence avec les données de séries chronologiques fournies. |
| Signatures dynamiques générées par les réseaux de réglementation (DSGRN) | Recherche de réseau | Un progiciel pour calculer de manière exhaustive la variété des comportements dynamiques à long terme qu’un réseau peut présenter. |
| Prévalence Edge | Recherche de réseau | Pourcentage de réseaux les mieux notés de l’étape de recherche de réseau qui incluent la périphérie en question. Le score permet un classement des arêtes qui ont une prévalence non nulle. |
Tableau 1 : Définition des termes Inherent Dynamics Pipeline et Inherent Dynamics Visualizer.
Fichier supplémentaire 1 : Données sur l’expression des gènes de la série chronologique (réplique 1) tirées d’Orlando, 200813. Veuillez cliquer ici pour télécharger ce fichier.
Fichier supplémentaire 2 : Données sur l’expression des gènes de séries chronologiques (réplique 2) tirées d’Orlando, 200813. Veuillez cliquer ici pour télécharger ce fichier.
Fichier supplémentaire 3 : Fichier d’annotation contenant tous les gènes trouvés dans le fichier supplémentaire 1 et le fichier supplémentaire 2. Veuillez cliquer ici pour télécharger ce fichier.
Fichier supplémentaire 4 : Fichier de configuration Inherent Dynamics Pipeline entièrement paramétré. Veuillez cliquer ici pour télécharger ce fichier.
Fichier supplémentaire 5 : Fichier de liste de gènes téléchargé à partir de la page De recherche de nœuds du visualiseur Inherent Dynamics. Veuillez cliquer ici pour télécharger ce fichier.
Fichier supplémentaire 6 : fichier d’annotation téléchargé à partir de la page De recherche de nœuds du visualiseur Inherent Dynamics. Veuillez cliquer ici pour télécharger ce fichier.
Fichier supplémentaire 7 : fichier de configuration du pipeline Dynamics inhérent paramétré uniquement pour l’étape Edge Finding. Veuillez cliquer ici pour télécharger ce fichier.
Fichier supplémentaire 8 : fichier réseau d’amorçage téléchargé à partir de la page Edge Finding d’Inherent Dynamics Visualizer. Veuillez cliquer ici pour télécharger ce fichier.
Fichier supplémentaire 9 : fichier de liste Edge téléchargé à partir de la page Recherche Edge du visualiseur Inherent Dynamics. Veuillez cliquer ici pour télécharger ce fichier.
Fichier supplémentaire 10 : fichier de liste de nœuds téléchargé à partir de la page Edge Finding d’Inherent Dynamics Visualizer. Veuillez cliquer ici pour télécharger ce fichier.
Fichier supplémentaire 11 : fichier de configuration du pipeline Dynamics inhérent paramétré uniquement pour l’étape de recherche de réseau. Veuillez cliquer ici pour télécharger ce fichier.
Fichier supplémentaire 12 : Mise à jour du fichier de configuration Du pipeline Dynamics inhérent (fichier supplémentaire 11) paramétré uniquement pour l’étape Recherche de réseau. Veuillez cliquer ici pour télécharger ce fichier.
Fichier supplémentaire 13 : Répertoire contenant les résultats de la section Résultats représentatifs. Veuillez cliquer ici pour télécharger ce fichier.
Les auteurs n’ont rien à divulguer.
Inherent Dynamics Visualizer est un ensemble de visualisation interactif qui se connecte à un outil d’inférence de réseau de régulation génique pour une génération améliorée et rationalisée de modèles de réseau fonctionnels. Le visualiseur peut être utilisé pour prendre des décisions plus éclairées pour paramétrer l’outil d’inférence, augmentant ainsi la confiance dans les modèles résultants.
Ce travail a été financé par la subvention NIH R01 GM126555-01 et la subvention NSF DMS-1839299.
| Docker | https://docs.docker.com/get-docker/ | ||
| Git | https://git-scm.com/ | ||
| Inherent Dynamics Pipeline | https://gitlab.com/biochron/inherent_dynamics_pipeline | ||
| Inherent Dynamics Visualizer | https://gitlab.com/bertfordley/inherent_dynamics_visualizer | ||
| Miniconda | https://docs.conda.io/en/latest/miniconda.html | ||
| Pip | https://pip.pypa.io/en/stable/ |