PathWhiz est un outil de dessin de voie en ligne complète pour générer des voies biochimiques et biologiques. Il utilise des bases de données accessibles au public et facilement extensibles palettes constituées de composants pré-dessinés voie. Ce protocole décrit comment construire facilement de nouvelles voies, reproduire et modifier les voies existantes, et de propager les voies précédemment tirées à différents organismes.
PathWhiz est un serveur Web intégré pour faciliter la création de diagrammes colorés, de la voie visuellement agréable interactifs qui sont riches en informations biologiques. Les voies générées par cette application en ligne sont entièrement compatibles avec pratiquement tous les navigateurs Web et les systèmes d'exploitation d'ordinateur lisible par machine et. Il utilise un, chemin interface de dessin compatible Web spécialement développé qui permet la sélection et le placement des différentes combinaisons d'entités biologiques ou biochimiques pré-dessinés pour décrire les réactions, les interactions, les processus de transport et d'événements de liaison. Cette palette est constituée d'entités de composés chimiques, des protéines, des acides nucléiques, des membranes cellulaires, les structures sous-cellulaires, des tissus et des organes. Tous les éléments visuels, il peut être ajusté et personnalisé de manière interactive. En outre, parce que cet outil est un serveur Web, toutes les voies et les éléments de la voie sont accessibles au public. Ce genre de parcours "crowd sourcing" signifie que PathWhizcontient déjà une grande et rapide collection croissante de voies précédemment tirées et les éléments de la voie. Nous décrivons ici un protocole pour la création rapide et facile des voies nouvelles et la modification des voies existantes. Pour faciliter encore le montage de la voie et de la création, l'outil contient des fonctions de réplication et de propagation. La fonction de réplication permet des voies existantes pour être utilisés comme modèles pour créer ou modifier de nouvelles voies. La fonction de propagation permet de prendre une voie existante et automatiquement propager à travers les différentes espèces. Pathways créés avec cet outil peuvent être "re-style" dans différents formats (KEGG-like ou d'un texte-livre comme), coloré avec différents milieux, exportés vers BioPAX, SBGN-ML, SBML ou PWML formats d'échange de données, et téléchargé comme PNG ou SVG images. Les voies peuvent être facilement intégrés dans les bases de données en ligne, intégré dans des présentations, des affiches ou des publications ou utilisées exclusivement pour la visualisation en ligne et d'exploration. Cette protocole a été appliquée avec succès pour générer plus de 2000 diagrammes de la voie, qui se trouvent désormais dans de nombreuses bases de données en ligne, y compris BDMH, DrugBank, SMPDB et ECMDB.
diagrammes de voie biologique sont comme des plans pour les scientifiques de la vie. Ils sont peut-être les itinéraires les plus concis et informatifs pour dépeindre les processus biologiques et les connexions contextuelles entre les gènes, les protéines et les métabolites. Ceci est parce que les images sont beaucoup plus efficacement traitées et souvent beaucoup plus faciles à comprendre par les humains que le texte 1. La qualité, le détail et le contenu des diagrammes de la voie peuvent varier considérablement. Ces différences dépendent souvent de la destination de la voie et les compétences de l'artiste de la voie. Pathways créés à des fins éducatives telles que des tableaux muraux ou manuels sont souvent créés par des artistes professionnels. En conséquence, ces schémas de voie sont beaucoup plus agréable visuellement et offrent beaucoup plus en détail biologique avec des représentations complètes de structures de métabolites, des composants subcellulaires, des structures cellulaires, des tissus et des organes. Ces représentations "de manuels scolaires» incluent souvent des notes détaillées etcommentaires. D'autre part, les diagrammes de voie conçus pour des applications Internet doivent souvent sacrifier l'art et la richesse visuelle en faveur des machines lisibles "câblage" schémas simplifiés. Ces diagrammes filaires sont plus facilement image cartographiée et hyperlinked. Diagrammes de voie simplifiées sont la base de ces bases de données de la voie en ligne populaires comme KEGG 2, metacyc 3, Wikipathways 4 et Reactome 5. L'émergence de bases de données de la voie compatible avec l'ordinateur a également conduit à l'apparition d'outils de dessin de voie compatible avec l'ordinateur. En d'autres termes, on n'a pas besoin d'être un artiste professionnel ou un programmeur professionnel pour générer des diagrammes de voie utilisables. Par exemple, les outils de Pathway BioCyc 6 et le logiciel de PathVisio de Wikipathway 7 permettent aux utilisateurs de générer librement et de partager des voies lisibles par machine dans BioPAX 8 and / ou format HTML. En outre, il y a un certain nombre d'autres paquets de freeware autonomes ainsi que des emballages commerciaux qui prennent en charge la génération de différentes voies lisible par machine, fil de fer, tels que Cytoscape 9, GenMAPP 10, PathCase 11 et Vasant 12.
La simplification des schémas de la voie d'Internet largement augmenté dans les limites historiques trouvés dans de nombreux navigateurs Web et des outils de rendu basés sur le Web. Cependant, des progrès significatifs dans les technologies web ont été réalisés au cours des dernières années. Cela suggère qu'il pourrait être possible de générer interactifs, des diagrammes de la voie Internet compatible qui sont tout aussi coloré, tout comme esthétiquement agréables et tout aussi biologiquement complets que ceux trouvés dans les manuels scolaires. Ce travail a conduit à l'élaboration de PathWhiz. PathWhiz a été mis en œuvre en utilisant un Ruby on Rails (http://rubyonrails.org, la version 4.2.0) framewor webk incorporant une base de données relationnelle MySQL (https://www.mysql.com, la version 1.5.50) pour gérer toutes les données de la voie, y compris les relations entre les entités, les références externes, les descriptions, les spécifications de visualisation et de structures chimiques. Le client Web front-end est contrôlé par Ruby on Rails combinés avec Backbone.js (http://backbonejs.org, la version 1.0.0) en tant que framework web front-end pour l'éditeur.
Initialement développé pour la curation de la seule base de données humaine Petite Molécule Pathway (SMPDB) 13, PathWhiz 14 a depuis été étendu pour soutenir la génération voie pour de nombreux autres organismes et de fonctionner comme une image de la voie générale et base de connaissances. En particulier, cet outil web permet la création de la gamme complète des voies biochimiques / biologiques, y compris métabolique, l'interaction de la protéine, la signalisation moléculaire, physiologique, et les voies de médicament / maladie. Cet outil de dessin de la voie diffère de la plupart des autresoutils voie de génération de trois façons principales: 1) il est un serveur Web plutôt que, un progiciel installable autonome; 2) elle prend en charge la génération facile et une visualisation interactive des composés chimiques, des protéines, des acides nucléiques, des membranes cellulaires, les structures sous-cellulaires, des tissus et d'organes; et 3) il permet aux utilisateurs d'emprunter facilement, construire ou améliorer sur le travail d'autres utilisateurs, permettant ainsi "crowdsourcing" génération voie. Comme un serveur web, il a plusieurs avantages par rapport, des outils logiciels spécifiques à la plateforme téléchargeables. En particulier, il est compatible avec tout système d'exploitation de la plate-forme et le navigateur web moderne. En outre, il ne nécessite pas l'utilisateur d'enregistrer afin de commencer à créer une voie (bien que les utilisateurs peuvent librement créer un "compte privé" afin de suivre et de contrôler l'accessibilité des voies qu'ils créent). Peut-être la caractéristique la plus attrayante de cet outil est la quantité de détails biologiques et biochimiques qui peuvent être facilement ajoutés danstoute voie à travers une palette d'images pré-rendus et une vaste base de données de protéines et des données biochimiques. Cela permet à la fois «non-artistes» et «non-programmeurs" de créer facilement des voies colorées, esthétiques et richement détaillées qui sont compatibles avec le Web et entièrement lisible par machine. Une comparaison plus détaillée entre PathWhiz et d' autres outils de dessin de voie est fourni dans le tableau 1.
Un certain nombre de bases de données de sciences de la vie populaire ont déjà utilisé cet outil de dessin de la voie pour créer spécifiques à la base de données, en ligne, des diagrammes de voie interactifs. Par exemple, la base de données Escherichia coli Métabolome (ECMDB) 15 récemment mis à jour sa bibliothèque de parcours avec plus de 1.650 voies tracées en utilisant web outil. Chaque voie dans le ECMDB est maintenant affiché comme une carte richement colorée, entièrement hyperlinked image avec des métabolites et de la structure des protéines représentations détaillées, ainsi qu'un KEGG-l en noir et blanc simplifiéeike diagramme de fil. Cette mise à jour de la voie à grande échelle a conduit à la découverte de nombreux métabolites intermédiaires qui n'a pas été auparavant inclus dans les autres bases de données métaboliques Escherichia coli. D' autres bases de données telles que la base de données du métabolome humain (BDMH) 15 non seulement reposent sur les voies PathWhiz pour illustrer et décrire les voies métaboliques et de signalisation, mais aussi pour décrire les changements métaboliques impliquées dans des maladies telles que le cancer. BDMH comprend actuellement 101 voies métaboliques, 376 voies d'action des médicaments, 233 voies associées à des maladies et 16 voies de signalisation, tous générés par cet outil Web.
Le protocole suivant décrit en détail comment PathWhiz peut être utilisé pour créer, reproduire, et de propager les voies biochimiques pour une variété de buts et applications.
Le protocole décrit ici pour la création d'une voie métabolique simples (le cycle TCA) peut être adapté pour créer une grande variété de lisibles à la machine, les voies biologiquement complexes pour toutes les espèces. En outre, ce protocole décrit également comment on peut répliquer ou propager des voies existantes créées par d'autres utilisateurs. La construction d'une voie à l'aide de cet outil nécessite répétées additions étape par étape des réactions, les interactions, les processus de transport, et des sous-voies, qui sont chacun reliés par des éléments qui se chevauchent. Mettre tout cela ensemble permet de créer des diagrammes colorés, de la voie visuellement agréable qui fournissent des détails biologique considérable et le contexte biologique utile. Les étapes décrites dans ce protocole sont relativement simples, et le temps qu'il faut pour construire un diagramme de la voie dépend de la taille et de la complexité de la voie. Avec un peu de pratique, la plupart des individus peuvent rendre un diagramme de la voie de haute qualité composé d'environ 15-20 réactions ou processus d'unej plusieurs composants cellulaires à environ 15 min. Une marque nouvel utilisateur peut prendre jusqu'à 30-40 min pour générer une voie de la taille et de complexité similaires. Le temps nécessaire pour générer une voie est à peu près linéaire avec le nombre de réactions / processus qui doivent être rendus.
Création d'une voie de haute qualité grâce à cet outil basé sur le Web dépend de la qualité et le détail de la source du matériel (voies de livres, bases de données en ligne, des données expérimentales, des croquis dessinés à la main) et la méticulosité de la voie «artiste». Ceux qui souhaitent générer des plus élevés des diagrammes de la voie de la qualité doivent accorder une attention particulière aux articles 1.11, 1.15 et 1.20 du protocole, étant donné que ces sections décrivent la création et l'édition des éléments de réaction (réactifs / produits, des enzymes, des arêtes, des images, des boîtes de zoom, des étiquettes, et membranes). Les meilleurs schémas de voie seront intelligemment fusionner des informations provenant d'autant de représentations existantes de la voie que possible, y compris ceux trouvés dans books, affiches, journaux et bases de données en ligne. Une autre clé pour générer des voies de haute qualité est de vérifier soigneusement l'exactitude des réactions avant de créer une réaction (par l'article 1.11 du protocole). Prendre le temps et d'efforts pour assurer que les réactifs, les produits, et les enzymes impliqués (dont beaucoup existent déjà en grande base de données de PathWhiz) sont correctes pour chaque espèce est très importante. Il est également important d'être conscient de la localisation cellulaire des réactions et d'inclure des composants cellulaires ou subcellulaires clés afin de fournir le contexte biologique correct. Cela peut être fait en vérifiant et en corroborant la réaction grâce à des bases de données en ligne tels que UniProt. Avoir toutes les informations nécessaires à portée de main, avec un croquis, dessiné à la main de la voie à créer permettra de réduire considérablement les erreurs et le temps total passé sur le dessin ou le rendu.
Comme on pouvait s'y attendre, les voies complexes plus grands et plus prendront plus de temps pour rendre, particculièrement si les éléments et les processus souhaités ne sont pas déjà dans la base de données PathWhiz. Lorsque vous travaillez avec de grandes voies, il est généralement sage de passer du mode Autosave au manuel mode d'économie, afin d'éviter un long décalage entre les actions. Lors de la réplication d'un chemin, la durée pendant laquelle l'utilisateur peut attendre que la voie doit être généré en fonction du nombre d'éléments de la voie. La plupart des voies peuvent être répliqués dans environ 1-2 min. Lorsque la propagation d' une voie, rendu réussie de la voie nouvellement propagé dépend de la façon similaire , les deux espèces sont, comme utilise PathWhiz BLAST 17 séquence recherches pour trouver des enzymes homologues entre les espèces. Grandes voies seront plus lents à se propager parce que BLAST devra être exécuté sur un plus grand nombre d'enzymes. Tenter de se propager de manière significative les voies entre espèces différentes (disons entre la levure et les humains) se traduira par des voies étant rendus avec un certain nombre de protéines inconnues. Ces "lointainement" pvoies ropagated nécessitent généralement l'édition manuelle supplémentaire. En raison de la nature hautement visuelle des schémas de la voie et le détail qui peut être amené à une voie, il est toujours une bonne idée de travailler sur un ordinateur avec un assez grand écran (> 20 pouces ou> 50 cm) et une bonne connexion Internet (> 5 mbps).
Si les problèmes de rendu ou de l'actualisation de l'écran sont rencontrés, l'utilisateur peut avoir à faire une petite quantité de dépannage. Si une grande voie complexe prend trop de temps pour mettre à jour, l'utilisateur peut avoir à rafraîchir la page. Si une voie ne se propage pas comme prévu, l'utilisateur peut avoir à faire un peu de montage manuel pour assurer que tous les éléments sont affichés correctement. En outre, comme un exemple plus précis, si les éléments d'une réaction ne sont pas affichées, l'utilisateur devra peut-être faire en sorte que tous les éléments ou les enzymes sont bien choisis et les bords ne sont pas cachés. Le lien «Aide» sur l'en-tête principale peut être utile si un problème est rencontré. Un tutoriel estdisponible sous l'onglet "Tutorial" et un manuel d'utilisation est disponible sous l'onglet «Guides de l'utilisateur". Les deux expliquent de nombreuses fonctions de l'outil en détail. Le Guide de l'utilisateur peut être utilisé pour résoudre ou expliquer les limites potentielles pour une caractéristique particulière, par exemple lorsqu'un utilisateur verrouille une voie et plus tard souhaite modifier.
Comme l'a souligné par ce protocole et à travers les exemples fournis dans les figures annexées, cet outil offre un certain nombre de caractéristiques uniques ne trouve pas dans tous (ou la plupart) d' autres outils de dessin de la voie (voir tableau 1). Tout d'abord, il est entièrement basé sur le Web et complètement indépendant de la plateforme. Deuxièmement, il prend en charge le rendu et la génération aisée de multicolores, biologiquement complexes, visuellement agréable, des diagrammes de voie entièrement hyperlinked qui peuvent également être convertis en formats lisibles par machine (BioPAX, SBGN-ML 18, SBML 19, PWML 14). Troisièmement, les diagrammes de voie genrested par cet outil peut être consulté, recherché, sélectionné et facilement exploré à travers une interface facile à utiliser la base de données en ligne et la visualisation. Quatrièmement, l'outil Web est conçu pour soutenir les contributions de la voie communautaire, permettant de "crowd sourcing voie" qui encourage le partage et la génération de nouvelles voies et de nouveaux éléments de la voie.
Pathways générées par cet outil basé sur le Web peuvent être utilisés pour une variété d'applications. Richement détaillées, des voies entièrement hypertexte peuvent être facilement intégrés dans les bases de données spécifiques à l'organisme pour la protéomique, métabolomique ou des applications en biologie des systèmes. voies accessibles par Internet sont particulièrement utiles à des fins d'éducation et de formation, comme les détails disponibles à travers des images basées sur le Web sont souvent beaucoup plus grande que ce qui peut être affiché par l'intermédiaire d'une image statique ou par l'intermédiaire d'une page de manuel ou d'un journal unique. Cet outil basé sur le Web prend également en charge la génération de représentations de la voie qui sont plus adaptés pour l'impression et la publication.En conséquence, de nombreuses images générées par cet outil basé sur le Web apparaissent dans les journaux, des affiches et des présentations de diapositives. Exportation des voies dans des formats de fichiers d'échange de données à base de texte (tels que BioPAX et SBML) permet de chemins générés en utilisant ce serveur Web pour être utilisés directement dans l'analyse informatique pour la biologie des systèmes ou des applications de modélisation métaboliques. Propager les voies entre les espèces permet des inférences à effectuer sur les processus biologiques, en particulier parmi les espèces qui ont été très récemment séquencés. Bien que toutes les voies existantes existent actuellement dans PathWhiz, sa base de données de la voie publique ne cesse de croître, ce qui conduit à l'émergence de nouvelles collections de la voie foule de source. Ces collections ne seront pas seulement être facilement extensible à de nouvelles espèces, ils nous l'espérons conduire à une meilleure compréhension de leur biologie unique et biochimie.
The authors have nothing to disclose.
Les auteurs tiennent à remercier les Instituts de recherche en santé (IRSC) et Génome Alberta, une division de Génome Canada, pour un soutien financier.
Computer with colour screen | N/A | N/A | >20 inches or >50 cm |
Internet connection | N/A | N/A | >5 mbps |
Modern web browser | N/A | N/A | Google Chrome (v. 31 and above), Internet Explorer (v. 9 and above), Safari (v. 7 and above), Opera (v. 15 and above) and Firefox (v. 23 and above) |