July 16th, 2017
Un protocole pour l'étude en ligne des relations protéines-structure-structure dynamique utilisant Bio3D-web est présenté.
L’objectif global de Bio3D-web est de permettre l’analyse interactive de la séquence, de la structure et de la diversité de confirmation des familles de protéines. Bio3D-web est une nouvelle application Web qui peut nous aider à comprendre les relations entre la séquence, la structure et la dynamique au sein de grandes familles de protéines. Le principal avantage de Bio3D-web est qu’il fournit une analyse interactive et reproductible en ligne des séquences, des structures et des dynamiques ne nécessitant aucune connaissance préalable en programmation de la part de l’utilisateur.
Pour saisir une structure à analyser, obtenez l’ID PDB de l’adénylate kinase en effectuant une recherche dans la base de données des protéines. Entrez l’ID PDB de quatre caractères pour l’adénylate kinase ou collez une séquence protéique dans la zone de texte de la structure d’entrée ou du panneau de séquence. Cliquez sur le bouton bleu de sélection du prochain résultat dans le premier panneau, ou faites simplement défiler jusqu’à la sélection du panneau B pour une analyse plus approfondie.
Assurez-vous que le curseur Limiter le nombre total de structures incluses est défini sur sa valeur maximale pour inclure toutes les structures au-dessus de la limite. Abaissez le seuil d’inclusion BitScore pour inclure les accès plus éloignés ou augmentez-le pour exclure. Assurez-vous que les accès sélectionnés représentent des structures pertinentes en inspectant les détails de la table, tels que le nom de la PDB, l’espèce et les ligands liés.
Cliquez sur l’onglet Aligner pour effectuer l’alignement séquentiel des structures sélectionnées à partir de l’onglet de recherche. Il existe une émergence potentielle d’erreurs d’alignement, en particulier lors de l’analyse de protéines plus éloignées, par exemple lorsque la similarité de séquence est inférieure à 30 %Vérifiez et corrigez toujours l’alignement de la séquence dans l’onglet d’alignement. Examinez le résumé de l’alignement dans le panneau A.
Assurez-vous que les régions d’intérêt sont alignées et ne sont pas masquées par des lacunes dans une ou plusieurs structures. Cliquez sur le bouton bleu d’analyse suivant pour effectuer une analyse de clustering basée sur la séquence des structures collectées. Ensuite, cliquez sur le bouton bleu de conservation suivant pour calculer la conservation des résidus par colonne.
Sélectionnez les ensembles de structures alignées pour générer un graphique de la conservation des résidus à chaque position d’alignement. Effectuez la superposition de la structure en entrant dans l’onglet ajuster. Assurez-vous que les structures protéiques sont superposées aux régions correspondantes et pertinentes par une inspection visuelle.
Cliquez et faites glisser la souris sur la structure pour la faire pivoter, puis faites défiler pour zoomer. Ajustez la coloration des structures en cliquant sur les options de couleur. Cliquez ensuite sur le bouton bleu d’analyse suivant pour effectuer un clustering basé sur la structure des structures PDB collectées.
Basculez la carte thermique RMSD dans le menu déroulant des options de tracé. Cliquez sur le bouton bleu imbriqué RMSF pour afficher la variabilité de la structure de chaque résidu avec les principaux éléments de structure secondaires affichés dans les régions marginales de l’axe des abscisses. Effectuez une analyse en composantes principales en accédant à l’onglet ACP.
Pour visualiser les composants principaux, cochez la case Afficher la trajectoire du PC pour visualiser les mouvements décrits par les composants principaux à l’aide de l’outil de visualisation intégré au navigateur. Assurez-vous que le composant principal un est sélectionné dans le premier menu déroulant. Pour visualiser les mouvements décrits par d’autres composants principaux, choisissez le PC souhaité dans le menu déroulant Choisir le composant principal.
Projetez les structures individuelles sur deux PC sélectionnés en cliquant sur le bouton bleu Tracé suivant. Assurez-vous que PC sur l’axe X est défini sur un et PC sur l’axe Y sur deux. Pour projeter les structures sur d’autres composants principaux, ajustez la numérotation du PC en conséquence.
Cliquez sur n’importe quel point individuel du graphique pour étiqueter les structures. Vous pouvez également mettre en surbrillance une ou plusieurs structures dans le tableau Annotation du tracé conforme PCA sous le graphique. Calculez les contributions résiduelles aux différentes composantes principales en cliquant sur le bouton bleu suivant des contributions
résiduelles.Tracez les contributions pour les composants principaux supplémentaires en incluant le numéro de PC dans la zone de texte Choisir le composant principal. Cliquez sur l’onglet eNMA pour lancer le calcul du mode normal. Ajustez le nombre de structures en abaissant ou en augmentant la limite d’inclusion ou d’exclusion de structures.
Cliquez sur l’ensemble NMA d’exécution vert pour lancer le calcul de l’analyse en mode normal. Faites défiler jusqu’au deuxième panneau de l’onglet eNMA, appelé visualisation des modes normaux, pour la visualisation des modes normaux. Cliquez sur le bouton bleu Fluctuations suivantes pour calculer les fluctuations résiduelles des structures sélectionnées pour l’analyse d’ensemble en mode normal.
Basculez le cluster par RMSD pour colorer les profils de fluctuation par le clustering basé sur RMSD. Basculez la case à cocher des lignes de spread pour tracer les profils de fluctuation groupés les uns des autres. Ensuite, cliquez sur le bouton bleu suivant PCA versus NMA pour calculer la similitude entre les modes normaux individuels et les composants principaux.
Cliquez sur le bouton bleu suivant en bas pour générer un rapport des résultats d’analyse, des entrées définies par l’utilisateur et des choix de paramètres. Le rapport peut être téléchargé aux formats PDF, Word et HTML partageables. Le rapport comprend également un lien permettant de revenir ultérieurement sur la session d’analyse, qui peut également être partagé avec les collaborateurs.
Voici les structures PDB disponibles de l’adénylate kinase superposées au noyau invariant identifié. Les structures sont colorées en fonction du clustering basé sur RMSD fourni dans l’onglet ajustement. La visualisation des composantes principales est disponible à partir de l’onglet ACP pour caractériser les principales variations conformationnelles dans l’ensemble de données.
Ici, la trajectoire correspondant au premier composant principal est représentée dans une représentation du tube montrant le mouvement de fermeture à grande échelle de la protéine. Les structures sont projetées sur leurs deux premières composantes principales dans un graphique conforme montrant une représentation de faible dimension de la variabilité conformationnelle. Chaque point ou structure est coloré en fonction de critères spécifiés par l’utilisateur, dans ce cas, les résultats de clustering basés sur l’ACP.
L’analyse en mode normal dans l’onglet eNMA suggère une dynamique locale et globale améliorée pour les structures à l’état ouvert par rapport à l’état fermé. Bio3D-web peut être utilisé pour explorer des ensembles de séquences et de structures et aider à comprendre les tendances générales de la famille de protéines d’intérêt en quelques minutes. Bio3D-web m’a aidé à éclairer l’analyse structurelle de la superfamille des kinésines.
Bio3D-web fournit un flux de travail complet pour l’étude entièrement personnalisée des relations séquence-structure-dynamique. Ce flux de travail fournit des fonctionnalités pour la cartographie des relations d’interconformité avec l’ACP et la comparaison quantitative des dynamiques locales et mondiales à travers de grands ensembles de structures hétérogènes à l’aide de NMA d’ensemble. Il est prévu que la plupart des chercheurs utilisent Bio3D-web pour comprendre les tendances générales de leur famille de protéines d’intérêt, ce qui peut ensuite éclairer d’autres analyses spécialisées.
Bio3D-web est donc conçu comme un outil de génération d’hypothèses avec des rapports de synthèse partageables qui incluent tous les paramètres définis par l’utilisateur. Les résultats de Bio3D-web sont également téléchargeables et sont entièrement compatibles avec le package Bio3D-R pour une analyse plus approfondie. De nombreuses structures sont maintenant disponibles pour une famille de protéines donnée, souvent déterminées dans des conditions différentes.
La comparaison de ces nombreux nombreux types de structures peut nous renseigner sur les mécanismes structurels essentiels à leur fonction, tels que la liaison des ligands, la catalyse et la régulation allostérique. Bio3D-web est largement accessible et facile à utiliser, sans installation de logiciel dédié ni apprentissage d’un nouveau langage de programmation. Bio3D-web est pris en charge sur tous les principaux navigateurs.
Le code source complet et les instructions de configuration pour la configuration locale sont disponibles gratuitement.
Cet article présente un protocole pour l'utilisation de Bio3D-web, une application web conçue pour l'analyse interactive de la séquence, de la structure et de la dynamique des protéines. Elle permet aux chercheurs d'explorer les relations au sein de grandes familles de protéines sans nécessiter de connaissances en programmation.