March 12th, 2012
La base de données ITS2 est un atelier pour la séquence d'inférence phylogénétique considérant simultanément et de la structure secondaire de l'espaceur interne transcrit 2. Cela comprend la collecte de données avec l'annotation précise, prédiction de la structure, plusieurs séquence-structure d'alignement et de calcul d'arbre rapide. En un mot, ce plan de travail simplifie les analyses phylogénétiques premiers à quelques clics.
Le gène ribosomique de l’espaceur deux transcrit interne ou I TS deux est l’un des marqueurs les plus importants de la systématique moléculaire. Les recherches des 20 dernières années se sont principalement concentrées sur l’exploitation des séquences ITs deux pour la reconstruction phylogénétique. Cependant, la structure secondaire de I TS deux est de plus en plus utilisée dans le domaine de l’inférence phylogénétique pour plusieurs raisons.
L’analyse de la structure secondaire étend l’applicabilité taxonomique de ce marqueur, tandis que la séquence I TS deux, qui évolue rapidement et donc très variable, est principalement adaptée à l’analyse phylogénétique au niveau de l’espèce ou à un niveau inférieur. L’ajout d’informations structurales permet une analyse à un rang taxonomique plus élevé simultanément en raison de la structure secondaire fortement conservée de ses deux éléments caractéristiques. Ainsi, les résultats de l’analyse de la structure secondaire peuvent améliorer la résolution phylogénétique obtenue à partir de la séquence primaire.
Bienvenue, chers collègues, je m’appelle Matthias Wolf. Je travaille dans le domaine de la preuve I ts two depuis environ huit ans maintenant. Je travaille ici au département de bio-informatique du centre de biologie de l’Université de Würzburg en Allemagne.
Aujourd’hui, nous aimerions vous présenter une petite vidéo sur l’utilisation de la base de données Its deux. Bonjour, je m’appelle Chu. La raison de ce film est que la base de données I Ts two n’est en fait pas seulement une base de données de stockage, mais nous fournissons également de nombreux outils qui vous permettent d’améliorer votre analyse phylogénétique.
Dans cette vidéo, nous voulons vous montrer comment travailler avec ces outils et comment connecter tous ces outils ensemble. C’est bien ça. La délimitation de la séquence I Ts deux peut être cruciale pour la prédiction de la structure. Par conséquent, une interface Web pour l’annotation basée sur le modèle de marquage caché a été implémentée.
Pour obtenir une annotation correcte de vos deux séquences I Ts, vous pouvez les coller dans l’éditeur de séquences en haut du site Web. Ceci est démontré en chargeant les exemples de séquences de plans. L’éditeur de séquences lui-même vérifie si vos deux séquences I TS sont valides ou non, et génère des messages d’erreur.
Par exemple, lorsque vous utilisez des caractères non PAC Après avoir choisi le HMM correct, vous pouvez démarrer le processus en cliquant sur annoter toutes les 5,8 s et 28 SRNA qui pouvait être identifié par le programme est supprimé, laissant les deux séquences correctement annotées, qui étaient situées entre les deux. En conséquence, deux séquences délimitées de TS sont montrées ainsi que l’hybride prédit de 5,8 s et 28 S-R-R-N-A. Pour confirmer l’exactitude des annotations HMM après l’annotation de deux séquences nouvellement conservées, les structures secondaires peuvent être déterminées de deux manières.
La première prédiction peut être réalisée par modélisation par homologie avec l’ensemble complet des séquences et des structures de la base de données servant de modèles. Pour prédire la structure de votre annoté, ses deux séquences de clic prédisent la structure. Si votre séquence droite peut se replier directement dans la structure secondaire typique de ses deux, le résultat est représenté immédiatement.
Vous pouvez désormais choisir entre plusieurs options pour traiter davantage votre structure de séquence, y compris l’ajouter à votre pool de données. Si vous êtes ici, deux séquences ne peuvent pas se plier directement, une recherche rapide dans la base de données est effectuée. La page résultante montre les meilleurs coups de souffle, y compris la modélisation d’homologie pour chaque plastique comme modèle.
En cliquant sur le signe plus, les détails s’affichent, vous pouvez sélectionner les paires de structure de séquence de votre choix et les ajouter au pool de données, soit par piste et dépôt, soit en utilisant le menu contextuel avec le clic droit. Une deuxième approche consiste à saisir manuellement une ou plusieurs séquences, y compris leurs structures secondaires en tant que modèles pour transférer les structures secondaires les plus appropriées à vos séquences de requête. Ceci est démontré en chargeant le fichier d’exemple pour plusieurs modèles.
En cliquant sur Prédire les meilleurs modèles, vous effectuez la modélisation d’homologie avec les paramètres par défaut. Le programme de modélisation d’homologie calculera tout par rapport à toutes les structures et affichera les meilleures combinaisons de modèles de requête. Dans la table résultante, vous pouvez voir quels modèles ont réussi à utiliser leur structure secondaire pour modéliser une ou plusieurs séquences de requête.
Encore une fois, les détails des résultats peuvent être ouverts en cliquant sur le signe plus car l’approche complète de modélisation d’homologie est indépendante de l’approche I TS deux. Il peut être utilisé pour prédire la structure secondaire de n’importe quel ARN à partir d’une molécule homologue avec une structure connue. De plus, les paires de structures de séquence résultantes peuvent être ajoutées au pool de données par glisser-glisser ou via le menu contextuel, qui s’ouvre avec le clic droit.
En plus de la structure globale, des motifs conservés comme la séquence A-U-G-G-U précédant l’apex de la troisième hélice et une pyramide de périne en décalage dans la deuxième hélice ont été décrits pour la séquence I TS deux. Ce décalage UU est entouré de deux motifs, l’un à gauche de l’hélice deux et l’autre à droite entre l’hélice deux et l’hélice trois avec un nucléotide triple A supplémentaire. Après avoir transformé ces motifs de séquence en hms, nous fournissons maintenant l’identification de ces motifs dans des séquences d’intérêt.
Pour rechercher ces motifs, entrez votre séquence de requête dans le champ de recherche et choisissez le modèle approprié. Encore une fois, cela est démontré en chargeant le fichier d’exemple pour les plans. Pour commencer les calculs, cliquez sur recherche de motif.
Deux motifs sont annotés et mis en évidence dans vos séquences de requêtes. La fonction de recherche permet de récupérer des paires de structures de séquences à partir de la base de données I. Ts deux. Il permet à l’utilisateur de rechercher des structures de séquence soit par nom de taxon, soit par identifiant de banque de génération.
Pour rechercher une structure de séquence par identifiant GenBank, tapez l’IG dans le champ de recherche et cliquez sur rechercher. Une liste de résultats apparaît dans un nouvel onglet. Vous pouvez afficher les détails d’une structure de séquence en cliquant sur afficher les détails.
En outre, vous pouvez afficher la séquence S directes de tous les accès dans l’onglet en cliquant sur afficher la structure de séquence par glisser-déposer, ou via le menu contextuel avec un clic droit, les structures de séquence de votre choix peuvent être ajoutées au pool de données. En plus de la recherche de paires de structures de séquences par gi, vous pouvez taper un nom de taxon dans le champ de recherche, qui est pris en charge par une boîte de recherche en direct qui apparaît. Une fois que le nouvel onglet apparaît répertoriant tous les résultats, vous pouvez accéder aux mêmes fonctions qu’auparavant.
Par exemple, l’ajout de la sélection au pool de données par glisser-déposer. La deuxième possibilité de récupérer des paires de structures de séquences à partir de la base de données est la fonction de navigation. Ici, les textes sont assortis.
Selon la base de données de taxonomie NCBI, les données sont accessibles via la structure arborescente. À gauche du site web. En cliquant sur le signe plus, vous pouvez afficher le texte un niveau en dessous.
D’un clic sur le nom d’un taxon, vous ouvrez un nouvel onglet contenant chaque structure de séquence, paire du taxon. En plus de la recherche de séquences et de structures à l’aide d’identificateurs de banque de MEC ou d’informations sur les espèces, la base de données I Ts two permet également une recherche basée sur le dynamitage. Cependant, les procédures d’explosion exceptionnelles ne sont souvent pas en mesure d’identifier des personnes éloignées.
Il y a deux séquences en raison de la grande divergence de séquence. Pour surmonter cet obstacle, nous avons mis en œuvre une recherche par souffle basée sur la séquence et la structure qui comprend des informations sur la structure hautement conservée pour la recherche d’homologie. Cela se fait en traduisant la structure de la séquence en une séquence pseudo-protéique de 12 lettres.
Ainsi, l’échantillonnage d’espèces commence par n’importe quelle séquence d’intérêt et couvre. Les vastes gammes taxonomiques sont devenues aussi simples qu’une recherche à grande échelle. Pour effectuer une recherche éclair, vous pouvez taper vos séquences de requête dans l’éditeur de séquences.
Si votre séquence de requête est une séquence de nucléotides simple sans structure, un algorithme blast n commun est utilisé pour les séquences incluant leurs structures secondaires. L’interface web utilise l’algorithme I Ts two blast. Démarrez le processus en cliquant sur blast.
Après quelques instants, vos coups de souffle sont répertoriés dans un nouveau tapotement. Ici, vous voyez un clic pour chaque séquence de requête. En cliquant sur afficher les alignements, vous pouvez faire défiler les alignements en plâtre. Comme auparavant, vous pouvez sélectionner les paires de structures de séquence de votre choix et les placer dans le pool de données.
Au cours de votre travail sur la base de données ITS two, votre pool de données s’est peut-être rempli de plusieurs structures de séquence. Vous pouvez accéder à votre pool de données à tout moment et afficher son contenu. L’étape suivante de votre analyse est l’alignement de la structure à séquences multiples.
Cliquez sur analyser l’ensemble de données, puis sur la séquence et la structure pour effectuer l’alignement de la structure de la séquence. Maintenant, il vous est demandé de sélectionner le mode graphique de votre alignement. Pour un grand nombre de séquences, il est recommandé de sélectionner la version slim.
Comme notre pool de données ne contient que quelques structures de séquences, nous choisissons le mode graphique complet. Une fois le calcul terminé, l’alignement est ajouté à votre pool de données. En mettant en surbrillance un côté d’une paire de bases, vous mettez automatiquement en surbrillance son homologue.
Enfin, l’alignement peut être sûr avec un clic sur l’alignement sûr. Une fois que vous êtes satisfait de la qualité de l’alignement de votre structure de séquence, vous pouvez calculer un arbre de jonction de voisin phylogénétique en cliquant sur analyser l’ensemble de données, puis sur neighbor. La jonction de l’arborescence résultante apparaît dans un nouvel onglet.
Vous pouvez mettre à l’échelle votre arbre librement à l’aide de la barre de défilement, le réacheminer en cliquant sur un nœud ou une feuille arbitraire de l’arbre, puis le rediriger vers ce nœud. Si vous souhaitez supprimer un taxon de votre pool de données, cliquez sur la feuille et choisissez. Supprimez ce nœud du pool.
Vous pouvez maintenant recalculer votre alignement et votre arbre avec un échantillonnage de taxons réduit en cliquant sur l’arbre sûr. Vous pouvez enregistrer votre arbre phylogénétique au format NU. Cliquez sur à propos de ce site Web et sur les outils pour trouver des informations supplémentaires sur les outils autonomes à vendre et les avantages.
En plus de l’alignement à la fonction de jonction du voisin également fournie par l’interface web de la base de données I Ts deux, vous pouvez maintenant accéder à plusieurs nouvelles fonctions, par exemple, l’espèce Del Limitation basée sur des modifications compensatoires. Au cours des dernières minutes, nous avons voulu vous montrer quelques astuces pour améliorer votre analyse phylogénétique. Nous vous avons montré comment rassembler vos données à partir de la base de données I Ts deux, les aligner avec quatre cellules, et enfin calculer vos arbres avec Pro S.In toutes ces étapes, nous n’avons pas seulement pris en compte la séquence, mais aussi la séquence et la structure. Sûr.
Nous espérons que vous avez apprécié notre petit film et la construction d’arbres lourds. Bonne nuit.
La base de données ITS2 sert d'outil complet pour l'analyse phylogénétique, intégrant des données de séquence et des informations sur la structure secondaire de l'espaceur transcrit interne 2 (ITS2). Elle facilite une annotation précise, une prédiction de structure et un alignement, rationalisant ainsi le processus d'analyse phylogénétique.