Biology

ITS2序列数据库

Published: March 12, 2012 doi: 10.3791/3806

Benjamin Merget^1,2, Christian Koetschan¹, Thomas Hackl¹, Frank Förster¹, Thomas Dandekar¹, Tobias Müller¹, Jörg Schultz¹, Matthias Wolf¹

¹Department of Bioinformatics, Biocenter, University of Würzburg, ²Institute of Pharmacy and Food Chemistry, University of Würzburg

Summary

ITS2的数据库是一个进化的推论，同时考虑序列和二级结构的内部转录间隔2工作台。这包括数据收集，注释准确，结构预测，多序列结构的对齐和快速的计算。概括地说，这个工作台简化点几下首次系统发育分析。

Abstract

作为进化标记内转录间隔2（ITS2序列）已使用超过二十年。正如ITS2的研究主要集中ITS2序列非常变量，它低级别的系统发育只局限于此标记。然而，ITS2序列和它的高度保守的二级结构的组合，提高进化第^1号决议，并允许在多个分类的行列，包括物种划定^2-8进化推理。

ITS2序列^数据库，提出了详尽的内部转录间隔区序列从NCBI GenBank数据库^11，准确reannotated ¹⁰集。资料隐马尔可夫模型（HMMs）的注释，每个序列的二级结构进行了预测。首先，它是测试是否正确，四螺旋构象的最低能量的结果基于¹²倍（直接倍）。如果是这种情况并非如此，结构预测同源建模^13。在已知的二级结构同源建模，被转移到另一个ITS2序列的二级结构是不能够正确地折叠直接倍。

ITS2的数据库不仅是一个数据库，用于存储和检索ITS2序列结构。它还提供了多种工具，来处理自己的ITS2序列，包括注释，结构预测，主题检测和BLAST ¹⁴相结合的序列结构信息的搜索。此外，它集成了4SALE ^15,16修剪版本，ProfDistS ¹⁷多序列结构比对的计算和邻居加入¹⁸树重建。他们一起形成了一个从初始的序列集的连贯序列和二级结构为基础的系统发育分析管道。

简而言之，这个工作台简化首次系统发育分析只几下鼠标点击，而额外提供的综合性大型分析工具和数据。

Protocol

1。 ITS2序列的正确诠释

进入数据库系统发育的ITS2的工作台位置： http://its2.bioapps.biozentrum.uni-wuerzburg.de
开始你的分析，通过点击“注释”一节中的图标“工具”。然后，键入或粘贴到序列编辑器，在网站上方的序列。序列编辑器会自动检查，是否您的ITS2序列是有效的。
选择适合您的序列（如植物Viridiplantae）HMM模型。
按一下启动过程中的“注释。”
徘徊在“杂交”的图标，你可以查看5.8S和28S rRNA的混合的形象，作为一个确认的HMM标注的准确性。
点击绿色加号所产生的ITS2序列的符号，选择你的二级结构预测方法：为了预测没有已知templat的结构E，点击“预测结构。”如果你想使用自己的模板，同源建模，点击“模型结构。”

2。二级结构预测

预测
1. 序列编辑器会自动粘贴到注释的ITS2序列。
2. 要开始使用默认设置的二级结构预测，点击“预测结构”按钮。
3. 保存包括二级结构模型到数据池ITS2序列，并通过点击绿色加号，然后“添加到池。”另外，你可以把它添加到你的数据池，通过拖放（图1）。
4. 如果该序列不能直接折叠，同源建模最好的结果。保存最合适的序列结构通过拖放拖放到数据池。另外，用右键，然后在点击保存序列结构“添加到池中。”到的数据池
自定义建模
1. 键入或粘贴到一个或多个模板（与已知结构）上的序列编辑器。
2. 一个或多个目标序列输入或粘贴到较低的序列编辑器（无结构）。
3. 点击“预测最佳模板（S）”，开始使用默认设置的同源建模。
4. 显示在结果列表模板目标的最佳组合。
5. 通过拖放到数据池或由右键上点击保存您所选择的模型序列结构（S）“添加到池。”

3。 MOTIF搜寻

在网站顶部的序列编辑器中键入或粘贴到您的查询序列（S）。
选择正确的HMM模型（如植物Viridiplantae）。 3.3。 “母题搜索”，点击启动进程。
ITS2的序列与强调主题的插图特德在网站的底部。
点击图标旁边的序列头显示二级结构中突出的图案。

4。搜索和浏览

搜索
1. 键入一个类群名称或序列标识符（GI），将在网站顶部的搜索栏。
2. 由现场搜索框出现一个类群名称搜索支持。
3. 您可以执行一个由逗号分隔查询多个搜索。
4. 点击“搜索”按钮，执行搜索。
5. 你的结果会出现一个新的选项卡中列出。
6. 点击列名，根据特定的列进行排序的结果。您还可以添加或删除您所选择的列与列菜单。列名之内出现的箭头图标上点击列菜单可以进入。
7. 点击“显示细节”查看序列结构的细节。 </ LI>
8. 通过拖放到数据池或由右键上点击保存您所选择的序列结构（S）“添加到池。”
9. 保存结果到一个外部文件，点击“保存选择”或“全部保存”。
浏览
1. 通过在网站左侧的树状结构浏览浏览ITS2序列数据库。
2. 一个加号，点击查看类群低一个级别。
3. 一个类群的名称，点击打开一个新标签包含每个类群的序列结构。
4. 点击“显示细节”查看序列结构对细节。
5. 通过拖放到数据池或由右键上点击保存您所选择的序列结构（S）“添加到池。”
6. 保存结果到一个外部文件，点击“保存选择”或“全部保存”。

5。 ITS2的高炉

键入或粘贴到一个或多个查询序列，序列编辑器。您的序列可以是纯核苷酸序列或序列结构对。你也可以键入一个序列以下几个二级结构。通过检查框“序列化XXFASTA序列”作为单独的查询，随后使用这些结构。
到高炉开始使用默认设置，单击“爆炸”。根据您的查询的性质，无论是共同BLASTN程序或ITS2序列结构高炉进行。
打开一个子标签内出现标签为每个查询序列“BLAST结果”，以及执行搜索概述。
点击“显示对齐”，以查看计算的高炉路线。
通过拖放到数据池或由右键上点击保存您所选择的高炉点击“添加到池中。”
保存结果到一个外部文件，点击“保存选择“或”保存。“

6。多序列结构调整

点击“管理数据集”，然后旁边的放大镜符号的游泳池中的序列，在看看你的数据池。另外，您可以点击网站左下方的数据池的迹象。
在您的数据池的序列结构对点击查看其详细信息。
在游泳池中的所有序列结构对创建多序列结构对齐，单击“分析数据集”，然后“序列和结构。”
现在，你被要求选择你对齐的图形模式。如果您的对齐只包含几个序列，拒绝按一下苗条模式“号”否则，按一下选择纤细的图形模式“是的。”
在几分钟，你的对齐显示在新标签页（图2）。此外，它会自动保存到数据池。
为了节省您的对齐到一个外部文件，点击“保存对齐”。

7。进化树

计算序列结构的邻接树的多个对齐，单击“分析数据集”，然后“邻接。”
结果树在新标签（图3）所示。
规模与卷轴自由树“缩放树。”
reroot你的树，树的一个节点或叶上，然后点击“在这个节点Reroot。”
如果你想删除您的数据池的类群，叶上单击并选择“从池中删除此节点。”现在，您可以重新计算路线和树的样本数量减少。
点击“保存树”作为分析的最终结果外部NEWICK文件保存您的系统发育树。

8。附加软件

点击“关于本网站” - “工具”，找到额外的通知关于独立的的工具4SALE和ProfDistS ATION。
旁边的路线和邻接ITS2的数据库网络接口提供的功能，你现在可以访问了几个新功能，如物种的划分，根据补偿碱基变化（CBCS）。

9。代表结果

如上所述的工作流程已成功应用在几个开放式访问调查^3,4。例子可以通过以下链接查看：

在这些大规模的研究，我们能够解决绿藻的亲缘关系以及Hypnales（苔藓）W第i个高的分辨率。在这两种情况下，收集了详尽的类群取样ITS2的数据库⁹ 4SALE ^15,16自动对齐，最后由ProfDistS ¹⁷到进化树处理。在所有这些步骤，序列和结构信息，同时使用。引导进化骨干支持实现使用简介邻接^{（PNJ）19，}这是在单机版的ProfDistS的。

一个序列结构对小集，数字1到3直接上新ITS2序列数据库工作台描述这种自动化的工作流程中的关键步骤^5：样本数量，多序列结构对齐，并最终进化树计算。

图1。拖放每类群抽样。在任何时间序列或序列结构 ê对可以添加数据池，通过拖放的实例。这里使用拖放和二级结构预测的下降后增加的序列结构。蓝色椭圆标志的序列结构面积下降到数据池。点击此处查看全尺寸版本的这个形象。

图2。在全图形模式下的多序列结构对齐。对于少数序列的数据池，被选为全图形模式。基地是彩色的;碱基可以通过点击一个碱基或碱基对的支架上用红色圆圈突出。点击这里查看这个图片全尺寸的版本。

3.JPG“ALT =”图3“/>
图3。序列结构的邻居加入树。七类群多序列结构的对齐计算，可自由扩展树保存在NEWICK格式。

Discussion

ITS2的数据库是一个完整的内部转录间隔区序列结构为基础的系统发育和功能齐全的工作台。网站可以非常快速，直观地操作。而其他基于网络的系统发育工作台像ARB的²⁰或Mobyle ²¹只能够工作序列和/或共识的结构信息，ITS2的^数据库同时认为每个类群和个人的二级结构序列。然而，由于在Web服务器的计算能力的限制，强烈建议使用多个对齐和邻居，4SALE ^15,16和¹⁷ ProfDistS加入¹⁸计算，分别为大型数据集，独立的工具。 ITS2序列的基本结构亲缘关系的工作流程⁵旁，这些工具具有一些额外的功能，如计算引导复制，资料邻接^（PNJ）19或实物的划的基础上补偿碱基变化^{（CBCS）8。}他们可通过“关于本网站” - “工具”下载和详细信息部分。，使用4SALE和ProfDistS，要始终把正确的格式的文件转换成。采样要由4SALE处理必须有一个类群的结局。FASTA或TXT，而作为输入ProfDistS序列结构的对齐必须结束。xfasta。

目前，我们正在实施在ITS2的数据库，以及相关工具的系统发育树重建的替代方法。因此，像²²序列结构的最大简约和/或最大似然^23的方法，将在未来的访问。

Disclosures

没有利益冲突的声明。

Acknowledgments

我们诚挚地感谢ITS2的组，Biocenter，维尔茨堡大学，为丰富和宝贵的意见。我们也感谢德意志研究联合会（DFG补助Mu-2831/1-1）提供资金。

Materials

Name	Company	Catalog Number	Comments
Internet access			Preferably high-speed
ITS2 Database⁹	University of Warzburg		Website: http://its2.bioapps.biozentrum.uni-wuerzburg.de
Software: 4SALE^15,16	University of Warzburg		Download: http://4sale.bioapps.biozentrum.uni-wuerzburg.de/
Software: ProfDistS¹⁷	University of Warzburg		Download: http://profdist.bioapps.biozentrum.uni-wuerzburg.de/