ITS2的数据库是一个进化的推论,同时考虑序列和二级结构的内部转录间隔2工作台。这包括数据收集,注释准确,结构预测,多序列结构的对齐和快速的计算。概括地说,这个工作台简化点几下首次系统发育分析。
作为进化标记内转录间隔2(ITS2序列)已使用超过二十年。正如ITS2的研究主要集中ITS2序列非常变量,它低级别的系统发育只局限于此标记。然而,ITS2序列和它的高度保守的二级结构的组合,提高进化第1号决议,并允许在多个分类的行列,包括物种划定2-8进化推理。
ITS2序列数据库 ,提出了详尽的内部转录间隔区序列从NCBI GenBank数据库11,准确reannotated 10集。资料隐马尔可夫模型(HMMs)的注释,每个序列的二级结构进行了预测。首先,它是测试是否正确,四螺旋构象的最低能量的结果基于12倍(直接倍)。如果是这种情况并非如此,结构预测同源建模13。在已知的二级结构同源建模,被转移到另一个ITS2序列的二级结构是不能够正确地折叠直接倍。
ITS2的数据库不仅是一个数据库,用于存储和检索ITS2序列结构。它还提供了多种工具,来处理自己的ITS2序列,包括注释,结构预测,主题检测和BLAST 14相结合的序列结构信息的搜索。此外,它集成了4SALE 15,16修剪版本,ProfDistS 17多序列结构比对的计算和邻居加入18树重建。他们一起形成了一个从初始的序列集的连贯序列和二级结构为基础的系统发育分析管道。
简而言之,这个工作台简化首次系统发育分析只几下鼠标点击,而额外提供的综合性大型分析工具和数据。
ITS2的数据库是一个完整的内部转录间隔区序列结构为基础的系统发育和功能齐全的工作台。网站可以非常快速,直观地操作。而其他基于网络的系统发育工作台像ARB的20或Mobyle 21只能够工作序列和/或共识的结构信息,ITS2的数据库同时认为每个类群和个人的二级结构序列。然而,由于在Web服务器的计算能力的限制,强烈建议使用多个对齐和邻居,4SALE 15,16和17 ProfDistS加入18计算,分别为大型数据集,独立的工具。 ITS2序列的基本结构亲缘关系的工作流程5旁,这些工具具有一些额外的功能,如计算引导复制,资料邻接(PNJ)19或实物的划的基础上补偿碱基变化(CBCS)8。他们可通过“关于本网站” – “工具”下载和详细信息部分。 ,使用4SALE和ProfDistS,要始终把正确的格式的文件转换成。采样要由4SALE处理必须有一个类群的结局。FASTA或TXT,而作为输入ProfDistS序列结构的对齐必须结束。xfasta。
目前,我们正在实施在ITS2的数据库,以及相关工具的系统发育树重建的替代方法。因此,像22序列结构的最大简约和/或最大似然23的方法,将在未来的访问。
The authors have nothing to disclose.
我们诚挚地感谢ITS2的组,Biocenter,维尔茨堡大学,为丰富和宝贵的意见。我们也感谢德意志研究联合会(DFG补助Mu-2831/1-1)提供资金。
Name of the reagent | Company | Comments |
Internet access | Preferably high-speed | |
ITS2 Database9 | Department of Bioinformatics, University of Würzburg | Website: http://its2.bioapps.biozentrum.uni-wuerzburg.de |
Software: 4SALE15,16 | Department of Bioinformatics, University of Würzburg | Download: http://4sale.bioapps.biozentrum.uni-wuerzburg.de/ |
Software: ProfDistS17 | Department of Bioinformatics, University of Würzburg | Download: http://profdist.bioapps.biozentrum.uni-wuerzburg.de/ |