March 12th, 2012
ITS2的数据库是一个进化的推论,同时考虑序列和二级结构的内部转录间隔2工作台。这包括数据收集,注释准确,结构预测,多序列结构的对齐和快速的计算。概括地说,这个工作台简化点几下首次系统发育分析。
内部转录的间隔区 2 核糖体基因或 I TS 2 是分子系统学中最重要的标志物之一。过去 20 年的研究主要集中在利用 I Ts 两个序列进行系统发育重建。然而,由于多种原因,I TS two 的二级结构越来越多地用于系统发育推理领域。
二级结构分析扩展了该标记的分类学适用性,而快速进化因此非常可变的 I TS 二序列主要适用于物种水平或更低级别的系统发育分析。添加结构信息允许同时在更高的分类学等级进行分析,因为 I ts 两个二级结构由其四个特征 ess 组成。因此,二级结构分析的结果可以提高从一级序列获得的系统发育分辨率。
欢迎,亲爱的同事们,我的名字是 Matthias Wolf。我在 I ts two proof 工作了大约八年。我在德国维尔茨堡大学生物中心的生物信息学系工作。
今天我们想向您展示一个关于如何使用 I ts two 数据库的小电影。嗨,我是 y Chu。那部电影的原因是 I Ts two 数据库实际上不仅仅是一个用于存储的数据库,而且我们还提供了很多工具,可以让你改进你的系统发育分析。
在本影片中,我们想向您展示如何使用这些工具以及如何将所有这些工具连接在一起。正确。I Ts 两个序列的描绘对于结构预测至关重要。因此,已经为基于 Hidden markoff 模型的注释实现了一个基于 Web 的界面。
要正确注释 I Ts 两个序列,您可以将它们粘贴到网站顶部的序列编辑器中。这可以通过加载计划的示例序列来演示。序列编辑器本身会检查您的 I TS 两个序列是否有效,并输出错误消息。
例如,当您使用非 PAC 字符时 选择正确的 HMM 后,您可以通过单击每 5.8 秒注释一次来启动该过程,并且 28 个 SRNA 可以被程序识别的 SRNA 被删除,留下正确注释的 I ts 两个序列,它们位于两者之间。结果,显示了分隔的 I TS 两个序列以及预测的 5.8 s 和 28 S-R-R-N-A 的杂交种。作为对新保留的 I ts 两个序列进行注释后 HMM 注释准确性的确认,二级结构可以通过两种方式确定。
第一次预测可以通过同源建模来完成,并将数据库的完整序列和结构集作为模板。要预测 Comments 的结构,其两个序列请单击 Predict 结构。如果你的右 two 序列可以直接折叠成典型的 two secondary 结构,结果会立即被描述出来。
现在,您可以在多个选项之间进行选择,以进一步处理序列结构,包括将其添加到数据池中。如果您在此处,两个序列无法直接折叠,则对数据库执行 blast 搜索。生成的页面显示最佳爆炸命中,包括作为模板的每个塑料的同源建模。
单击加号详细信息后,您可以选择您选择的序列结构对,并通过跟踪和拖放或右键单击使用上下文菜单将其添加到数据池中。第二种方法是手动输入一个或多个序列,包括它们的 secondary 结构作为模板,以将最合适的 secondary 结构传输到您的查询序列。通过加载多个模板的示例文件来演示这一点。
通过单击 Predict best templates(预测最佳模板),您可以使用默认设置执行同源建模。Homology 建模程序将针对所有结构进行计算并显示最佳查询模板组合。在结果表中,您可以看到哪些模板可以成功地使用其 secondary 结构对一个或多个查询序列进行建模。
同样,只需单击加号即可打开结果的详细信息,因为完整的同源建模方法独立于 I TS 二。它可用于预测给定具有已知结构的同源分子的任何 RNA 的二级结构。此外,可以通过 drag 和 tr 或通过右键单击打开的上下文菜单将生成的序列结构对添加到数据池中。
除了整体结构外,还描述了守恒动机,如第三螺旋顶点之前的 A-U-G-G-U 序列和第二螺旋中错配的会阴金字塔,用于 I TS 二。这种 UU 错配被两个动机包围,一个在螺旋 2 的左侧,一个在螺旋 2 和 3 之间的右侧,还有一个额外的 3 A 核苷酸。将这些序列动机转化为 hms 后,我们现在在感兴趣的序列中提供了这些动机的识别。
要搜索这些动机,请在搜索字段中输入您的查询序列并选择正确的模型。同样,通过加载计划的示例文件来演示这一点。要开始计算,请单击 motive search。
发现 I ts 两个动机在您的查询序列中被注释和突出显示。从 I Ts two 数据库中检索 I ts 两个序列结构对的一种可能性是搜索功能。它允许用户按分类单元名称或生成库标识符搜索序列结构。
要按 GenBank 标识符搜索序列结构,请在搜索字段中键入 GI,然后单击搜索。点击列表将显示在新选项卡中。您可以通过单击 Show details 来查看序列结构的详细信息。
此外,您还可以通过单击 Show sequence structure per drag and drop 来显示选项卡中所有点击的序列 S 方向,或者通过右键单击上下文菜单,将所选序列结构添加到数据池中。除了按 gi 搜索序列结构对之外,您还可以在搜索字段中键入分类单元名称,该名称由显示的实时搜索框支持。在显示列出所有点击的新选项卡后,您可以访问与以前相同的功能。
例如,通过拖放向数据池添加选择。从数据库中检索序列结构对的第二种可能性是 browse 函数。在这里,文本是分类的。
根据 NCBI 分类数据库,数据可以通过树状结构访问。在网站的左侧。单击加号,您可以在下方显示一层文本。
单击分类单元名称,您将打开一个包含每个序列结构的新选项卡,即分类单元对。除了使用 CEM 库标识符或物种信息搜索序列和结构外,I Ts two 数据库还提供基于爆炸的搜索。然而,突出的 MAF作通常无法识别远亲。
I ts 两个序列,因为序列发散很高。为了克服这一障碍,我们实施了基于序列和结构的爆炸搜索,其中包括有关同源搜索的高度保守结构的信息。这是通过将序列结构翻译成 12 个字母的伪蛋白序列来完成的。
因此,从任何感兴趣的序列开始并涵盖的物种采样。广泛的分类范围已经变得像爆炸搜索一样简单。要执行 blast 搜索,您可以在 sequence 编辑器中键入查询序列。
如果您的查询序列是没有结构的普通核苷酸序列,则常见的 blast n 算法将用于序列,包括其二级结构。Web 界面使用 I Ts two blast 算法。单击 blast 启动该过程。
片刻之后,您的 blast 命中将列在新的点击中。在这里,您会看到每个查询序列的一次点击。通过单击 show alignments,您可以滚动石膏对齐 与以前一样,您可以选择所需的序列结构对并将它们放入数据池中。
在处理 ITS two 数据库期间,数据池可能已填充了多个序列结构。您可以随时访问您的数据池并显示其内容。分析的下一步是多序列结构比对。
单击 analyze dataset(分析数据集),然后单击 sequence and structure(序列和结构)以执行序列结构对齐。现在,系统会要求您选择对齐的图形模式。对于大量序列,建议选择 slim 版本。
由于我们的数据池仅包含几个序列结构,因此我们选择了 full graphic 模式。计算完成后,对齐将添加到您的数据池中。通过高亮显示碱基对的一侧,您会自动高亮显示其对应的侧。
最后,只需单击 Safe Alignment,即可安全地进行对齐。一旦您对序列结构比对的质量感到满意,就可以通过单击 analyze data set(分析数据集),然后单击 neighbor 来计算系统发育邻域连接树。联接结果树将显示在新选项卡中。
您可以使用滚动条自由缩放树,通过单击树的任意节点或叶子来重新路由树,然后在此节点处重新路由。如果要从数据池中删除分类,请单击叶并选择。从池中删除此节点。
现在,您可以通过单击安全树来使用减少的分类单元采样来重新计算您的对齐和树。您可以将系统发育树保存为 NU 格式。单击关于此网站,然后单击工具以查找有关独立工具出售和专业人士的更多信息。
除了 I Ts 两个数据库 Web 界面提供的邻域对齐连接功能外,您现在还可以访问几个新功能,例如,基于补偿性更改的物种 Del 限制。在最后几分钟内,我们想向您展示一些如何改进系统发育分析的技巧。我们向您展示了如何从 I Ts two 数据库中收集数据,将它们与 four cell 对齐,最后使用 Pro 计算树 S.In 所有这些步骤中,我们不仅考虑了序列,还考虑了序列和结构。确定。
我们希望您喜欢我们的小电影和沉重的树木建造。晚安。
ITS2数据库作为一个全面的工具用于系统发育分析,整合了内部转录间隔区2(ITS2)的序列数据和二级结构信息。它便于准确注释、结构预测和比对,简化了系统发育分析过程。