July 16th, 2017
介绍了使用Bio3D-web在线调查蛋白质序列结构 - 动力学关系的协议。
Bio3D-web 的总体目标是实现对蛋白质家族的序列、结构和确认多样性的交互式分析。Bio3D-web 是一款新的网络应用程序,可以帮助我们了解大型蛋白质家族中序列、结构和动力学之间的关系。Bio3D-web 的主要优点是它提供交互式和可重复的在线序列、结构和动力学分析,无需用户事先具备编程知识。
要输入结构进行分析,请通过搜索蛋白质数据库来获取腺苷酸激酶的 PDB ID。输入腺苷酸激酶的四个字符长的 PDB ID,或在输入结构或序列面板的文本框中粘贴蛋白质序列。单击第一个面板中蓝色的 next hit selection(下一个点击选择)按钮,或者直接向下滚动到面板 B hit(选择 B)以进行进一步分析。
确保将 Limit total number of included structures (限制包含结构的总数) 滑块设置为其最大值,以包括截止值以上的所有结构。降低包含 BitScore 截止值以包含更遥远相关的点击,或增加它以排除。通过检查表的详细信息(如 PDB 名称、物种和结合的配体),确保所选的命中代表相关结构。
单击 align 选项卡,从搜索选项卡中对所选结构执行序列对齐。可能会出现比对错误,尤其是在分析更远相关的蛋白质时,例如当序列相似性低于 30% 时,请务必在比对选项卡中仔细检查并更正序列比对。查看面板 A 对齐摘要中的对齐摘要。
确保感兴趣的区域对齐,并且没有被一个或多个结构中的间隙所掩盖。单击蓝色的 next analysis 按钮,对收集的结构执行基于序列的聚类分析。然后,单击蓝色的 next conservation 按钮以计算逐列残基守恒。
选择对齐的结构集以生成每个对齐位置的残基守恒图。通过进入 fit 选项卡来执行结构叠加。通过目视检查确保蛋白质结构叠加到相应的相关区域。
单击并拖动鼠标以旋转结构,然后滚动以缩放。通过单击颜色选项调整结构的颜色。然后,单击蓝色的 next analysis 按钮,对收集的 PDB 结构执行基于结构的聚类。
在绘图选项下拉菜单中切换 RMSD 热图。单击蓝色嵌套 RMSF 按钮可查看每个残基的结构变异性,主要二级结构元素显示在 X 轴的边缘区域。通过进入 PCA 选项卡来执行主成分分析。
要可视化主组件,请切换 show PC trajectory 复选框,以使用浏览器内可视化工具可视化主组件描述的运动。确保从第一个下拉菜单中选择主组件 1。要可视化其他主组件描述的运动,请从 choose principal component 下拉菜单中选择所需的 PC。
通过单击蓝色的 next plot(下一步绘图)按钮,将各个结构投影到两个选定的 PC 上。确保 X 轴上的 PC 设置为 1,Y 轴上的 PC 设置为 2。要将结构投影到其他主组件上,请相应地调整 PC 编号。
点击图中的任何单个点来标记结构。或者,在图下方的表 PCA 构象图注释中突出显示一个或多个结构。通过单击蓝色的 next residue contribution(下一个残基贡献)按钮来计算残基对各个主组分的贡献。
通过在 choose principal component (选择主组件) 文本框中包含 PC 编号来绘制其他主分量的贡献。单击 eNMA 选项卡以启动正常模式的计算。通过降低或增加结构包含或排除的截止来调整结构数。
点击绿色运行集成 NMA 开始正则模式分析计算。向下滚动到 eNMA 选项卡的第二个面板,称为 Normal Modes visualization(正常模式可视化),用于可视化 Normal Modes(正常模式)。点击蓝色的 next volatilitys 按钮,计算为集成正则模态分析选择的结构的残差方向波动。
按 RMSD 切换集群,以通过基于 RMSD 的集群为波动曲线着色。切换 spread lines 复选框以将分组的波动曲线彼此分开。然后,单击蓝色的下一个 PCA 与 NMA 按钮,计算各个正则模式和主成分之间的相似性。
单击底部的蓝色 next 按钮以生成分析结果、用户定义的输入和参数选择的报告。该报告可以以可共享的 PDF、Word 和 HTML 格式下载。该报告还包括一个链接,用于稍后重新访问分析会话,该链接也可以与协作者共享。
此处显示的是叠加在已鉴定的不变核心上的腺苷酸激酶的可用 PDB 结构。结构根据 fit 选项卡中提供的基于 RMSD 的聚类进行着色。主成分的可视化可从 PCA 选项卡获得,以表征数据集中的主要构象变化。
在这里,对应于第一个主成分的轨迹以管状表示显示,显示了蛋白质的大规模闭合运动。在构象图中,结构被投影到它们的两个前主成分上,显示构象变异性的低维表示。每个点或结构都根据用户指定的标准进行着色,在本例中,是基于 PCA 的聚类结果。
eNMA 选项卡中的正则模式分析表明,与关闭状态相比,打开状态下的结构的局部和全局动力学得到了增强。Bio3D-web 可用于探索序列和结构集,并帮助在几分钟内了解目标蛋白质家族的一般趋势。Bio3D-web ha 帮助我为驱动蛋白超家族的结构分析提供信息。
Bio3D-web 为序列-结构-动力学关系的完全定制研究提供了完整的工作流程。此工作流程提供了使用 PCA 进行互柔度关系映射以及使用集成 NMA 对大量异质结构的局部和全局动力学进行定量比较的功能。可以设想,大多数研究人员将使用 Bio3D-web 来了解他们感兴趣的蛋白质家族的一般趋势,然后可以为进一步的专业分析提供信息。
因此,Bio3D-web 被设计为一种假设生成工具,具有可共享的摘要报告,其中包括所有用户定义的参数。Bio3D-web 的结果也可以下载,并且与 Bio3D-R 软件包完全兼容,以便进一步深入分析。现在,给定的蛋白质家族有许多结构可用,通常在不同的条件下确定。
比较这些大量结构可以告诉我们对其功能至关重要的结构机制,例如配体结合、催化和变构调节。Bio3D-web 可广泛访问且易于使用,无需安装任何专用软件或学习新的编程语言。所有主流浏览器都支持 Bio3D-web。
免费提供本地设置的完整源代码和设置说明。
本文介绍了使用Bio3D-web的协议,这是一个为蛋白质序列、结构和动力学的交互式分析而设计的Web应用程序。它使研究人员能够探索大型蛋白质家族内的关系,而无需编程知识。