July 14th, 2015
基于共有基序的合成蛋白序列通常忽略共进化的残基,这意味着插入依赖性 (IPD)。 IPD 对活动至关重要,忽视它们的设计可能会导致次优结果。 该协议使用 StickWRLD 来识别 IPD 并帮助为合理的蛋白质设计提供信息,从而获得更有效的结果。
该程序的总体目标是识别蛋白质比对中意味着插入依赖性或 IPD 的共进化残基。这是通过首先将比对加载到棒状世界中来实现的,棒状世界是一种可视化分析工具,可创建蛋白质比对的交互式 3D 表示,并清楚地显示棒状世界中的同变残基。比对中的每个位置都表示为一列,该列由一堆球体组成,比对中该位置可能出现的 20 个氨基酸中的每一个都有一个球体,其大小与频率相关,代表每个位置的列缠绕在一个圆柱体周围以表示 IPD。
在残基之间划线,如果存在于这些位置的残基在程序中是独立的,则残基协同进化得更高或更低。调整残差,直到有可管理的边缘数量,然后确定感兴趣的边缘。最终,棍棒世界用于识别彼此共同进化的残基。
这种功能所需的 coving 残基已在通气激酶中鉴定出来。人们为这个过程而苦苦挣扎的原因之一是因为它的新颖性。它几乎既是一门科学,也是一种艺术形式。
直观地演示 Stick World 非常重要,因为它是一种可视化分析工具,需要用户交互。作。使用具有 Intel I 5 或更高处理器且至少 4 GB Bram 的计算机,运行 Mac OS 10 或 Linux OS,并配备了文本协议中列出的 Python 库。下载 Stick World 作为包含所有相关 Python 脚本的 zip 存档。
此外,下载 FASTA 双棒脚本,用于将标准 fasta DNA 蛋白序列比对转换为 Stick World 格式。解压缩存档,并将生成的 stick world 文件夹和 FASTA 双 stick 脚本放在桌面上。然后使用任何标准比对软件创建蛋白质序列的比对。
将对齐方式保存在桌面上。感染 a 格式。在宏 Linux 计算机上打开终端应用程序,然后键入 CD tilda slash desktop 并在终端中按 Return 键导航到桌面。
键入命令以使 FASTA 双棒脚本可执行,然后键入命令以执行脚本。按照脚本提供的屏幕说明指定输入文件名和所需的输出名称。将输出文件保存在桌面顶部。
通过在终端中键入 Python dash 32 stick world demo PI,使用 Mac 或 Linux 计算机的终端应用程序启动 stick world,导航到 stick world 可执行文件文件夹。验证 stick world 数据加载器面板是否在屏幕上可见。然后通过按下 load protein 按钮加载转换后的蛋白质序列比对。
选择创建的文件,然后按打开摇杆世界将打开几个新窗口,包括摇杆世界控制和摇杆世界打开 gl。选择摇杆世界打开 GL 窗口。从打开的 GL 菜单中选择 reset view (重置视图),以通过圆柱体以自上而下的视图显示默认的棒世界可视化效果,表示可调整大小的打开 GL 窗口中的数据。
摇杆世界中存在多个视图选项。在 stick world 控制窗格中选择列标签和球标签的框,以显示列和球的值。取消选中 stick world control 窗格中的列边缘框以隐藏列边缘线。
在 stick world control 窗格中将列粗细设置为 0.1,以绘制一条穿过列的细线。为了更轻松地导航 3D 视图,请按 Return 键接受更改。在 stick world open GL 窗口中重置视图。
然后按 全屏 按钮最大化视图以在程序中导航。通过按住鼠标左键同时向任意方向移动鼠标来旋转 3D 摇杆世界显示。通过在上下移动鼠标时按住鼠标右键来缩放 3D 摇杆世界显示。
通过平移和缩放浏览视图,超过阈值要求的 p 和残差的协同进化残基通过边缘线连接。如果连接残差的边太多或太少,请更改残差阈值以显示更少或更多的边 增加摇杆世界控制痛点上的残差阈值,直到没有显示 IPD 边缘线,然后慢慢降低,直到出现关系。继续增加残差,直到有足够数量的关系可供检查。
使用命令和左键单击确定涉及已知目标残基或比对中彼此远端残基的关系,选择任何感兴趣的边缘。棒世界控制面板将指示列并连接特定的残留物。实线表示积极的联想。
而虚线代表负面关联。按下摇杆世界控制窗格上的 output edges 按钮,将所有可见边缘的纯文本格式文件保存在适当的目录中,包括关节残差及其实际残差值。在前景中可以看到一个大型簇插入依赖性或 IPD,包括位置 1 32、酪氨酸位置 1 35 和位置 1 41 的脯氨酸之间的三节点关联。
在这里,视图被倾斜以将用户定位在圆柱体略上方,揭示了位置 1 36 的组胺和距离 29 107 个残基的蛋氨酸之间的 IPD。相反,同一结构域的 A-P-A-M-H-M-M 衍生基序不会将这些检测为特异性共存的基序变异,并且还在生物学上不支持的方案中定义了整体分组。执行此过程时,请务必记住尝试两种不同的方式。
从高残差开始,然后逐渐下降,或者从低残差开始,然后逐步上升,这样您就可以以两种不同的方式探索空间。
该协议利用StickWRLD来识别蛋白质比对中共同进化的残基,突出对蛋白质活性至关重要的互置依赖关系(IPDs)。通过将IPDs纳入蛋白质设计,研究人员可以获得更高效的结果。