May 22nd, 2018
在这里, 我们提出了 proteogenomic 工具的弹跳和协议的快速, 数量, 后平移修改和变种启用映射的肽识别通过质谱的参考基因组。该工具用于集成和可视化 proteogenomic 和个人蛋白质组学的研究, 并与正交基因学数据相衔接。
该软件方案的总体目标是展示使用 PoGo 来定位具有相关翻译后修饰的肽和来自质谱实验的定量信息,以参考基因组,并实现与正交基因组学数据的集成和可视化。该工具可以帮助将基因组信息添加到质谱蛋白质组学搜索生成的肽列表中,以便于与 RNA 测序数据的整合。该工具的主要优点是使用简单、快速,并支持翻译后修饰、定量和氨基酸方差等附加信息。
首先,下载并安装此视频中演示的软件,如随附的文本协议中所述。安装后,导航到 PoGo GUI 可执行文件文件夹,然后双击 PoGo GUI 图标启动程序。使用 PoGo 可执行文件旁边的选择按钮。
然后在 executables 文件夹中导航到相关的作系统子文件夹并选择可执行的 PoGo 文件。通过单击确认其选择 可选 按钮。接下来,通过单击选择选择蛋白质序列的参考输入文件。
导航到 data 文件夹并选择翻译 fast day 文件。通过单击确认其选择,打开。使用 select 按钮选择脚本注释文件。
然后导航到数据文件夹,选择注释 GTF 文件并单击打开。使用 peptide files 旁边的 add 按钮添加肽鉴定文件。在此处,选择支持格式 MZ Tab、MZ Ident ML 或 MZ ID 的文件,或选择制表符分隔的四列格式的文件。
此外,在输出格式选择中取消勾选 BED NGTF 旁边的复选框。仅选中 PTM BED 和 GCT。然后从下拉选择中为数据选择合适的物种,并通过单击 start 开始映射。
首先,将以 _ptm. bed 结尾的 PoGo 输出文件加载到 integrative genomics 查看器中。重复上述步骤,同时加载以 _noptm.bed 结尾的文件。
此文件包含未进行任何修改的所有肽段。通过将轨道拖放到列表中的所需位置来重新排序轨道。每个文件将显示为单独的轨道,文件名标识轨道。
每个轨道最初都以折叠方式显示。要展开它们,请右键单击轨迹名称,然后选择 expanded 以获得包括序列在内的肽的完整视图。现在加载以 gct 结尾的文件。
此文件包含肽定量信息。与之前加载的文件不同,每个带注释的采样都将作为单独的轨道加载。根据需要使用拖放作重新组织样本。
通过在下拉菜单中选择染色体,单击并按住染色体的一部分以放大或键入基因组坐标,在基因组中导航。PoGo 映射可以使用图形用户界面或通过命令行界面进行。在协议的这一部分中,命令行界面用于强调可互换性。
为了将通过文本协议中的前面步骤获得的变异肽映射到参考基因组,请打开命令提示符并导航到 PoGo 的 executables 文件夹。然后键入此处显示的命令。按 Enter 键确认执行,并等待执行完成,然后再继续。
在整合基因组学查看器中可视化无错配和无错配的肽段。在 PoGo 图形用户界面软件中,使用肽文件旁边的添加按钮添加肽鉴定文件,然后选择单个或多个文件,然后拖放到肽文件下方的空白字段中。然后在输出格式部分取消选中 PTM BED、GTF 和 GCT 旁边的复选框,仅选中 BED。
此外,选择选项 将多个输入文件合并为单个输出.这将产生一个包含输入文件的所有肽的单个输出文件。如果未选中此选项,将导致每个输入文件分别按顺序执行程序。
接下来,从下拉列表中选择与快速日 NGTF 文件一致的数据适当物种。选择后,单击 start 按钮开始映射。为了从映射的肽生成跟踪中枢,请打开终端窗口并在命令提示符中键入以下命令。
按 Enter 键确认执行。执行只需很短的时间即可完成。完成后,将生成的 track hub 及其所有内容传输到 Web 可访问的 FTP 服务器或 GitHub。
在 Web 浏览器中,导航到 UCSC Genome 浏览器并选择 My Data Track Hubs(我的数据跟踪中心)。然后单击 My Hubs 选项卡。将 Track Hub 的 URL 复制到文本字段中,然后单击 add hub 加载 track hub。
最后,选择基因组浏览器,进入浏览器视图。自定义航迹中心将显示在列表顶部。如果多个 BED 文件构建了 track hub 的基础,则每个文件都将表示为 hub 内的单独 track。
这里比较了 PoGo 和其他两种蛋白质基因组学作图工具的整体内存使用和分析运行时间。PoGo 在速度和内存方面都明显优于其他工具,并且它能够将翻译后修饰和与肽相关的定量信息映射到基因组上。PoGo 利用着色选项为基因组内肽图谱的独特性提供简单的视觉帮助。
红色映射表示与单个转录本的唯一性,而块突出显示与单个基因的映射。灰度映射显示多个基因之间共享的肽。PoGo 的 PTM BED 选项重新定义了颜色代码,以适应不同类型的翻译后修饰,在修饰的氨基酸残基处用厚块指示修饰的位置。
在此处显示的代表结直肠癌的蛋白质组数据中,仅鉴定出两种肽,每种肽都显示单个磷酸化。输出 GCT 文件中的信息提供了肽所覆盖的基因组区域的定量值。跨越剪接连接的肽被分成不同的部分而不连接。
有关拼接的更全面信息,还需要输出的 GTF 文件。下载并设置参考蛋白序列和注释后,在不允许序列错配的情况下,可以在 5 分钟内将数千个肽映射到基因组坐标上。在尝试使用 PoGo 将肽映射到参考基因组上时,重要的是要记住使用蛋白质编码转录本的翻译序列和相关的转录本注释。
观看此视频后,您应该对如何使用 PoGo 和 PoGo GUI 将蛋白质组学质谱实验中的肽与相关信息映射到参考基因组上并对其进行可视化有很好的了解。
本文介绍了PoGo,一个旨在快速定量地将通过质谱鉴定的肽段映射到参考基因组上的蛋白质组学工具。它便于将蛋白质组学数据与正交基因组学数据进行整合和可视化。