Summary
蛋白精氨酸(R)-甲基化是一种广泛的翻译后修饰,调节多种生物学途径。质谱法是全球分析R-甲基蛋白质组的最佳技术,当与修饰肽富集的生化方法相结合时。本文介绍了专为高置信度鉴定人细胞中全球R-甲基化而设计的工作流程。
Abstract
蛋白精氨酸(R)-甲基化是一种广泛的蛋白质翻译后修饰(PTM),参与多种细胞途径的调节,包括RNA加工,信号转导,DNA损伤反应,miRNA生物发生和翻译。
近年来,由于生化和分析的发展,基于质谱(MS)的蛋白质组学已成为以单位点分辨率表征细胞甲基蛋白质组的最有效策略。然而,通过MS鉴定和分析 体内 蛋白质R-甲基化仍然具有挑战性且容易出错,主要是由于这种修饰的亚化学计量性质以及存在各种氨基酸取代和酸性残基的化学甲酯化,这些残基与甲基化同量异位。因此,需要富集方法来增强R-甲基肽的鉴定和正交验证策略,以降低甲基蛋白质组学研究中的错误发现率(FDR)。
本文描述了一种专门为细胞样品中的高置信度R-甲基肽鉴定和定量而设计的方案,该方案将细胞的代谢标记与重同位素编码的蛋氨酸(hmSILAC)和双蛋白酶全细胞提取物的溶液内消化相结合,然后使用抗泛-R-甲基抗体对R-甲基肽进行离线高pH反相(HpH-RP)色谱分级分离和亲和富集。在高分辨率MS分析后,首先使用MaxQuant软件包处理原始数据,然后通过hmSEEKER分析结果,hmSEEKER是一款设计用于深入搜索MaxQuant输出文件中对应于轻质和重质甲基肽的MS峰对的软件。
Introduction
精氨酸(R)-甲基化是一种翻译后修饰(PTM),可装饰约1%的哺乳动物蛋白质组1。蛋白精氨酸甲基转移酶(PRMTs)是通过一个或两个甲基以对称或不对称方式沉积到R侧链胍基的氮(N)原子上来催化R-甲基化反应的酶。在哺乳动物中,PRMT可分为三类 - I型,II型和III型 - 取决于它们沉积单甲基化(MMA)和不对称二甲基化(ADMA),MMA和对称二甲基化(SDMA)或仅MMA的能力,分别2,3。PRMT主要靶向位于富含甘氨酸和精氨酸的区域的R残基,称为GAR基序,但一些PRMTs,如PRMT5和CARM1,可以将脯氨酸-甘氨酸-富含蛋氨酸(PGM)基序4甲基化。R-甲基化已成为几种生物过程的蛋白质调节剂,例如RNA剪接5,DNA修复6,miRNA生物发生7和翻译2,促进了对该PTM的研究。
质谱 (MS) 被认为是以蛋白质、肽和位点分辨率系统研究全局 R-甲基化的最有效技术。但是,该PTM需要一些特殊的预防措施才能通过MS进行高置信度鉴定。首先,R-甲基化是亚化学计量的,肽的未修饰形式比修饰的肽丰富得多,因此在数据依赖性采集(DDA)模式下运行的质谱仪将比低强度甲基化对应物更频繁地破碎高强度未修饰肽8。此外,大多数用于R-甲基化位点鉴定的基于MS的工作流程在生物信息学分析水平上存在局限性。事实上,甲基肽的计算鉴定容易产生高错误发现率(FDR),因为这种PTM与各种氨基酸取代(例如,甘氨酸转化为丙氨酸)和化学修饰(例如天冬氨酸和谷氨酸的甲酯化)同量异位9。因此,基于甲基同位素标记的方法,例如细胞培养中氨基酸重甲基稳定同位素标记(hmSILAC),已被实施为正交策略,用于 体内甲基化的 可靠MS鉴定,显着降低了假阳性注释的发生率10。
最近,研究R-甲基化蛋白质的各种蛋白质组范围方案已经优化。基于抗体的R-甲基肽免疫亲和富集策略的开发导致了人类细胞中数百个R-甲基化位点的注释11,12。此外,许多研究3,13报告说,将基于抗体的富集与肽分离技术(如HpH-RP色谱分级分离)偶联可以增加鉴定的甲基肽总数。
本文介绍了一种基于各种生化和分析步骤的系统、高置信度鉴定人细胞中 R-甲基化位点的实验策略:从 hmSILAC 标记的细胞中提取蛋白质,使用胰蛋白酶和 LysargiNase 蛋白酶进行平行双酶消化,然后对消化肽进行 HpH-RP 色谱分级分离,再加上基于抗体的 MMA-、SDMA-、 和含ADMA的肽。然后,在DDA模式下通过高分辨率液相色谱(LC)-MS/MS对所有亲和富集肽进行分析,并使用MaxQuant算法处理原始MS数据以鉴定R-甲基肽。最后,使用hmSEEKER处理MaxQuant输出结果,hmSEEKER是一种内部开发的生物信息学工具,用于搜索重质和轻质甲基肽对。简而言之,hmSEEKER从msms文件中读取并过滤甲基肽鉴定,然后将每个甲基肽与其在allPeptides文件中相应的MS1峰相匹配,最后搜索重肽/轻肽对应物的峰。对于每个假定的重光对,计算Log2 H/L比(LogRatio)、保留时间差(dRT)和质量误差(ME)参数,并将位于用户定义的截止值内的双峰标记为真阳性。生化方案的工作流程如图 1所示。
Subscription Required. Please recommend JoVE to your librarian.
Protocol
1. 细胞培养和蛋白质提取(时间:需要3-4周)
- 分别在用轻(L)或重(H)蛋氨酸提供的培养基中平行生长HeLa细胞(参见 表1 的培养基组成)。在至少八次细胞分裂后,从每个SILAC通道收集等分试样的细胞并进行掺入测试。
注意:为了检查掺入效率,请通过LC-MS/MS分析测试重质通道中重蛋氨酸(Met-4)的百分比尽可能接近100%。通过LC-MS/MS分析重标记细胞的等分试样(设置见表 2),然后使用 表3所示的参数使用MaxQuant处理MS数据。为了检查Met-4的合并情况,可以在 https://bitbucket.org/EMassi/hmseeker/src/master/ 获得内部开发的脚本。 - 当蛋氨酸达到 >97% 时,考虑将其完全掺入。当每个通道达到约60×106 个细胞的总数(对应于约40个培养皿,每个培养皿15cm,HeLa细胞的85%汇合度,根据细胞类型而变化)收获它们。仔细计数,以1:1的比例混合,并在4°C下以335× g 离心5分钟沉淀。
注意:要评估正确的 1:1 L/H 混合,请保持等分试样并在已知含有高丰度和重度 R-甲基化蛋白质(例如原纤维蛋白)的凝胶切片上运行。如果标记成功并实现了 1:1 混合,则样品中存在的 R-甲基化肽的轻质和重质版本的比例应为 1:1。或者,保留要通过LC-MS/MS分析的混合样品的等分试样,然后使用 表3 所示的参数使用MaxQuant处理MS数据,并绘制Log2 H / L比值的分布图,如图 2C所示。可以通过快速冷冻沉淀并将其储存在-80°C来停止协议。 - 相对于细胞沉淀体积,将细胞沉淀重悬于四体积的裂解缓冲液中(裂解缓冲液组成参见表1)。例如,将 6 mL 裂解缓冲液用于 120 x 10 6 Hela 细胞(60 x 10 6 Light + 60 x 106 重)的沉淀,对应于 1.5 mL 体积。
注意:蛋白质提取必须在室温(RT)下进行,因为裂解缓冲液含有在冰温下沉淀的离液剂9 M尿素;因此,加入广谱丝氨酸和半胱氨酸蛋白酶抑制剂以及磷酸酶抑制剂是重要的,以同时保护蛋白质免受蛋白水解降解和去磷酸化,蛋白酶和磷酸酶抑制剂的混合物以小片剂的形式市售,参见表 1 和 材料表。 - 用微尖端细胞干扰超声仪对样品进行至少五个 15 秒开和 30 秒关的循环,以确保细胞膜的有效断裂以及 DNA 释放和剪切。通过上下移液来检查提取物的粘度。如果由于DNA剪切和膜溶解不完全而导致太粘稠,请重复超声循环。
注意:确保样品在超声处理过程中不会过热,因为高温会损坏蛋白质。但是,由于存在9M尿素,因此不可能在超声循环之间将样品放在冰上;因此,建议在不同的超声周期之间暂停 60 秒关闭。此外,避免在超声处理过程中形成气泡,因为它们会降低超声处理效果。 - 在室温下以 3,000 x g 离心提取物 10 分钟以沉淀碎片并将上清液转移到新的 15 mL 管中。
- 用比色测定法测量提取物的蛋白质含量,例如布拉德福德或二辛可宁酸(BCA)14,15。该方案蛋白质提取物的最佳起始量在20-30mg之间。
注意:含有高浓度尿素的裂解缓冲液与布拉德福德和BCA定量测定兼容;其他类型的裂解缓冲液,例如含有高浓度十二烷基硫酸钠(SDS)的缓冲液,与Bradford不兼容。
2. 裂解物消化(指示时间需要2小时)
- 使用溶解在超纯水中的二硫苏糖醇(DTT)储备溶液以4.5mM进行蛋白质的硫醇基团(-SH)的还原,并在55°C下反应30分钟。
注意:可以制备1 M储备DTT溶液并将其在-20°C下储存长达1个月,仅解冻每个实验所需的等分试样。或者,巯基还原剂三-(2-羧乙基)-膦(TCEP)可用于还原-SH基团;特别是对于蛋白质的长期储存,TCEP比缓冲液中不含EGTA等金属螯合物的DTT稳定得多,而如果存在金属螯合物,DTT则更稳定16。 - 通过添加浓度为10mM的碘乙酰胺(IAA)来对蛋白质的硫醇基团(-SH)进行烷基化,并在黑暗中在室温下孵育15分钟。在黑暗中用IAA溶液孵育提取的蛋白质,因为IAA是光敏的。
注意:应在每次实验前新鲜制备100mM的IAA储备溶液。或者,氯乙酰胺可用于进行-SH基团的烷基化,特别是如果实验的目标是分析甲基化和泛素化之间的串扰,因为IAA诱导的伪影模拟泛素化17。 - 在进行蛋白质消化步骤之前,保存等分试样蛋白质提取物(起始未消化裂解物的1/1,000),以便随后对SDS-PAGE考马斯染色凝胶进行分析,并在消化时与相应量的样品进行比较;该测试用于验证蛋白水解效率(见第4点)。
- 用四个体积的20mM HEPES pH 8.0稀释剩余的蛋白质提取物,以达到2M的最终尿素浓度(这是与蛋白酶的酶活性相容的浓度)。将样品分成两部分:在第一部分添加测序级修饰胰蛋白酶,在第二部分添加LysargiNase蛋白酶(参见 材料表),相对于起始材料的mg的比例为1:100(w / w)。在37°C的温度混合器中以600rpm放置过夜,以允许酶消化。
注意:胰蛋白酶是蛋白质组学中最常见的消化酶,在R和赖氨酸(K)的C末端裂解,产生电荷分布的肽,在碰撞诱导解离(CID)时产生由y型离子主导的碎裂光谱。因此,LysargiNase在R和K的N末端切割,反映了胰蛋白酶的切割特异性并产生在CID碎裂时主要释放b型离子的肽。这种组合分析大大提高了肽序列的覆盖率,并提高了R-甲基化位点特异性鉴定的置信度18。
3.肽纯化(指示时间需要1小时)
- 保留来自两个反应的消化肽的等分试样,收集与第2.3点相同的体积,以便在SDS-PAGE考马西染色凝胶上进行比较,以评估蛋白酶消化效率(见第4点)。
- 通过酸化样品以加入三氟乙酸(TFA)至终浓度为5%来停止消化。充分混合并用石蕊纸测量样品的pH值(pH值应在3左右)。短暂涡旋并旋转酸化样品,然后将其转移到新的 15 mL 管中。
- 通过两个C18真空滤芯(吸附剂重量1 g,参见 材料表)清理样品,一个用于用胰蛋白酶消化的样品,另一个用于用LysargiNase消化的样品。制备溶剂A、溶剂B和洗涤缓冲液(缓冲液组成见 表1 )。
- 使用玻璃移液器,用 6 mL 100% 乙腈对每个滤芯进行再水化 3 次。之后,用3-9-18 mL溶剂A依次平衡每个小柱,加载样品(树脂应变为黄色)。用 3-9-18 mL 溶剂 A 依次洗涤,然后加入 6 mL 洗涤缓冲液。将每根色谱柱转移到干净的15 mL管中,并用7 mL溶剂B洗脱样品.用7 mL溶剂B重复洗脱步骤,最终体积为14 mL。
注意:通过让缓冲液和溶液通过重力通过色谱柱来执行所有这些步骤。为了有利于缓冲液流过色谱柱,用注射器缓慢推动每种溶液,以模拟真空。 - 保存 50 μL 洗脱肽、50 μL 流通 (FT)、50 μL 溶剂 A 洗涤液和 50 μL 最后一次洗涤液,用于后续 SDS-PAGE 肽评估(参见第 4 点)。
4. 库马西染色的SDS-PAGE凝胶(指示性时间需要2小时)
- 在17.5%SDS-PAGE凝胶上运行收集的等分试样,并用速溶蓝光考马斯染色(见 材料表)。预期结果如图 2A所示。
5.肽冻干(指示时间2天)
- 用石蜡膜覆盖含有洗脱肽的 15 mL 管,然后用 20 G 针头打孔以形成 3-5 个孔。将试管放入干冰中至少30分钟,直到样品完全冷冻。
- 将冷冻馏分冻干48小时,该时间间隔通常足以确保样品完全冻干,即使由于冷冻干燥机性能而可能发生一些变化。
注意:实验可以在此处暂停,将冻干样品储存在-80°C。
6.肽的离线HpH-RP色谱分级分离(指示时间4天)
- 要将肽分离成60个级分,请使用HpH-RP液相色谱,使用C12-RP HPLC柱(250 x 4.6 mm,4 μm Proteo 90A)配备的HPLC系统。
- 在运行之前,准备新的缓冲液A和缓冲液B(缓冲液的组成如 表1所述)。
- 用0.22μm过滤器过滤所有溶液,并在超声仪浴中脱气至少30分钟。
- 将冻干肽溶解在1mL缓冲液A中,使用注射器通过聚四氟乙烯(PTFE)0.45μm过滤器过滤肽。
- 将分馏速率设置为 1 mL/min 流量并收集 1 mL 级分,使用以下色谱梯度:60 分钟内 5% B 至 30% B;2分钟内30%B至60%;70% B 持续 3 分钟。
- 设置HPLC,使此时停止馏分收集,梯度在70%缓冲液B下保持5分钟,然后用快速梯度洗涤至100%缓冲液B,然后进行最终洗涤(100%缓冲液B10分钟)。
注意:在每次色谱运行结束时,始终用100%缓冲液A平衡色谱柱20分钟。 - 通过离线HpH RP色谱梯度分馏用胰蛋白酶和赖氨酸酶分别消化的两个样品,如第6.5点所述。
- 对于每个色谱梯度,将所有馏分收集到深的96孔板中。
- 将梯度前收集的馏分合并为一个名为 PRE 的单个馏分。将 HpH-RP 液相色谱 (LC) 梯度中的 60 个馏分以非连续方式汇集成 14 个最终馏分。为了获得这种不连续的串联,请根据以下方案合并HpH-RP级分。
- 馏分 1(最终体积 5 mL):池 1-15-29-43-57
- 馏分 2(最终体积 5 mL):池 2-16-30-44-58
- 馏分 3(最终体积 5 mL):池 3-17-31-45-59
- 馏分 4(最终体积 5 mL):池 4-18-32-46-60
- 馏分 5(最终体积 4 mL):池 5-19-33-47
- 馏分 6(最终体积 4 mL):池 6-20-34-48
- 馏分 7(最终体积 4 mL):池 7-21-35-49
- 馏分 8(最终体积 4 mL):池 8-22-36-50
- 馏分 9(最终体积 4 mL):池 9-23-37-51
- 馏分 10(最终体积 4 mL):池 10-24-38-52
- 馏分 11(最终体积 4 mL):池 11-25-39-53
- 馏分 12(最终体积 4 mL):池 12-26-40-54
- 馏分 13(最终体积 4 mL):池 13-27-41-55
- 馏分 14(最终体积 4 mL):池 14-28-42-56
注意:非连续串联包括合并早期、中期和晚期洗脱级分,这允许增加混合级分中肽组成的异质性。因此,在随后的纳米流低pH-RP-LC色谱中,每个混合级分的肽混合物在直接偶联到质谱仪的纳米流低pH-RP-LC色谱中被有效地分离,共洗脱有限。
- 将梯度后收集的馏分合并为一个名为 POST 的唯一馏分。
注意:通过包括级分 PRE 和 POST 梯度,在 15 mL 管中总共获得 16 个馏分(参见 图 3A)。 - 用石蜡膜覆盖 15 mL 管,并用 20 G 针头打孔以产生 3-5 个孔。通过将离心管在干冰中孵育来冷冻它们,直到每个部分完全冷冻。
- 将馏分冻干约48小时。在停止冷冻干燥机之前,确保每个样品完全干燥。
注意:实验可以在此处暂停,将冻干样品储存在-80°C。
7.R-甲基化肽免疫亲和富集(指示时间2天)
- 使用抗泛R-甲基化抗体并行执行修饰肽的顺序免疫亲和富集,但分别针对胰蛋白酶和赖氨酸酶消化的两个样品。免疫亲和纯化(IAP)缓冲液由购买抗泛R-甲基抗体的公司提供,用于修饰肽亲和富集(详情见表材料和试剂)。IAP缓冲液浓缩10倍,使用前应稀释10倍。
注意:IAP缓冲液1x可以在-20°C下储存长达1年。 - 在室温下以 2,000 x g 离心冻干肽 5 分钟,将肽旋转到 15 mL 管的底部。每 15 mL 管中用 250 μL 1x IAP 缓冲液重悬冻干肽,并在 1.5 mL 低结合管中转移。使用石蕊纸检查pH值是否为>6。
- 保留每个馏分的少量等分试样(约体积的5%)作为后续MS分析的输入。
- 将每个级分分成两个等分试样,以便平行进行不对称二甲基化(ADMA)和对称二甲基化(SDMA)肽的免疫富集。
- 每 10 mg 初始蛋白质提取物使用三瓶选定的抗 pan-R-甲基化抗体与蛋白质 A 琼脂糖珠偶联。
- 通过将每个小瓶以2,000 x g 离心30秒并从磁珠中除去缓冲液,制备与琼脂糖珠偶联的正确量的抗体。用 1 mL 的 1x PBS 洗涤珠子 3 次,始终以 2,000 x g 离心 30 秒。
- 最后一次洗涤后,将珠子重新悬浮在 40 μL 1x PBS 中,用于每个小瓶;将它们合并,最后将它们平均分成 16 个级分(以便向每个级分中加入 2.5 μL 抗体珠)。
- 向每个试管中加入 250 μL 1x IAP 缓冲液,倒置混合,并在 4 °C 下在旋转轮上孵育 2 小时。
注意:通过倒置 1.5 mL 管而不是用微量吸头移液来混合样品,这可能会损坏磁珠或导致磁珠丢失。 - 孵育2小时后,将含有肽和pan-R-甲基抗体偶联珠的1.5 mL管以2,000 x g 离心30秒以沉淀珠子;将每个馏分的 FT 转移到干净的 1.5 mL 低结合管中。
- 将与R-单甲基化(MMA)抗体偶联的磁珠添加到FT中,并重复步骤7.7至7.9。
- 在肽样品与MMA磁珠孵育期间,用250μL IAP缓冲液(倒置和不移液)洗涤先前用抗ADMA和SDMA免疫沉淀的馏分的两倍,并在每次洗涤时弃去上清液。
- 用 LC-MS 等级 H2O 重复洗涤三次。
- 通过向每个试管中加入 50 μL 0.15% TFA,从琼脂糖珠中洗脱富含亲和力的对称和不对称 R-二甲基化肽(实际上,强酸条件会使表位变性,导致抗原从抗体中释放)。将该溶液在室温下放置10分钟,每2-3分钟倒置试管。
- 将第一次洗脱转移到干净的 1.5 mL 低结合管中,并用 50 μL 0.15% TFA 重复洗脱;将 2 个馏分集中在一个管中。
- 对与抗MMA抗体珠一起孵育的R-单甲基化肽重复从7.11到7.14的步骤。
8. 通过C18微柱对富含亲和力的甲基肽进行脱盐和浓缩(指示时间需要30分钟)
- 在MS分析之前,用甲醇平衡由3M固相萃取柱制成的C18-RP微柱,用于肽脱盐和浓缩19。
- 通过以600 x g 离心6分钟,分两步(每个C18微柱上50 μL + 50 μL)在C18微柱上加载样品(对应于单独的免疫亲和富集级分和输入级分)。
- 用55μL缓冲液A洗涤微柱(缓冲液组成参见 表1 ),始终以约900 x g 离心5分钟。
注意:实验可以在此处暂停,将C18-RP微柱保持在4°C,在那里它们可以储存长达2周。
9.第二次酶消化(指示时间需要3小时)
- 用55μL缓冲液A洗涤C18-RP微柱两次,以约850×g离心5分钟。
- 用 20 μL 缓冲液 B 洗脱肽两次(缓冲液组成参见 表 1 )并合并两种馏分。
- 在真空浓缩器中干燥洗脱的肽(详见 表材料和试剂 )。同时,制备由50mM碳酸氢铵组成的消化溶液,该碳酸氢铵从新鲜的1M储备溶液中稀释(见 表1)。
- 将胰蛋白酶或赖氨酸酶添加到相应的样品中,终浓度为25ng / μL。 将每个样品在37°C孵育2小时。
- 加入 1 μL 5% TFA 以停止消化;涡旋并旋转样品。
注意:胰蛋白酶的酶裂解可以在甲基化R和K的C末端受到抑制,导致错过切割,从而增加肽长度和电荷,进而产生复杂和不完整的碎裂谱图,阻碍肽鉴定和甲基化位点的位点特异性归属。已经表明,第二次酶消化可以减少这种漏诊切割的频率,提高序列覆盖率和位点归属20。
10.脱盐肽(指示时间需要30分钟)
- 将酸化肽溶液加载到新的C18-RP微柱中,这些微柱先前已按照第8点中所述的相同步骤进行平衡。
- 上样在C18-RP微柱上的肽可以在4 °C下储存,直到洗脱用于LC-MS/MS分析。
11. 液相色谱-串联质谱(LC-MS/MS)分析(指示时间5天)
- 通过传递 10μL 缓冲液 B,在室温下以 615 x g 离心 5 分钟,从 C18-RP 微柱中洗脱肽。 重复此步骤两次并合并洗脱液。
- 在真空浓缩器中减少洗脱液的体积,直到它们几乎干燥,避免过度干燥。
- 将肽重悬于10 μL缓冲液A中,用于LC-MS/MS分析。
- 在高分辨率质谱仪(见 材料表)中通过液相色谱-串联质谱(LC-MS/MS)分析R-甲基肽的每个部分,并与纳米流动超高效液相色谱(UHPLC)系统耦合。按照 表2中的说明设置仪器参数。
- 在纳米分析柱(易喷柱内径75 μm,长25 cm)上加载每个样品2 μL,并用C18-RP树脂(2 μm粒径)填充。
- 样品以300 nL/min的流速通过C18 RP纳米柱,具有以下线性梯度:3%-30%B持续89分钟,30%-60%B持续5分钟,60%-95%B持续1分钟,95%B持续5分钟。
- 质谱仪在数据依赖性采集 (DDA) 模式下运行,可在全扫描 MS 和 MS/MS 采集之间自动切换。设置要在光谱仪检测器中分析的测量全扫描MS,分辨率R = 70,000。将15个最强烈的肽离子依次分离至目标值3 x 106 ,并通过28%的相对碰撞能量破碎。将完全扫描的最大允许离子积累时间设置为 20 毫秒,将 MS/MS 的最大允许离子积累时间设置为 50 毫秒,并将 MSMS 的目标值固定为 1 x 106。动态排除时间设置为 20 秒。
12. 运行MaxQuant和hmSEEKER数据分析
- 完成LC-MS/MS运行后,将MS原始数据导入肽搜索引擎,以对照参考数据库通过基于概率的方法鉴定甲基肽。在此协议中,MaxQuant版本1.6.2.10用于我们的分析。MaxQuant 至少需要 2 GB RAM 才能运行,以及足够的磁盘空间来存储所有原始数据和所有输出文件。
注:有关安装以及硬件和软件要求的所有详细信息,请参阅 https://www.maxquant.org 的官方文档。 - 复制每个原始数据文件。通过在原件名称后附加“_light”来重命名原件,然后通过附加“_heavy”来重命名原件。
注意:hmSEEKER,下游分析的脚本,区分大小写。 - 使用 表3所示的设置启动MaxQuant/Andromeda肽鉴定搜索。在MaxQuant生成的几个输出数据中,后处理步骤只需要allPeptides.txt和msms.txt文件(位于combed/txt子文件夹中)。
- MaxQuant输出数据的后处理由算法hmSEEKER执行。从以下位置下载hmSEEKER: https://bitbucket.org/EMassi/hmseeker/src/master/.该脚本可作为用 Python 3.7 编写的 Jupyter 笔记本提供,并附带一个用于测试目的的示例数据集。对于新用户,建议下载并安装Anaconda平台(https://www.anaconda.com/products/individual)。最新版本默认包括Python 3.8,Jupyter和运行hmSEEKER所需的所有软件包(例如,Scikit-learn 0.23.1)。
- 创建一个文件夹并将文件全部肽.txt和msms.txt从MaxQuant输出存储到其中。
- 启动Jupyter(从命令行或从Anaconda导航器)。
- 导航到 hmSEEKER 文件夹并打开 hmSEEKER.ipynb。
- 在笔记本的 “输入参数 ”部分中,指示 FASTA 数据库和包含 MaxQuant 文本文件的文件夹的路径。
- 通过选择单元格并单击 Jupyter 界面顶部的 “播放 ”按钮,在每个单元格中运行代码。
- 该脚本为每个已分析的数据集生成一个逗号分隔的输出文件,以及一个组合文件。最终的双峰列表可以在名为“[日期]-[时间]-combined_hmSILAC_doublets_HxL_summary.csv”的文件中找到
(表 4 包括输出表中列的简要说明)。
Subscription Required. Please recommend JoVE to your librarian.
Representative Results
本文介绍了一种高置信度鉴定全局蛋白R-甲基化的工作流程,该工作流程基于蛋白质提取物的酶消化与两种不同的蛋白酶并行结合,然后对蛋白水解肽进行HpH-RP液相色谱分级分离,以及使用抗泛-R-甲基抗体对R-甲基肽进行免疫亲和富集(图1)。
细胞在蛋氨酸存在下生长,蛋氨酸可以是天然的(Light,L,Met-0)或同位素标记的(重,H,Met-4)。在完全同位素标记后,通过MS分析对少量仅Met-4提取物进行测试,收获重细胞和轻细胞并以1:1 L / H的比例混合,如图 1A所示。在 13CD3-蛋氨酸代谢标记后,甲基从甲基供体S-腺苷甲硫氨酸(SAM)添加到蛋白质骨架中,并将以轻或重同位素形式21存在。 图1B 描述了由蛋白精氨酸甲基转移酶(PRMTs)家族进行的精氨酸甲基化反应,该反应催化甲基从S-腺苷甲硫氨酸(SAM)转移到精氨酸的胍氮。如果将单个甲基置于精氨酸的末端氮原子之一上,则获得单甲基化的精氨酸(MMA)。如果在胍基的同一氮原子上加入两个甲基,则产生不对称的二甲基化精氨酸(ADMA),而如果将两个甲基放在两个不同的氮原子上,则产生对称的二甲基化精氨酸(SDMA)。
在1:1比例的轻标记和重标记细胞中混合后,提取蛋白质并通过胰蛋白酶和LysargiNase平行进行消化。如图2所示,SDS-PAGE考马斯染色凝胶用于验证肽中总蛋白的有效酶消化(比较泳道I和II)。此外,评估了C18 Sep-Pak色谱柱进行的纯化步骤的效率,确认C18色谱柱的流通(图2,泳道III)以及第一次和第二次洗涤(分别为图2泳道IV和V)中不存在肽,并且它们预期存在于洗脱液中(图2,泳道VI)。评估了重通道中正确的 Met-4 掺入(图 2B)和正确的 1:1 H/L 混合(图 2C)。
图3显示了离线HpH-RP液相色谱分馏肽和随后馏分的非连续串联的色谱图。通过215 nm UV检测肽,而通过280 nm紫外线评估可能残留的未消化蛋白质。在色谱图下方,馏分串联策略示意图,将起始馏分的70个减少到最终的16个,包括PRE和POST梯度级分。
抗泛-R-甲基抗体用于R-甲基肽的富集。这些抗体可识别三种类型的R-甲基化(MMA、SDMA和ADMA),它们可直接与琼脂糖珠偶联(详见 表材料和试剂 )。 表1 列出了该协议中使用的所有缓冲液和溶液。
采集后,使用MaxQuant对每个MS原始数据进行两次分析,以鉴定不同搜索组中的轻甲基化和重甲基化,其基本原理是甲基肽(重质和轻质)只能在特定组中鉴定。分别搜索重甲基化和轻甲基化可减少引入的可变修饰数量并降低混合标记肽假阳性的风险,从而改善分析。一旦MaxQuant分配了甲基位点,hmSEEKER就会解析其输出表,以重建可能的重轻峰对13。
图4和图5显示了肽FELTGIPPAPR(me)(4)和NPPGFAFVEFEDPR(me)(5)的完整MS谱图,它们分别代表真阳性和假阳性甲基肽注释。在图4中,在三个峰之间观察到的m/z差异与酶促甲基化残基的存在一致(未修饰和轻甲基化之间的Th为7.0082 Th;甲基肽的轻质和重质形式之间的2.0102 Th)。由此产生的hmSILAC双峰具有0.40 ppm的ME,0.00分钟的dRT和-0.41的对数比;这些值低于 hmSEEKER 用于区分真假双峰的默认阈值,之前估计如下:|我|< 2 ppm, |dRT|< 0.5 分钟,和 |对数比率|< 1.在图5所示的第二种情况下,在轻甲基化肽与其假定的重对应物之间观察到的m/z差异偏离预期值0.0312 Th(ME = -37.28 ppm)。此外,此双峰的 LogRatio 为 2.50,这超出了默认的 LogRatio 预测区间(这些截止值已在13 中定义和讨论)。事实上,在MS / MS谱图中,肽NPPGFAFVEFEDPR(me)的序列导致未完全覆盖,并且指定的R-甲基化也可以解释为谷氨酸或接近R的天冬氨酸上的甲酯化。
hmSEEKER 工作流程在 图 6 中示意图,而表 4 提供了此工具生成的输出 表 的描述,以帮助解释结果:携带多次修饰的肽多次出现,每个条目对应于给定肽上的不同甲基化事件;最后,峰双峰组分为三类: 匹配的双峰是最有把握的,因为肽被片段化并以重形式和轻形式鉴定。
图 1:实验工作流程和酶促蛋白-R-甲基化反应的方案。 (A)生化方案工作流程图。将细胞在含有轻(Met-0)和重(Met-4)蛋氨酸的培养基中生长至少8倍,轻通道和重通道按1:1的比例混合。提取蛋白质并用胰蛋白酶或LysargiNase平行消化,并通过离线HpH-RP液相色谱法收集70个级分进行分馏,最后合并成16个级分。R-甲基肽由与琼脂糖珠偶联的抗泛-R-甲基抗体富集,这些抗体经过第二次酶消化(分别为胰蛋白酶或赖氨酸酶),并通过LC-MS/MS进行分析。 原始MS数据通过MaxQuant算法处理,用于肽和PTM鉴定。然后将MaxQuant输出数据提交hmSEEKER生物信息学工具进行分析,该工具是内部开发的重甲基肽和轻甲基肽关联。(B)R-甲基化反应方案。精氨酸的瓜尼迪诺基团可以通过加入一个甲基来修饰,产生单甲基化精氨酸(MMA)或通过添加两个甲基,产生对称(SDMA)或不对称(ADMA)二甲基化精氨酸。该反应由蛋白精氨酸甲基转移酶(PRMTs)家族的酶催化,这些酶从S-腺苷基-蛋氨酸(SAM)转移这些甲基。甲基转移后,SAM被还原为S-腺苷同型半胱氨酸(SAH)。 请点击此处查看此图的大图。
图 2:协议关键步骤的控制。 (一) SDS-PAGE考马斯染色凝胶,用于评估蛋白水解消化效率。分子量:分子量标记。I) 在消化前通过BCA定量的20μg总H / L蛋白提取物;II)酶解肽的负载比例与I中相同;III) C18滤芯的流通量与泳道I的比例相同;IV-V)用缓冲液A对C18墨盒进行第一次和第二次洗涤,以与I相同的比例加载;VI)从C18滤芯中洗脱,上样比例与I.(B)Met-4掺入率分析相同。重型通道中的 Met-4 掺入由内部开发的脚本进行评估(可在 https://bitbucket.org/EMassi/hmseeker/src/master/ 获得);rate = 1 表示完全掺入 (C) 1:1 混合评估的 H/L 比率的高斯分布。绘制了考虑±2σ的Log2 H/L比的正态分布。请点击此处查看此图的大图。
图 3:HpH 级分串联方案和代表性的 R-甲基化肽富集评估。 (A)高pH反相分馏色谱图和非连续馏分串联方案。色谱图表示在 215 nm 紫外(蓝线)下检测到的肽的 HpH-RP 分离曲线,而在 280 nm 紫外通道(红线)中追踪未消化蛋白质的存在。浅绿色线表示缓冲液B在色谱运行中的浓度。报告了馏分合并方案,描述了从70到16的早期,中期和晚期洗脱馏分的非连续串联策略,包括PRE和POST梯度分数。(B)总结R-甲基化肽富集的代表性表。该表概述了肽的总数和R-甲基化富集的相对百分比,比较了每个IP在其输入端。请点击此处查看此图的大图。
图 4:真正的 hmSILAC 双峰模型示例。 真阳性双联体的质谱图。显示的峰对应于未修饰的轻单甲基化(CH3)和重单甲基化(13CD3)形式的肽FELTGIPPAPR,电荷为2+。在三个峰之间观察到的m/z差异与酶甲基化残基的存在一致。质谱图下的表格表示hmSEEKER输出,并包含双峰的对数比,ME和dRT参数。 请点击此处查看此图的大图。
图 5:假 hmSILAC 双联体的示例。负体内甲基肽分配的质谱图。811.3849 m/z和818.3927 m/z处的峰对应于肽NPPGFAFVEFEDPR的未修饰和轻单甲基化形式,电荷为2+。第三个峰可以指定为轻甲基化肽的重甲基对应物,但观察到的m/z位移与预期位移相差0.0312 Th,这排除了这种可能性。质谱图下的表格表示hmSEEKER输出,并包含双峰的对数比,ME和dRT参数。请点击此处查看此图的大图。
图 6:数据分析工作流程的示意图 。 (A) MaxQuant 检测原始数据中的 MS1 峰值。(B)具有相关MS2谱图的峰由数据库搜索引擎Andromeda处理以获得肽鉴定。(C)hmSEEKER读取MaxQuant肽鉴定并提取甲基肽,仙女座评分>25,德尔塔评分>12,修饰定位概率>0.75。(D)对于通过质量过滤的每个甲基肽,hmSEEKER在MaxQuant allPeptides表中找到其对应的MS1峰,然后在同一表中搜索其对应物。(E)峰的双峰由其保留时间(RT)、强度比(LogRatio)以及预期和观察到的δ质量(ME)之间的偏差来定义;hmSEEKER 使用这三个参数来区分真阳性和假阳性,如讨论13 所示。(F) 最后,hmSEEKER编制冗余和非冗余双峰清单;第一个包括对所有甲基肽的预测,而第二个被过滤,以便在多次鉴定肽时,仅报告最佳评分双峰。 请点击此处查看此图的大图。
缓冲区 | 卷 | 组成 |
L-蛋氨酸(L)溶液 | 10毫升 | 30mg/mL 超纯水中的轻蛋氨酸 |
L-蛋氨酸(H)溶液 | 10毫升 | 30mg/mL 超纯水中重蛋氨酸 |
细胞培养基 | 500毫升 | 含稳定谷氨酰胺和不含蛋氨酸的DMEM,10%(v/v)透析FBS,1%(v/v)P/S,1:1000(v/v)L-蛋氨酸溶液 |
裂解缓冲液 | 50毫升 | 9M尿素,20mMHEPESpH 8.0;1%(v/v)蛋白酶抑制剂;超纯水中的1%(v/v)磷酸酶抑制剂 |
碳酸氢铵 (AMBIC) 解决方案 | 50毫升 | 1M (NH4)2CO3 超纯水溶液 |
数字地面对数字转换器解决方案 | 10毫升 | 1.25M DTT超纯水溶液 |
IAA 解决方案 | 5毫升 | 109mM超纯水溶液 |
溶剂 A 用于 Sep-Pak C18 | 50毫升 | 0.1%三氟乙酸超纯水溶液 |
溶剂B 用于 Sep-Pak C18 | 50毫升 | 0.1% TFA + 40% 乙腈超纯水溶液 |
用于Sep-Pak C18的洗涤液 | 50毫升 | 0.1% TFA + 5% 乙腈超纯水溶液 |
用于 HpH 分馏的缓冲液 A | 500毫升 | 25 mM NH4OH 超纯水溶液 |
用于 HpH 分馏的缓冲液 B | 500毫升 | 25 mM NH4OH+ 90% 乙腈超纯水溶液 |
IP 绑定缓冲区 1x | 5毫升 | 二稀酸盐 1:10 (V/V) 超纯水溶液,来自 10x 商业储备溶液 |
IP洗脱缓冲液 | 50毫升 | 0.15%三氟乙酸超纯水溶液 |
用于载物台提示的缓冲器 A | 50毫升 | 0.1%三氟乙酸超纯水溶液 |
用于载物台提示的缓冲液B | 50毫升 | 0.1% TFA + 40% 乙腈超纯水溶液 |
用于载物台提示的缓冲液C | 50毫升 | 0.1% TFA + 50% 乙腈超纯水溶液 |
质谱溶剂A | 250毫升 | 0.1%FA超纯水中 |
质谱溶剂B | 250毫升 | 0.1% FA + 80% 乙腈超纯水溶液 |
蛋白酶抑制剂鸡尾酒 | 5毫升 | c根据生产说明溶解在超纯水中的不含EDTA的蛋白酶抑制剂片剂(ROCHE) |
磷酸酶抑制剂鸡尾酒 | 5毫升 | PhosSTOP片剂(罗氏)根据生产说明溶解在超纯水中 |
表1:缓冲液和溶液组成。 此协议中使用的缓冲区和溶液的列表。
参数 | 价值 |
样品上样量 (uL) | 2 |
装载流量(uL/min) | 10 |
梯度流速(nL/min) | 300 |
线性梯度 | 3-30% B 持续 89 分钟,30-60% B 持续 5 分钟,60-95% B 持续 1 分钟,95% B 持续 5 分钟 |
全扫描分辨率 | 70,000 |
选择的最强离子数量 | 15 |
相对碰撞能量 (%) (CID) | 28 |
动态排除 (s) | 20.0 |
表 2:LC-MS/MS 设置。 应用于在高分辨率四极杆-Orbitrap质谱仪上对R-甲基肽进行LC-MS/MS分析的参数,该质谱仪与纳米流动超高效液相色谱(UHPLC)系统耦合。
MQ 参数设置(版本 1.6.2.10) | |||
设置 | 行动 | ||
配置 | |||
修改 | 金属4 | 添加新修改。将组合设置为 H(-3) Hx(3) Cx C(-1),然后选择 M 作为特异性。 | |
甲基4 (韩国) | 复制“甲基(KR)”,重命名并更改成分 Cx H(-1) Hx(3) | ||
二甲基4 | 复制“二甲基(KR)”,重命名并更改成分为H(-2) Hx(6) Cx(2) | ||
三甲基4(K) | 复制“三甲基(K)”,重命名并更改成分为Cx(3) H(-3) Hx(9) | ||
牛美4 | 复制“氧化(M)”并重命名。 | ||
蛋白酶 | 赖氨酸酶 | 添加新的蛋白酶。选择“R”和“K”列。 | |
创建新的PTM或蛋白酶时,单击“修改表”以更改MaxQuant设置,然后单击“保存更改”以确认更改。重新启动MaxQuant,新选项将可见。 | |||
“原始文件”选项卡 | |||
“参数”组 | 将原始文件分成 2 组(0 和 1) | ||
组特定参数 | |||
类型 | 类型 | 标准 | |
多样性 | 1 | ||
消化 | 酶 | 胰蛋白酶或赖氨酸酶 | |
最大漏诊解理 | 设置为 3 | ||
修改 | 变量修改 | 组 0 | 氧化, 甲基, 二甲基, 三甲基 |
组 1 | OxMet4, 甲基4, 二甲基4, 三甲基4 | ||
固定修改 | 组 0 | 脲甲基化 | |
组 1 | 氨基甲酰甲基化和甲基4 | ||
全局参数 | |||
序列 | 法斯塔文件 | 加载法斯塔文件 | |
鉴定 | PSM 罗斯福 | 设置为 0.01 | |
修饰肽的最低分数 | 设置为 1 | ||
修饰肽的最低 Delta 评分 | 设置为 1 | ||
高级识别 | 第二肽搜索 | 检查 | |
表 | 写入所有肽表 | 检查 | |
高深 | 计算峰值特性 | 检查 | |
如果未指定,请保留默认参数。 | |||
合并测试的 MQ 参数设置 | |||
组特定参数 | |||
类型 | 类型 | 标准 | |
多样性 | 2 | ||
最大标记 | 5 | ||
重标签 | 选择 Met4 | ||
消化 | 酶 | 胰蛋白酶或赖氨酸酶 | |
最大漏诊解理 | 设置为 3 | ||
修改 | 变量修改 | 氧化 (M) | |
固定修改 | 脲甲基化 | ||
如果未指定,请保留默认参数。 |
表 3:最大定量处理参数。 列出了调整到所描述的特定实验的组特定参数和全局参数。所有其他参数已设置为默认值,具体取决于所使用的程序版本。
列名 | 描述 |
原始文件 | 在其中标识双峰的原始数据文件 |
H 扫描 | 重型对应物的扫描编号 |
L扫描 | 光对应物的扫描编号 |
.CLASS | 可以有 3 个值: |
匹配 = 重肽和轻肽具有相同的序列 | |
不匹配 = 重肽和轻肽具有相同的 aa 序列,但甲基化位点的定位不匹配 | |
获救 = 双联体中仅鉴定出一种肽;它的对应物是一个未识别的山峰。 | |
肽 | 肽序列 |
得分 | 仙女座肽评分 |
RES | 改性残留物 |
收银机 | 改性残留物的位置 |
国防部 | 修改 |
铅蛋白 | 肽所属的蛋白质 |
基因 | 与蛋白质对应的基因名称 |
PROBABILITY_TRUE | 双峰是真正的 hmSILAC 双峰的概率,由逻辑回归模型计算 |
预测 | 如果双峰为真,则为 1,如果为假,则为 0 |
H/L 对数比 | 重/光强度比的 Log2 |
我 | 预期和观测质量差之间的偏差 |
DRT | 保留时间的差异 |
表 4:hmSEEKER 输出结果说明。 hmSEEKER 输出表中的列条目列表,以及其内容的简要说明。
Subscription Required. Please recommend JoVE to your librarian.
Discussion
由于存在高FDR的风险,通过全球基于MS的蛋白质组学对 体内 蛋白质/肽甲基化进行高置信度鉴定具有挑战性,在样品制备过程中会发生几种氨基酸取代和甲酯化,这些氨基酸取代和甲酯化与甲基化同量异位,并且在没有正交MS验证策略的情况下可能导致错误的分配。该PTM的亚化学计量性质使全球甲基蛋白质组学的任务进一步复杂化,但可以通过选择性富集修饰肽10来克服。
本文介绍了一种生化和分析工作流程,旨在通过应用hmSILAC策略与HpH-RP色谱肽分级分离和抗泛-R-甲基肽抗体试剂盒的亲和富集,提高R-甲基肽全球MS分析的效率和可靠性。前一种策略允许甲基肽的正交验证并大大降低鉴定的FDR,而后一种方案提高了它们从未修饰肽的背景中的可检测性22。然而,该协议的局限性是需要非常大量的起始蛋白质提取物(在20-40mg的范围内)作为随后的肽分级分离和亲和富集的输入,这限制了该方法的应用永生化,快速生长的细胞系可以广泛扩增。相反,目前的设置不适用于患者来源的原代细胞或组织。未来的研究应朝着这个方向改进方案:甲基化肽的生化富集策略优于未修饰的策略可以允许规避抗体的使用,从而缩小实验规模。另一个有趣的发展可能是将当前方法与具有同量异位或串联质量标签的蛋白水解肽的化学修饰相结合,具有双重的潜在优势:一方面,可以在一个实验中组合多个条件,从而在不同扰动下多重甲基蛋白质组学变化的相对定量;另一方面,在色谱分级分离和亲和富集之前将不同的样品汇集成一个样品可以减少单个实验的规模。
该方案依赖于与胰蛋白酶和赖氨酸酶平行的全细胞提取物的两个独立消化。胰蛋白酶在K和R残基的C端切割肽键,产生肽,除了来自α胺23的N端正电荷外,还产生在C末端呈现带正电荷的残基的肽。LysargiNase酶选择性地水解肽基-K和-R键,产生在N末端位点携带K或R的肽,其中可以包括K-甲基化形式。两种蛋白酶的使用增加了大规模MS分析中蛋白质组的整体覆盖率,从而鉴定出最终在单次胰蛋白酶消化中遗漏的肽18。相反,进行双酶消化以减少可能遗漏的酶切割的数量。事实上,K和R的甲基化会大大降低胰蛋白酶切割蛋白质的效率。尽管采取了这种预防措施,但甲基化肽仍然很常见,并且包含遗漏的切割,这会导致CID片段化不良。
使用另一种类型的碎裂,如电子转移解离(ETD),可以解决这个问题。事实上,ETD通常不会像CID那样有效地破碎带双电荷的肽离子,但它提供了较高电荷态的肽前体的相当均匀的切割(≥3)。在R-甲基化的情况下,这可能是一个优势,因为它经常发生在含有多个相邻R残基的富含精氨酸的结构域中。然而,ETD的扫描速率低于CID,因此肽鉴定的总数减少了24,25,26。
最近,涉及富集翻译后修饰肽的几种方案已与不同的色谱分离策略相结合,有助于降低肽混合物的复杂性,从而提高MS中修饰肽检测的整体效率。在这里,应用HpH-RP色谱分级分离与馏分的非连续串联相结合。基于高pH反相色谱的离线肽分级分离显示出高分离能力分离,与LC-MS/MS运行27期间下游进行的在线低pH RP分离正交。此外,非连续级联策略有两个主要优点:首先,通过将早期、中期和晚期洗脱部分汇集到单独的级联部分中,保持肽混合物的异质性,从而提高蛋白质覆盖率。其次,串联通过获取较少数量的样品馏分28来减少后续MS运行时分析。
由于R-甲基化的亚化学计量性质,为了便于在修饰蛋白质组的全局MS分析中检测甲基肽,需要富集步骤。在该协议中,甲基肽通过免疫亲和沉淀(IAP)富集,同时使用抗SDMA抗体和抗ADMA,而使用抗MMA抗体的单甲基肽的免疫沉淀在先前IAP实验的FT上进行。这个顺序反映了这些抗体的不同效率:抗SDMA和抗ADMA抗体的结合效率低于抗MMA抗体。值得注意的是,这种不同的效率也可能导致实验注释的修饰蛋白质组中不同程度的R-甲基化表示的偏差29。
在抗泛-R-甲基化抗体商业化之前,应用了其他分离策略来增强MS对R-甲基化肽的检测,例如强阳离子交换(SCX)和亲水作用(HILIC)色谱。尽管这些技术可以降低在MS中分析的肽混合物的复杂性,但它们并没有显著改善甲基肽30,31,32,33的鉴定。
尽管所有这些技术和分析解决方案都旨在增加甲基肽的分离、检测、片段化和序列注释,但甲基蛋白质组的覆盖范围仍然有限,并且偏向于更丰富的甲基化蛋白质,例如核糖核蛋白、RNA结合解旋酶,而几种已知的低丰度修饰蛋白(例如TP53BP1,CHTF8,MCM2)仅在多个全局实验中偶然检测到,并不可靠34.在当前工作流程之前应用的亚细胞分级分离可以改善此类蛋白质的检测;然而,目前所需的实验规模并不能使其成为可行的替代方案。
在MS上,通过MaxQuant算法分析原始数据以进行肽和PTM鉴定。然而,使用标准搜索算法对hmSILAC实验数据的分析并不简单。例如,虽然MaxQuant可以有效地分析基于同位素编码K和R的代谢标记的标准SILAC实验,但当同位素标记被编码到可变PTM中时,它不能有效地工作,例如在导致重甲基化的重甲基标记的情况下。因此,本文采用的策略是首先使用MaxQuant分析hmSILAC数据,而不使用其内置的双峰搜索功能,以便可以独立识别轻肽和重肽;然后将它们与后处理软件匹配。这种生物信息学工作流程也有其自身的缺陷,因为必须在MaxQuant的“变量修饰”面板中指定重和轻形式的甲基化,当还包括蛋氨酸氧化(重和轻)时,最终总共有八个变量修饰。使用MaxQuant/Andromeda等数据库搜索引擎搜索过多的PTM是不切实际的,因为它会导致算法必须测试的理论肽呈指数级增长:我们的解决方案是使用不同的可变PTM集(通过MaxQuant的参数组功能)分析每个MS原始数据两次。在肽搜索之后,使用内部开发的工具hmSEEKER来支持从MaxQuant生成的输出表中分配重轻肽对。hmSEEKER算法的第一个版本最近发布了13,其中表明hmSEEKER可以识别FDR<1%的hmSILAC双峰。假阳性仍然可能来自偶然具有4.02 Da质量差倍数的峰对,但鉴于以下事实,这对于分类为匹配或不匹配的双峰来说不太可能:对于匹配或不匹配的双峰是假的,仙女座必须错误地确定重对应物和轻对应物的序列。假设搜索引擎已使用其默认参数运行,则每个标识都有 1% 的概率不正确。因此,hmSILAC对应物也不正确的概率为0.01%。
hmSILAC的一个缺陷是,在其骨架中含有蛋氨酸的肽也会产生与甲基肽产生的双峰无法区分的双峰。然而,根据我们的经验,这应该不是一个主要问题,首先是因为没有甲基化的肽可以简单地从MaxQuant输出中丢弃,其次,因为hmSEEKER在计算预期质量差时会自动考虑甲基肽中的任何蛋氨酸残基;最后,这种风险也被排除在外,因为重度和轻度修饰是在单独的参数组中搜索的,因此搜索引擎无法将重单甲基化(+18.03 Da)拆分为轻单甲基化加重蛋氨酸(14.01 + 4.02 Da)。
Oreste Acuto和他的合作者提出了一个更正式和实验性的解决方案,他们开发了一种hmSILAC的变体,名为异蛋氨酸甲基-SILAC(iMethyl-SILAC)22。在这种替代代谢标记方案中,自然光蛋氨酸被[13C 4]-蛋氨酸取代,其质量与[13CD3]-蛋氨酸(Met-4)相同,但由于分子标签内重同位素的分布不同,它不产生稳定的同位素编码甲基。因此,在iMethyl-SILAC实验中,未修饰的含蛋氨酸肽不会产生双峰。然而,应该注意的是,当Acuto及其同事比较iMethyl-SILAC和传统hmSILAC的性能时,这两种方法仍然显示出非常相似的FDR。
hmSEEKER 的一个可能的局限性是,它被设计为直接在 MaxQuant 输出表上工作,因此其源代码与其他搜索引擎不兼容,后者的输出文件结构不同;从这个意义上说,MethylQuant35提供了一种很好的替代生物信息学工具,该工具是为直接分析来自hmSILAC型实验的MS原始 数据而量身定制 的,并且在提供的输入文件方面更加灵活。正在开发一种机器学习模型,以便在不依赖用户定义的阈值的情况下区分真假甲基肽 H/L 双联体。
Subscription Required. Please recommend JoVE to your librarian.
Disclosures
作者没有什么可透露的。
Acknowledgments
MM和EM是欧洲分子医学学院(SEMM)的博士生。EM是FIRC-AIRC助学金的3年期(项目代码:22506)的获得者。结核病组中R-甲基蛋白质组的全球分析得到了AIRC IG资助(项目代码:21834)的支持。
Materials
Name | Company | Catalog Number | Comments |
Ammonium Bicarbonate (AMBIC) | Sigma-Aldrich | 09830 | |
Ammonium Persulfate (APS) | Sigma-Aldrich | 497363 | |
C18 Sep-Pak columns vacc 6cc (1g) | Waters | WAT036905 | |
Colloidal Coomassie staining Instant | Sigma-Aldrich | ISB1L-1L | |
cOmplete Mini, EDTA-free | Roche-Sigma Aldrich | 11836170001 | Protease Inhibitor |
Dialyzed Fetal Bovine Serum (FBS) | GIBCO ThermoFisher | 26400-044 | |
DL-Dithiothreitol (DTT) | Sigma-Aldrich | 3483-12-3 | |
DMEM Medium | GIBCO ThermoFisher | requested | with stabile glutamine and without methionine |
EASY-nano LC 1200 chromatography system | ThermoFisher | ||
EASY-Spray HPLC Columns | ThermoFisher | ES907 | |
Glycerolo | Sigma-Aldrich | G5516 | |
HeLa cells | ATCC | ATCC CCL-2 | |
HEPES | Sigma-Aldrich | H3375 | |
Iodoacetamide (IAA) | Sigma-Aldrich | 144-48-9 | |
Jupiter C12-RP column | Phenomenex | 00G-4396-E0 | |
L-Methionine | Sigma-Aldrich | M5308 | Light (L) Methionine |
L-Methionine-(methyl-13C,d3) | Sigma-Aldrich | 299154 | Heavy (H) Methionine |
LysargiNase | Merck Millipore | EMS0008 | |
Microtip Cell Disruptor Sonifier 250 | Branson | ||
N,N,N′,N′-Tetramethylethylenediamine (TEMED) | Sigma-Aldrich | T9281 | |
Penicillin-Streptomycin | GIBCO ThermoFisher | 15140122 | |
PhosSTOP | Roche-Sigma Aldrich | 4906837001 | Phosphatase Inhibitor |
Pierce C18 Tips | ThermoFisher | 87782 | |
Pierce 0.1% Formic Acid (v/v) in Acetonitrile, LC-MS Grade | ThermoFisher | 85175 | LC-MS Solvent B |
Pierce 0.1% Formic Acid (v/v) in Water, LC-MS Grade | ThermoFisher | 85170 | LC-MS Solvent A |
Pierce Acetonitrile (ACN), LC-MS Grade | ThermoFisher | 51101 | |
Pierce Water, LC-MS Grade | ThermoFisher | 51140 | |
Polyacrylamide | Sigma-Aldrich | 92560 | |
Precision Plus Protein All Blue Prestained Protein Standards | Bio-Rad | 1610373 | |
PTMScan antibodies α-ADMA | Cell Signaling Technology | 13474 | |
PTMScan antibodies α-MMA | Cell Signaling Technology | 12235 | |
PTMScan antibodies α-SDMA | Cell Signaling Technology | 13563 | |
Q Exactive HF Hybrid Quadrupole-Orbitrap Mass Spectrometer | ThermoFisher | ||
Sequencing Grade Modified Trypsin | Promega | V5113 | |
Trifluoroacetic acid | Sigma-Aldrich | T6508 | |
Ultimate 3000 HPLC | Dionex | ||
Urea | Sigma-Aldrich | U5378 | |
Vacuum Concentrator 5301 | Eppendorf | Speed vac |
References
- Bulau, P., et al. Quantitative assessment of arginine methylation in free versus protein-incorporated amino acids in vitro and in vivo using protein hydrolysis and high-performance liquid chromatography. Biotechniques. 40 (3), 305-310 (2006).
- Blanc, R. S., Richard, S.
Arginine methylation: the coming of age. Molecular Cell. 65 (1), 8-24 (2017). - Sylvestersen, K. B., Horn, H., Jungmichel, S., Jensen, L. J., Nielsen, M. L. Proteomic analysis of arginine methylation sites in human cells reveals dynamic regulation during transcriptional arrest. Molecular & Cellular Proteomics. 13 (8), 2072-2088 (2014).
- Yang, Y., Bedford, M. T.
Protein arginine methyltransferases and cancer. Nature Reviews Cancer. 13 (1), 37-50 (2013). - Bezzi, M., et al. Regulation of constitutive and alternative splicing by PRMT5 reveals a role for Mdm4 pre-mRNA in sensing defects in the spliceosomal machinery. Genes & Development. 27 (17), 1903-1916 (2013).
- Auclair, Y., Richard, S. The role of arginine methylation in the DNA damage response. DNA Repair. 12 (7), 459-465 (2013).
- Spadotto, V., et al. PRMT1-mediated methylation of the microprocessor-associated proteins regulates microRNA biogenesis. Nucleic Acids Research. 48 (1), 96-115 (2020).
- Musiani, D., Massignani, E., Cuomo, A., Yadav, A., Bonaldi, T. Biochemical and computational approaches for the large-scale analysis of protein arginine methylation by mass spectrometry. Current Protein and Peptide Science. 21 (7), 725-739 (2020).
- Ong, S. -E., Mittler, G., Mann, M. Identifying and quantifying in vivo methylation sites by heavy methyl SILAC. Nature Methods. 1 (2), 119-126 (2004).
- Hart-Smith, G., Yagoub, D., Tay, A. P., Pickford, R., Wilkins, M. R. Large scale mass spectrometry-based identifications of enzyme-mediated protein methylation are subject to high false discovery rates. Molecular & Cellular Proteomics. 15 (3), 989-1006 (2016).
- Bedford, M. T., Clarke, S. G. Protein arginine methylation in mammals: who, what, and why. Molecular Cell. 33 (1), 1-13 (2009).
- Larsen, S. C., et al. Proteome-wide analysis of arginine monomethylation reveals widespread occurrence in human cells. Science Signaling. 9 (443), (2016).
- Massignani, E., et al. hmSEEKER: Identification of hmSILAC doublets in MaxQuant output data. Proteomics. 19 (5), 1800300 (2019).
- Bradford, M. M. A rapid and sensitive method for the quantitation of microgram quantities of protein utilizing the principle of protein-dye binding. Analytical Biochemistry. 72, 248-254 (1976).
- Smith, P. K., et al.
Measurement of protein using bicinchoninic acid. Analytical Biochemistry. 150 (1), 76-85 (1985). - Getz, E. B., Xiao, M., Chakrabarty, T., Cooke, R., Selvin, P. R. A comparison between the sulfhydryl reductants tris(2-carboxyethyl)phosphine and dithiothreitol for use in protein biochemistry. Analytical Biochemistry. 273 (1), 73-80 (1999).
- Nielsen, M. L., et al. Iodoacetamide-induced artifact mimics ubiquitination in mass spectrometry. Nature Methods. 5 (6), 459-460 (2008).
- Huesgen, P. F., et al. LysargiNase mirrors trypsin for protein C-terminal and methylation-site identification. Nature Methods. 12 (1), 55-58 (2015).
- Rappsilber, J., Mann, M., Ishihama, Y. Protocol for micro-purification, enrichment, pre-fractionation and storage of peptides for proteomics using StageTips. Nature Protocols. 2 (8), 1896 (2007).
- Hartel, N. G., Chew, B., Qin, J., Xu, J., Graham, N. A. Deep protein methylation profiling by combined chemical and immunoaffinity approaches reveals novel PRMT1 targets. Molecular & Cellular Proteomics. 18 (11), 2149-2164 (2019).
- Bremang, M., et al. Mass spectrometry-based identification and characterisation of lysine and arginine methylation in the human proteome. Molecular bioSystems. 9 (9), 2231-2247 (2013).
- Geoghegan, V., Guo, A., Trudgian, D., Thomas, B., Acuto, O. Comprehensive identification of arginine methylation in primary T cells reveals regulatory roles in cell signalling. Nature Communications. 6 (1), 1-8 (2015).
- Tabb, D. L., Huang, Y., Wysocki, V. H., Yates, J. R. Influence of basic residue content on fragment ion peak intensities in low-energy collision-induced dissociation spectra of peptides. Analytical Chemistry. 76 (5), 1243-1248 (2004).
- Guthals, A., Bandeira, N. Peptide identification by tandem mass spectrometry with alternate fragmentation modes. Molecular & Cellular Proteomics. 11 (9), 550-557 (2012).
- Swaney, D. L., et al. Supplemental activation method for high-efficiency electron-transfer dissociation of doubly protonated peptide precursors. Analytical Chemistry. 79 (2), 477-485 (2007).
- Kundinger, S. R., Bishof, I., Dammer, E. B., Duong, D. M., Seyfried, N. T. Middle-down proteomics reveals dense sites of methylation and phosphorylation in arginine-rich RNA-binding proteins. Journal of Proteome Research. 19 (4), 1574-1591 (2020).
- Batth, T. S., Francavilla, C., Olsen, J. V. Off-line high-pH reversed-phase fractionation for in-depth phosphoproteomics. Journal of Proteome Research. 13 (12), 6176-6186 (2014).
- Yang, F., Shen, Y., Camp, D. G., Smith, R. D. High-pH reversed-phase chromatography with fraction concatenation for 2D proteomic analysis. Expert Review of Proteomics. 9 (2), 129-134 (2012).
- Hartel, N. G., Chew, B., Qin, J., Xu, J., Graham, N. A. Deep protein methylation profiling by combined chemical and immunoaffinity approaches reveals novel PRMT1 targets. Molecular & Cellular Proteomics. 18 (11), 2149-2164 (2019).
- Uhlmann, T., et al. A method for large-scale identification of protein arginine methylation. Molecular & Cellular Proteomics. 11 (11), 1489-1499 (2012).
- Wang, K., et al. Antibody-free approach for the global analysis of protein methylation. Analytical chemistry. 88 (23), 11319-11327 (2016).
- Moore, K. E., et al. A general molecular affinity strategy for global detection and proteomic analysis of lysine methylation. Molecular cell. 50 (3), 444-456 (2013).
- Wu, Z., et al. A chemical proteomics approach for global analysis of lysine monomethylome profiling. Molecular & Cellular Proteomics. 14 (2), 329-339 (2015).
- Sylvestersen, K. B., Horn, H., Jungmichel, S., Jensen, L. J., Nielsen, M. L. Proteomic analysis of arginine methylation sites in human cells reveals dynamic regulation during transcriptional arrest. Molecular & Cellular Proteomics. 13 (8), 2072-2088 (2014).
- Tay, A. P., Geoghegan, V., Yagoub, D., Wilkins, M. R., Hart-Smith, G. MethylQuant: A Tool for Sensitive Validation of Enzyme-Mediated Protein Methylation Sites from Heavy-Methyl SILAC Data. Journal of Proteome Research. 17 (1), 359-373 (2018).