Summary
本文介绍了如何使用软件应用程序mAbScale来计算基于单克隆抗体的蛋白质疗法的质量数。
Abstract
生物治疗肿块是验证身份和结构完整性的一种手段。完整蛋白质或蛋白质亚基的质谱 (MS) 为生物制药开发的不同阶段提供了一种简单的分析工具。当MS的实验质量数在理论质量数的预定义质量数误差范围内时,蛋白质的身份得到确认。虽然有几种计算工具可用于计算蛋白质和肽分子量,但它们要么不是为直接应用于生物治疗实体而设计的,要么由于付费许可证而存在访问限制,要么需要将蛋白质序列上传到主机服务器。
我们开发了一种模块化质量数计算程序,可以轻松测定治疗性糖蛋白(包括单克隆抗体 (mAb)、双特异性抗体 (bsAb) 和抗体-药物偶联物 (ADC))的平均或单同位素质量数和元素组成。这个基于 Python 的计算框架的模块化特性将允许该平台在未来扩展到其他模式,例如疫苗、融合蛋白和寡核苷酸,并且该框架也可用于自上而下的质谱数据查询。通过创建具有图形用户界面 (GUI) 的开源独立桌面应用程序,我们希望克服在无法将专有信息上传到基于 Web 的工具的环境中使用的限制。本文介绍了mAbScale工具在不同基于抗体的治疗方式中的算法和应用。
Introduction
在过去的二十年里,生物治疗药物已经发展成为现代制药工业的中流砥柱。SARS-CoV2 大流行和其他危及生命的疾病进一步增加了对更快、更广泛地开发生物制药分子的需求 1,2,3。
生物治疗药物分子量与其他分析检测相结合,对于分子的鉴定至关重要。完整和减少的亚基质量数用于整个发现和开发生命周期,作为旨在保持质量的控制策略的一部分,如QTPP(质量目标产品简介)4中所述。
生物制药行业的分析开发在很大程度上依赖于质量测量,以使用肽图分析或多属性方法(MAM)监测进行完整质量分析和深度表征。利用现代质谱 (MS) 平台的这些技术的核心是能够提供高分辨率的精确质量 (HR/AM) 测量。大多数HR/AM仪器的质量精度在0.5-5 ppm范围内,与质量范围成正比。准确测量完整大分子质量数的能力能够快速、可靠地鉴定大分子治疗药物。由于使用大分子(>10 kDa)的典型实验条件无法获得同位素分辨率,因此必须计算平均质量数以进行比较和鉴定5,6。
典型的完整或亚基蛋白质质谱图代表了整体蛋白型图谱,其中包含翻译后修饰 (PTM) 产生的各种分子形式的复合信息以及任何一级结构差异,例如片段或序列变体。这些测量相对容易和高通量的特性使它们对表征和作为过程监测控制具有吸引力7,8。这些实验的数据分析通常要求用户定义分子形式(PTM或其他分子形式的范围)的搜索空间。对于糖基化蛋白,这种搜索空间很大程度上是由糖型异质性驱动的。多个 PTM、二硫键构型以及沿一级结构的其他变化的组合使得计算所有可能的分子形式成为一项繁琐的任务。因此,手动计算可能的分子形式是一个耗时、耗费资源的过程,极有可能出现人为错误。
在这里,我们提出了一种质量计算工具,该工具是考虑到生物治疗分子的最重要特征而开发的,例如mAb、bsAb、ADC等。该工具允许轻松合并搜索空间变量,以实现质量和元素组成的一致计算。该工具的模块化特性将使其能够进一步发展并应用于其他模式的质量计算和质量匹配。
GUI模块允许用户指定质量计算的输入,如图 1所示;具体来说,用户输入轻抗体链和重抗体链的单字母氨基酸序列。重链 N 端环化和 C 端赖氨酸剪切的常见修饰作为复选框包括在内。此外,可以通过相应的 Chem Mod 文本框从这些蛋白质链中添加/减去化学式/元素组成。这允许用户灵活地添加元素组成,包括多个翻译后修饰或ADC中的小分子有效载荷。由于大多数治疗性单克隆抗体被设计为去除轻链中的糖基化位点,因此轻链中的糖基化是可选的,可以使用 GUI 上的复选框进行指定。
抗体完整质量数分析的典型变化是亚基质量数分析,其中轻链通过减少链间二硫键从重链中分离出来。根据所用还原剂的强度,链内二硫键可能被裂解,也可能不被切割。用户可以根据IgG亚型或半胱氨酸偶联ADC9灵活地输入二硫键的总数。
该应用程序以自下而上的方式计算质量,其中首先计算单个重链和轻链的元素组成。接下来,通过调整计算出的元素组成来解释重链(HC)N端环化Lys-clipping。然后将任何指定的化学修饰应用于重链和/或轻链。根据分析类型和用户指定的二硫键模式,调整两条多肽链的氢数量。糖基化的HC和轻链(LC)(可选)质量数是根据用户的输入计算的。最后,将多个HC和LC质量数合并,并自动更新二硫键数以计算完整质量数。
对于较大的分子(如完整的蛋白质),当使用具有典型分辨能力的质谱仪时,由于加性质量缺陷,无法测量单同位素质量数。取而代之的是,测量或报告标称或平均质量 5,10,11,12,13。平均元素质量可以根据用于策划质量的来源而变化14,15。虽然元素质量的差异可能很小,但对于大分子分子量计算来说,它们加起来可以产生显著的值。软件应用程序中默认使用的平均元素质量如附表1所示。对于生物制药研发(R&D)领域等受监管的环境,保持一致的分子量非常重要,因为质量的变化可能意味着在监管备案期间分子实体发生变化。为了实现元素质量使用的一致性,软件工具中包含了元素质量字典,作为逗号分隔值 (csv) 文本文件:Element_Mass.csv(补充编码文件 1)。同样,包括mAb上常见的聚糖组合物的精选列表:聚糖.csv(补充编码文件2)。这两个文件都保存在与可执行应用程序相同的文件夹位置,用户可以修改以使用特定的元素质量数列表或聚糖库。
图 1:mAbScale 应用程序的 GUI 界面。 GUI模块允许用户指定质量计算的输入。用户输入轻抗体链和重抗体链的单字母氨基酸序列。重链 N 端环化和 C 端赖氨酸剪切的常见修饰作为复选框包含在内。化学式/元素组成可以通过相应的 Chem Mod 文本框进行添加/减去。 请点击这里查看此图的较大版本.
Subscription Required. Please recommend JoVE to your librarian.
Protocol
mAbScale 的高级工作流程 如图 2 所示。每个步骤都有更复杂的内部决策分支、循环和组合函数。描述计算过程的详细算法工作流程见 补充图 1。应用程序输出以电子表格格式保存在用户选择的文件夹中。输出文件由多个单独的工作表组成,这些工作表可以归类为用户输入、分子量计算和平均同位素质量数推导的参考(补充表中提供了示例输出)。用户输入的工作表包括用户输入的蛋白质氨基酸序列和其他信息、平均元素质量和聚糖质量,用于计算元素组成和不同分子量。分子量计算表包括各种形式的化学组成、有和没有糖基化和化学修饰的还原质量数,以及有和没有糖基化和化学修饰的完整质量数。如果用户在用户输入页面中输入两种不同的 HC 和/或两种不同的 LC,则将自动生成含有半抗体质量的纸,因为半抗体是需要相对于所需异二聚体进行鉴定和定量的主要杂质。mAbScale 的源代码可通过以下存储库访问:https://github.com/kkhatri99/mAbScale。
图 2:使用该应用计算元素组成和质量所涉及的步骤概述。 颜色编码可用于链接到 补充图1中描述的工艺流程。 请点击这里查看此图的较大版本.
1. 打开 mAbscale 应用程序
- 双击可执行文件的图标打开软件应用程序。
2. 序列输入
- 在标有 1 的相应文本框中输入重链和轻链序列,不带任何空格。
- 对于 bsAbs,在标记为 2 的第二组文本框中添加其他重链或轻链。对于具有相同重链和轻链的mAb,留 2 个空白。
- 选中 N-Terminal Cyclization 和/或 C-Terminal Clipping 复选框(如果这些重链端子变体适用)。
- 将任何化学修饰(包括ADC分子的接头和有效载荷)添加到“重链化学模组”和/或“轻链化学模组”文本框中。
- 将修饰指定为元素组成,例如 CaCl2。修饰将被添加到相应的蛋白质亚基或链中。
注:化学成分也可以通过在元素组成前面加上-符号来从亚基或链中减去。例如,-H2O 将从亚基组成和质量中减去水分子。
- 将修饰指定为元素组成,例如 CaCl2。修饰将被添加到相应的蛋白质亚基或链中。
3. 指定二硫键的数量
- 在标记为“二硫 化物总数”的文本框中指定蛋白质分子中二硫键的数量。
- 在未还原的 HC 二硫 化物文本框中输入未还原的 HC 二硫化物的数量,在未还原的 LC 二硫化物文本框中输入未还原的 LC 二硫 化物的数量,具体取决于还原程度(完全还原与部分还原)。
注:mAb亚基的简化质量数分析涉及二硫键连接的重链和轻链的还原/分离。 - 如果 mAb 轻链上存在糖基化,请选中 Light Chain is Glycosylated 复选框。
4. 设置输出文件夹并运行应用程序
- 单击“ 浏览 ”按钮为“输出文件夹”文本框选择 输出文件夹 。
- 在 Excel 文件(无分机) 文本框中输入不带文件扩展名的输出文件名(自动另存为 .xlsx)。
- 单击 “提交 ”按钮开始应用程序。输出文件可以在指定的文件夹中找到。
注:元素质量和聚糖列表可以通过分别编辑带分隔符的文本文件 Element_Mass.csv (补充编码文件 1)和 聚糖.csv (补充编码文件 2)来定制。这些文件必须与 mAbScale.exe (补充编码文件 3)可执行文件放在同一文件夹中,应用程序才能执行。应用程序将在执行一次后自动关闭。如果需要第二次计算,用户将不得不再次启动应用。
Subscription Required. Please recommend JoVE to your librarian.
Representative Results
选择多种单克隆抗体来代表不同类型的单克隆抗体。选择市售的mAb标准品来表示在Fc区域具有相同重链、相同轻链和一个N-连接糖基化位点的常规mAb。此外,还选择了具有额外轻链 N-连接糖基化的单克隆抗体、双特异性单克隆抗体和抗体-药物偶联物 (ADC) 单克隆抗体,以扩大应用范围。 表1总结了这些示例mAb的化学成分、计算质量数、测量质量和质量数误差。mAbScale报告的蛋白质化学组成和计算质量数已通过GPMAW16(一种用于蛋白质和肽一级结构分析的程序)确认。
对于完整质量数分析,使用LC-MS级水将mAb样品稀释至1 mg/mL,然后进样进行分析。对于还原分析,首先用二硫苏糖醇处理样品,并在37°C下孵育15分钟以切割链间二硫键。所有样品均使用与质谱仪联用的Acquity UPLC系统进行分析。采用BEH 200 SEC色谱柱进行在线脱盐,采用等度法,以水/乙腈(65:35)和0.1% TFA为流动相分离重链和轻链。质谱仪在正离子模式下运行,扫描范围为700-5,000 m/z。
Protien Metrics, Inc. (PMi) Byos 的完整工作流程和简化工作流程分别用于处理完整和简化的原始光谱。完整质量数反卷积的蛋白质质量范围设置为143,000-163,000 Da,HC质量数反卷积的蛋白质质量范围设置为47,000-53,000 Da,LC质量数反卷积的蛋白质质量范围设置为20,000-27,000 Da。对于自动质量数/峰拾取,质量峰之间的最小差值设置为15 Da,最大质量峰数限制为10。在质量匹配选项卡中输入/选择预期糖基列表,并将质量匹配公差的上限设置为10 Da。
计算质量数与测量质量数之间的小质量数误差在正常质量数误差接受标准范围内(完整mAb为≤10 Da,还原重链和轻链分别为≤5 Da),表明计算的质量数准确17。
为了计算ADC理论质量数,可以将具有接头/有效载荷元素组成的化学修饰添加到特定的mAb亚基中。但是,输出中仅包括一种载药比质量的分子量。不同载药比的抗体的复合分子量必须由用户手动添加。鉴于该项目的开源性质,这些功能可以添加到更高版本的 mAbScale 中,也可以在社区支持下进行修改。
表1:各种mAb亚基和分子形式的计算和测量质量数比较。 下表总结了示例mAb的化学成分、计算质量数、测量质量和质量数误差。 请按此下载此表格。
补充图 1:mAbScale 的详细算法工作流程。请点击这里下载此文件。
补充表1:mAbScale14,15中使用的计算平均元素质量数。请点击这里下载此文件。
补充编码文件1:元素质量列表。请点击这里下载此文件。
补充编码文件2:聚糖列表。请点击这里下载此文件。
补充编码文件 3:捆绑的应用程序 - mAbScale 可执行文件。请点击这里下载此文件。
Subscription Required. Please recommend JoVE to your librarian.
Discussion
mAbScale提供了一个直观的用户界面,可以灵活地改变质量数和元素计算的构建模块。用户应对目标分子有基本的了解,以便使用该应用程序,得出正确的质量数,并解释结果。例如,由于完整或减少质量数的行数众多,完整或减少的质量输出表可能会让人不知所措,因为默认的聚糖数据库包含88种N-连接聚糖,这些聚糖通常存在于治疗性抗体的Fc部分,并且该应用程序计算了数据库18中包含的所有可能的糖型质量数,19.虽然大多数治疗性单克隆抗体被设计为去除 Fab 区域的糖基化,但一些单克隆抗体可能会保留该糖基化位点,这可能会进一步增加糖基化蛋白型的总数。建议用户建立一个聚糖数据库,重点关注给定分子最合适的糖型,以降低输出的复杂性,并更好地将结果与测量的质量数对齐,以进行质量峰鉴定。
由于轻链和重链的异质性,bsAb 的复杂性进一步增加。该软件应用程序使用提供的 LC 和 HC 序列和糖型生成所有可能的排列和组合,以允许从抗体亚基(如半抗体)的错配或不完全配对中产生所有潜在的副产物。这就让用户过滤出最适合他们使用的蛋白质形式。软件输出将糖基化和非糖基化输出划分为单独的工作表,使用户更容易查看。完整分子量和还原分子量也被分离,bsAb 的所有可能的半抗体组合都列在专门的工作表中,以进一步简化处理结果的摄取。
当前软件版本的一个局限性是,由于有效载荷化学结构是在 Heavy Chain Chem Mod 和 Light Chain Chem Mod 文本框中输入的,因此应用程序一次仅使用一种药物抗体比来计算 ADC 质量数。对于每种药物抗体比值(DAR),用户需要输入元素组成进行重新计算。
计算完整蛋白质质量数的能力由多个应用程序提供,但它们要么需要购买商业许可证,要么是需要上传蛋白质序列的基于 Web 的工具 16,20,21。这些应用为用户提供了非常有限的灵活性,无法添加定制的化学修饰或轻松合并分子内键,例如二硫化物。此外,当涉及专有和机密信息时,例如在药物开发或其他受控环境中,基于Web的应用程序的价值受到限制,因为生物治疗药物序列信息无法上传到外部服务器。因此,研究人员必须依赖手动计算或程序化例程,这些例程不太灵活,难以传播,并可能导致不一致。
我们开发了一个用于计算分子量和元素组成的开源框架,重点是减轻与现有应用相关的限制。带有 GUI 的独立桌面应用程序将克服与将专有信息上传到外部服务器相关的限制,并使用户能够轻松访问。该工具可用于最常见的生物治疗方式,包括mAb、bsAb和ADC。此外,可以很容易地定制修改范围和源元素质量,以满足用户的需求。该工作流程的灵活性将允许未来的开发包括应用于其他治疗方式,如非mAb蛋白疗法、多亚单位疫苗和寡核苷酸或mRNA。通过开源这个框架,我们希望让社区参与到进一步的开发和适应其他模式中,以及添加更多功能,例如计算自上而下的MS数据查询的理论片段。
Subscription Required. Please recommend JoVE to your librarian.
Disclosures
该软件在 Apache 2.0 许可下发布。葛兰素史克研究与发展有限公司版权所有 (2022)。保留所有权利。根据 Apache 许可证 2.0 版(以下简称“许可证”)获得许可;除非遵守许可,否则您不得使用此文件。您可以在 http://www.apache.org/licenses/LICENSE-2.0 获取许可证的副本。除非适用法律要求或书面同意,否则根据许可分发的软件按“原样”分发,不附带任何明示或暗示的保证或条件。请参阅许可证,了解许可证下管理权限和限制的特定语言。L.C.是葛兰素史克(GSK)的员工。T.H. 和 K.K. 作为 GSK 的员工开发了该软件,现在分别是 Merck 和 Moderna 的合作伙伴。
Acknowledgments
作者感谢罗伯特·舒斯特(Robert Schuster)在数据验证方面的帮助。
Materials
Name | Company | Catalog Number | Comments |
Acquity UPLC system | Waters Corp., Milford, MA | N/A | Modular system |
Antibody-drug conjugate (ADC) | GlaxoSmithKline | N/A | Proprietory molecule |
BEH 200 SEC column | Waters Corp., Milford, MA | 176003904 | |
Bispecific mAb | GlaxoSmithKline | N/A | Proprietory molecule |
Byos | Protein Metrics, Cupertino, CA | https://proteinmetrics.com/byos/ Version 4.5 |
|
GPMAW | GPMAW | http://www.gpmaw.com/ | |
LC-MS grade water | Thermo Fisher Scientific, Waltham, MA | W6-1 | |
mAb standard | Waters Corp., Milford, MA | 186009125 | Waters Humanized mAb Mass Check Standard |
mAbScale | GlaxoSmithKline | Apache License, Version 2.0 | |
Xevo G2 Q-TOF mass spectrometer | Waters Corp., Milford, MA | N/A | Modular system |
References
- Reichert, J. M., Valge-Archer, V. E. Development trends for monoclonal antibody cancer therapeutics. Nature Reviews Drug Discovery. 6 (5), 349-356 (2007).
- Kintzing, J. R., Filsinger Interrante, M. V., Cochran, J. R. Emerging strategies for developing next-generation protein therapeutics for cancer treatment. Trends in Pharmacological Sciences. 37 (12), 993-1008 (2016).
- Wang, M. -Y., et al. SARS-CoV-2: Structure, biology, and structure-based therapeutics development. Frontiers in Cellular and Infection Microbiology. 10, 587269 (2020).
- ICH Q8 (R2) Pharmaceutical Development - Scientific Guideline. European Medicines Agency. , Available from: https://www.ema.europa.eu/en/ch-q8-r2-pharmaceutical-development-scientific-guideline (2018).
- Donnelly, D. P., et al. Best practices and benchmarks for intact protein analysis for top-down mass spectrometry. Nature Methods. 16 (7), 587-594 (2019).
- Gadgil, H. S., Pipes, G. D., Dillon, T. M., Treuheit, M. J., Bondarenko, P. V. Improving mass accuracy of high performance liquid chromatography/electrospray ionization time-of-flight mass spectrometry of intact antibodies. Journal of the American Society for Mass Spectrometry. 17 (6), 867-872 (2006).
- Beck, A., Sanglier-Cianférani, S., Van Dorsselaer, A. Biosimilar, biobetter, and next generation antibody characterization by mass spectrometry. Analytical Chemistry. 84 (11), 4637-4646 (2012).
- Camperi, J., Goyon, A., Guillarme, D., Zhang, K., Stella, C. Multi-dimensional LC-MS: the next generation characterization of antibody-based therapeutics by unified online bottom-up, middle-up and intact approaches. Analyst. 146 (3), 747-769 (2021).
- Liu, H., May, K. Disulfide bond structures of IgG molecules. mAbs. 4 (1), 17-23 (2012).
- Jakes, C., Füssl, F., Zaborowska, I., Bones, J. Rapid analysis of biotherapeutics using protein a chromatography coupled to orbitrap mass spectrometry. Analytical Chemistry. 93 (40), 13505-13512 (2021).
- Robotham, A. C., Kelly, J. F. Chapter 1 - LC-MS characterization of antibody-based therapeutics: Recent highlights and future prospects. Approaches to the Purification, Analysis and Characterization of Antibody-Based Therapeutics. Matte, A. , Elsevier. Amsterdam, the Netherlands. 1-33 (2020).
- Valeja, S. G., et al. Unit mass baseline resolution for an intact 148 kDa therapeutic monoclonal antibody by fourier transform ion cyclotron resonance mass spectrometry. Analytical Chemistry. 83 (22), 8391-8395 (2011).
- Fornelli, L., Ayoub, D., Aizikov, K., Beck, A., Tsybin, Y. O. Middle-down analysis of monoclonal antibodies with electron transfer dissociation orbitrap fourier transform mass spectrometry. Analytical Chemistry. 86 (6), 3005-3012 (2014).
- Berglund, M., Wieser, M. E. Isotopic compositions of the elements 2009 (IUPAC Technical Report). Pure and Applied Chemistry. 83 (2), 397-410 (2011).
- Wang, M., et al. The Ame2012 atomic mass evaluation. Chinese Physics C. 36 (12), 1603-2014 (2012).
- Peri, S., Steen, H., Pandey, A. GPMAW--A software tool for analyzing proteins and peptides. Trends in Biochemical Sciences. 26 (11), 687-689 (2001).
- Tipton, J. D., et al. Analysis of intact protein isoforms by mass spectrometry. The Journal of Biological Chemistry. 286 (29), 25451-25458 (2011).
- De Leoz, M. L. A., et al. interlaboratory study on glycosylation analysis of monoclonal antibodies: Comparison of results from diverse analytical methods. Molecular & Cellular Proteomics. 19 (1), 11-30 (2020).
- Cymer, F., Beck, H., Rohde, A., Reusch, D. Therapeutic monoclonal antibody N-glycosylation - Structure, function and therapeutic potential. Biologicals. 52, 1-11 (2018).
- Baker, P. R., Trinidad, J. C., Chalkley, R. J. Modification site localization scoring integrated into a search engine. Molecular & Cellular Proteomics. 10 (7), (2011).
- Chalkley, R. J., Clauser, K. R. Modification site localization scoring: Strategies and performance. Molecular & Cellular Proteomics. 11 (5), 3-14 (2012).