该协议说明了如何使用在线资源探索,比较和解释人类蛋白质糖组。
Glyco@Expasy倡议是作为相互依存的数据库和工具的集合而发起的,这些数据库和工具跨越了糖生物学知识的几个方面。特别是,它旨在突出糖蛋白(如细胞表面受体)与聚糖介导的碳水化合物结合蛋白之间的相互作用。在这里,通过两个以人前列腺特异性抗原(PSA)的N-糖组和人血清蛋白的O-糖组为中心的说明性示例介绍了该系列的主要资源。通过不同的数据库查询和可视化工具的帮助,本文演示了如何在连续体中浏览和比较内容,以收集和关联原本分散的信息片段。收集的数据注定要为更复杂的聚糖功能方案提供信息。因此,这里介绍的Glycoinformatics被提议作为一种在给定背景下加强,塑造或反驳对蛋白质糖组特异性的假设的手段。
聚糖、它们附着的蛋白质(糖蛋白)和它们结合的蛋白质(凝集素或碳水化合物结合蛋白)是细胞表面的主要分子参与者1。尽管在细胞 – 细胞通讯中发挥了核心作用,但与基因组学和蛋白质组学中的对应物相比,包括糖组学,糖组学或聚糖相互作用组学数据的大规模研究仍然稀缺。
直到最近,尚未开发出表征复杂碳水化合物的分支结构,同时仍与载体蛋白偶联的方法。糖蛋白的生物合成是一个非模板驱动的过程,其中单糖供体,接受糖蛋白底物以及糖基转移酶和糖苷酶起着相互作用的作用。由此产生的糖蛋白可以具有具有多个分支点的复杂结构,其中每个单糖组分都可以是自然界中存在的几种类型之一1。非模板驱动的过程将生化分析作为生成寡糖结构数据的唯一选择。附着在天然蛋白质上的聚糖结构的分析过程通常具有挑战性,因为它需要灵敏,定量和稳健的技术来确定单糖组成,键和分支序列2。
在这种情况下,质谱(MS)是糖组学和糖蛋白质组学实验中使用最广泛的技术。随着时间的推移,这些都是在更高的吞吐量设置中执行的,数据现在正在数据库中积累。各种格式的聚糖结构3,填充GlyTouCan4,通用聚糖数据存储库,其中每个结构都与稳定的标识符相关联,而不管定义聚糖的精度水平如何(例如,可能缺少链接类型或模糊的组成)。收集了非常相似的结构,但清楚地报告了它们的微小差异。糖蛋白在GlyConnect5和GlyGen6中进行了描述和策划,这两个数据库相互交叉引用。支持结构性证据的MS数据越来越多地存储在GlycoPOST7中。为了更广泛地覆盖在线资源,参考手册的第52章”糖生物学精要”专门介绍glycoinformatics8。有趣的是,糖肽鉴定软件近年来激增9,10尽管没有达到可重复性的好处。后一种担忧促使HUPO GlycoProteomics Initiative(HGI)的领导者在2019年设定了软件挑战。通过处理CID,ETD和EThcD片段化模式下的N-和O糖基化人血清蛋白的复杂混合物获得的MS数据可供竞争对手使用,无论是软件用户还是开发人员。关于这一挑战的结果11的完整报告仅在此概述。首先,观察到身份的传播。它主要被解释为由搜索引擎中实施的方法的多样性,它们的设置以及输出如何过滤和肽”计数”引起的。实验设计也可能使一些软件和方法处于(不)优势。重要的是,使用相同软件的参与者报告了不一致的结果,从而突出了严重的可重复性问题。通过比较不同的提交得出的结论是,某些软件解决方案的性能优于其他软件解决方案,并且某些搜索策略产生了更好的结果。这种反馈可能会指导自动化糖肽数据分析方法的改进,进而影响数据库内容。
glycoinformatics的扩展导致创建了门户网站,提供信息和访问多个相似或互补的资源。最新和最新的在综合糖科学丛书的一章中进行了描述12,通过合作,以开放获取模式提供了数据共享和信息交换的解决方案。在对Expasy平台14进行重大改革之后,开发了一个这样的门户网站,最初称为Glycomics@ExPASy 13,并更名为Glyco@Expasy,该平台托管了数十年来在几个组学中使用的大量工具和数据库,最受欢迎的项目是UniProt15 – 通用蛋白质知识库。Glyco@Expasy基于可视化分类和显示其相互依赖关系,对数据库和工具的目的和用途进行了教学性发现。以下协议说明了探索糖组学和糖组学数据的程序,并从该门户网站中选择资源,通过糖组学明确地将糖组学和聚糖相互作用组学之间的联系明确化。事实上,糖组学实验产生的结构是完全定义的单糖和部分或完全确定的键,但它们的蛋白质位点附着很差,如果有的话,表征得很差。相反,糖蛋白质组学实验产生精确的位点附着信息,但聚糖结构的分辨率较差,通常仅限于单糖组合物。这些信息在GlyConnect数据库中拼凑在一起。此外,GlyConnect中的搜索工具可用于检测潜在的聚糖配体,这些配体与UniLectin16中识别它们的蛋白质一起描述,通过聚糖与GlyConnect相关联。这里介绍的方案分为两个部分,以涵盖N-连接和O-连接聚糖和糖蛋白特异性的问题。
注意:需要具有互联网连接的设备(最好是大屏幕)和最新的Web浏览器,如Chrome或Firefox。使用 Safari 或 Edge 可能不那么可靠。
1. 从GlyConnect中的蛋白质N-糖组到UniLectin的凝集素
2. 探索和比较GlyConnect中的O-糖组
GlyConnect Octopus作为揭示意外相关性的工具
GlyConnect Octopus最初设计用于查询具有松散的聚糖定义的数据库。事实上,文献经常报道糖组中聚糖的主要特征,例如岩藻糖基化或唾液酸化,由两个或多个触角组成等。此外,无论是N-还是O-连接的聚糖都被归类为核心,如参考手册《Glycobiology的精要》1中所述,这些聚糖也经常在已发表的文章中引用。最后,聚糖表位(如血型抗原)是在结构中寻求的另一种特性,并可能被挑出来用于输入聚糖。最后,可能相关的是寻找在特定组织或选定物种中表达的糖组的共同或独特特征。从这个意义上说,收集到的信息应该被用作新假设的来源,而不是独特的事实。
GlyConnect Compozitor作为塑造聚糖组合集的工具
浏览蛋白质页面中描述的结构信息具有局限性,因为列表往往会模糊项目化结构之间的关系以及组合物之间的关系。GlyConnect Octopus关注前者,GlyConnect Compozitor关注后者。仔细查看大多数GlyConnect条目中列出的结构,可以发现存在常见的子结构。然而,如果没有专门的观众的帮助,这些信息并不容易在视觉上掌握。
通过分析HGI挑战的结果,建立了支持聚糖部分鉴定的聚糖组成文件的内容,作为糖肽鉴定软件的关键参数。大多数经典的蛋白质组学搜索引擎都适应从数据库/存储库或文献中收集的数据中获取的集合中选择基于糖的修饰。其他糖蛋白质组学专用工具使用聚糖生物合成的知识。这样,组合锉理论上被定义为预期的酶活性的结果。最后,合成文件的数量与搜索引擎的数量一样多,并且它们之间的重叠是高度可变的。尽管如此,从蛋白质组学过去的经验中学习,特别是当考虑到翻译后修饰时,揭示了搜索引擎的性能与限制搜索空间相关31。在糖蛋白质组学中也进行了类似的观察,GlyConnect Compozitor旨在支持有根据的组成数据选择,其重要性之前已经讨论过32。
该协议中未完全说明此工具的用法,特别是关于”高级“选项卡,其中可以表示通过其API(应用程序编程接口)直接启动对GlyConnect的编程访问的查询。例如,在”高级“选项卡的查询窗口中键入 taxonomy=homo sapiens&glycanType=N-linked&tissue=urine&disease=prostate cancer 等效于在”源“选项卡中填写相应的字段(在”物种“中选择“智人“,在”聚糖类型中选择尿液“和”聚糖类型中选择 N-linked“)和”疾病“选项卡(在“物种“中选择“智人” 疾病中的前列腺癌和聚糖型中的N连锁)。换句话说,它一步到位地提供了一个需要多次选择的结果。
最后,虽然协议中解释了虚拟节点的创建,但它们的潜在冗余需要额外的注释。两个并发选项可能无法区分,因为图中酶的模拟作用不考虑酶活性的年表。这就是为什么Compozitor建议通过两个虚拟节点的两条路径来桥接两个未连接的节点,对应于单糖计数,最多有两个差异。纳入新数据往往会造成缺失的环节。用户始终可以自由地考虑或关闭虚拟节点,方法是(取消)勾选 “包括虚拟节点 “框。
已知的数据库和软件限制
总体而言,与 Web 上的任何导航一样,上述协议偶尔会导致页面不存在,这通常是由于站点的更新或两个站点之间的更新冲突。在这种情况下,实际上,在所有导航不流畅的情况下,最简单的方法是向Expasy帮助台发送便笺,其效率在过去28年中为门户的成功做出了重大贡献。
GlyConnect的内容偏向于反映了文献中当前的不平衡。大多数出版物报道了哺乳动物中的N-糖基化,并且数据库中的人N-糖蛋白含量更高。尽管如此,我们过去曾被要求包括不太常见的数据集,并保持完全开放的态度,接受意见和建议。
此外,Compozitor目前仅限于比较三个组合数据集。计划对八达通中的 行列式 子选项卡进行重大修订。Glyco@Expasy的资源需要定期更新,有些资源可能无法在适当时候进行;尽管如此,警告和/或公告会在发生这种情况时发布。
称为 GlyGen(https://www.glygen.org)和 GlyCosmos(https://www.glycosmos.org)的合作伙伴门户提供了不同的选项和工具。最终,浏览和搜索有关任何一个选项的信息都需要高度的主观性,并且在很大程度上取决于用户的习惯和关注点。我们只能希望我们的解决方案适合社区的一部分。
糖科学的投入在生命科学项目中正在增长,并且不断产生建立聚糖在健康问题中的作用的研究。最近对SARS-Cov-2的关注再次揭示了糖基化蛋白的重要性,特别是在结构方法中33。Glycoinformatics支持糖科学家进行数据分析和解释的日常任务。
The authors have nothing to disclose.
internet connection | user's choice | ||
recent version of web browser | user's choice |