Summary
这里建立了一个质谱仪指导基因组挖掘协议并对此进行描述。它基于基因组序列信息和LC-MS/MS分析,旨在促进从复杂的微生物和植物提取物的分子的识别。
Abstract
天然产品所覆盖的化学空间是巨大的,而且被广泛地未被识别。因此,需要方便的方法对其在性质和潜在的人类利益(例如,药物发现应用)的功能进行广泛的评估。该协议描述了基因组挖掘 (GM) 和分子网络 (MN) 的组合,这两种现代方法将全基因组测序中的基因簇编码注释与粗代谢提取物的化学结构特征相匹配。这是发现新的自然实体的第一步。这些概念,当一起应用,在这里被定义为MS引导基因组挖掘。在此方法中,主要组件以前被指定(使用 MN),并且与结构相关的新候选项与基因组序列注释(使用 GM)相关联。将GM和MN结合是一种有利可图的策略,旨在瞄准新的分子骨干或收获代谢特征,以便识别已知化合物中的类似物。
Introduction
二次代谢的研究通常包括筛选特定生物活动的粗提取物,然后对属于活性馏分的成分进行纯化、识别和表征。事实证明,这一过程是有效的,促进了若干化学实体的隔离。然而,现在这被认为是不可行的,主要是因为高的重新发现率。由于制药业在不了解特殊代谢物的作用和功能的情况下进行了革命,其鉴定是在实验室条件下进行的,没有准确代表自然1。今天,人们更好地了解了自然信号的影响、分泌,以及大多数目标在检测出的低浓度下的存在。此外,对这一过程的监管将有助于学术界和制药业利用这一知识。它还将有利于与沉默生物合成基因簇(BGCs)2相关的代谢物的直接分离研究。2
在此背景下,基因组测序的进步重新产生了对筛选微生物代谢物的兴趣。这是因为分析未发现的生物合成簇的基因组信息可以揭示基因编码在实验室条件下未观察到或生产的新化合物。许多微生物全基因组项目或草案今天可用,而且数量每年都在增长,这为通过基因组挖掘33、44发现新的生物活性分子提供了巨大的前景。
生物合成基因簇图集是目前最大的自动挖掘基因簇集合,作为联合基因组研究所(JGI IMG-ABC)2集成微生物基因组平台的组成部分。2最近,生物合成基因簇(MIBiG)标准化倡议的最低信息促进了BPC的手动再注释,提供了高度精心策划的参考数据集5。如今,大量的工具可用于计算挖掘遗传数据及其与已知次生代谢物的连接。还制定了不同的策略,以获取新的生物活性天然产品(即异构表达、靶基因删除、体外重组、基因组序列、同位素引导筛选[基因同位素方法]、操纵本地和全球监管机构、基于抗药性的采矿、培养独立采矿,以及最近MS引导/编码方法2,2、6、7、8、9。6,7,8,9,1010、11、12、13、14、15。,11,12,13,14,15
基因组挖掘作为一种单一策略,需要努力对单个或一小群分子进行批批;因此,在将新化合物列为隔离和结构阐明的优先位置的过程中仍然存在差距。原则上,这些方法每次实验只针对一种生物合成途径,从而导致缓慢发现速度。从这个意义上说,使用转基因和分子网络方法是天然产品研究的一个重要进步14,15。14,
液相色谱-质谱(LC-MS)的多功能性、准确性和高灵敏度使其成为复合鉴定的好方法。目前,几个平台已经投资算法和软件套件的无目标代谢组16,17,18,19,20。16,17,18,19,20这些程序的核心包括特征检测(峰值选取)21和峰值对齐,这允许在一批样本中匹配相同的特征并搜索模式。基于MS模式的算法22,23,23比较特征破碎模式,匹配MS2的相似性,生成共享结构特征的分子族。这些特征可以突出和聚类,赋予快速发现已知和未知的分子从复杂的生物提取物通过串联MS2,24,252,24,25的能力。因此,串联MS是一种多功能方法,用于同时获取大量数据中包含的几种化学型的结构信息。
全球天然产物社会分子网络(GNPS)26算法使用规范化片段离子强度来构造多维向量,其中相似性使用原成函数进行比较。不同父离子之间的关系在关系图表示形式中绘制,其中每个碎片都可视化为节点(圆),每个节点的相关性由边缘(线)定义。单一来源分子的全球可视化被定义为分子网络。结构上分裂分子,独特的碎片将形成自己的特定簇或星座,而相关分子聚集在一起。聚类化学型允许假设其生物合成起源类似的结构特征连接。
在建立BGC及其小分子产品之间的生物信息学联系时,将化学型到基因型和基因型到化学型的方法结合起来是强大的。因此,MS引导基因组挖掘是一种快速方法和低耗材料策略,它有助于在不同代谢和环境条件下,WGS揭示的一个或多个菌株的母离子和生物合成途径。
该协议的工作流程(图1)包括将WGS数据输入生物合成基因簇注释平台,如反SMASH28、29、30。28,29,30它有助于估计由基因组编码的化合物和化合物的种类。必须采用一种以生物合成基因簇为目标的策略,编码感兴趣的化学实体,并分析含有BGC的野生型菌株和/或异质菌株的培养提取物,以利用GNPS26、31,31的相似性生成聚类离子。因此,可以识别与目标 BGC 关联的新分子,并且数据库中不可用(主要是未知的类似物,有时以低脚点生成)。考虑用户可以为这些平台做出贡献,并且生物信息学和 MS/MS 数据的可用性正在迅速增加,从而推动有效计算工具和算法的不断发展和升级,从而指导复杂提取物与分子的有效连接, 这是相关的。
图 1:整个工作流的概述。如图所示,说明了在所述 MS 引导基因组挖掘方法中涉及的生物信息学、克隆和分子网络步骤,以识别新的代谢物。请点击此处查看此图形的较大版本。
该协议描述了一个快速而高效的工作流程,将基因组挖掘和分子网络结合为天然产品发现管道的起点。尽管许多应用能够可视化一个网络中MS可检测分子的组成和关联性,但此处采用了几种来可视化结构相似的聚类分子。利用这一策略,成功鉴定了在链球菌孢菌剂2042代谢提取物中观察到的新型环丙肽产物。在基因组挖掘的指导下,对华利霉素进行全生物合成基因簇编码被识别和克隆成生产者菌株链球菌素M1146。最后,在MS模式分子网络之后,MS检测到的分子与负责其生物成形的BPC相关。
Subscription Required. Please recommend JoVE to your librarian.
Protocol
1. 生物合成基因簇的基因组挖掘
- 执行全基因组测序 (WGS) 作为选择用于 MS 引导基因组挖掘的生物合成基因簇 (BCG) 的第一步。感兴趣的菌株(细菌)的全基因组草案可以通过光明会MiSeq技术获得,使用以下高质量基因组DNA:猎枪TruSeqPCR免费库准备和NexteraMate配对库准备工具包33。
注:测序后,可以使用纽布勒 v3.0(罗切, 454) 汇编程序(在)上,并使用基于 FgeneSB 的管道进行批号(如前33所述,位于 )进行批号。微生物资源公告 (MRA) 是一个完全开放的访问日志,文章发布任何微生物资源的可用性沉积在可用的存储库(见于 )。候选蛋白质编码基因使用RAST服务器注释34进行识别,全基因组猎枪(WGS)项目沉积在DDBJ/ENA/GenBank(见于 )和黄金(见于 )序列数据库中。 - 要从完整测序基因组获取关于二次代谢基因簇注释的信息,请将序列文件(GenBank/EMBL 或 FASTA 格式)提交到反SMASH 平台(见于
)。 - 根据最相似的已知聚类,从输出数据中选择感兴趣的基因组 (图 2)。
注:首先,探索逐基因的基因并进行单个搜索(blastp)以评估哪些功能与所需的生物合成基因组相关是例行公事。此过程还有助于确定哪个 BGC 可能与所需化合物的生产相关,即使它的百分比较低。反SMASH预测将星团中的所有基因都考虑为百分比覆盖率,这可以表示目标BGC的相似度的全球低百分比。然而,在逐基因分析基因时,可以使用最相似的已知聚类获得更准确的信息。其次,反SMASH有两个选项来细化搜索:1) 检测严格性:生物合成基因簇必须被视为命中的严格程度。对于此选项,用户应使用以下参数:a) 严格:检测包含所有所需区域的完全定义良好的聚类,不易出现遗传信息错误;(c) 严格:检测包含所有所需区域的完全定义的群集,不易受到遗传信息错误的影响;(c) 严格:检测包含所有所需区域的完全定义良好的聚类,不易出现遗传信息错误;b) 放松:检测缺少一个或多个功能区域的部分群集,这也可用于检测严格的功能;或 c) 松散:检测定义不佳的群集和群集,这些群集和群集可能与主要代谢物匹配,这可能导致出现误报或定义不佳的 BDC。另一个选项是 2) 额外的功能:平台必须在输出中搜索和显示的信息类型。通常,这两个选项可以节省预测后的时间。但是,反 SMASH 作业需要较长的时间段。
图 2:来自反SMASH平台的输出。从全基因组序列注释分析中分二次代谢。请点击此处查看此图形的较大版本。
- 根据BGC的DNA序列信息,设计引物(20~25 nt)在ESAC(大肠杆菌/链球菌人工染色体)库筛选的基因簇侧。
注:不同方法3535,3636可用于从DNA捕获整个生物合成基因簇。在这里,使用的方法是建造一个有代表性的ESAC库3737,3838从链球菌sp.CBMAI 2042包含平均大小片段为+95 kb的克隆。
2. ESAC库中整个生物合成基因簇的异质表达
- 通过三亲结合32将ESAC病媒从大肠杆菌DH10B移动到大肠杆菌ET12567。
- 在含氯霉E. coli素(25微克/米)的5 mL的Luria-Bertani(LB)介质中,在含有氯霉素(25微克/米)的5 mL中,在大肠杆菌ET12567(CamR)、TOPO10/pR9604(卡布R)、DH10B/ESAC4H(AprR)中,含有氯霉素(25微克/米))、肉丙尼林(100微克/米耳)和阿高霉素(50微克/米拉)。
- 在 37 °C 和 250 rpm 下孵育培养素过夜。
- 在含有半浓度抗生素的10 mLLB介质中接种500μL的过夜培养素。
- 在 37 °C 和 250 rpm 下孵育培养剂,直到达到 A600的 0.4±0.6。
- 在2,200 x g的离心下收获细胞5分钟。
- 用 20 mL 的 LB 介质清洗两次细胞。
- 在 500 μL 的 LB 介质中重新悬浮细胞。
- 将每个菌株的20μL混合在微离心管中,滴入不含抗生素的LB介质的加盘中。
- 在37°C下孵育板过夜。
- 将生长的细胞划到含有抗生素的新鲜LB agar板上,并在37°C下孵育过夜。
3.链球菌/大肠杆菌结合
- 为了获得重组异质体,在含有ESAC载体的大肠杆菌ET12567、助剂质粒体pR9604和另链球菌素菌质M1146或其他选定的宿主菌株39之间进行结合。
- 第1天:在250 mL Erlenmeyer烧瓶中,在250 mL Erlenmeyer烧瓶中,在250 mL的TSBY介质中,在250 mL Erlenmeyer烧瓶中,在30°C和48小时时,在200 rpm的温度下,将S.coelicolor M1146的分离菌落体接种。
- 第2/3天:在含有氯霉素(25微克/米L)、卡贝尼西林(100微克/米升)和阿高霉素(50微克/米)的5 mL中,在5毫脂中接种ET12567/ESAC/pR9604,在37°C和250 rpm下过夜。
- 第3/4天:在含有半工作浓度的抗生素的10 mL2TY(在50 mL锥形管中)中接种500μL的过夜培养素。在 37 °C 和 250 rpm 下孵育,直到达到 A600的 0.4±0.6。
- 将培养物(ET12567/ESAC/pR9604 和 M1146)在 2200 x g下离心 10 分钟。
- 在 2TY 介质的 20 mL 中清洗颗粒 2 倍,并在 500 μL 2TY 中重新悬浮。
- S 型 coelicolor M1146 悬架的阿利quot 200 μL,稀释在 500 μL 的 2TY(悬架 A) 中。
- 悬架 A 的阿利quot 200 μL,稀释在 500 μL 的 2TY(悬架 B)。
- 悬架 B 的阿利quot 200 μL,稀释在 500 μL 的 2TY(悬架 C) 中。
- ET12567/ESAC/pR9604 悬架的 200 μL 的阿利quot 200 μL,与 200 μL 悬架 C 混合。
- 缺乏抗生素的SFM加盘上偶联混合物的板150μL。
- 在30°C孵育16小时。
- 盖板有1 mL的抗生素溶液(根据质粒电阻)。干燥后,在30°C孵育4~7天。
注:在这里,制备了含有1.0毫克/mL三黄酮和0.5毫克/mL鼻脂酸的溶液。 - 在含有三聚酮(50毫克/米)和鼻脂酸(25毫克/米L)的SFM加盘上出现条纹。在30°C孵育。
- 条纹在仅含有鼻脂酸的SFMAgar上。
- 对分离的菌落进行PCR分析,以确认整个基因簇已转移到S.coelicolor M1146宿主。
4. 应变培养
- 为了获得代谢特征,在适当的发酵介质和适当的培养条件下接种1/100株菌株的预培养物。
- 离心培养在2200 x g时10分钟。
- 根据兴趣化合物40的类别执行提取。
5. 获取质谱和准备 GNPS 分析
- 要获取MS/MS数据,请使用控制软件编程合适的HPLC和质谱方法。可以分析高分辨率和低分辨率数据相关质谱分析 (DDA)。
注:一般来说,复杂粗提取物样品的1mg/mL溶液是理想的。对于不太复杂的提取物,需要稀释。需要注意的是,MS/MS网络是给定的质谱条件下可检测的分子网络。 - 使用来自 Proteowizard 的 MSConvert 将质谱转换为 .mzXML 格式(见于
)。转换的输入参数如图3所示。几乎所有公司的软件数据都是兼容的。
图 3:使用 MsConvert 将 MS 文件转换为 mzXML 扩展名。将显示 GNPS 分析的正确参数。说明如下:在框 1 中添加所有 MS 文件,并在框中 2 中添加筛选器峰值选取;对于此筛选器,请使用算法供应商;按下启动,转换过程将随之而来。请点击此处查看此图形的较大版本。
- 将转换后的 LC-MS/MS 文件上载到 GNPS 数据库中。有两个选项可用:使用文件传输协议 (FTP) 或通过在线平台直接在浏览器中。
注:有关如何安装和将数据传输到 GNPS 的详细信息,请访问。
6. GNPS分析
- 在 GNPS 中创建帐户(见于
),登录到创建的帐户选择创建分子网络。添加职务。 - 基本选项:选择 mzXML 文件以执行分子网络。它们最多可分为六组。选择去复制例程的库(图 4)。
注:这些组不会干扰分子网络构造。此信息将仅用于图形表示。
图4:使用在线GNPS平台进行分子网络分析。通过单击框 1 来选择 mzXML 文件。在打开的对话框中,文件可以从个人文件夹(框 2)中选择,或使用拖放文件上传器(小于 20 MB)在第二个选项卡中上载。这些文件可以分为最多六组。请点击此处查看此图形的较大版本。
- 分别选择前体ion质量公差和片段ia ion质量公差分别为0.02 Da和0.05 Da。
注: GNPS 具有不同类型的严格性,具体取决于 1) MS/MS 数据的准确度和 2) 关联的准确性。基本选项:在此文件夹中,可以设置前体 Ion 质量公差和碎片 Ion 质量容差。这些参数用作确定前体ion和片段ion的精确程度的指南。所选质量公差取决于所使用的质谱仪的分辨率和精度。 - 高级网络选项:根据图 5选择参数。这些参数直接影响网络群集的大小和形式。其余选项卡部分中的另一个参数是高级用户;因此,保留默认值。
注: 高级参数可以在 GNPS 文档中读取(见于)。
图5:使用 GNPS 执行分子网络分析(高级选项)。Min Pair Cos 将直接影响聚类的大小,因为高值将导致在结合与远相关化合物时结合密切相关的化合物和低值。应避免使用太低的值。最小匹配的片段离子表示要在网络中链接的两个碎片光谱之间的共享片段数。两个参数一起指导网络格式;较低的值将聚集更远相关的化合物,反之亦然。使用正确的值将大大有助于复合解释。请点击此处查看此图形的较大版本。
- 选择电子邮件地址以在工作完成后接收警报,并提交作业。
7. GNPS结果分析
- 登录到 GNPS。选择"作业>已发布的作业>完成"以打开作业。网页将打开,如图6所示。将显示从分子网络获得的所有结果。
- 选择"查看光谱系列"(在浏览器网络可视化工具中)以查看所有网络群集(红色框,图 6)。
图6:使用 GNPS 可视化分子网络结果。所有相关的复合簇都可以在光谱族(红色框)中看到。要仅可视化库命中,应选择"查看所有库命中"(蓝色框)。为了更好地图形表示分子网络结果,应下载"直接细胞景观预览"(黄色框),并应使用最新版本的Cytoscape。请点击此处查看此图形的较大版本。
- 将显示一个列表,其中将显示所有生成的分子网络簇。如果选择了库搜索来生成结果,则暂定分子识别将显示在 AllD 中。选择"显示"以可视化它们。
注:数据分析可以驱动其他结果(如基因组挖掘、生物测定、库去复制分子等)。 - 要分析分子网络簇,请选择可视化网络。
注:每个簇由节点(圆)和边缘组成,分别表示分子和分子相似性。在在线浏览器网络可视化工具中,去复制的分子将作为蓝色节点突出显示。 - 在节点标签框中,选择父质量(红色框,图 7)。
- 在边缘标签框中,选择"协和子"或"增量MZ",分别观察节点之间的节点相似性或质量差(黄色框,图 7)。
- 在多组分析的情况下,单击节点着色框中的"绘制饼图"以观察每个组中每个节点出现的频率(蓝色框,图 7)。
注: 其他选择是可能的,但上面建议的那些是注释群集节点和分解其结构的最佳选择。
图7:使用 GNPS 可视化分子聚类结果。打开分子簇以更好的数据可视化后,应选择以下:"父质量"作为节点标签(红色框);"DeltaMZ"作为边缘标签(黄色框);和"绘制饼图"作为节点着色(蓝色框)。浏览分子簇并尝试对所有节点进行批号。请点击此处查看此图形的较大版本。
- 要查看所有库命中,请选择"查看所有库命中次数"(蓝色框,图 7)。
注意:此外,MNW 可以在"直接细胞景观预览/下载"(黄色框,图 7)中下载,文件可以在 Cytoscape 平台(见于)中打开,以在图形结构中提供更多选项。 - 需要人工确认去复制化合物和相关化合物的结构阐明。直接在 GNPS 平台或原始原始文件中打开碎片光谱。
Subscription Required. Please recommend JoVE to your librarian.
Representative Results
该协议成功地利用基因组挖掘、异构表达和MS引导/代码方法的组合来获取新的专用华霉素模拟分子。目标(Valinomycin )的基因组到分子工作流在图8中表示。链球菌sp.CBMAI 2042草案基因组在silico中进行分析,然后确定VLM基因簇并将其转移到异质宿主。异质菌株和野生菌株采用适当的发酵条件,用乙酸乙酯进行分,并浓缩产生粗提取物。从该产品中,获取了MS/MS数据,以生成用于分子网络的串联MS代谢物配置文件。图9表示从链球菌2042原油提取物中从MS/MS数据中获得的聚类离子,其中特征破碎模式和相应的MS相似性表明分子家族共享结构特征2的出现。根据已知的生物合成逻辑和生物信息学见解,并在基于模式的MS/MS光谱的支持下,阐明了最初报告的四种环氧肽的结构,其起源与负责VLM组装32的同一生物合成基因簇相关。
分子网络数据(见于
图 8:从 silico 基因组序列分析到 MS 数据采集的工作流。(A) 由光明会MiSeq测序获得链球菌片2042基因组的草稿。(B) Valinomycin BGC 识别和注释。(C) 将整个基因簇转移到适当的宿主后,培养菌株。LC对培养物中的乙酸乙酯提取物进行分析,得出产生的二次代谢物的概况。色谱图显示,华利霉素、蒙塔纳他汀和五个类似物是由VLM BGC表达式在异构主机中产生的。请点击此处查看此图形的较大版本。
图9:分子网络结果。(A) 来自链球菌的分子网络 s. CBMAI 2042 提取物.与Valinomycin对应的分子网络离子,在链球菌sp.CBMAI 2042基因组中带有相应的BGC批出的已知化合物,与VLM BGC首次描述的模拟相关的离子聚集。(B) 显示华霉素和相关模拟物的 MS 光谱和化学结构。请点击此处查看此图形的较大版本。
Subscription Required. Please recommend JoVE to your librarian.
Discussion
该协议的最大优点是能够快速去复制代谢特征,并将基因组信息与MS数据桥接,以阐明新分子的结构,特别是结构模拟2。根据基因组信息,可以研究不同的天然产物化学型,如多基肽(PK)、非核糖类肽(NRP)和糖基化天然产物(GNP),以及神秘的BFC。 Metabolomic筛选可产生实验室条件下特定菌株产生的活性BGC轮廓和化学多样性的证据。因此,BGC 可以克隆,以直接生产与已知 BGC 相关的新化合物或未知类似物,从而通过分子网络发现的相似性促进。因此,此过程有助于区分天然来源产生的贵重化合物,并可用作未来隔离步骤的指南,这在天然产品管道中很常见。
MS引导基因组挖掘首先在肽组基因组41和糖基因组42领域描述。为了估计肽天然产物的化学多样性程度,Dorrestein 及其同事开发了一种使用 MS 和基因组学的自动化方法,以可视化表达的天然产物(化学型)与其基因簇(基因型)之间的联系。然后,在使用肽专用代谢物时描述了MS引导基因组挖掘的概念。在这里,采用转基因方法和串联MS鉴定微生物糖基化天然产物(GNP)的方法作为工具,在糖足迹之后迅速将GNP化学型(来自微生物元形)与其相应的生物合成基因型联系起来。
肽基因组学的概念已被应用在链球菌玫瑰孢子虫中揭示硬体素基因簇,为GNPS作为平台43的广泛效用提供了第一个见解。基于模式的基因组挖掘和分子网络最终与GNPS平台26相结合,以促进新化合物、已知化合物的去复制、新模拟的检测以及35个Salinispora菌株的结构阐明。这导致了对雷霉素A的分离和表征,一种藜麦素型的去肽44。GNPS之后,整合代谢组学和基因组挖掘方法已成为将分子网络与生物合成能力联系起来的最广泛途径,45、46、47、48、49、50。45,46,47,48,49,50
该协议强化了使用基因组和甲氧体分析,在消耗低含量材料的同时,以几个步骤调查已知和未知化学类似化合物的产生的可行性。此处介绍的模型与通过分子网络去复制从粗提取物中确认的华霉素模拟鉴定有关。模拟结构由MS/MS碎片推导出,遵循克隆VLM BDC的生物合成逻辑。
不同的软件可用于挖掘二次代谢物生物合成基因簇51和代谢物阐明,但开源选项具有优势,因为不断更新,并且它们向科学界开放。从这个意义上说,反SMASH和GNPS平台是最受欢迎的选择。
根据所探索的自然来源,可以修改此常规程序,用于其他提取方法。根据代谢物特性(即极性、疏水性、形成云母的能力),甚至类似的特性、不同的溶剂或树脂,还可以结合多种萃取方法, 达到增强的结果。通常,提取物是从液体介质培养中制备的,但有大量的提取方法可用于分离浓缩提取物和筛选任何感兴趣的生物样品。
获取 MS 数据时,应使用数据依赖采集 (DDA) 分析。当在一次注射中评估大量化合物时,此问题非常重要。执行DDA时,应补偿每个前体ion的最大MS/MS光谱数和不同前体子子子的最大数量。使用快速扫描速率设备时,可以通过更高的扫描率(每个周期 6+10 MS/MS 扫描)来实现这一点。然而,在较低的扫描速率设备中,MN 性能只能通过更好的色谱分辨率提高。应获得最全面的数据来填充分子网络。对于MS数据采集,固定碰撞能量是可能的,但斜坡能量适合产生更好的结果。没有最佳条件可以完美地适用于所有样品。获得足够的 MS 分析对于以下步骤至关重要。今后,分子网络簇应根据程序生成和去复制。
频繁的故障排除错误缺少质量强度。通常,这可以通过在分析过程中引入更高的碰撞能量来解决。有时,在光谱和 GNPS 库之间没有观察到相关性,这非常罕见。在这种情况下,请确保文件夹在预可视化 MS 软件中正确打开,因为有时在转换步骤到 .mzXML 文件期间可能会创建错误。
在基因组挖掘方面,基因簇注释平台的最精确的输出将为单一菌株或培养独立挖掘提供更高质量的全基因组测序。高质量的测序将产生高质量的生物信息学见解,用于生物合成途径的去复制。相比之下,尽管BGC预测生物信息学软件发展迅速,但基因功能和假定产物的精确预测仍然很困难,尤其是在研究硅酸盐中无法预测的新型生物合成途径和特征时。此外,一些生物合成机械的保存显著,而混合系统、跨-AT模块化PK和NRPS中的酶学被认为是共线性规则的例外。从这个意义上说,生物信息输出软件中的异质表达和细化有助于阐明不可预测的酶功能和不寻常的生物化学52、53、54。52,53,54公共数据库的丰富将导致更精确的预测和发现新的专门代谢物,因为WGS的成本并不代表基因组挖掘的障碍。
最后,集成的甲氧核酸和基因组挖掘方法的最大优势与它们通过连接基因组、转录学和分子数据,有效地连接基因与分子。
Subscription Required. Please recommend JoVE to your librarian.
Disclosures
作者没有什么可透露的。
Acknowledgments
这项研究的财政支助由圣保罗研究基金会-FAPESP(2019/10564-5, 2014/12727-5 和 2014/50249-8 到 L.G.O; 2013/12598-8 和 2015/01013-4 到 R.S.; 和 2019/08853-9 到 C.F.F.A. 。B.S.P.、C.F.F.A.和L.G.O.获得国家科学和技术发展委员会(CNPq)研究金(205729/2018-5、162191/2015-4和313492/2017-4)。L.G.O.还感谢《妇女参与科学》方案(2008年,巴西版)提供的赠款支持。所有作者都承认CAPES(高等教育人员改进协调)支持巴西的毕业后课程。
Materials
Name | Company | Catalog Number | Comments |
Acetonitrile | Tedia | AA1120-048 | HPLC grade |
Agar | Oxoid | LP0011 | NA |
Apramycin | Sigma Aldrich | A2024 | NA |
Carbenicillin | Sigma Aldrich | C9231 | NA |
Centrifuge | Eppendorf | NA | 5804 |
Chloramphenicol | Sigma Aldrich | C3175 | NA |
Column C18 | Agilent Technologies | NA | ZORBAX RRHD Extend-C18, 80Å, 2.1 x 50 mm, 1.8 µm, 1200 bar pressure limit P/N 757700-902 |
Kanamycin | Sigma Aldrich | K1377 | NA |
Manitol P.A.- A.C.S. | Synth | NA | NA |
Microcentrifuge | Eppendorf | NA | 5418 |
Nalidixic acid | Sigma Aldrich | N4382 | NA |
Phusion Flash High-Fidelity PCR Master Mix | ThermoFisher Scientific | F548S | NA |
Q-TOF mass spectrometer | Agilent technologies | NA | 6550 iFunnel Q-TOF LC/MS |
Sacarose P.A.- A.C.S. | Synth | NA | NA |
Shaker/Incubator | Marconi | MA420 | NA |
Sodium Chloride | Synth | NA | P. A. - ACS |
Soy extract | NA | NA | NA |
Sucrose | Synth | NA | P. A. - ACS |
Thermal Cycles | Eppendorf | NA | Mastercycler Nexus Gradient |
Thiostrepton | Sigma Aldrich | T8902 | NA |
Tryptone | Oxoid | LP0042 | NA |
Tryptone Soy Broth | Oxoid | CM0129 | NA |
UPLC | Agilent Technologies | NA | 1290 Infinity LC System |
Yeast extract | Oxoid | LP0021 | NA |
References
- Davies, J. Specialized microbial metabolites: functions and origins. The Journal of Antibiotics. 66 (7), Tokyo. 361-364 (2013).
- Ziemert, N., Alanjary, M., Weber, T. The evolution of genome mining in microbes - a review. Natural Product Reports. 33 (8), 988-1005 (2016).
- Zerikly, M., Challis, G. L. Strategies for the Discovery of New Natural Products by Genome Mining. ChemBioChem. 10 (4), 625-633 (2009).
- Gomez-Escribano, J. P., Bibb, M. J. Heterologous expression of natural product biosynthetic gene clusters in Streptomyces coelicolor: from genome mining to manipulation of biosynthetic pathways. Journal of Industrial Microbiology & Biotechnology. 41 (2), 425-431 (2014).
- Medema, M. H., et al. Minimum Information about a Biosynthetic Gene cluster. Nature Chemical Biology. 11 (9), 625-631 (2015).
- Lautru, S., Deeth, R. J., Bailey, L. M., Challis, G. L. Discovery of a new peptide natural product by Streptomyces coelicolor genome mining. Nature Chemical Biology. 1 (5), 265-269 (2005).
- Chiang, Y. -M., et al. Molecular Genetic Mining of the Aspergillus Secondary Metabolome: Discovery of the Emericellamide Biosynthetic Pathway. Chemistry & Biology. 15 (6), 527-532 (2008).
- Huang, T., et al. Identification and Characterization of the Pyridomycin Biosynthetic Gene Cluster of Streptomyces pyridomyceticus NRRL B-2517. Journal of Biological Chemistry. 286 (23), 20648-20657 (2011).
- Udwary, D. W., et al. Genome sequencing reveals complex secondary metabolome in the marine actinomycete Salinispora tropica. Proceedings of the National Academy of Sciences. 104 (25), 10376-10381 (2007).
- Gross, H., et al. The Genomisotopic Approach: A Systematic Method to Isolate Products of Orphan Biosynthetic Gene Clusters. Chemistry & Biology. 14 (1), 53-63 (2007).
- Spohn, M., Wohlleben, W., Stegmann, E. Elucidation of the zinc-dependent regulation in Amycolatopsis japonicum enabled the identification of the ethylenediamine-disuccinate ([S,S ]-EDDS) genes. Environmental Microbiology. 18 (4), 1249-1263 (2016).
- Thaker, M. N., Waglechner, N., Wright, G. D. Antibiotic resistance-mediated isolation of scaffold-specific natural product producers. Nature Protocols. 9 (6), 1469-1479 (2014).
- Katz, M., Hover, B. M., Brady, S. F. Culture-independent discovery of natural products from soil metagenomes. Journal of Industrial Microbiology & Biotechnology. 43, 129-141 (2016).
- Quinn, R. A., et al. Molecular Networking as a Drug Discovery, Drug Metabolism, and Precision Medicine Strategy. Trends in Pharmacological Sciences. 38 (2), 143-154 (2017).
- Yang, J. Y., et al. Molecular Networking as a Dereplication Strategy. Journal of Natural Products. 76 (9), 1686-1699 (2013).
- Lommen, A. MetAlign: Interface-Driven, Versatile Metabolomics Tool for Hyphenated Full-Scan Mass Spectrometry Data Preprocessing. Analytical Chemistry. 81 (8), 3079-3086 (2009).
- Katajamaa, M., Miettinen, J., Oresic, M. MZmine: toolbox for processing and visualization of mass spectrometry based molecular profile data. Bioinformatics. 22 (5), 634-636 (2006).
- Pluskal, T., Castillo, S., Villar-Briones, A., Orešič, M. MZmine 2: Modular framework for processing, visualizing, and analyzing mass spectrometry-based molecular profile data. BMC Bioinformatics. 11 (1), 395 (2010).
- Tautenhahn, R., Patti, G. J., Rinehart, D., Siuzdak, G. XCMS Online: A Web-Based Platform to Process Untargeted Metabolomic Data. Analytical Chemistry. 84 (11), 5035-5039 (2012).
- Kuhl, C., Tautenhahn, R., Böttcher, C., Larson, T. R., Neumann, S. CAMERA: An Integrated Strategy for Compound Spectra Extraction and Annotation of Liquid Chromatography/Mass Spectrometry Data Sets. Analytical Chemistry. 84 (1), 283-289 (2012).
- Katajamaa, M., Orešič, M. Data processing for mass spectrometry-based metabolomics. Journal of Chromatography A. 1158, 318-328 (2007).
- Liu, W. -T., et al. Interpretation of Tandem Mass Spectra Obtained from Cyclic Nonribosomal Peptides. Analytical Chemistry. 81 (11), 4200-4209 (2009).
- Ng, J., et al. Dereplication and de novo sequencing of nonribosomal peptides. Nature Methods. 6 (8), 596-599 (2009).
- Liaw, C., et al. Vitroprocines, new antibiotics against Acinetobacter baumannii, discovered from marine Vibrio sp. QWI-06 using mass-spectrometry-based metabolomics approach. Scientific Reports. 5 (1), 1-11 (2015).
- Kang, K. B., et al. Targeted Isolation of Neuroprotective Dicoumaroyl Neolignans and Lignans from Sageretia theezans Using in Silico Molecular Network Annotation Propagation-Based Dereplication. Journal of Natural Products. 81 (8), 1819-1828 (2018).
- Wang, M., et al. Sharing and community curation of mass spectrometry data with Global Natural Products Social Molecular Networking. Nature Biotechnology. 34 (8), 828-837 (2016).
- Doroghazi, J. R., et al. A roadmap for natural product discovery based on large-scale genomics and metabolomics. Nature Chemical Biology. 10 (11), 963-968 (2014).
- Medema, M. H., et al. antiSMASH: rapid identification, annotation and analysis of secondary metabolite biosynthesis gene clusters in bacterial and fungal genome sequences. Nucleic Acids Research. 39, 339-346 (2011).
- Weber, T., et al. antiSMASH 3.0-a comprehensive resource for the genome mining of biosynthetic gene clusters. Nucleic Acids Research. 43, 237-243 (2015).
- Blin, K., et al. antiSMASH 5.0: updates to the secondary metabolite genome mining pipeline. Nucleic Acids Research. 47, 81-87 (2019).
- Watrous, J., et al. Mass spectral molecular networking of living microbial colonies. Proceedings of the National Academy of Sciences. 109 (26), 1743-1752 (2012).
- Paulo, B. S., Sigrist, R., Angolini, C. F. F., De Oliveira, L. G. New Cyclodepsipeptide Derivatives Revealed by Genome Mining and Molecular Networking. ChemistrySelect. 4 (27), 7785-7790 (2019).
- Gonzaga de Oliveira, L., Sigrist, R., Sachetto Paulo, B., Samborskyy, M. Whole-Genome Sequence of the Endophytic Streptomyces sp. Strain CBMAI 2042, Isolated from Citrus sinensis. Microbiology Resource Announcements. 8 (2), 1-2 (2019).
- Aziz, R. K., et al. The RAST Server: Rapid Annotations using Subsystems Technology. BMC Genomics. 9 (1), 75 (2008).
- Nah, H. -J., Pyeon, H. -R., Kang, S. -H., Choi, S. -S., Kim, E. -S. Cloning and Heterologous Expression of a Large-sized Natural Product Biosynthetic Gene Cluster in Streptomyces Species. Frontiers in Microbiology. 8, 1-10 (2017).
- Zhang, J. J., Tang, X., Moore, B. S. Genetic platforms for heterologous expression of microbial natural products. Natural Product Reports. 36 (9), 1313-1332 (2019).
- Alduina, R., et al. Artificial chromosome libraries of Streptomyces coelicolor A3(2) and Planobispora rosea. FEMS Microbiology Letters. 218 (1), 181-186 (2003).
- Jones, A. C., et al. Phage P1-Derived Artificial Chromosomes Facilitate Heterologous Expression of the FK506 Gene Cluster. PLoS One. 8 (7), 69319 (2013).
- Gomez-Escribano, J. P., Bibb, M. J. Engineering Streptomyces coelicolor for heterologous expression of secondary metabolite gene clusters. Microbial Biotechnology. 4 (2), 207-215 (2011).
- Cannell, R. J. P. Natural Products Isolation. , Humana Press. Totowa, NJ. (1998).
- Kersten, R. D., et al. A mass spectrometry-guided genome mining approach for natural product peptidogenomics. Nature Chemical Biology. 7 (11), 794-802 (2011).
- Kersten, R. D., et al. Glycogenomics as a mass spectrometry-guided genome-mining method for microbial glycosylated molecules. Proceedings of the National Academy of Sciences. 110 (47), 4407-4416 (2013).
- Liu, W., et al. MS/MS-based networking and peptidogenomics guided genome mining revealed the stenothricin gene cluster in Streptomyces roseosporus. The Journal of Antibiotics. 67 (1), Tokyo. 99-104 (2014).
- Duncan, K. R., et al. Molecular Networking and Pattern-Based Genome Mining Improves Discovery of Biosynthetic Gene Clusters and their Products from Salinispora Species. Chemistry & Biology. 22 (4), 460-471 (2015).
- Cao, L., et al. MetaMiner: A Scalable Peptidogenomics Approach for Discovery of Ribosomal Peptide Natural Products with Blind Modifications from Microbial Communities. Cell Systems. , (2019).
- Chen, L. -Y., Cui, H. -T., Su, C., Bai, F. -W., Zhao, X. -Q. Analysis of the complete genome sequence of a marine-derived strain Streptomyces sp. S063 CGMCC 14582 reveals its biosynthetic potential to produce novel anti-complement agents and peptides. PeerJ. 7 (1), 6122 (2019).
- Kim Tiam, S., et al. Insights into the Diversity of Secondary Metabolites of Planktothrix Using a Biphasic Approach Combining Global Genomics and Metabolomics. Toxins. 11 (9), 498 (2019).
- Özakin, S., Ince, E. Genome and metabolome mining of marine obligate Salinispora strains to discover new natural products. Turkish Journal of Biology. 43 (1), 28-36 (2019).
- Trivella, D. B. B., de Felicio, R. The Tripod for Bacterial Natural Product Discovery: Genome Mining, Silent Pathway Induction, and Mass Spectrometry-Based Molecular Networking. mSystems. 3 (2), 00160 (2018).
- Maansson, M., et al. An Integrated Metabolomic and Genomic Mining Workflow To Uncover the Biosynthetic Potential of Bacteria. mSystems. 1 (3), 1-14 (2016).
- Blin, K., Kim, H. U., Medema, M. H., Weber, T. Recent development of antiSMASH and other computational approaches to mine secondary metabolite biosynthetic gene clusters. Briefings in Bioinformatics. 20 (4), 1103-1113 (2019).
- Fisch, K. M. Biosynthesis of natural products by microbial iterative hybrid PKS-NRPS. RSC Advances. 3 (40), 18228-18247 (2013).
- Tatsuno, S., Arakawa, K., Kinashi, H. Analysis of Modular-iterative Mixed Biosynthesis of Lankacidin by Heterologous Expression and Gene Fusion. The Journal of Antibiotics. 60 (11), Tokyo. 700-708 (2007).
- Helfrich, E. J. N., Piel, J. Biosynthesis of polyketides by trans-AT polyketide synthases. Natural Product Reports. 33 (2), 231-316 (2016).