联合基因组学,代谢组学和信息通过植物基因功能的注解

Biology
 

Summary

基因组学相结合,共同表达的基因分析和鉴定目标化合物通过新陈代谢,给基因功能注释。

Cite this Article

Copy Citation | Download Citations

Tohge, T., Fernie, A. R. Annotation of Plant Gene Function via Combined Genomics, Metabolomics and Informatics. J. Vis. Exp. (64), e3487, doi:10.3791/3487 (2012).

Please note that all translations are automatically generated.

Click here for the english version. For other languages click here.

Abstract

由于模式植物物种完整的基因组序列和丰富的生物资源,如敲除突变体,野生种质和先进的繁殖种群数量不断扩大,有上升的负担,为基因功能注释。在这个协议中,使用联合共表达基因分析植物基因功能注释,代谢和信息提供( 图1)。这种方法使用已知功能的靶基因,允许非注释基因的鉴定一定的代谢过程中可能会涉及与代谢目标化合物通过鉴定,理论基础。战略提出申请产生正向和反向遗传学的方法,尽管这些都不人口信息是毫不费力的。推论,这种方法也可以被用来作为一种方法来描述未知峰代表新的或特定的本身在有限的组织,植物或治疗压力,这是目前重要的试验,以了解植物的新陈代谢condary代谢产物。

Protocol

1。样品制备

  1. 植物材料的收获,并立即冻结。
  2. 冷冻材料厂搅拌机磨制成粉末(或砂浆)和猎鹰管或Eppendorf管中于-80°C。

2。提取代谢物谱

  1. 植物材料,在2毫升的Eppendorf管分装冷冻。
  2. 添加5μL提取每毫克冷冻厂材料的鲜重的缓冲区。
  3. 新增一个金属(或gilconia)的球,并融汇冻粉与调音台轧机在25 LS -1 2分钟。
  4. 在12000转离心10分钟。
  5. 转移上清NANOSEP离心式过滤器。
  6. 在4000转速离心2分钟。
  7. 将上清转移至新的Eppendorf管中,并储存在-20°C,直到使用。

3。代谢物谱的LC-MS

  1. 建立高效液相色谱法和检查柱箱温度和样品盘。
  2. 成立MS条件和检查真空和加热毛细管的状态。
  3. 执行的m / z MS检测校准。
  4. 50μL提取物转移到玻璃小瓶的LC-MS。
  5. 注入5μL提取物的LC-MS。

4。数据分析

  1. 配置神剑传奇或Metalign 4,选择要处理的数据进行分析。
  2. 准备检测到您的利益峰表,按照表I类化合物。
  3. 识别标准化合物的共流出峰。
  4. 注释使用MS 分析 ,文献调查,代谢物数据库搜索( 2),12,13检测峰。

5。代谢途径的预测

  1. 构建与检测的化合物可能的途径。预测使用高峰注解的途径,应根据检测到的化合物的化学结构S的 ​​预测连接酶的功能,代谢途径13。构建合成步骤应进行精确的峰值注释。但详细的化学结构的测定,例如糖基,是不可缺少的这一步,因为糖基和内收位置的预测是非常困难的,以确定由MS分析。酶法测定糖捐助的测定糖如hexoside和pentoside的类型将确定,在项目的最后一步。主要建设途径的预测,应为小分子较大分子的中间,除了在某些情况下,如脱水反应。原子分子量的名单,例如16/ Z - H之间的差异和OH基(氧化),14/ Z(碳原子)之间的-OH和-OMe的(甲基)差价和162 m / z为 (兆瓦H 2 O的己糖(糖基化)),是有用的预测。测定修改相关组织的具体分析的类型,有助于代谢途径的预测。一般代谢途径,如KEGG数据库(数据库http://www.genome.jp/kegg/ )PlantCyc( http://plantcyc.org/~~V ),为您感兴趣的代谢途径的预测是非常有效的。

6。基因名单的制备与拟南芥同源基因ID

  1. 下载从基因组数据库,基因ID列表。
  2. 添加同源基因的拟南芥基因ID,在你的目标工厂的情况下是不拟南芥。
  3. 准备一个利益的途径中的基因名单。在TAIR网页( http://www.arabidopsis.org/~~V ),拟南芥的通路数据和基因家族的数据诠释。如果你准备拟南芥同源基因的清单,你可以随后组合NE他们。

7。共表达基因分析

  1. 测试使用搜索最佳通路的数据库,使用众所周知的基因对您的利益途径( 表二 )检查相关的准备基因ID列表。如果数据库或共同表达的基因表达数据库是不是你的兴趣在植物,植物共表达数据库,应使用与拟南芥的同源基因的清单。在大麦的情况下,可用于水稻,杨树,小麦,苜蓿,大豆,植物物种的共同表达分析( 见表二 )。
  2. 基于利益的途径著名的基因连接,构建框架为目标的共同表达网络。
  3. 新增相关的候选基因(R <0.4〜0.90系数的途径利益知名的基因之间的连接价值的近似值,内),并检查他们在你的PR基因注释edicted家庭网络连接,寻找最佳的候选基因( 图3)。系数阈值应根据网络结构和密度相关基因的协调。
  4. 使您可以作为专门为你的目标的途径缩小的基因列表。
  5. 检查你的候选基因的器官特异性和应激反应的基因表达。

8。的所有信息整合到预测的新途径

  1. 新增查询共表达分析已用于预测代谢途径的基因特征。
  2. 检查这个途径在未知的部分,未知酶的步骤,例如运输蛋白和转录因子。
  3. 预测这些失踪未知的步骤最合适的基因注释。
  4. 结合GE 在硅片的代谢产物分析和候选基因的结果NE表达的基础上预测的途径。
  5. 安排您的候选基因,根据基因功能的预测途径,例如,乙酰转移酶的代谢产物乙酰化,糖基苷,P450的氧化复合。氨基酸序列的系统发育树分析是有用的宽一些,例如P450和糖基转移酶的基因家族。
  6. 检查的组织特异性应激反应或代谢产物的积累和候选基因的基因表达水平之间的一致性。
  7. 检查提供基板和应激反应的基因连接到其他代谢。

9。实验中使用的生物资源的基因鉴定

  1. 检查的生物资源提供便利为候选基因鉴定实验。
  2. 执行实验利用生物资源,如高突变体库和全长cDNA文库,基因功能鉴定。 ţ他的实验与编制过度植物及敲除突变体,酶的检测和启动子结合试验,基因功能鉴定,必须在你的预测最好的候选基因进行。蛋白质性质的表征和过度植物准备好要进行确认后代谢产物的文件,使用正突变体,因为它需要相当长的时间准备改造重组蛋白和基因的克隆,重组蛋白检测。

10。代表结果

在本协议中所述的综合分析的过程有很多可能性,取决于指定的实验目的和选择生物和分析组合。程序和实验设计的选择,应进行正确目标的途径,化合物和植物物种的基础上。在本协议中所述的一体化战略是FOC用于植物基因功能和新基因功能的发现与一些生物和数据资源的有效使用注释。预期的结果是承诺提供与确凿预测的唯一情况。这一事实表明,如果有足够的证据不能组合型材,实验不应该被启动。出于这个原因,在任何情况下,可以支持额外的初步实验,RT-PCR技术,如针对性的基因表达谱,基因功能的预测。预测的准确性和正确性的相关性更高的质的区别和数量组合的变化而定。此外,良好的候选人和有效的结果,只能来自准确预测的途径。高峰应进行注释的几种方法的组合,例如文献调查,参考植物提取物,MS n分析,器官特异性和突变分析13。

1“SRC =”/ files/ftp_upload/3487/3487fig1.jpg“/>
图1。实验相结合的方法,通过基因注释流程的概述。在某些情况下,项目开始发现这是在特殊条件下或组织发现一个新的高峰,和渴望了解在其新陈代谢作用。在其他情况下,该项目的目的是关键调控因子,如转录因子的基因鉴定或发现。实验设计应刨用一组数据显示了明显的差异,在你的目标途径的代谢水平,从不同器官的组织样本的广泛使用,接触应力条件差异生长的植物或植物,并受到材料代谢产物分析。突变和转基因植物以及QTL窝藏育种材料,也代表了适合这些研究的遗传材料。应认真进行准确预测新途径如metabolotype机关根据证券及应激反应的基因表达数据的途径利益的不同类型的峰值注释和相结合的办法。在最后一步,代谢物和成绩单分析应执行最终,当网络资源,在硅片分析和基因表达的特征, 通过异源表达在体外结合,导致确认的候选基因,并阐明其功能内的代谢途径中的地位。缩写:QTL定位,QTL定位。

图2
图2。工作流高峰注释的组合方式。标准化合物的峰识别和注释,比较野生型和敲除突变体的过程,多维目标峰的质谱质谱纯COM从数据库12磅。缩写:DB,数据库;敲,敲了一维,一维,二维,二维核磁共振,核磁共振,红外光谱,红外多级质谱 ,质量质量spectrometries。

图3
图3。例如合作的花青素途径调控网络分析的共表达分析进行了使用与总理( http://prime.psc.riken.jp/?action=coexpression_index )设置ATTEDII版本的数据3 8,2的pajek计划( http://vlado.fmf.uni-lj.si/pub/networks/pajek/ )。呈正相关(R <0.5)被用来进行网络连接。红色节点:12花色苷酶基因(At5g13930,社区卫生服务,TT4,查尔酮合酶; At3g55120,C您好,TT5,查耳酮isomerise; At3g51240,F3H,TT6,黄烷酮3 -羟化酶; At5g07990,甘蓝型油菜F3'H,TT7,类黄酮3'-羟化酶; At5g17050,Fd3GT,UGT78D2,类黄酮3 - O型葡萄糖; At5g17220,AtGSTF12,TT19 ; At5g42800,DFR的二氢叶酸还原酶,TT3 At4g22880时,ANS / LDOX,TT18,花青素的合成; At4g14090 A5GT,花青素5 - O型葡萄糖; At5g54060,A3G2“XT的,公认的花青素3 - O-葡萄糖苷2” - O - xylosyltransferase; At3g29590,A5GMaT,花青素5 - O-葡萄糖苷6''' - O型 malonyltransferase; At1g03940,A3GCouT,花青素3 - O-葡萄糖苷6“ - O - P-coumaroyltransferase)和两个花青素生产的转录因子(At1g56650, PAP1; At1g66390,PAP2)用于寻找候选基因的候选基因被发现一个“集合的交集”搜索与阈值的系数 r <。/ EM >>质疑0.50套所有质疑的基因(十四花青素合成基因)的交点。共同表达网络,包括相关的候选基因(68个基因)和查询基因(14个基因),是由一个“套联网”重新构建与R> 0.50总理数据库搜索。与“网”从总理的数据库和网络的文件格式的输出文件使用Pajek软件绘制。蓝色节点代表候选人花青素基因相关的基因。

种类 主要次生代谢产物
拟南芥 硫代葡萄糖甙,黄酮,花青素,sinapoyl的衍生
杨毛果 黄酮,花青素,水杨酸衍生物
葡萄 黄酮,花青素,单宁酸,苯乙烯
马铃薯lycopersicum 黄酮,花青素,glycoalkaloid,chrologenate相关,
烟草 黄酮,花青素,nicotianamide,chrologenate相关acylsugar
水稻 glycoflavone,花色苷,甾醇衍生物
玉米5月 glycoflavone,花青素,benzoxazinone,甾醇衍生物
苜蓿 花青素,异黄酮,皂甙,
莲花粳稻 大豆异黄酮,花青素,黄酮,皂甙,

表一,主要模式植物的次生代谢产物。

共表达数据库 地址
植物交叉规范IES
缔约方会议 http://webs2.kazusa.or.jp/kagiana/cop0911/~~V
http://aranet.mpimp-golm.mpg.de/
植物物种
ATEED-II http://atted.jp/
英美 http://142.150.214.117/welcome.htm
缔约方会议 http://webs2.kazusa.or.jp/kagiana/cop
GeneCAT http://genecat.mpg.de/
拟南芥
http://www.arabidopsis.leeds.ac.uk/act/coexpanalyser
AthCoR@CSB.DB http://csbdb.mpimp-golm.mpg.de/csbdb/dbcor/ath.html
CressExpress http://cressexpress.org/~~V
PRIME http://prime.psc.riken.jp/?action=coexpression_index
水稻
RiceArrayNet http://arraynet.mju.ac.kr/arraynet/~~V
水稻阵列数据库 http://www.ricearray.org/coexpression/coexpression.shtml

表二。可用硅片共同表达分析基因表达的数据库。

Discussion

既然已经用了好几年,转录组和代谢组学技术,数据集成为辅助的基因注释代谢过程中通常开始一个新的峰代表一个未知的代谢产物的鉴定。这一事实导致了下一个阶段,这是评估的定量或认为是负责其合成的新的候选基因变异的代谢产物峰。然而,在本协议中所述的战略有三大问题)峰值标注的困难,二)通路预测的复杂性,三)基因信息和基因表达数据质量的决议。要对付的第一个问题,高峰注释应开展合作与标准化合物或从MS n分析,参考提取物,突变分析,代谢物数据库检索和文献调查( 12)2,组合的方式,利用信息洗脱。为Second问题,预测途径只能得到正确的峰值注释。然而,组织特异性代谢产物分析也可以支持峰值标注,应与相关基因的基因表达密切相关,因为代谢产物积累。因此结合不同的组织和生长条件的文件,可以帮助这第二个问题。第三个问题,关于基因信息的分辨率取决于序列数据的进展。在没有完成基因组序列的模型工厂的情况下,使用等模式植物中的同源基因的共同表达分析是有益的。详细的氨基酸序列对齐比较和进化树分析,可以支持连接到其他物种的模式生物。

该协议是适用于所有的新陈代谢。这是最有效的,在初中和高中的代谢分析,这是很好的特点是受到强烈的转录çontrol 1,5,11,16。在一些例子,硫同化执行成功的合作表达分析,基因β-氧化,支链氨基酸降解,叶绿素击穿,和赖氨酸代谢3,细胞壁代谢10,7和光信号级联14。通过联合基因组学,代谢和信息注释基因的功能不仅是生物合成基因和转录因子直接调节,同时也为了解生理过程及反应(例如图3 14)。

要发展这种方法从模式植物,作物品种,各地植物物种的代谢比较是在一些一般性的代谢功能强大的方法。例如,如果检测到相同的化合物在不同的植物物种,一些同源基因在这些植物物种中发现,跨物种共同使用同源基因的表达分析可以提供strong支持你的预测。这种方法可以在拟南芥,杨树,紫花苜蓿,除了重要的作物,如大麦,大米,小麦和大豆,植物物种的共同表达分析(6,行星: http://aranet.mpimp-golm.mpg DE / 9,缔约方会议: http://webs2.kazusa.or.jp/kagiana/cop0911/ ;看一个例子,15岁 )。

Disclosures

没有利益冲突的声明。

Acknowledgements

我们感谢在RIKEN的PSC和比约恩·Usadel博士和树齐藤教授有用讨论MPIMP的。 TT是从亚历山大·冯·洪堡基金会奖学金支持。

Materials

Name Company Catalog Number Comments
Distilled water ULC/MS grad BIOSOLVE 23214102
Acetonitrile (ACN) ULC/MS grade BIOSOLVE 01204102
Methanol (MeOH) ULC/MS grade BIOSOLVE 13684102
Formic acid (HCOOH) ULC/MS grade for liquid chromatography BIOSOLVE 06914131
Standard compounds EXTRASYNTHESE
Linear ion trap (IT) ESI-MS system FINNIGAN-LTQ Thermo Fisher Scientific, Inc.
HPLC system Surveyor Thermo Fisher Scientific, Inc.
Analytical column Luna C18(2), 2.0 mm diameter, 150 mm length, 100 Å pore size and spherical particles of 3 mm Phenomenex 00F-4251-B0
Xcalibur software Thermo Fisher Scientific, Inc.

DOWNLOAD MATERIALS LIST

References

  1. Aharoni, A., Keizer, L. C. P., Bouwmeester, H. J., Sun, Z. K., Alvarez-Huerta, M., Verhoeven, H. A., Blaas, J., van Houwelingen, A., De Vos, R. C. H., van der Voet, H. SAAT gene involved in strawberry flavor biogenesis by use of DNA microarrays. Plant Cell. 12, 647-661 (2000).
  2. Akiyama, K., Chikayama, E., Yuasa, H., Shimada, Y., Tohge, T., Shinozaki, K., Hirai, M. Y., Sakurai, T., Kikuchi, J., Saito, K. PRIMe: a Web site that assembles tools for metabolomics and transcriptomics. In Silico Biol. 8, 339-345 (2008).
  3. Araujo, W. L., Ishizaki, K., Nunes-Nesi, A., Larson, T. R., Tohge, T., Krahnert, I., Witt, S., Obata, T., Schauer, N., Graham, I. A., Leaver, C. J., Fernie, A. R. Identification of the 2-Hydroxyglutarate and Isovaleryl-CoA Dehydrogenases as Alternative Electron Donors Linking Lysine Catabolism to the Electron Transport Chain of Arabidopsis Mitochondria. Plant Cell. 22, 1549-1563 (2010).
  4. De Vos, R. C. H., Moco, S., Lommen, A., Keurentjes, J. J. B., Bino, R. J., Hall, R. D. Untargeted large-scale plant metabolomics using liquid chromatography coupled to mass spectrometry. Nat. Protoc. 2, (2007).
  5. Hirai, M. Y., Sugiyama, K., Sawada, Y., Tohge, T., Obayashi, T., Suzuki, A., Araki, R., Sakurai, N., Suzuki, H., Aoki, K., Goda, H., Nishizawa, O. I., Shibata, D., Saito, K. Omics-based identification of Arabidopsis Myb transcription factors regulating aliphatic glucosinolate biosynthesis. Proceedings of the National Academy of Sciences of the United States of America. 104, 6478-6483 (2007).
  6. Mutwil, M., Klie, S., Tohge, T., Giorgi, F. M., Wilkins, O., Campbell, M. M., Fernie, A. R., Usadel, B., Nikoloski, Z., Persson, S. PlaNet: Combined Sequence and Expression Comparisons across Plant Networks Derived from Seven Species. Plant Cell. 23, 895-910 (2011).
  7. Mutwil, M., Ruprecht, C., Giorgi, F. M., Bringmann, M., Usadel, B., Persson, S. Transcriptional Wiring of Cell Wall-Related Genes in Arabidopsis. Molecular Plant. 2, 1015-1024 (2009).
  8. Obayashi, T., Kinoshita, K., Nakai, K., Shibaoka, M., Hayashi, S., Saeki, M., Shibata, D., Saito, K., Ohta, H. ATTED-II: a database of co-expressed genes and cis elements for identifying co-regulated gene groups in Arabidopsis. Nucleic Acids Research. 35, D863-D869 (2007).
  9. Ogata, Y., Suzuki, H., Sakurai, N., Shibata, D. CoP: a database for characterizing co-expressed gene modules with biological information in plants. Bioinformatics. 26, 1267-1268 (2010).
  10. Persson, S., Wei, H. R., Milne, J., Page, G. P., Somerville, C. R. Identification of genes required for cellulose synthesis by regression analysis of public microarray data sets. Proceedings of the National Academy of Sciences of the United States of America. 102, 8633-8638 (2005).
  11. Tohge, T., Yonekura-Sakakibara, K., Niida, R., Watanabe-Takahashi, A., Saito, K. Phytochemical genomics in Arabidopsis thaliana: A case study for functional identification of flavonoid biosynthesis genes. Pure and Applied Chemistry. 79, 811-823 (2007).
  12. Tohge, T., Fernie, A. R. Web-based resources for mass-spectrometry-based metabolomics: A user's guide. Phytochemistry. 70, 450-456 (2009).
  13. Tohge, T., Fernie, A. R. Combining genetic diversity, informatics and metabolomics to facilitate annotation of plant gene function. Nature Protocols. 5, 1210-1227 (2010).
  14. Tohge, T., Kusano, M., Fukushima, A., Saito, K., Fernie, A. R. Transcriptional and metabolic programs following exposure of plants to UV-B irradiation. Plant Signal Behav. 6, Forthcoming (2011).
  15. Tohge, T., Ramos, M. S., Nunes-Nesi, A., Mutwil, M., Giavalisco, P., Steinhauser, D., Schellenberg, M., Willmitzer, L., Persson, S., Martinoia, E., Fernie, A. R. Towards the storage metabolome: profiling the barley vacuole. Plant Physiol. (2011).
  16. Yonekura-Sakakibara, K., Tohge, T., Matsuda, F., Nakabayashi, R., Takayama, H., Niida, R., Watanabe-Takahashi, A., Inoue, E., Saito, K. Comprehensive flavonol profiling and transcriptome coexpression analysis leading to decoding gene-metabolite correlations in Arabidopsis. Plant Cell. 20, 2160-2176 (2008).

Comments

1 Comment

  1. First of all, thank you for your scientific share in joVE. It consists profitable informations for me and other young scientists. I want to ask a question about your video. I couldn't find the extraction buffer in your experiment. If it is possible, can you say me which components did you use in your extraction buffer.
    Yours sincerely,
    Fahriye

    Reply
    Posted by: Fahriye î
    November 21, 2013 - 5:49 AM

Post a Question / Comment / Request

You must be signed in to post a comment. Please or create an account.

Usage Statistics