葡萄全基因组鉴定与表达的综合工作流 E3 泛素连接基因家族的 Meta 分析

* These authors contributed equally
Biology

Your institution must subscribe to JoVE's Biology section to access this content.

Fill out the form below to receive a free trial or learn more about access:

Welcome!

Enter your email below to get your free 10 minute trial to JoVE!





We use/store this info to ensure you have proper access and that your account is secure. We may use this info to send you notifications about your account, your institutional access, and/or other related products. To learn more about our GDPR policies click here.

If you want more info regarding data storage, please contact gdpr@jove.com.

 

Summary

本文介绍了一个基因家族的鉴定和描述的程序, 适用于在 Levadura 的家庭的葡萄Tóxicos 的拟南芥(ATL) E3 泛素酶。

Cite this Article

Copy Citation | Download Citations

Ariani, P., Vandelle, E., Wong, D., Giorgetti, A., Porceddu, A., Camiolo, S., Polverari, A. Comprehensive Workflow for the Genome-wide Identification and Expression Meta-analysis of the ATL E3 Ubiquitin Ligase Gene Family in Grapevine. J. Vis. Exp. (130), e56626, doi:10.3791/56626 (2017).

Please note that all translations are automatically generated.

Click here for the english version. For other languages click here.

Abstract

家庭中基因的分类和命名可以显著地有助于描述编码蛋白质的多样性, 以及基于几个特征的家庭功能的预测, 如序列主题的存在或特定修饰修改的网站和家庭成员在不同条件下的表达谱。这项工作描述了一个关于基因家族特性的详细的协议。在这里, 这个过程被应用到在 Levadura 中的拟南芥 Tóxicos的描述 (ATL) E3 泛素连接家族的葡萄。这些方法包括家庭成员的全基因组鉴定、基因定位、结构和复制的特征、保守蛋白的分析、蛋白质定位和磷酸化的预测以及基因表达谱在不同的数据集的整个家族。这种程序可以扩展到根据实验目的进一步分析, 可适用于任何基因组的任何植物物种, 为其提供基因数据, 并提供有价值的信息, 以确定感兴趣的候选人为功能性研究, 提供对植物适应环境的分子机制的洞察。

Introduction

在过去的十年中, 对葡萄基因组学进行了大量的研究。葡萄是一种公认的经济相关作物, 它已成为研究果实发育和木本植物对生物和非生物学胁迫反应的模型。在此上下文中,葡萄亚种cv. PN40024 基因组在 2007年1及其更新版本2中的发布导致了 "学" 数据的快速积累和大量高通量的研究。根据所公布的序列数据, 对某一特定基因家族 (通常由分享保守主题的蛋白质、结构和/或功能相似性和进化关系) 的综合分析, 现在可以进行, 以揭示其分子功能, 进化和基因表达谱。这些分析有助于理解基因家族如何控制整个基因组的生理过程。

植物生命周期的许多方面是由泛素介导的关键蛋白降解, 这需要一个 fine-tuned 的营业额, 以确保正常的细胞过程。泛素介导的降解过程的重要组成部分是 E3 泛素酶, 这是负责系统的灵活性, 由于具体目标的招聘3。因此, 这些酶代表一个巨大的基因家族, 约 1400 E3 连接编码基因预测在拟南芥基因组4, 每 E3 泛素连接作用于特定靶蛋白泛。尽管基质特异泛在植物细胞调控中的重要性, 但很少有人知道如何调节泛通路和目标蛋白只在少数情况下被识别。对这种特异性和调节机制的破译首先依赖于系统的不同组成部分的识别和定性, 特别是 E3 酶。在泛素酶中, ATL 亚科的特征是: 在a. 南芥中, 显示一个 RING-H2 手指域5,6, 其中一些在防御和荷尔蒙应答中扮演了一个角色7

定义新基因家族成员的第一个关键步骤是对家庭特征的精确定义, 如一致主题、关键域和蛋白质序列特征。事实上, 基于爆炸分析的所有基因家族成员的可靠检索需要一些强制性的序列特性, 特别是蛋白质的功能/活动, 作为蛋白质的签名。这可以通过先前对其他植物物种的同一基因家族的描述来促进, 或者通过分析不同植物物种中属于同一家族的不同基因认定来分离共同的序列。然后, 家庭成员可以根据国际财团为某种特定植物所定的共同规则, 单独命名。例如, 在小道消息, 这种程序受到了葡萄基因注释 (sNCGGa) 的超级命名委员会的建议, 建立了一个系统系统树的构建, 包括五亚种a. 南芥基因家族成员允许基于核苷酸序列的基因注释8

染色体定位的家庭成员和基因重复调查允许突出的存在, 全基因组或串联复制基因。这种信息似乎有助于解开假定的基因功能, 因为它可能显示功能冗余或揭示不同的情况,, non-functionalization, 新官能化, 或 sub-functionalization9。新的和 sub-functionalization 都是重要的事件, 创造了基因的新奇, 为植物适应变化的环境提供了新型的细胞组件10。特别是, 在葡萄基因组的进化过程中, 祖先基因的重复和新基因的产生是非常频繁的, 而新形成的基因则是来自葡萄的近端和串联重叠, 更有可能产生新函数11

破译基因家族功能的另一个关键因素是组剖面。因此, 可以利用公共数据库访问大量的组数据, 从而利用 large-scale在 "硅片" 表达式分析中为基因家族成员分配假定函数。的确, 特定植物器官中某些基因的奇特表达或对某些压力的反应, 可以给出一些关于在定义条件下相应蛋白质的假定作用的提示, 并支持关于可能的假设sub-functionalization 重复的基因来应对不同的挑战。为此, 重要的是要考虑几个数据集: 这些可以已经可用的基因表达矩阵, 如葡萄器官的全基因组组图谱和发育阶段12, 或者可以通过以下方式生成ad hoc检索特定植物物种的组数据集的定义应力。此外, 一个简单的方法使用两个矩阵, 一个具有成对相似性的数据和另一个具有两两表达系数, 可以用来评价序列相似性和表达模式之间的关系在一个基因家族。

这项工作的目的是提供一个全球性的方法, 定义基因结构, 保守的蛋白质主题, 染色体位置, 基因重复, 和表达模式, 以及预测蛋白质本地化和磷酸化的网站, 以达到植物基因家族的详尽描述。这种综合的方法在这里适用于描述的 ATL E3 泛素连接家族的葡萄。根据 ATL 亚科成员在调控关键细胞过程中的新作用7, 这项工作可以很好地帮助识别功能性研究的强候选者, 并最终解开控制这一重要作物对其环境的适应。

Subscription Required. Please recommend JoVE to your librarian.

Protocol

1. 确定假想的 ATL 基因家族成员 (s)

  1. 爆炸网络版
    1. 打开爆炸网页13 , 然后单击 "蛋白质爆炸" 部分。
    2. 在 "输入查询序列" 字段中, 输入蛋白质的氨基酸序列 (这里 VIT_05s0077g01970), 它将用作探针来识别其他家族成员。
      注意: 应该使用一种很好的代表性蛋白质 (一种蛋白质, 显示家庭的所有重要特征)。
    3. 在 "选择搜索集" 字段中, 选择 "参考蛋白质" 数据库 (refseq_protein) 和感兴趣的有机体 (v 亚种-taxid:29760)。
    4. 在 "程序选择" 字段中, 选择 "PSI-冲击波" 算法, 然后单击 "爆炸" 按钮运行分析。
      注: 通过单击 "算法参数" 可以调整一些高级参数 (最大目标序列、评分矩阵、PSI 阈值、)。
    5. 第一个爆炸圆检索所有显示与查询相关匹配的序列 (e-value 在所选阈值之上-默认为 0.005; 0.001)。取消选择所有的条目, 这显然不属于在审查的家庭点击在 "为 psi 爆炸" 列的滴答声, 并运行第二个 psi-爆炸迭代通过单击的爆炸按钮, 在步骤1.1.4。
    6. 新识别的序列以黄色突出显示。取消选择明显错误的检索命中, 并按照步骤1.1.5 中的说明来发现进一步的迭代。
    7. 继续执行迭代, 直到算法找不到任何相关的条目或它达到收敛 (没有找到新的条目)。下载假定基因家族成员名单, 作进一步分析。在每次迭代中检查检索到的命中, 以避免出现误报。
  2. 防爆独立版
    1. 单击爆炸主页13上的 "下载爆炸" 按钮, 下载爆炸的独立版本。
      注: 独立爆炸软件是前面描述的 web 界面的命令行版本。它允许对自定义本地或远程数据库执行 PSI 搜索。此外, 它允许搜索一个预定义的位置特定分数矩阵 (PSSM)。

2. 手动检查防扩散安全倡议-爆炸识别的家庭成员

  1. 多重对齐
    1. 收集先前在 FASTA 格式化的文件中标识的氨基酸序列, 并将其上载到巨型软件14以继续进行多重对齐。
    2. 打开超级软件, 点击 "对齐" 按钮, 点击 "编辑/建立对齐", 点击 "创建一个新的对齐", 点击 "蛋白质"。
    3. 单击 "对齐" 菜单中的 "编辑" 和 "从文件插入序列"。浏览之前创建的 FASTA 文件并确认所有被调查序列的上载。
    4. 单击 "对齐" 菜单和 "按肌肉对齐"。使用默认参数, 单击 "计算" 按钮, 然后等待多对齐的完成。
    5. 直观地检查多个对齐方式, 以排除错误预测的家庭成员。标准 CxxC (13 x) PxCxHxxHxxCxxxW (7 x) CxxCW 母题 (特别是在第三半胱氨酸之前存在脯氨酸残留) 是定义 ATL 家族成员所需的关键功能。
  2. 具体标志分析
    1. 提交家庭成员的权威列表 (96 葡萄序列满足被认为是 ATL 的要求) 到多 Em 为主题启发 (模因)15定义在整个家族中的保守主题。
    2. 从模版主页上, 点击 "迷因" 按钮, 完成 "数据提交表", 其中有有关家庭利益的特定信息。
    3. 使用模因分析来确认在葡萄的 ATL 家族成员中存在两个预期的主题,, RING-H2 和 GLD 主题。
  3. 或者, 使用生物信息学软件套件同时执行步骤2.1 和 2.2 (请参见材料表)。
    1. 将 FASTA 文件 (参见步骤 2.1.1) 上载到套件中。从菜单中选择 "文件", 然后 "导入", 然后单击 "从文件"。浏览 FASTA 文件并单击 "打开"。
    2. 在列表中选择所有导入的序列, 然后单击工具栏中的 "对齐/组合" 按钮, 然后单击 "配对多对齐"。选择 "肌肉对齐", 然后单击 "确定" 以使用默认参数启动对齐。
    3. 要可视化对齐的徽标, 请单击 "图形" → "选项", 然后选择 "序列徽标"。

3. 蛋白质物理参数和域的分析

  1. 由于对家庭成员的不同物理参数的定义对家庭的全面描述是重要的, 将家庭成员名单提交给特定的网络工具。
    1. 对于等电点 (pI) 和分子量 (kDa), 使用默认参数的专家系统网站上的 ProtParam 工具16
    2. 对于蛋白质亚细胞定位, 使用不同的工具, 以获得更可靠的预测, 如 ngLOC v1.017与默认设置, targetP v1.118的默认设置, 和蛋白质的潜行亚细胞本地化 v1.219以0.5 的概率截断。对于磷酸化站点, 请使用带有默认参数的 MUsite v1.0 web 工具20
  2. 调查家庭成员的其他蛋白质领域。
    1. 打开 Pfam 数据库网页21, 选择 "序列搜索" 工具, 在查询框中提交蛋白质序列, 然后单击 "Go" 运行分析。
      注: 每个蛋白质序列分别进行分析。默认设置中的 e-value 1.0 允许区分重要的和显著的命中。
    2. 从生物序列分析中心打开 TMHMM 服务器22 , 以调查假定跨膜区域的存在。
在查询框中同时粘贴所有蛋白质序列 (或者以 FASTA 格式上传包含所有蛋白质序列的文本文件), 然后单击 "提交" 来运行分析。
  • 分析蛋白质缺乏预测跨膜领域, 根据 TMHMM (步骤 3.2.2), 与 ProtScale 工具, 以确定假定疏水性地区。打开 ProtScale 网页23。在查询框中粘贴每个蛋白质序列并选择 "Hphob"。/Kyte 和 #38, 作为氨基酸鳞片。单击 "提交" 以运行分析。
  • 4. 染色体分布、重复和外显子-内含子组织

    1. 根据从葡萄基因组 CRIBI 生物技术中心网站24检索到的信息, 在染色体上映射 ATL 家族成员。
      1. 浏览 PhenoGram 网站首页25。将 "输入文件" 写成制表符分隔的文本文件, 并将其特定的特征映射到染色体上, 根据详尽的指南和示例, 说明所提供文件的编译遵循路径 "Phenogram" → "文档 "→" 选项 "→" 输入文件 "。
      2. 写出作品的 "标题"。选择要绘制的基因组。对于未在软件中实现的基因组, 如葡萄基因组, 请在下拉菜单中选择 "其他"。根据所提供的指南和示例编写基因组文件, 遵循路径 "Phenogram" → "文档" → "选项" → "基因组", 并上传。
      3. 使用默认参数 "表型间距", "表型颜色", "图像格式", 或选择在各自的菜单中的替代品, 并点击 "情节", 以获得染色体上的基因的可视化。
    2. 使用 MCScanX 软件26定义家族成员的复制状态。
      1. 在运行命令行 1 (补充文件 1) 的本地计算机上下载并解压 MCscanX 的副本。输入 MCscanX 文件夹, 并创建运行命令行 2 (补充文件 1) 所需的可执行文件。
        注意: 由于有关函数 chdir 的问题, MCscanX 的安装在某些 Linux 64 位计算机上是失败的。如果在执行命令时返回与此函数相关的错误消息, 则应运行命令行 3 (辅助文件 1), 之后应尝试进行 "发出" 命令。
      2. 下载v 亚种蛋白质和运行命令行的注释文件 4 (补充文件 1)。
        注: 葡萄树注释文件需要解压缩, 并通过运行命令行 5 (补充文件 1) 在唯一文件中的单染色体信息 cat。
      3. 使用v 亚种蛋白文件作为查询和主题运行 "全部与所有" blastp 搜索。
      4. 使用运行命令行 6 (补充文件 1) 的v 亚种蛋白文件创建可搜索的爆炸数据库。通过使用v 亚种蛋白质文件作为对以前通过运行命令行 7 (补充文件 1) 创建的数据库的查询来执行 blastp 搜索。
      5. 将注释文件转换为 MCScanX 的适当格式。运行命令行 8 (辅助文件 1) 来下载自定义 perl 脚本 parseMSCanXgff.pl。执行分析运行命令行 9 (补充文件 1)。
        注: 一个文件葡萄. gff 是以下列格式保存基因座标的:
        sp 基因起始位置结束位置
        其中 "sp" 是两个字母的代码的物种 (为葡萄树), 而 "#" 是名称的脚手架。请注意, 提供的自定义 perl 脚本适用于大多数转换, 尽管在某些特定情况下可能需要进行一些代码修改, 因为可用的注释文件中提供的信息多种多样。
      6. 启动 MCScanX 运行命令行 10 (补充文件 1)。
        注: "葡萄" 是注释和爆炸输出文件的前缀。这表示软件运行的强制要求。
      7. 分析 MCScanX 结果。MCScanX 产生一个文本文件 "葡萄. 共线性", 其中包含共线块。此类文件可以由任何文本编辑器检查 (请参见输出 1补充文件 1)。
        注意: 生成了一个 "mcscaxOutput. html" 目录, 其中包含针对每个参考染色体的多对齐共线块的 html 文件。这些文件可以通过 web 浏览器进行检查。
      8. 根据染色体相对位置对同源基因进行分类运行命令行 11 (辅助文件 1)。
        注: 同源基因分类在补充表二中描述。生成的输出文件 "gene_type" 包含具有简单制表符分隔格式的所有原始信息。
      9. 进行浓缩分析, 以评估基因家族是否由运行命令行 12 (补充文件 1) 的特定机制发起普遍。
        注意: 文件 "gene_type" 是在步骤4.2.8 生成的, 而文件 "gene_family_file" 表示的是一个行文本文件, 其中家庭的名称 (例如, ATL_genes) 后面是所有属于家族的基因的轨迹名称。由制表符分隔。用于富集的应用统计测试是 Fisher 精确测试, 不同来源的p值存储在文件 "outputFile.txt" 中。
    3. 使用交互式生命树 (iTOL)27来可视化基因的外显子-内含子组织, 这是用于系统系统树的显示、注释和管理的 on-line 工具。
      1. 上传 iTOL 网站的 "上传" 部分的系统进化树。这棵树是根据下面5节建造的。对于每个家族成员基因, 从葡萄基因组的 V1 注释中检索基因结构预测 (CRIBI 网站上面提到)。计算假定显、内含子和未翻译区域 (UTRs) 的长度 (bp)。
      2. 使用 "蛋白质域" 数据集对外显子-内含子模式的图形化显示。
    根据所提供的路径 "帮助" → "帮助页" → "数据集类型" → "蛋白质域" 在 iTOL 网站27中编写包含计算长度的纯文本文件。使用 "蛋白质域" 数据集, "矩形 (RE)" 和 "矩形间隙 (GP)" 形状分别表示外显子和 UTRs。

    5. 系统发育分析和命名

    1. 通过构建高质量的系统树和定义家庭名称来分析 ATL 家庭成员之间的关系。
      1. 对于葡萄基因家族, 遵循葡萄超级命名委员会8建立的规则。
      2. 从 UniProt 数据库28中检索一个. 南芥ATL 序列, 要求作为葡萄基因命名标准的参考8
      3. 写一个 FASTA 的文件, 包括所有的核苷酸序列的葡萄和. 南芥基因家族成员将包括在系统发育分析。核苷酸序列允许家庭成员间的最大变异 (与蛋白质序列相比较)。
    2. 系统进化树
      注意: 利用发展史. fr 29管线是为了获得高质量的系统进化树, 但不是强制的。
      1. 浏览发展史. fr 主页29, 并选择 "系统发育分析" 管道。
        注: "一击" 在大多数情况下都适用, 但如果需要, 可以选择特定的高级设置 ("高级"), 甚至可以进行完全定制的分析 ("点菜"; 请参见步骤 5.2.5)。
      2. 写上 "分析的名称", 上传以前创建的 FASTA 文件 (步骤 5.2.1, 然后单击 "提交" 来运行分析。
      3. 或者, 如果上面描述的过程 (步骤 5.2.1, 5.2.2) 导致错误消息, 则分别完成系统间套件管线的每一步, 如下所示。
        1. 从肌肉软件主页30中, 将 FASTA 文件上载到 "步骤 1" 中, 在 "步骤 2" 中选择 "皮尔逊/FASTA" 作为 "输出格式", 然后在 "步骤 3" 中单击 "提交" 以对齐查询序列。
        2. 单击 "下载对齐文件" 并另存为 FASTA 文件以进一步执行步骤。
        3. 使用 Gblocks 服务器工具31处理对齐 FASTA 文件以消除不太一致的位置。上传对齐 FASTA 文件, 选择 "DNA" 作为 "序列类型", 并选择最适合的选择 (s) 的严格性, 以分析 (例如, 为葡萄的 ATL 基因家族选择所有的三选项建议 "不严格的选择", 因为高序发散)。单击 "获取块" 运行分析。
        4. 在输出页的底部单击 "生成的对齐", 并将结果保存为新的 FASTA 文件。
        5. 从发展史. fr 主页29, 选择 "点菜" 作为 "系统发育分析" 管道。然后, 取消选择 "多对齐" 和 "对齐治疗"。单击 "创建工作流", 上传 Gblocks FASTA 文件 (步骤 5.2.5.4), 在 "设置" 中选择 "引导程序", 并单击 "提交" 以运行分析。
      4. 通过单击 "选择和操作" 部分中的 "折叠分支" 并下载 Newick 格式的最终结果以进行进一步的分析, 从而折叠支持较差的分支 (、引导值和 #60; 70%)。
    3. 指定一个基于系统发展史的基因名称。
      1. 通过将树状结构上传到上面提到的 iTOL 套件 (4.3 节), 查看系统树以评估其可靠性。
      2. 手动为每个家庭成员分配一个基因名称。在一对一 orthologues 的情况下, 指定拟南芥样的名称 (例如、AtATL3 → VviATL3)。区分葡萄的基因 (两个或两个以上) 从一个单一的拟南芥同源与相同的系统发育距离使用数字, 或字母, 如果拟南芥基因结束与一个数字 (, AtATL23 → VviATL23a, VviATL23b)。
      3. 在一对多或多对多 orthologues 的情况下, 指定一个新的基因名, 该名称由拟南芥样名称 (此处为 "ATL") 配对, 其数量高于已用于v 亚种拟南芥的最高数字。(e. g., VviATL83)。
      4. 完成新定义的家庭的命名, 从系统树的顶部到底部的降序。

    6. 葡萄的器官和阶段表达谱

    1. 生成包含家庭成员表达式数据的工作数据矩阵。
      1. 从 "平台32上分发的链接下载v 亚种cv. Corvina 基因表达图集方形。此文件包含要在以下步骤中使用的 RMA 规范化表达式值。
      2. 从 atlas 方形中提取每个家族基因的表达值, 并编写一个 "工作方形", 其中包含与阿特拉斯方形相同的标题行。将 "工作方形" 保存为制表符分隔的文本文件。
    2. 使用多实验查看器 (兆伏特) 软件执行分层双聚簇分析。
      1. 下载并安装电子伏特软件33
      2. 上传 "工作方形" (步骤 6.1.2) 跟随路径 "文件" → "加载数据" → "浏览" 并选择文本文件。选择 "单色阵列", 并在未提供自动注释时从 "加载注释" 中删除刻度。选择表达式表预览的左上角表达式值, 然后单击 "加载" 按钮。
      3. 调整数据应用 Log2 转换 ("调整数据" → "日志转换" → "Log2 变换") 和基因/列正常化 ("调整数据" → "基因或列调整" → "中间中心基因或列")。设置适当的比例限制 ("显示" → "设置颜色刻度限制")。
      4. 根据路径 "分析" → "聚类" → "HCL" 计算分层聚类。
    选择 "优化基因叶序" 和 "优化样本叶序", 在 "排序优化场", "皮尔逊相关性" 中的 "距离矩阵选择" 领域, "平均连锁聚类" 在 "联系方法选择" 领域。然后, 单击 "确定" 以运行分析。
  • 在窗口左侧面板的 "分析结果" → "HCL" 菜单中查看结果。通过单击 "文件" 菜单中的 "保存图像" 来导出热图。
  • 7. 表达谱对生物和非生物学应力的响应

    1. 重复步骤 6.1, 从各自的出版物中获得了 GSE 的加入 ID, 并研究了对葡萄的生物和非生化胁迫的调查。例如, 实验提供了转录的葡萄浆果感染真菌病原体灰霉病菌使用 NimbleGen 葡萄全基因组芯片可以浏览的 GSE ID GSE52586。重复步骤6.1.1 和6.1.2。
    2. 搜索 NCBI 序列读取存档34与 BioProject ID (例如, SRP055458 或 PRJNA275778 的 "葡萄花阴影" 实验) 和下载所有相关的原始序列读取。从许多不同的研究中提取 RNA 序列数据集, 使用单一管道进行一致性处理。
      1. 简要地, 修剪原始序列 FASTQ 读 (单对端) 和过滤器质量与 Trimmomatic35。使用 AVGQUAL 和 MINLEN 过滤器分别为20和 40, 所有参数均为默认值。
      2. 使用 Bowtie236索引12X 葡萄树参考基因组1 。在运行bowtie2命令之前, 下载12X 葡萄树参考基因组 (例如, bowtie2-build)。
      3. 使用 htseq V1 基因模型注释 (GFF/GTF) 文件获取计数矩阵表, 其数量为37
    3. 在 R38中执行差分基因表达式 (re) 分析, 并分别为 RMA 归一化矩阵和 DESeq240库中的 limma39库, 用于从步骤7.1.1 和7.2.1 中获得的计数矩阵表。
      1. 执行标准的 "两组" 比较 (、"处理"/"控制")。确保正确地指定了 "控制" 和 "处理" 条件的设计矩阵/分组。
        注: 微阵列差异表达分析的典型设计 (GSE52586) 在与limma运行命令行的同一开发阶段, 将 EL-33 浆果与灰霉病菌感染对照 (健康) 浆果进行比较13显示在补充文件 1中。一个典型的 RNA-seq 差分表达式分析 (SRP055458 或 PRJNA275778) 的设计比较花 (在7天后上限下降) 下的阴影处理与DESeq2运行命令行14的控件显示在补充文件1.
      2. 获取差异表达基因 (度) 的列表在每个对比, 对于limma, 使用函数lmFit (), 后跟eBayes (), 然后通过topTable() 函数, 而对于DESeq2, 使用DESeqDataSetFromMatrix (), DESeq ()结果 ( ) 函数。下面是要遵循的典型工作流。
        1. 有关微阵列差异表达式分析, 请参见命令行 15 (补充文件 1)。对于 RNA-seq 差分表达式分析, 请参见命令行 16 (补充文件 1)。为所有其他与不同的适当设计模式的对比, 重复上述步骤 (参见步骤7.3.1 中的示例)
    4. 从生成的表达列表中提取与 ATL V1 加入不对应的所有行, 保留包含 log2 折叠更改 (处理/控制) 和 #62 的列; | 0.5 |并调整了p值 (罗斯福) 和 #60; 0.05, 并将它们相应地合并到一个矩阵表中, 研究是否属于 "非生物" 或 "生物学/病原体相互作用" 药典。
    5. 使用库gplots在 R 中构造分层群集 heatmaps (非生物药典)。
      注意: 调用图 2函数将图与各自矩阵表中的行 dendrograms 一起构造。使用cellnote函数的其他参数有助于区分差异表达 (log2FC 和 #62; 0.5、罗斯福和 #60; 0.05) ATL 基因在每个比较大范围的实验条件的一个 * 符号。在 R 运行命令行 17 (补充文件 1) 中应用典型的工作流或者, 或者, 重复步骤6.2.2 到6.2.5 以使用兆伏特软件构建 heatmaps。

    8. 同源序列发散与基因共表达关系的分析

    1. 构造包含两两相似性的矩阵。相似矩阵的元素是序列相似性的值, 由配对蛋白质对齐。
      1. 使用带有默认设置的浮雕针 web 服务器41可使成对序列对齐并另存为文本文件。打开输出文本文件并删除所有注释行, 以及列名和行名称以生成名为 "similarityTable.txt" 的文件。
        注意: 这样的表为每个 ATL 基因都提供了一条线, 用于报告在每个配对对齐中计算的相似性值。行和列中的位点的顺序是相同的, 这样就产生了对称矩阵的对角值。
    2. 通过计算皮尔逊相关系数, 构造表达数据的矩阵。以下过程要求 R 和 perl 模块 PDL。
      1. 下载在终端中运行命令行 18 (补充文件 1) 的 96 ATL 基因的表达式值。使用可通过运行命令行 19 (辅助文件 1) 下载的自定义 perl 脚本执行表达分析。这样的脚本将计算的皮尔逊相关系数之间的一对 ATL 位点如先前所报告。
      2. 启动运行命令行 20 (辅助文件 1) 的脚本, 并按照输出说明进行操作。
    该脚本将产生一个输出文件 (即 "coexpressionTable.txt"), 包含一个表达矩阵, 其特点是在步骤8.1 中获得矩阵的相同的轨迹名称顺序 (这是运行壁炉测试所必需的, 请参见下面的命令)。
  • 在步骤8.1 和8.2 中获得的数据矩阵之间进行一个壁炉测试。在进入 r 环境 (从终端中运行命令 "r") 后, 使用以下命令加载 ade4 库: 库 (ade4)
    1. 通过加载两个数据矩阵并执行运行命令行 21 (补充文件 1) 的统计信息运行壁炉测试, 并使用 "nrep" 表示置换的数量。该测试包括计算这些矩阵的元素之间的相关性, 排列矩阵, 然后再次计算相同的测试统计。
      注意: 统计测试所获得的所有值都用于建立统计测试的引用分布, 用于计算p值以测试其重要性。置换的数量定义了可以获得p值的精度。
  • Subscription Required. Please recommend JoVE to your librarian.

    Representative Results

    VIT_05s0077g01970 基因, 被确定为最相似的a. 南芥 ATL2 (At3g16720) 通过 BLASTp 搜索, 被用作探针, 以调查的 ATL 家族成员在葡萄基因组 (五亚种cv 皮诺 PN40024)。PSI-爆炸分析在几个周期之后汇合, 揭示了属于葡萄树 ATL 基因家族 (图 1A) 的假定基因列表。在分析中确定的所有条目的肌肉对齐方式的视觉检查 (图 1B) 中, 对每个候选项的规范 RING-H2 域的存在进行了评估。在拟南芥5中, 只有那些含有正确间隔的保守氨基酸、两组氨酸残留物以及在第三半胱氨酸之前的脯氨酸残留的基因被视为 ATLs。共有96葡萄的基因满足了要求, 并考虑进一步的定性。对每个 ATL 家族成员进行了分析, 以定义该基因的特定特征和相应的编码蛋白,, 除了 RING-H2、跨膜或疏水性丰富的区域外, 还有其他已知的域的存在, 亚细胞本地化和假定的磷酸化站点 (表 1表 2)。

    Figure 1
    图 1: PSI-爆炸调查和假定的葡萄 ATLs 的对准.(A) 第一个 PSI-爆炸迭代搜索的前10命中的截图, 使用蛋白质序列 VIT_05s0077g01970 作为诱饵。(B) 96 所选葡萄藤的部分对齐方式假定 ATLs 显示其 RING-H2 域以及使用分子生物学套件获得的相应徽标 (参见材料表)。转载自 Ariani et al.在创作共用归属4.0 国际许可证42下获得许可。请点击这里查看更大版本的这个数字。

    名称 基因 ID 基因长度 (bp) 内含子数 UniProt ID 蛋白质长度 (aa) RING-H2 主题 TM/H 域编号 其他域
    VviATL3 VIT_09s0002g00220 1245 0 F6HXK6 304 PxC 1
    VviATL4 [VviRHX1A] VIT_15s0021g00890 1827 3 D7SM36 203 PxC 0
    VviATL18 VIT_11s0118g00780 1113 2 F6HCI8 193 pc 0
    VviATL23a VIT_18s0001g01060 935 0 F6H0E4 114 PxC 0。5
    VviATL23b VIT_18s0001g01050 399 0 E0CQX3 132 PxC 1
    VviATL24 VIT_17s0000g06460 4466 4 D7SI89 217 PxC 1
    VviATL27 VIT_00s0264g00020 2554 4 D7T1R5 235 PxC 1
    VviATL43 VIT_11s0052g00530 1576 2 D7SQD9 457 PxC 3
    VviATL54a VIT_18s0001g06640 3221 1 F6H0Y5 405 PxC 1
    VviATL54b VIT_03s0017g00670 2774 1 F6HTI0 427 PxC 1
    VviATL55 [VviRING1] VIT_07s0191g00230 1844 0 F6HRP9 372 PxC 1
    VviATL63 VIT_06s0004g06930 804 0 D7SJU6 267 PxC 1
    VviATL65 VIT_03s0063g01890 2068 0 F6HQI8 396 PxC 1
    VviATL82 VIT_01s0026g02540 820 0 F6HPQ9 233 pc 0。5
    VviATL83 VIT_17s0000g08400 1887 0 F6GSQ4 143 pc 0
    VviATL84 VIT_06s0004g00120 1853 0 F6GUP5 368 pc 0。5 zf-RING_3
    VviATL85 VIT_12s0034g01400 786 0 F6H965 261 pc 0。5
    VviATL86 VIT_12s0034g01390 1434 1 D7T016 451 pc 0。5
    VviATL87 VIT_18s0001g03270 1002 0 F6H0T2 333 pc 0。5 zf-RING_3
    VviATL88 VIT_08s0040g00590 1320 0 F6HQR2 314 pc 0 zf-RING_3

    表 1: 前 20 VviATL 基因和相应蛋白质的序列特征.TM: 跨膜;H: 疏水性;0.5 表示一个或多个疏水区域的存在。转载自 Ariani et al.在创作共用归属4.0 国际许可证42下获得许可。

    Table 2
    表 2: 前20的详细信息VviATL基因定位v 亚种基因组、复制状态和 ATL 蛋白物理化学特性和位置(a) 由 Musite 预测的磷酸化点的数量;(b) 至少用两个软件获得的类似预测以黑体突出显示;ngLOC 用于默认设置, 而 TargetP v1.1 和蛋白质的潜行亚细胞定位使用的概率为0.5 的截止。校正, 核;麻省理工学院, 线粒体;智利, 叶绿体;聚乳酸、等离子体膜;S, 分泌通路 (存在一个信号肽);M, 线粒体;C、叶绿体;O 或-, 其他地点;nd, 未确定 (, 低于阈值)。转载自 Ariani et al.在创作共用归属4.0 国际许可证42下获得许可。请单击此处下载此文件.

    系统发育分析, 包括被辨认的葡萄的核苷酸序列与参考A. 南芥atl 基因家族的序列一起被用于葡萄 atl 命名, 根据指南sNCGGa8。九十六和83核苷酸序列从v 亚种一. 南芥, 分别受到了系统发展史. fr 管道获得可靠的系统进化树。后一个序列后来被用来注释和命名葡萄基因的基础上坚实的关系 (图 2)。按照这种方法, 13 的96葡萄 ATLs 收到一个特定的标识符, 考虑它们与a. 南芥ATL 的一对一 orthology。其他83基因的名称是根据系统进化树分配的, 从上到下进行递增编号, 从高于a. 南芥中使用的最高数字的 ATL 基因数开始。

    Figure 2
    图 2: v 亚种一. 南芥ATL E3 泛素连接编码基因的系统进化树.无树是由发展史产生的. fr 套件 (v 亚种(绿色) 和A. 南芥的 83 ATL 基因在 UniProt 数据库中报告 (黄色)。从100引导复制中获得了分支支持值。红星表示在相应的蛋白质中存在一个 BCA2 锌指 (BZF) 域。转载自 Ariani et al.在创作共用归属4.0 国际许可证42下获得许可。请单击此处查看此图的较大版本.

    将 atl 编码基因映射到葡萄染色体上, 显示了整个基因组的广泛分布, 表明全基因组重复是葡萄树中 atl 基因家族扩展的主要进化力量。事实上, 31 ATLs 在同源染色体区域中发现, 可能来源于节段性或全基因组复制事件。此外, 同样的分析突出显示了13串联复制的基因, 一个近端复制, 和51分散重复 (图 3)。考虑到在 ATL 家族中有大量的重复基因, 我们进行了一次浓缩试验 (Fisher 的精确测试), 以检查基因组分离过程中重复基因的优先保留。使用p值和 #60; 0.001, 此测试证实了重复的 atl 基因保留的假设比随机预期的多, 这表明在葡萄的适应和进化过程中, atl 基因家族扮演了一个角色。

    Figure 3
    图 3: 葡萄树 ATL-编码基因分布在v 亚种染色体和复制状态.在数据库中有确切的染色体信息的96葡萄树的 ATL 基因被映射到 19 v 亚种染色体。颜色表示原始复制事件。垂直黑线和红线分别从串联重叠和全基因组复制中识别成对。转载自 Ariani et al.在创作共用归属4.0 国际许可证42下获得许可。请单击此处查看此图的较大版本.

    为了进一步研究 ATLs 在葡萄中的生物学功能, 在亚种cv. Corvina 全球基因表达图谱12中进行了 meta 分析。该数据集包括54不同葡萄器官的全基因组表达值和发育阶段, 并用于进行分层双聚类分析。结果不仅证实了所有 96 ATLs 在54组织/阶段中至少有一个表达, 而且还指出了五主要表达式配置文件的存在 (图 4A)。简单地, 星团 a 和 E 显示了相反的行为, 特别是第一个特点是一般下调的 ATL 基因在少年样本, 包括早期浆果阶段, 幼叶, 卷须, 花序, 和大部分的芽阶段。另一方面, 在同一个星团中, 成熟的浆果和收获后的枯萎阶段, 木本组织, 和后期的种子发育的 ATL 基因显示了一个主要的上调。在大多数样品中, 聚丙 downregulated 中的基因主要是上调的, 而在浆果发育后期, 群 D 中的 ATL 基因通常是在早期的。最后, 群集 B 没有在表达式配置文件中显示任何相关的变体。

    采用类似的方法研究葡萄树 ATL 家族成员的表达, 以响应生物和非生物学的压力, 使用专门的数据集为此目的。从基因表达综合 (GEO) 和 ArrayExpress 等公共访问数据库中可以获得大量的表达数据, 从微阵列和 RNA 序列实验中得到。一旦收集和方便地正常化, 这些信息被用来进一步洞察 ATLs 在植物对胁迫的反应中的潜在作用。通过分析葡萄 ATLs 在生物胁迫下的表达谱, 发现62的96种转录记录在至少两个条件下显示出显著的调制 (log2 褶皱-变化 (FC) 和 #62; | 0.5 |), 有假发现率 (罗斯福) 和 #60; 0.05 (图 4B)。数字增加到81只考虑罗斯福门限在一个单独情况。这些结果强烈提示了 ATL 基因家族直接参与了对葡萄病原体的反应。特别是, 一组12基因 (VviATL3-27-54b-55-90-97-123-144-148-149-156) 强烈上调反应的大多数病原体, 包括 biotrophic 和 necrotrophic 真菌和草食动物, 因此, 值得注意的进一步功能分析.

    Figure 4
    图 4: 葡萄图谱中的分层 clusteringof ATL 基因表达及葡萄生物胁迫相关数据集.(A) 将葡萄树的 ATL 基因在葡萄树上的表达值转换为基于皮尔逊距离度量的层次聚类分析.颜色比例代表了较高 (红色) 或较低 (绿色) 的表达水平, 相对于每一个基因的平均转录丰度的所有样本。右侧的字母 A 到 E 表示标识的不同簇。AB: 爆裂后;B: 爆裂;芽 W: 冬芽;F: 开花;花期开始;财政司司长: 水果套装;G: 绿色;先生: mid-ripening;PFS: post-fruit 集;PHWI II. III: 收获后枯萎 1, 2 和3月;R: 成熟;S: 衰老;茎 W: 木质茎;V: veraison;WD: 开发良好;杨: 年轻人。(B) 颜色比例表示在受感染样本中葡萄 ATL 基因表达的增加 (红色) 或减少 (蓝色) 褶皱的变化与每个条件的对照。星号表示每个 ATL 在相应条件下的显著差异表达式 (罗斯福和 #60; 0.05)。转载自 Ariani et al.在创作共用归属4.0 国际许可证42下获得许可。请单击此处查看此图的较大版本.

    补充表 1: 用于替代剪接的 ATL 基因候选.(a) atl 基因 id 根据 V1 葡萄基因预测和注释, (b) atl 基因 id 根据 V2 葡萄基因预测和注释43, (c) 假定 atl 替代拼接变体的数量, (d)有关每个假定的 ATL 变体的编码顺序的信息。请单击此处下载此文件.

    补充表 2:请单击此处下载此文件.

    补充文件 1:请单击此处下载此文件.

    Subscription Required. Please recommend JoVE to your librarian.

    Discussion

    在基因组时代, 许多植物物种被深深地刻画了。这些信息是初步的功能研究, 并提供一个框架, 进一步调查不同成员在一个家庭中的作用。在这方面, 还需要一个命名系统, 允许唯一地识别家庭中的每个成员, 避免在不同的研究组独立于不同的基因分配姓名时可能出现的冗余和混乱。

    经过深思熟虑的考虑, 葡萄科学界同意命名的葡萄基因在一个家庭的基础上与拟南芥基因的相似性, 并建立了一系列的规则, 必须用于描述新的基因家族的葡萄,基本上从系统发育比较葡萄和拟南芥家族成员的核苷酸序列8。因此, 只有在拟南芥中已经标注并正确命名的基因才能在葡萄藤命名中使用。因此, 本文所描述的拟南芥葡萄 orthologues 的鉴定方法, 仅是为了满足指定正确的葡萄基因家族命名的要求。然而, 对于其他植物物种, 替代方法可能是一种选择。例如, orthology 可以被推断使用双向爆炸命中 (BBH), 在那里 orthologues 被定义作为两个种类更相似的基因的对 (, 与最高的对准线比分) 对彼此比其他基因在另一个种类44。然而, 这种方法可能会错过许多 orthologues 的情况下, 基因重复率高, 如在植物和动物的45。此外, 在 atl 编码基因的情况下, BBH 可能会检索缺乏精确的 atl 型 RING-H2 结构 (包括脯氨酸残留物) 或未在拟南芥中注明为 ATLs 的基因。虽然从进化论的角度来看, 这种搜索可能是相关的, 但没有标注的 orthologues 的检索将不会满足葡萄的 ATL 基因家族注释和命名的范围, 而 orthologues 不被注释为 ATLs不能用来命名葡萄家族成员。另一种可能性是根据氨基酸而不是核苷酸序列来推断 orthology, 使用 InParanoid46, 或者最近的 Hieranoid 247, 虽然这些工作流不是科学界明确推荐的。

    表达 meta 分析, 可以定义为一个系统的方法来研究和组合不同的公开可用的数据集的表达资料, 允许强调共享和不同的分子机制在各种条件。因此, 从多个 large-scale 组实验中整合基因表达信息, 可以通过在实验中定义家庭成员的表达谱, 从而改善基因家族的特征, 从而减少实验特定因素的影响, 支持在特定过程中假定基因功能的更稳健假设。然而, 利用微阵列数据需要将表达数据与不同的平台相结合, 考虑到它们自身的局限性。例如, 在小道消息 Nimblegen 微阵列平台中, 在阵列 (约1.3万基因) 上所代表的相应基因中, 有相当比例的 probesets 有可能 cross-hybridization 问题48。在葡萄树的情况下, 15 基因可能会受到这种现象的影响。不过, 正如克莱默et al.所讨论的48, 同一探针的高度相似基因家族成员的交叉可以提供有关表达的有趣信息, 在特定条件下, 不仅是单个基因, 而是两个以上基因共享高序列相似性, 从而可能共享目标和功能。与微阵列数据集相关的另一个潜在问题是微阵列平台的表达检测限制, 它们并不十分敏感。为了解决这两个问题, i. e., cross-hybridization 和信号灵敏度, 一个可能的解决方案可能是只考虑 RNAseq 表达式数据集。然而, 从许多不同的研究中 RNAseq 数据的 meta 分析可能会耗费大量的时间, 需要大量的计算资源和高的专业知识。

    虽然这里提出的方法是详尽无遗的, 但可以肯定地补充其他分析。首先, 为了进一步了解植物基因家族成员之间的分子进化和亲缘关系, 系统进化分析可以通过家庭成员的多序列排列来扩展生成系统树从几个植物种类。也可以计算家族基因的进化时间, 在进化过程中对它们同义和同义替代率的估计, 通过确定值 Ks (在给定时间) 和 Ka (同一期间内每个同义站点的同义替换数)。Ka/Ks 比率是用来推断基因重复事件的机制后, 从他们的祖先分歧。ka/ks 值 = 1 建议中性选择, ka/ks 值和 #60; 1 建议净化选择, 和 ka/ks 值的和 #62; 1 建议积极选择49。此外, 如果基因结构分析揭示了内含子的存在, 基因家族的表征可以进一步扩展到其他剪接变体的检测。事实上, 基于对不同组织的 RNA 序列数据的深入调查, 压力条件和基因型43, 21 (96) ATLs 是替代剪接事件的强有力候选者, 这些 ATLs 的潜在数量从2到16不等 (见补充表 1)。替代的成绩单经常产生蛋白质异构体, 不同的氨基酸序列, 这些变化可能会改变细胞性质的蛋白质, 并可能导致改变从微妙的调制功能丧失的基因产品。为此, 可选剪接事件参与了重要的植物功能, 包括应力响应, 抗病性, 光合作用和开花50,51。ATL 基因启动子信息的集成包含假定的cis-管理元素52或查找分子 (,, rna 和长编码 RNA) 可能目标 ATLs53也可以补充揭示了对葡萄 ATLs 的复杂分子调控和相互作用的系统洞察。

    最后, 选择的分析, 以及适用的程序来表征一个新的基因家族的植物物种主要是由科学的社区规则和范围的基因家族鉴定。重要的是要记住可能的后续调查步骤, 这将利用这组信息, 其中包括植物物种之间的基因进化, 基因组结构描述, 或可靠的候选人选择在功能研究.

    Subscription Required. Please recommend JoVE to your librarian.

    Disclosures

    作者没有什么可透露的。

    Acknowledgements

    这项工作得到了维罗纳大学在联合项目2014的框架内的支持 (在葡萄藤中的 ATL 基因家族的特性及其对霜霉病霜霉病的抗性)。

    Materials

    Name Company Catalog Number Comments
    Personal computer
    Basic Local Alignment Search Tool (BLAST) https://blast.ncbi.nlm.nih.gov/Blast.cgi
    Molecular Evolutionary Genetics Analysis (MEGA) http://www.megasoftware.net/
    Motif-based sequence analysis tools (MEME) http://meme-suite.org/
    Geneious Biomatters Limited http://www.geneious.com/
    ProtParam Tool http://web.expasy.org/protparam/
    ngLOC http://genome.unmc.edu/ngLOC/index.html
    TargetP v1.1 Server http://www.cbs.dtu.dk/services/TargetP/
    Protein Prowler http://bioinf.scmb.uq.edu.au:8080/pprowler_webapp_1-2/
    MUsite http://musite.sourceforge.net/
    Pfam http://pfam.xfam.org/
    TMHMM Server v. 2.0 http://www.cbs.dtu.dk/services/TMHMM/
    ProtScale http://web.expasy.org/protscale/
    Grape Genome Database (CRIBI) http://genomes.cribi.unipd.it/grape/
    PhenoGram http://visualization.ritchielab.psu.edu/phenograms/plot
    MCScanX http://chibba.pgml.uga.edu/mcscan2/
    Interactive Tree Of Life (iTOL) http://itol.embl.de/
    UniProt http://www.uniprot.org/
    Phylogeny.fr http://www.phylogeny.fr/index.cgi
    MUSCLE http://www.ebi.ac.uk/Tools/msa/muscle/
    Gblocks Server http://molevol.cmima.csic.es/castresana/Gblocks_server.html
    Vitis vinifera cv. Corvina gene expression Atlas datamatrix https://www.researchgate.net/publication/273383414_54sample_
    datamatrix_geneIDs_Fasoli2012
    Multi Experiment Viewer (MeV) http://mev.tm4.org/#/welcome
    Sequence Read Archive (SRA) https://www.ncbi.nlm.nih.gov/sra
    R https://www.r-project.org/
    EMBOSS Needle (EMBL-EBI) http://www.ebi.ac.uk/Tools/psa/emboss_needle/

    DOWNLOAD MATERIALS LIST

    References

    1. Jaillon, O., et al. The grapevine genome sequence suggests ancestral hexaploidization in major angiosperm phyla. Nature. 449, (7161), 463-467 (2007).
    2. Adam-Blondon, A. -F., et al. Genetics, Genomics, and Breeding of Grapes. Science Publishers. 211-234 (2011).
    3. Chen, L., Hellmann, H. Plant E3 Ligases: Flexible Enzymes in a Sessile World. Mol. Plant. 6, (5), 1388-1404 (2013).
    4. Vierstra, R. D. The ubiquitin-26S proteasome system at the nexus of plant biology. Nat. Rev. Mol. Cell Biol. 10, (6), 385-397 (2009).
    5. Serrano, M., Parra, S., Alcaraz, L. D., Guzmán, P. The ATL Gene Family from Arabidopsis thaliana and Oryza sativa Comprises a Large Number of Putative Ubiquitin Ligases of the RING-H2 Type. J. Mol. Evol. 62, (4), 434-445 (2006).
    6. Aguilar-Hernández, V., Aguilar-Henonin, L., Guzmán, P. Diversity in the Architecture of ATLs, a Family of Plant Ubiquitin-Ligases, Leads to Recognition and Targeting of Substrates in Different Cellular Environments. PLoS One. 6, (8), e23934 (2011).
    7. Guzmán, P. The prolific ATL family of RING-H2 ubiquitin ligases. Plant Signal Behav. 7, (8), 1014-1021 (2012).
    8. Grimplet, J., et al. The grapevine gene nomenclature system. BMC Genomics. 15, 1077 (2014).
    9. Prince, V. E., Pickett, F. B. Splitting pairs: the diverging fates of duplicated genes. Nat. Rev. Genet. 3, (11), 827-837 (2002).
    10. Magadum, S., Nerjee, U., Murugan, P., Gangapur, D., Ravikesavan, R. Gene duplication as a major force in evolution. J. Gen. 92, (1), 155-161 (2013).
    11. Wang, N. Patterns of Gene Duplication and Their Contribution to Expansion of Gene Families in Grapevine. Plant Mol. Biol. Rep. 31, (4), 852-861 (2013).
    12. Fasoli, M. The Grapevine Expression Atlas Reveals a Deep Transcriptome Shift Driving the Entire Plant into a Maturation Program. Plant Cell. 24, (9), 3489-3505 (2012).
    13. BLAST. BLAST2.6.0. Available from: https://blast.ncbi.nlm.nih.gov/Blast.cgi (2016).
    14. MEGA. MEGA7.0.25 build 7170412. Available from: http://www.megasoftware.net/ (2017).
    15. MEME. MEME Suite Version 4.11.4. Available from: http://meme-suite.org/ (2017).
    16. ProtParam. ExPASy Server. Available from: http://web.expasy.org/protparam/ (2005).
    17. ngLOC v1.0. Available from: http://genome.unmc.edu/ngLOC/index.html (2007).
    18. TargetP v1.1 Server. Available from: http://www.cbs.dtu.dk/services/TargetP/ (2000).
    19. Prowler v1.2. Available from: http://bioinf.scmb.uq.edu.au:8080/pprowler_webapp_1-2/ (2005).
    20. MuSite v1.0. Available from: http://musite.sourceforge.net/ (2010).
    21. Pfam. Pfam version 31.0. Available from: http://pfam.xfam.org/ (2016).
    22. TMHMM v2.0c. Available from: http://www.cbs.dtu.dk/services/TMHMM/ (2007).
    23. ExPASy. ProtScale. Available from: http://web.expasy.org/protscale/ (2005).
    24. CRIBI. Grape genome database. Available from: http://genomes.cribi.unipd.it/grape/ (2012).
    25. PhenoGram. Available from: http://visualization.ritchielab.psu.edu/phenograms/plot (2012).
    26. ScanX v0.8. Available from: http://chibba.pgml.uga.edu/mcscan2/ (2013).
    27. Interactive Tree Of Life (iTOL). Version3.5.3. Available from: http://itol.embl.de/ (2016).
    28. UniProt. Available from: http://www.uniprot.org/ (2016).
    29. Phylogeny.fr. Available from: http://www.phylogeny.fr/index.cgi (2008).
    30. MUSCLE. Available from: http://www.ebi.ac.uk/Tools/msa/muscle/ (2017).
    31. Gblocks Server. Version 0.91b. Available from: http://molevol.cmima.csic.es/castresana/Gblocks_server.html (2002).
    32. Vitis vinifera cv. Corvina gene expression Atlas. Available from: https://www.researchgate.net/publication/273383414_54sample_datamatrix_geneIDs_Fasoli2012 (2015).
    33. Multiple Experiment Viewer (MeV). Version 4.8.1. Available from: http://mev.tm4.org/ (2017).
    34. Sequence Read Archive (SRA). Available from: https://www.ncbi.nlm.nih.gov/sra (2017).
    35. Bolger, A. M., Lohse, M., Usadel, B. Trimmomatic: a flexible trimmer for Illumina sequence data. Bioinformatics. 30, (15), 2114-2120 (2014).
    36. Langmead, B., Salzberg, S. L. Fast gapped-read alignment with Bowtie 2. Nat Meth. 9, (4), 357-359 (2012).
    37. Anders, S., Pyl, P. T., Huber, W. HTSeq-a Python framework to work with high-throughput sequencing data. Bioinformatics. 31, (2), 166-169 (2015).
    38. R. Version 3.4.1. Available from: https://www.r-project.org/ (2017).
    39. Ritchie, M. E. limma powers differential expression analyses for RNA-sequencing and microarray studies. Nucleic Acids Res. 43, (7), e47 (2015).
    40. Love, M. I., Huber, W., Anders, S. Moderated estimation of fold change and dispersion for RNA-seq data with DESeq2. Genome Biology. 15, (12), 550 (2014).
    41. EMBL-EBI. EMBOSS Needle. Available from: http://www.ebi.ac.uk/Tools/psa/emboss_needle/ (2017).
    42. Ariani, P. Genome-wide characterisation and expression profile of the grapevine ATL ubiquitin ligase family reveal biotic and abiotic stress-responsive and development-related members. Sci. Rep. 6, 38260 (2016).
    43. Vitulo, N., et al. A deep survey of alternative splicing in grape reveals changes in the splicing machinery related to tissue, stress condition and genotype. BMC Plant Biol. 14, (1), 99 (2014).
    44. Overbeek, R., Fonstein, M., D'Souza, M., Pusch, G. D., Maltsev, N. The use of gene clusters to infer functional coupling. Proc. Natl. Acad. Sci. USA. 96, (6), 2896-2901 (1999).
    45. Dalquen, D. A., Dessimoz, C. Bidirectional Best Hits Miss Many Orthologs in Duplication-Rich Clades such as Plants and Animals. Genome Biol. Evol. 5, (10), 1800-1806 (2013).
    46. Remm, M., Storm, C. E. V., Sonnhammer, E. L. L. Automatic clustering of orthologs and in-paralogs from pairwise species comparisons1. J. Mol. Biol. 314, (5), 1041-1052 (2001).
    47. Kaduk, M., Sonnhammer, E. Improved orthology inference with Hieranoid 2. Bioinformatics. 33, (8), (2017).
    48. Cramer, G. R., et al. Transcriptomic analysis of the late stages of grapevine (Vitis vinifera cv. Cabernet Sauvignon) berry ripening reveals significant induction of ethylene signaling and flavor pathways in the skin. BMC Plant Biol. 14, 370 (2014).
    49. Juretic, N., Hoen, D. R., Huynh, M. L., Harrison, P. M., Bureau, T. E. The evolutionary fate of MULE-mediated duplications of host gene fragments in rice. Genome Res. 15, (9), 1292-1297 (2005).
    50. Filichkin, S. A. Genome-wide mapping of alternative splicing in Arabidopsis thaliana. Genome Res. 20, (1), 45-58 (2010).
    51. Quesada, V., Macknight, R., Dean, C., Simpson, G. G. Autoregulation of FCA pre-mRNA processing controls Arabidopsis flowering time. EMBO J. 22, (12), 3142-3152 (2003).
    52. Wong, D. C. J., Gutierrez, R. L., Gambetta, G. A., Castellarin, S. D. Genome-wide analysis of cis-regulatory element structure and discovery of motif-driven gene co-expression networks in grapevine. DNA Res. 24, (3), 311-326 (2017).
    53. Wong, D. C. J., Matus, J. T. Constructing Integrated Networks for Identifying New Secondary Metabolic Pathway Regulators in Grapevine: Recent Applications and Future Opportunities. Front. Plant Sci. 8, 505 (2017).

    Comments

    0 Comments


      Post a Question / Comment / Request

      You must be signed in to post a comment. Please or create an account.

      Usage Statistics