Waiting
Login processing...

Trial ends in Request Full Access Tell Your Colleague About Jove
Click here for the English version

Cancer Research

肿瘤组织中高通量芯片测序的染色质状态全基因组图谱集成平台

Published: April 5, 2018 doi: 10.3791/56972

Summary

在这里, 我们描述了一个优化的高通量芯片排序协议和计算分析管道, 以确定从冷冻肿瘤组织和细胞系的全基因组的染色质状态模式。

Abstract

组蛋白修饰是表观基因的主要组成部分, 在确定相关基因座的转录状态方面起着重要的调控作用。此外, 还使用特定的修改来确定位置和身份非编码功能元素, 如增强剂。近年来, 染色质免疫沉淀其次是下一代测序 (芯片序列) 已成为一个强有力的工具, 以确定基因组范围内的个别蛋白修饰的轮廓。然而, 越来越清楚的是, 染色质修饰的组合模式, 称为染色质状态, 决定了相关基因组轨迹的特征和性质。因此, 由健壮的高通量 (HT) 方法组成的工作流, 用于分析许多组蛋白修饰标记, 以及能够处理无数芯片序列分析数据集的计算分析管线, 因此需要大量样品中 epigenomic 状态的综合测定。这里提出的 HT 芯片序列工作流包括两个模块: 1) 一个实验性的协议, 用于分析从少量肿瘤样本和细胞系的96井格式的几个组蛋白修饰;和 2) 一个计算数据分析管道, 结合现有的工具, 以计算单独的标记占用和组合染色质状态模式。这两个模块结合在一起, 便于快速、高效地处理数以百计的芯片序列样本。本文介绍的工作流用于从黑色素瘤肿瘤和细胞系中的6组蛋白标记剖面中提取染色质状态模式。总的来说, 我们提出了一个全面的芯片序列的工作流程, 可用于许多人肿瘤标本和癌细胞株, 以确定 epigenomic 畸变在各种恶性肿瘤。

Introduction

大多数哺乳动物基因组 (98-99%) 由非编码序列组成, 这些 nocoding 区域包含已知参与控制基因表达和染色质组织 1, 2 的调控元素.在正常细胞中, 基因组 DNA 的特定组装进入致密的染色质结构, 对于各种 DNA 相关进程的空间组织、调控和精确定时至关重要, 这些过程3,4,5。然而, 在癌细胞中, 异常表观遗传机制的染色质修饰可能导致染色质结构的不正确组织, 包括获得调控元素、染色体循环系统和基因表达模式6, 7,8,9,10

尽管最近取得了进展, 我们对与肿瘤进展或治疗反应相关的表观变化的理解有限。表观基因由一系列的修改组成, 包括组蛋白标记和 DNA 甲基化, 它们共同形成一个动态状态 (称为染色质状态), 它会影响基因表达网络和其他关键的过程来维持细胞身份。最近, 通过研究 H3K27Ac 配置文件11, 增强剂的改变已显示在多种恶性肿瘤中。虽然这些研究提供了对孤立的表观遗传标记的相关性的洞察力, 但100多种表观修改已被识别为12,13 , 而没有清楚地了解它们的生物学角色和相互 依赖。此外, 还有更多的可能组合模式的这些组蛋白和 DNA 的修改, 它是这些组合模式-而不是个别的修改-听写表观遗传学的状态14。因此, 在癌症进展或对治疗的反应中, 有必要确定这些染色质状态的变化.由于技术 (例如, 从少量临床材料/单细胞生成大规模数据) 和分析 (例如算法来定义, 癌症中表观基因改变的综合知识已经滞后于部分原因。组合状态) 的挑战。因此, 迫切需要强健的高通量方法来分析大量的组蛋白修饰标记, 从临床材料和易于实现的计算方法来预测组合模式, 这将有助于不同肿瘤分期和治疗耐药性相关的表观遗传状态的测定。此外, 从最近的表观基因分析研究中获得的数据15, 16, 17, 18, 19, 20, 21, 2223正常组织和细胞系可与肿瘤染色质剖面结合, 进一步深入了解表观基因对肿瘤生物学的贡献。

染色质分析已成为识别各种染色质修改的全局绑定模式的强大工具15,24。近年来, 芯片序列已成为研究全球尺度上的 DNA-蛋白质相互作用的 "金标准"25,26,27。对于任何芯片序列实验, 有必要的关键步骤, 它的成功, 包括组织处理和解除, 确定最佳超声波条件, 确定的最佳抗体浓度的降水, 图书馆准备,后测序数据处理和下游分析。这些步骤中的每一个都包含关键的质量控制检查点, 当两者结合在一起时, 对于正确识别功能验证的潜在目标至关重要。通过这些步骤的创新, 一些先前的研究已经开发出从少量组织执行芯片或芯片序列的方法28,29,30,31,32.此外, 一些研究还提出了高通量芯片实验的协议, 其次是基于 PCR 的定量33,34。最后, 一些公开可用的芯片序列数据分析平台现在可用, 如 Easeq35和 Galaxy36。然而, 在高吞吐量的方式下, 结合计算管道来执行单标记和染色质状态分析, 一个集成的平台来执行芯片序列。

本协议描述了一个完整和全面的芯片序列工作流程, 用于全基因组在肿瘤组织和细胞系中的染色质状态图谱, 并易于遵循指导原则, 包括成功实验所需的所有步骤。通过采用以前由 Blecher Gonen et描述的高通量方法。37, 此协议可在多个样本中并行执行, 并已成功应用于癌细胞系和人类肿瘤, 如黑色素瘤、结肠、前列腺和胶质瘤多形性。我们演示了六组核心组蛋白修饰的方法, 它代表了人类黑色素瘤细胞系和肿瘤样本中表观遗传调控景观的关键组成部分。这些修改包括 H3K27ac (增强剂)、H3K4me1 (积极和有活力的增强剂)、H3K4me3 (促进者)、H3K79me2 (转录区)、H3K27me3 (polycomb 镇压) 和 H3K9me3 (异色镇压)。这些标记可以单独或组合使用, 以确定代表压制性和活动域的功能上不同的染色质状态。

Subscription Required. Please recommend JoVE to your librarian.

Protocol

所有临床标本都是按照机构审查委员会的指导方针获得的。

1. 缓冲准备

  1. 使200毫升的 TE 缓冲器 (10 毫米三盐酸, 10 毫米乙二胺乙酸 (EDTA) pH 值 8.0)。
  2. 使200毫升的圣凯瑟缓冲 (10 毫米三盐酸, 10 毫米 EDTA pH 值 8.0, 140 毫米氯化钠)。
  3. 使200毫升2.0 米甘氨酸 (37.52 克甘氨酸在200毫升水) 和加热它到65°c。
  4. 使200毫升的5% 脱氧钠 (doc) 溶液 (10 克的 doc 在200毫升水)。
  5. 制作500毫升的芯片收获缓冲器 (12 毫米三氯, 0.1x 磷酸盐缓冲盐水 (PBS), 6 毫米 EDTA, 0.5% 月桂酸钠 (SDS))。
  6. 使500毫升的芯片稀释缓冲 (10 毫米三氯, 140 毫米氯化钠, 0.1% DOC, 1% 海卫 x, 1 毫米 EDTA)。
  7. 制作500毫升的马国贤洗涤缓冲器 (x-100, 1%, 0.1% SDS, 0.1% DOC)。
  8. 使500毫升的 RIPA/500 洗涤缓冲器 (马国贤缓冲 + 360 毫米氯化钠)。
  9. 制作500毫升的 LiCL 洗涤缓冲器 (TE, 250 毫米 LiCL, 0.5% NP-40, 0.5% DOC)。
  10. 使500毫升直接洗脱缓冲:10 毫米三氯 pH 8.0, 5 毫米 EDTA, 300 毫米氯化钠, 0.5% SDS。
  11. 制作50毫升抗体结合/阻断缓冲 (PBS + 0.1% TWEEN-20 + 0.2% 无 IgG BSA)。

2. 组织/细胞系的加工和交联

  1. 如果组织是闪光冷冻, dethaw 它在冰在离解之前。
  2. 使用无菌刀片将50毫克组织 (每组蛋白修饰抗体的8毫克) 与2毫升的汉克斯平衡盐溶液 (HBSS) 进行人工分离。在无菌组织培养皿中, 将组织切成3到4毫米, 大约5分钟。
  3. 将组织和 HBSS 溶液转移到 dissociator 管中, 再加入8毫升的 HBSS。进一步解除组织使用 dissociator 直到匀质。
  4. 对于黑色素瘤肿瘤, 把管子放在一个 dissociator 中, 每一次依次运行以下周期: h_tumor_01.01、h_tumor_02.01、h_tumor_03.01 和 m_heart_02.01。
  5. 刮 21 x 106细胞在10毫升中等 (~ 3 x 106每组蛋白的修改和输入; 它可以降低到10万细胞每标记为罕见的人口) 生长在一个标准的组织培养皿, 并收集他们在15毫升圆锥管。
    注: 用于代表性黑色素瘤细胞系 WM115 的培养基 DMEM 补充10% 胎牛血清和5% 青霉素/链霉素。
  6. 通过增加200µL 16% 甲醛每3毫升 HBBS 为组织 (或3毫升培养基为细胞) 交联的组织/细胞使用1% 最终甲醛浓度。在37摄氏度的时候, 用搅拌机在 10 rpm 处摇动混合物。
    注意: 甲醛是有毒的, 应该在适当的通风罩中处理。
  7. 添加200µL 2.0 米甘氨酸每3毫升的样品, 并继续晃动在 10 rpm 另5分钟37°c。
    注: 甘氨酸起淬火作用。每个月都要做新鲜的甘氨酸溶液, 因为溶液的 pH 值随着时间的推移而逐渐趋于。
  8. 使用台式离心机将样品在4摄氏度的 934 x g 处旋转5分钟。取出上清液, 加入5毫升冰冷 PBS, 再离心样品 934 x g, 取出上清液。
  9. 闪光冷冻颗粒和存储在-80 °c, 以进一步处理。

3. 组织裂解、超声波和抗体制备

  1. 溶解1蛋白酶抑制剂片剂每10毫升的芯片收获缓冲。
  2. 添加300µL 的芯片收获缓冲液, 每50毫克的组织蛋白酶抑制剂, 并允许30分钟的裂解冰。
    注: 添加300µL 的芯片收获缓冲液, 每 1 X 107 WM115 黑色素瘤细胞系的蛋白酶抑制剂。
  3. 当细胞株溶藻时, 打开水浴器干扰装置和相关的冷却系统, 使温度达到4摄氏度。将 sonicator 管放置在水浴器的干扰和油脂实验黑色素瘤组织60周期在三十年代和三十年代关闭, 以获得 200-600 基对 (bp) 的染色质碎片。
    注: 超声波时间可以不同组织类型, 并应相应调整。这是一个关键的步骤, 应在试点试验中进行优化, 然后再继续免疫沉淀。
  4. 在超声波期间, 使用1000µL 的绑定/阻塞缓冲 (PBS + 0.1% TWEEN-20 + 0.2% BSA), 每样抗体三次清洗20µL 的蛋白质 G 磁性珠子。
  5. 对于8毫克的黑色素瘤组织, 孵化3µg 的每个组蛋白抗体100µL 的捆绑/阻塞缓冲区 2 h 4 °c 与旋转使用管左轮手枪。12个单一抗体的样本包含240µL 的珠子, 36 µg 的抗体和1200µL 的捆绑/阻塞缓冲器。
    注: 对于 3 x 106单元格, 每种抗体使用5µg 的每个抗体和30µL 蛋白 G 磁性珠子。如果使用不同数量的组织, 则应滴定抗体和蛋白 G 珠。该协议说明了所描述的六组蛋白修饰的免疫沉淀条件 (材料表), 但是, 抗体浓度应针对其他修改和转录因子进行优化。
  6. 要确定碎片大小, 请删除20µL 的 sonciated 染色质溶液, 并添加一个洗脱缓冲主混合 (室温), 其中包含44µL 的直接洗脱缓冲器, 1 µL RNase (20 毫克/毫升) 和5µL 蛋白酶 K (20 毫克/毫升) 每样。在 PCR 热循环仪中孵育样品, 至少在50摄氏度时为2小时。根据制造商的指示, 使用 PCR 纯化试剂盒净化样品。
  7. 确保染色质得到充分的剪切通过确定碎片大小使用高灵敏度的 DNA 电泳图谱仪器, 然后再进行步骤3.6。打开电泳图谱仪器。
  8. 将高灵敏度缓冲剂2µL 到8井光管条中的每个井中。将高灵敏度梯的2µL 在剩余井中的第一井和2µL 纯化样品中。
  9. 将光学管帽放在管 stips 和涡流上, 样品在2000转每分钟1分钟. 打开盖子, 插入一个新的高灵敏度的屏幕磁带和加载提示框。取下带帽并将样品装入电泳图谱仪器。
  10. 打开分析软件, 突出显示屏幕磁带上的前十三个空格, 然后按右下角的 "开始" 选项卡。染色质碎片介于 200-1000 bp 之间, 适用于芯片。
  11. 将微气泡溶液转移到无菌管上, 用台式离心机在4摄氏度处旋转 21130 x g 的管子, 15 分钟。将上清液转移到新管上。
  12. 确定上清的总容积, 并删除输入控制的总解决方案的 10%, 并将其存储在4摄氏度。

4. 染色质免疫沉淀

  1. 溶解2蛋白酶抑制剂片剂每20毫升的芯片稀释缓冲。
  2. 在超声波稀释剩余的样品5次使用芯片稀释缓冲器使 SDS 水平降低到0.1%。稀释270µL 的剩余上清与1080µL 芯片稀释缓冲器, 以获得最终总容积1350年µL。
  3. 当抗体和蛋白 G 磁性珠子的孵化完成后, 将管子放在磁铁上, 取出上清。
  4. 当管子仍然坐在磁铁上时, 用蛋白酶抑制剂加入750µL 的芯片稀释缓冲液来洗涤珠子。
    注意: 在这个步骤中, 不要打扰珠子或旋转管子是很重要的。
  5. 去除芯片稀释缓冲器洗涤和并用重悬在240µL 相同的芯片稀释缓冲器的珠子。整除将20µL 的珠子分成12个单独的管, 每根都用于一个单独的组织样本。
  6. 整除微气泡材料均匀地对蛋白 G 珠与特定抗体和翻滚使用管左轮手枪过夜4摄氏度。

5. Immunoprecipitated DNA 蛋白复合物的洗涤和反向交联

  1. 第二天早上反向交联后, 将抗体蛋白溶液转移到96井板上, 将其放在磁支架上。允许珠子坚持至少三十年代和删除上清。
  2. 使用多通道吸管, 用150µL 的冰冷马国贤洗涤缓冲器清洗珠子5次。在洗涤步骤中, 不要吸管珠子, 但每次清洗时从右向左移动磁铁。
  3. 用150µL 的冰冷 RIPA-500 洗涤缓冲器清洗样品两次。
  4. 用150µL 的冰冷 LiCl 洗涤缓冲器清洗样品两次。
  5. 用150µL 的冰冷 TE 洗涤缓冲器清洗样品一次, 立即取出 TE 缓冲器。对于低输入应用程序, 可以省略此步骤。
  6. 将输入控制从步骤3.7 添加到包含芯片 DNA 样本的96井板的新鲜井中。
  7. 洗涤步骤后, 添加一个洗脱缓冲主混合 (室温), 其中包含44µL 直接洗脱缓冲器, 1 µL RNase (20 毫克/毫升) 和5µL 蛋白酶 K (20 毫克/毫升) 每芯片和输入样品的反向交联。
  8. 用 PCR 热循环仪在37°c, 4 小时在50°c 和 8-16 h 在65°c 孵化样品。

6. 沉淀 DNA 的纯化和定量化

  1. 第二天早上, 把样品放回磁铁上, 转移到上清到一个新的96井 PCR 板, 其中含有 immunoprecipitated 的 DNA。
  2. 添加2.3x 顺磁珠到解决方案 (115 µL 50 µL 的解决方案), 并小心吸管上下25次使用多通道吸管。如果适当地混合, 溶液将变为均匀。
  3. 将溶液在室温下从磁铁中孵化4分钟. 将样品放回磁铁上, 在室温下孵化4分钟. 放弃上清。
  4. 在将样品留在磁铁上时, 添加150µL 70% 乙醇 (卷/卷), 并在室温下孵化, 而不干扰珠子。
  5. 取出乙醇并重复清洗。允许顺磁珠在磁铁上风干5分钟。
    注: 除去所有的乙醇后, 第二次清洗, 因为剩余的乙醇将干扰净化。
  6. 从磁铁中取出样品, 并添加30µL 10 毫米三氯 pH 8.0。混合吹打25次, 在室温下将样品从磁铁上孵化4分钟。
  7. 将样品放回磁铁上, 在室温下孵化4分钟. 将每个样品的20µL 转移到一个新的96井板上, 供图书馆准备。存储剩余的10µL 的芯片 DNA, 以防任何可能的问题与生成的库。
  8. 在这个阶段, 在图书馆准备之前量化芯片 DNA。用高灵敏度的 dna 试剂测定 dna 浓度。用高灵敏度的 dna 电泳图谱仪对步骤7.1 进行测定, 确定沉淀 dna 的大小分布。

7. 使用 NEBNext 超 II DNA 库准备套件的库生成

  1. 根据制造商推荐的协议, 使用 DNA 库准备生成用于自定序列的库。所有反应在96井板和孵化执行在 PCR 热循环仪与盖子温度集 > 100 °c 和容量设置在50µL。
  2. 对于索引, 使用了寡核苷酸平台的多路复用。使用以下设置执行总共10x 个周期的 PCR 扩增: 初始变性在98°c 三十年代, 变性在98°c 十年代, 退火/延长在65°c 为三十年代 (10x 周期), 最后的延长65°c 为5分钟和举行在4°c。
    注: 表1包含用于 PCR 放大的引物。
  3. PCR 扩增后, 取出样品, 用核酸酶水将总容积µL 100。执行双面顺磁尺寸选择 (0.55x/0.8x) 先加入55µL 的珠子, 并混合吹打25倍。在室温下将样品从磁铁中孵化4分钟。
  4. 将样品放回磁铁上, 再在室温下孵化4分钟。此步骤用于保留不适合排序的珠子上的大块碎片。
  5. 将上清液转移到新的96井 PCR 板上。不要丢弃上清, 因为这包含部分纯化的 DNA。
  6. 再添加25µL 顺磁珠, 混合吹打25次, 在室温下从磁铁中孵化4分钟。
  7. 将样品放回磁铁上, 再在室温下孵化4分钟, 然后丢弃上清。此步骤用于保留将用于最终库的200到 600 bp 的片段。
  8. 在将样品留在磁铁上时, 添加150µL 70% 乙醇 (v/v), 并允许在三十年代孵化, 而不干扰珠子 (不要在磁铁上移动)。取出乙醇, 再重复一次洗涤。
  9. 允许顺磁珠在磁铁上晾干5分钟. 在第二次洗涤后, 除去所有的乙醇, 因为剩余的乙醇会干扰纯化。
  10. 从磁铁中取出样品, 并添加25µL 10 毫米三氯 pH 8.0。混合吹打25次, 在室温下从磁铁中孵化4分钟. 将样品放回磁铁上, 在室温下孵育另4分钟。
  11. 在多路复用前使用高灵敏度的 DNA 电泳图谱仪器量化库, 以确保尺寸适合测序。完成的图书馆范围在 200-600 bp 之间并且缺乏所有底漆脂肪酸。
    注: 如有必要, 另进行0.7x 顺磁珠提纯, 以去除不需要的底漆脂肪酸, 其存在于 130 bp。
  12. 根据浓度以独特的指数引物为基础, 建立量化的 DNA 库。对于包含六个样品的水池在 1 ng/µL 和 6 ng/µL 之间, 分布是15µL 的最低样品和2.5 µL 最高的样品。这样做是为了确保读取计数将均匀分布在每个通道的流单元。

8. 后芯片序列数据处理

  1. 基于snakemake3839的管线用于在单个命令中处理以下所有步骤。重要的是, 每个步骤都与相关命令单独讨论。
  2. 确定原始 fastq 排序的质量使用 FastQC (http://www.bioinformatics.babraham.ac.uk/projects/fastqc/): 打开 unix 终端并更改目录 (cd) 到包含每个六组蛋白修改的原始 fastq 文件的文件夹。在 unix 终端类型中, fastqc * fastq 和按 [返回]。这将对文件夹中的所有 fastq 文件运行质量控制指标。
  3. 将质量读数与参考基因组对齐, 并在压缩到 bam 文件之前删除重复项。这是使用领结版本 1.1.239、SAMBLASTER 版本 0.1.2140和 SAMTOOLS 版本 1.3.141执行的: 在 unix 终端类型中, 领结-m 1-n 1-最佳-地层 s-q/path_to/hg19 histone1.fastq.gz |samblaster-removeDups |samtools 查看-> histone1 和按 [返回]。
    注: path_to 表示包含 hg19 人类基因组组件的文件夹。这将根据感兴趣的有机体而改变。
  4. 使用以下命令对 bam 文件进行排序: 在 unix 终端类型中, SAMTOOLS 排序 histone1 SAMTOOLS 2G @ 5 T histone1. 排序并按 [返回]。
  5. 使用 SAMTOOLS 在以下命令中索引 bam 文件: 在 unix 终端类型中, SAMTOOLS 索引 histone1.sorted.bam histone1.sorted.bam.bai 并按 [返回]。
  6. 使用以下命令确定唯一映射的和齐的读取 SAMTOOLS flagstat: 在 unix 终端类型中, SAMTOOLS flagstat histone1.sorted.bam 并按 [返回]。
  7. 通过使用以下命令对 bam 文件进行标准化: 在 unix 终端类型中, sambamba 视图 f bam-subsampling-seed=3 0.X histone1.sorted.bam |samtools 排序-m 2G-@ 5 吨 histone1.downsample.temp histone1.downsample.sorted.bam 和按 [返回]。
  8. 使用 SAMTOOLS 以下列命令再次索引 bam 文件: 在 unix 终端类型中, SAMTOOLS 索引 histone.downsample.sorted.bam histone.downsample.sorted.bam.bai 并按 [返回]。
  9. 在基因组浏览器 (i. e) 上可视化芯片序列库。UCSC 或 IGV), 使用 deepTools 版本 2.4.040生成要人文件, 方法是将 bam 文件缩放为每百万 (kilobase) 的每 RPKM 读取。可以使用以下命令执行此操作:
    1. 对于标准的要人文件: 在 unix 终端类型中, bamCoverage-b histone1。downsample.sorted.bam--normalizeUsingRPKM--binSize 30-smoothLength 300-extendReads 200 o histone1, 并按 {返回]。
    2. 对于输入减去的大人物文件: 在 unix 终端类型中, bamCompare--bamfile1 histone1.downsample.sorted.bam bamfile2 input1.downsample.sorted.bam--normalizeUsingRPKM--binSize 30-smoothLength 300-extendReads 200-ohistone1.subtracted.bw 和按 [返回]。
  10. 用基于模型的芯片序列分析 (mac) 版本 1.4.225,26和2.1.0 版本, 识别 "输入" 背景下的芯片序列信号富集。使用 macs1 的 "点源" 因素 H3K4me3, H3K4me1 和 H3K27ac 和 macs2 的 "广泛来源" 因素 H3K79me2, H3K27me3 和 H3K9me3。这是使用以下命令执行的:
    1. 对于点源: 在 unix 终端类型中, macs14 histone1.downsample.sorted.bam-input1.downsample.sorted.bam 1e-5-nomodel-保持所有 n histone1. 文件并按 [返回]。
    2. 对于广义源: 在 unix 终端类型中, macs2 callpeak histone1.downsample.sorted.bam-c input1.downsample.sorted.bam-g 1e-6-宽-宽截止 1e-6-保持所有-nomodel n histone1. 文件和按 [返回]。
  11. 使用 ChromHMM24可以根据使用以下命令研究的组蛋白修改来识别组合染色质状态模式:
    1. 在 unix 终端类型中, cd/path_to/ChromHMM_folder 和按 [返回]。
    2. 一旦在 ChromHMM 目录类型, java mx2G jar ChromHMM. jar BinarizeBam-b 1000 hg19.txt/path_to/bam_directory/path_to/CellMarkFile .txt/path_to/BinarizeBam_output 和按 [返回]。
    3. 类型, mx2G ChromHMM 罐 LearnModel-b 1000/path_to/BinarizeBam/path_to/output_directory 15 hg19 和按 [返回]。

Subscription Required. Please recommend JoVE to your librarian.

Representative Results

该协议允许免疫沉淀从冰冻肿瘤组织和细胞系, 可以在许多样本并行使用高通量方法 ( 1A)。染色质碎片应介于 200-1000 bps 之间, 以达到最佳免疫沉淀。我们注意到, 达到相同的剪切长度所需的时间不同的组织和细胞类型。芯片的成功, 从少量的组织依赖于保持裂解冷, 特别是在超声波期间。在进行库准备之前, 应量化纯化的芯片 DN Ashould (图 2A)。适用于多路复用和脂肪酸的已完成库应介于 200-600 bp 之间, 并且不含任何入门级的(图 2B).在后测序后, 在继续执行管线的进一步步骤 (如 mac 峰值调用或 ChromHMM 分析(图 3))之前, 需要满足许多质量控制指标。许多这些指标都可以使用诸如 FastQC 和 MultiQC 这样的程序来确定。质量 fastq 读数与人类基因组一致, 速度为 50-80%, 最大值为一个不匹配。建议的排序深度为 "点源" 因子的 10-1500万唯一映射的读取, 而 ~ 20-3000万唯一映射的读取为 "广义源" 因子27,41,42,43。已排序和索引的 BAM 文件用于生成可使用基因组浏览器 (如 IGV 或 UCSC) 可视化的要人文件。芯片样本应该丰富的输入 DNA 和每个组蛋白修改应该显示一个不同的配置文件, 代表表观的特定组成部分(图 4A)。在某些组织中, 可能会有更高的背景噪声, 从而掩盖了芯片序列信号。如果发生这种情况, 建议在基因组浏览器中生成输入减去的要人文件并重新可视化。为了确定染色质状态剖面, 我们利用 ChromHMM 算法24。ChromHMM 使用多元隐马尔可夫模型来识别基于组蛋白修饰的最突出的再发生组合和空间染色质模式(图 5)。使用这六修改 ChromHMM 识别功能上不同的染色质状态, 代表压制性和活跃的领域, 如 polycomb 镇压 (状态 1), 异色镇压 (状态 5), 活跃转录 (状态8和 9) 和活性增强剂 (状态13和 14)。ChromHMM 的输出包括每个状态的分段床文件, 可进一步用于下游分析。

Figure 1
图 1: 芯片模块的工作流.活检肿瘤组织首先被分离并交叉连接, 以捕获蛋白质-DNA 相互作用。组织然后微气泡获得的染色质片段适合免疫沉淀和组蛋白-DNA 配合物是沉淀使用六表示的抗体。样品被洗涤, 交叉链接被逆转, 并且芯片脱氧核糖核酸被纯化和定量。图书馆是由纯化的 DNA 生成的, 并根据独特的索引进行复用。请单击此处查看此图的较大版本.

Figure 2
图 2: 电泳图谱纯化芯片 DNA 的分析和完成的库准备。(A) 由纯化芯片-含有染色质碎片的 DNA 电泳图谱的代表, 适用于图书馆准备的 200-600 bp。(B) 有代表性的电泳图谱从一个已完成的图书馆扩增和双面顺磁尺寸选择, 适用于多路复用和。请单击此处查看此图的较大版本.

Figure 3
图 3: 用于芯片序列数据处理模块的工作流.工作流显示芯片序列数据处理和下游分析准备的关键步骤。此协议中使用的管线是使用snakemake生成的, 但是, 每个步骤也可以按所述单独执行。请单击此处查看此图的较大版本.

Figure 4
图 4: 组蛋白修饰芯片-序列轨迹的基因型浏览器视图。a) deeptools 产生的芯片序列轨迹, 它显示有代表性的黑色素瘤肿瘤标本周围 NRAS 轨迹的活跃和受压抑区域。基因, 如 NRAS, CSDE1 是 SIKE1 与所有主动组蛋白修饰 (H3K27ac, H3K4me3 和 H3K4me1) 和主动转录 (H3K79me2), 而侧翼基因 AMPD1, DENND2C 和 SYCP1 包含 polycomb 压制标记 H3K27me3, 并没有包含活动转录。B) 由 deeptools 在代表性黑色素瘤肿瘤标本中显示 ZNF 基因的染色质的芯片序列轨迹。请单击此处查看此图的较大版本.

Figure 5
图 5: 基于黑色素瘤肿瘤样本的 ChromHMM 模型.15态 LearnModel 的发射剖面根据六组蛋白修饰研究。ChromHMM 识别出功能分明的染色质状态, 代表压制性和活跃的领域, 如 polycomb 镇压 (状态 1), 异色镇压 (状态 5), 活跃转录 (状态8和 9) 和活跃促进剂 (State13 和14).请单击此处查看此图的较大版本.

Subscription Required. Please recommend JoVE to your librarian.

Discussion

本协议描述了一种完整和全面的高通量芯片序列模块, 用于在人类肿瘤组织和细胞系中染色质状态的全基因图谱。在任何芯片序列协议中, 最重要的步骤之一是抗体特异性。在这里, 此方法说明了所描述的六组蛋白修改的免疫沉淀条件, 所有这些都是芯片级的, 以前在我们和其他实验室中验证过 42, 44, 45.虽然相同的抗体浓度已成功地应用于各种其他肿瘤类型, 但重要的是要确定抗体特异性, 如果研究不同因素的兴趣27

成功实验的另一个关键方面包括优化超声波条件。超声波时间在样品和组织类型之间可能变化, 并且必须相应地调整。为了进行适当的优化, 通过增量增加超声波时间并不断检查片段大小, 对每个示例执行试用运行。对于最初的芯片实验, 染色质碎片应介于 200-1000 bp 之间的最佳免疫沉淀, 并在进行图书馆准备之前量化纯化的芯片 DNA。此片段大小确保了将被用于多路复用和的扩增 DNA (200 到 600 bp) 的最佳生成和保留。如果以高通量的方式进行这些实验, 则多路复用的一个好的起点是每条车道上的8个样本进行测序。虽然这一量的样品可能会产生一个浅的测序深度, 它是有用的测试抗体质量, 然后再继续。汇集多个样本的瓶颈之一是不平等覆盖后测序。通常使用一种基于定量的 fluoremetric 方法, 但是, 许多次它并不等同于每个库中的测序就绪分子。最好的方法是定量的图书馆 DNA 是利用 qPCR 的标准-预先确定的测序-就绪 DNA 分子。

芯片序列数据集分析的另一个关键步骤是排序后数据处理。重要的是, 在进行下游分析的任何方面之前, 都应该首先满足各种质量控制指标。诸如 FastQC 之类的程序将提供有关原始 fastq 顺序读取的质量信息 (通过或失败测试的形式)。虽然 fastq 读取应该通过大部分的指标, 一些更重要的测试包括基本统计, 每序列基础质量, 每序列质量分数, 和适配器污染。FastQC 处理的读数与人类基因组对齐, 并应以 50-80% 的速率映射, 最大值为一个不匹配。低于50% 的比率可能表明芯片、库准备或测序中的问题, 可能包括污染、低质量的芯片 DNA 或在 PCR 过程中过度放大。在将 SAM 转换为 BAM 文件期间, 应首先标记重复读取, 然后在继续向下取样之前使用 SAMBLASTER 删除。虽然在 PCR 过程中某种程度的重复是正常的, 但高水平的复制通常预示着低质量的芯片 DNA, 或者可能是图书馆准备的问题。FastQC、领结和 samblaster (组合在 flagstat 中) 的输出都可以通入 MultiQC, 这提供了所有质量控制结果的完整交互式摘要。MultiQC 从 fastqc、领结和 samblaster 的输出文件中显示质量控制指标, 分别提供有关基本统计信息、对齐百分比和 PCR 复制率的资料。

在下采样规范化之后, 下一个可能最重要的步骤是使用基因组浏览器 (如 IGV 或 UCSC) 进行数据可视化。每个组蛋白修饰都代表了表观遗传学调控景观的一个关键组成部分, 包括 H3K27ac (促动剂)、H3K4me1 (活性和促动剂)、H3K4me3 (促进者)、H3K79me2 (转录区)、H3K27me3 (polycomb 压制) 和H3K9me3 (异色镇压)。通过使用这些标记单独或组合, 这些组蛋白可以识别活跃, 准备或被压抑的促进剂和促进剂, 以及编码区域的转录状态。这是使用 ChromHMM 表明, 其中功能分明的染色质状态表示压制和活跃的领域被确定。这些状态由单数标记定义, 例如 polycomb 镇压 (H3K27me3), hetrochromatic 镇压 (H3K9me3) 和活跃转录 (H3K79me2), 以及组合标记, 例如活跃促进剂 (H3K4me1 和 H3K27ac) 和转录促进剂 (H3K4me1, H3K27ac 和 H3K79me2)。

所提出的综合平台非常适合于测定组织样本中组蛋白或转录因子的占用情况。我们已经成功地利用这一协议, 以确定上述六标记的占用, 从活检大小黑色素瘤样本。然而, 我们仍然没有确定成功的芯片序列应用所需的最低数量的组织, 因为它是 depenedent 的组织类型和可用的抗体。此外, 虽然我们经常使用这个协议的新鲜, 闪光冷冻和 OCT 冷冻样本, 我们没有优化这个协议的 FFPE 组织。最近的一些研究报告了此类组织的协议4647和建议的更改可以在这个平台的框架内合并, 以测试所提出的平台是否会对 FFPE 组织有用。我们相信, 这将是非常有用的, 以确定的染色质状态模式从临床材料得到的病人在临床试验。总的来说, 本协议描述了一个完整的和全面的芯片序列模块, 用于全基因组在人类肿瘤组织中的染色质状态的映射, 并易于遵循指导, 包括所有必要的组成部分, 成功的实验。

Subscription Required. Please recommend JoVE to your librarian.

Disclosures

作者声明没有冲突。

Acknowledgments

我们感谢马库斯科伊尔, 柯蒂斯 Gumbs, SMF 核心在 MDACC 的排序支持。本文所述的工作得到了 NIH 赠款 (CA016672) 对 SMF 核心和1K99CA160578 奖 (R00CA160578) 的赠款的支持, 以 k.r。

Materials

Name Company Catalog Number Comments
ChIP-grade H3K4me1 antibody Abcam ab8895
ChIP-grade H3K27ac antibody Abcam ab4729
ChIP-grade H3K4me3 antibody Abcam ab8580
ChIP-grade H3K79me2 antibody Abcam ab3594
ChIP-grade H3K27me3 antibody Abcam ab6002
ChIP-grade H3K9me3 antibody Abcam ab8898
1M Tris HCl, pH 8.0 Teknova T1080
EDTA Sigma-Aldrich E9884
NaCl Sigma-Aldrich S7653
Glycine Sigma-Aldrich G8898
Sodium deoxycholate Sigma-Aldrich 30970
DPBS Sigma - Life Sciences D8537-500ML
SDS Sigma-Aldrich 74255
Triton-X Sigma-Aldrich X100-100ML
LiCl Sigma-Aldrich 746460
NP-40 Calbiochem 492016-100ML
1% TWEEN-20 Fisher Bioreagents BP337-500
BSA - IgG-free Sigma - Life Sciences A2058-5G
HBSS Gibo 14025092
GentleMACS C tube GentleMACS 120-008-466 disassociation tube
16% Formaldehyde Peierce 28906
miniProtease inhibitor  Roche Diagnostics 11836153001 protease inhibitor tablets
Dynabeads Protein G  Invitrogen 10009D
Bioruptor NGS tubes 0.65 mL Diagenode C30010011 sonication tubes
DynaMag - 96 Side Skirted Invitrogen 120.27 96-well magnetic stand
TE buffer Promega V6231
RNase A Invitrogen 12091021
Proteinase K Invitrogen 100005393
AMPure XP beads Beckman Coulter A63882 paramagnetic beads
Ethanol Sigma-Aldrich E7023
Qubit ds DNA High Sensitivity Assay Kit Invitrogen Q32854 high sensitivity DNA reagents
NEBNext Ultra II DNA Library Prep Kit New England BioLabs E7645L DNA Library Prep Kit
Nuclease-free water Ambion AM9932
High sensitivity D1000 ScreenTape Agilent Technologies 5067-5584 high sensitivity DNA reagents
High sensitivity D1000 reagents Agilent Technologies 5067-5585 high sensitivity DNA reagents
Multiplex Oligos (Index primers- Set 1) New England BioLabs E7335L Multiplex Oligos 
Multiplex Oligos (Index primers- Set 2) New England BioLabs E7500L Multiplex Oligos 
TapeStation 4200 Agilent Technologies G2991AA high sensitivity DNA electropherogram instrument
Bioruptor Pico sonication device  Diagenode B01060001 water bath disruputor
Mixer Nutator 421105
Bio-Rad C1000 Touch Thermal Cycler Bio-Rad 1851196 PCR Thermal cycler
Water Bath Fisher Scientific 2322
Multichannel Pipet Denville 1003123
Tube Revolver Thermo-Scientific 88881001
96-Well Skirted Plate Eppendorf 47744-110
Allegra X-12R Centrifuge  Beckman Coulter A99464 benchtop centrifuge
Centrifuge 5424 Eppendorf 22620461 tabletop centrifuge
Optical tube strips (8x Strip) Agilent Technologies 401428
Optical tube strip caps (8x strip) Agilent Technologies 401425
Loading Tips, 10 Pk Agilent Technologies 5067-5599
IKA MS3 vortex IKA 3617000 vortex

DOWNLOAD MATERIALS LIST

References

  1. Rao, S. S., et al. A 3D map of the human genome at kilobase resolution reveals principles of chromatin looping. Cell. 159 (7), 1665-1680 (2014).
  2. Hnisz, D., Day, D. S., Young, R. A. Insulated Neighborhoods: Structural and Functional Units of Mammalian Gene Control. Cell. 167 (5), 1188-1200 (2016).
  3. Dixon, J. R., et al. Topological domains in mammalian genomes identified by analysis of chromatin interactions. Nature. 485 (7398), 376-380 (2012).
  4. Sanyal, A., Lajoie, B. R., Jain, G., Dekker, J. The long-range interaction landscape of gene promoters. Nature. 489 (7414), 109-113 (2012).
  5. Wang, X., et al. SMARCB1-mediated SWI/SNF complex function is essential for enhancer regulation. Nat Genet. 49 (2), 289-295 (2017).
  6. Hnisz, D., et al. Activation of proto-oncogenes by disruption of chromosome neighborhoods. Science. 351 (6280), 1454-1458 (2016).
  7. Jäger, R., et al. Capture Hi-C identifies the chromatin interactome of colorectal cancer risk loci. Nat Commun. 6, 6178 (2015).
  8. Krijger, P. H., de Laat, W. Regulation of disease-associated gene expression in the 3D genome. Nat Rev Mol Cell Biol. 17 (12), 771-782 (2016).
  9. Mansour, M. R., et al. Oncogene regulation. An oncogenic super-enhancer formed through somatic mutation of a noncoding intergenic element. Science. 346 (6215), 1373-1377 (2014).
  10. Weischenfeldt, J., et al. Pan-cancer analysis of somatic copy-number alterations implicates IRS4 and IGF2 in enhancer hijacking. Nat Genet. 49 (1), 65-74 (2017).
  11. Herz, H. M., Hu, D., Shilatifard, A. Enhancer malfunction in cancer. Mol Cell. 53 (6), 859-866 (2014).
  12. Kouzarides, T. Chromatin modifications and their function. Cell. 128 (4), 693-705 (2007).
  13. Tan, M., et al. Identification of 67 histone marks and histone lysine crotonylation as a new type of histone modification. Cell. 146 (6), 1016-1028 (2011).
  14. Strahl, B. D., Allis, C. D. The language of covalent histone modifications. Nature. 403 (6765), 41-45 (2000).
  15. Ernst, J., et al. Mapping and analysis of chromatin state dynamics in nine human cell types. Nature. 473 (7345), 43-49 (2011).
  16. Consortium, E. P., et al. An integrated encyclopedia of DNA elements in the human genome. Nature. 489 (7414), 57-74 (2012).
  17. Rivera, C. M., Ren, B. Mapping human epigenomes. Cell. 155 (1), 39-55 (2013).
  18. Stergachis, A. B., et al. Developmental fate and cellular maturity encoded in human regulatory DNA landscapes. Cell. 154 (4), 888-903 (2013).
  19. Xie, W., et al. Epigenomic analysis of multilineage differentiation of human embryonic stem cells. Cell. 153 (5), 1134-1148 (2013).
  20. Chen, L., et al. Transcriptional diversity during lineage commitment of human blood progenitors. Science. 345 (6204), 1251033 (2014).
  21. Saeed, S., et al. Epigenetic programming of monocyte-to-macrophage differentiation and trained innate immunity. Science. 345 (6204), 1251086 (2014).
  22. Bernstein, B. E., et al. The NIH Roadmap Epigenomics Mapping Consortium. Nat Biotechnol. 28 (10), 1045-1048 (2010).
  23. Roadmap Epigenomics, C., et al. Integrative analysis of 111 reference human epigenomes. Nature. 518 (7539), 317-330 (2015).
  24. Ernst, J., Kellis, M. ChromHMM: automating chromatin-state discovery and characterization. Nat Methods. 9 (3), 215-216 (2012).
  25. Feng, J., Liu, T., Qin, B., Zhang, Y., Liu, X. S. Identifying ChIP-seq enrichment using MACS. Nat Protoc. 7 (9), 1728-1740 (2012).
  26. Zhang, Y., et al. Model-based analysis of ChIP-Seq (MACS). Genome Biol. 9 (9), R137 (2008).
  27. Landt, S. G., et al. ChIP-seq guidelines and practices of the ENCODE and modENCODE consortia. Genome Res. 22 (9), 1813-1831 (2012).
  28. O'Neill, L. P., VerMilyea, M. D., Turner, B. M. Epigenetic characterization of the early embryo with a chromatin immunoprecipitation protocol applicable to small cell populations. Nat Genet. 38 (7), 835-841 (2006).
  29. Dahl, J. A., Collas, P. Q2ChIP, a quick and quantitative chromatin immunoprecipitation assay, unravels epigenetic dynamics of developmentally regulated genes in human carcinoma cells. Stem Cells. 25 (4), 1037-1046 (2007).
  30. Zhang, B., et al. Allelic reprogramming of the histone modification H3K4me3 in early mammalian development. Nature. 537 (7621), 553-557 (2016).
  31. Dahl, J. A., et al. Broad histone H3K4me3 domains in mouse oocytes modulate maternal-to-zygotic transition. Nature. 537 (7621), 548-552 (2016).
  32. Shen, J., et al. H3K4me3 epigenomic landscape derived from ChIP-Seq of 1,000 mouse early embryonic cells. Cell Res. 25 (1), 143-147 (2015).
  33. Flanagin, S., Nelson, J. D., Castner, D. G., Denisenko, O., Bomsztyk, K. Microplate-based chromatin immunoprecipitation method, Matrix ChIP: a platform to study signaling of complex genomic events. Nucleic Acids Res. 36 (3), e17 (2008).
  34. Nelson, J. D., Denisenko, O., Sova, P., Bomsztyk, K. Fast chromatin immunoprecipitation assay. Nucleic Acids Res. 34 (1), e2 (2006).
  35. Lerdrup, M., Johansen, J. V., Agrawal-Singh, S., Hansen, K. An interactive environment for agile analysis and visualization of ChIP-sequencing data. Nat Struct Mol Biol. 23 (4), 349-357 (2016).
  36. Afgan, E., et al. The Galaxy platform for accessible, reproducible and collaborative biomedical analyses: 2016 update. Nucleic Acids Res. 44 (W1), W3-W10 (2016).
  37. Blecher-Gonen, R., et al. High-throughput chromatin immunoprecipitation for genome-wide mapping of in vivo protein-DNA interactions and epigenomic states. Nat Protoc. 8 (3), 539-554 (2013).
  38. Tang, M. pyflow-ChIPseq: a snakemake based ChIP-seq pipeline. Zenodo. , (2017).
  39. Koster, J., Rahmann, S. Snakemake--a scalable bioinformatics workflow engine. Bioinformatics. 28 (19), 2520-2522 (2012).
  40. Ramirez, F., et al. deepTools2: a next generation web server for deep-sequencing data analysis. Nucleic Acids Res. 44 (W1), W160-W165 (2016).
  41. Bailey, T., et al. Practical guidelines for the comprehensive analysis of ChIP-seq data. PLoS Comput Biol. 9 (11), e1003326 (2013).
  42. Fiziev, P., et al. Systematic Epigenomic Analysis Reveals Chromatin States Associated with Melanoma Progression. Cell Rep. 19 (4), 875-889 (2017).
  43. Liu, T., et al. Broad chromosomal domains of histone modification patterns in C. elegans. Genome Res. 21 (2), 227-236 (2011).
  44. Egelhofer, T. A., et al. An assessment of histone-modification antibody quality. Nat Struct Mol Biol. 18 (1), 91-93 (2011).
  45. Rai, K., et al. Dual Roles of RNF2 in Melanoma Progression. Cancer Discov. , (2015).
  46. Cotney, J. L., Noonan, J. P. Chromatin immunoprecipitation with fixed animal tissues and preparation for high-throughput sequencing. Cold Spring Harb Protoc. (2), 191-199 (2015).
  47. Cejas, P., et al. Chromatin immunoprecipitation from fixed clinical tissues reveals tumor-specific enhancer profiles. Nat Med. 22 (6), 685-691 (2016).

Tags

癌症研究 问题 134 芯片序列 染色质免疫沉淀 下一代测序 组蛋白修饰 人肿瘤组织 转移性黑色素瘤 染色质状态剖面
肿瘤组织中高通量芯片测序的染色质状态全基因组图谱集成平台
Play Video
PDF DOI DOWNLOAD MATERIALS LIST

Cite this Article

Terranova, C., Tang, M., Orouji, E., More

Terranova, C., Tang, M., Orouji, E., Maitituoheti, M., Raman, A., Amin, S., Liu, Z., Rai, K. An Integrated Platform for Genome-wide Mapping of Chromatin States Using High-throughput ChIP-sequencing in Tumor Tissues. J. Vis. Exp. (134), e56972, doi:10.3791/56972 (2018).

Less
Copy Citation Download Citation Reprints and Permissions
View Video

Get cutting-edge science videos from JoVE sent straight to your inbox every month.

Waiting X
Simple Hit Counter