Summary
基因组在核空间中组织成不同的结构,可以通过染色体构象捕获技术揭示出来。核内Hi-C方法提供了在果蝇细胞系中全基因组的染色质相互作用集合,生成接触图,可以在限制片段水平下以兆基分辨率进行探索。
Abstract
基因组被组织成拓扑关联域(TADs),由隔离域之间相互作用的边界划分。在德罗索菲拉,TAD形成和边界背后的机制仍在调查中。此处描述的核内 Hi-C 方法的应用有助于解剖 TAD 边界下隔离 诺奇 基因的建筑蛋白 (AP) 结合位点的功能。导致 APs 损失的域界的基因改造会导致 TAD 融合、转录缺陷和远程拓扑变化。这些结果提供了证据,证明遗传元素对果蝇的域界形成和基因表达控制的贡献。在这里,详细描述了核内Hi-C方法,它提供了重要的检查点,以评估实验的质量以及协议。还显示所需的测序读数和有效的 Hi-C 对,以分析不同基因组尺度的基因组相互作用。CRISPR/Cas9介质的遗传编辑调节元素和高分辨率的基因组相互作用分析使用这种核内Hi-C协议可以是一个强大的组合,研究遗传元素的结构功能。
Introduction
在真核生物中,基因组被分割成染色体,在相间第1阶段占据核空间的特定区域。形成染色体的染色质可分为两种主要状态:一种是转录允许的可访问染色质,另一种是转录抑制的紧凑型染色质。这些染色质状态在核空间中分离和很少混合,在核2中形成两个不同的隔间。在亚兆基尺度上,边界分隔高频染色质相互作用的领域,称为TAD,标记染色体组织3,4,5。在哺乳动物中,TAD边界被凝聚力和CCTC结合因子(CTCF)6、7、8所占据。凝固素复合物挤出色度素,并停止在CTCF结合点,在基因组序列的收敛方向处置,形成稳定的染色质循环9,10,13,14。CTCF DNA结合部位点在CTCF和凝聚蛋白丰度的边界上发生基因破坏或减少,导致调控元素之间的异常相互作用、TAD形成的丧失和基因表达放松管制9、10、11、13、14。
在德罗索菲拉, TAD 之间的边界由多个 AP 占据,包括边界元素相关因子 32 kDa (BEAF-32)、Motif 1 结合蛋白 (M1BP)、中生代蛋白 190 (CP190)、毛翼抑制剂 (SuHW) 和 CTCF,并富含活性组蛋白修饰和聚合酶 II 16、17、18。有人建议,在德罗索菲拉,TADs出现的结果是转录13,17,19,和独立的AP在边界形成和绝缘属性的确切作用仍在调查之中。因此,德罗索菲拉的域名是否是类似转录状态区域聚合的唯一结果,或者包括反恐委员会在内的 AP 是否有助于边界形成,仍有待充分说明。通过开发染色体构象捕获技术以及下一代测序,可以探索高分辨率基因组接触。Hi-C 协议首先描述为"解决方案"2的粘合步骤,以避免染色质片段之间的虚假粘合产品。然而,一些研究指出,数据中的有用信号来自在部分赖化核形成的结结产品,这些结核不在解决方案20、21中。
然后,作为单细胞Hi-C实验22的一部分,对协议进行了修改,以在细胞核内进行粘合。核内Hi-C协议随后被纳入细胞群Hi-C,在全基因组距离内产生更一致的覆盖,并产生技术噪声较少的数据23,24。该协议,在这里详细描述,是基于人口在细胞核Hi-C协议23,24,并用于调查遗传去除DNA结合图案的CTCF和M1BP的后果,从领域边界在D罗索菲拉25。结果表明,改变边界上对 APs 的 DNA 结合图案对 Notch 域的形成、Notch点周围区域更大的拓扑缺陷以及基因表达放松管制有严重的影响。这表明,域界的遗传元素对于维持25号果蝇的基因组拓扑学和基因表达非常重要。
Subscription Required. Please recommend JoVE to your librarian.
Protocol
1. 固定
- 从 1000 万施耐德的 2 号线加 (S2R+) 细胞开始,在施耐德介质中准备 17.5 mL 的细胞悬浮,其中含有 10% 的胎儿牛血清 (FBS) 在室温下 (RT)。
- 加入无甲醇甲醛,最终浓度为2%。混合和孵育10分钟在RT,小心混合每分钟。
注:甲醛是一种危险化学品。遵守相应的健康和安全法规,并在烟罩中工作。 - 通过添加甘氨酸来抑制反应,实现最终浓度为 0.125 M 和混合。在 Rt 孵育 5 分钟, 在冰上孵育 15 分钟。
- 离心机 400 × g 在 Rt 5 分钟, 然后 10 分钟在 4 °C;丢弃超纳特。小心地将颗粒重新沉入 25 mL 的冷 1x 磷酸盐缓冲盐水中。
- 离心机在 400 × g 在 4 °C 下 10 分钟,然后丢弃超高。
注:如果继续处理协议,请前往第 2.1 步进行裂解:否则,将颗粒在液体 N2 中闪存冻结,并将颗粒存储在 -80 °C 下。
2. 裂解
- 将细胞重新吸纳在1兆L的冰冷裂解缓冲器(10mM Tris-HCl,pH 8:0.2%的非离子表面活性剂(见 材料表):10mM NaCl:1x蛋白酶抑制剂),并调整体积到10mL与冰冷裂解缓冲器。调整体积以获得 1 × 106 个单元格/mL 的浓度。在冰上孵育30分钟,通过倒置管子每2分钟混合一次。
- 在 300 × g 下离心,在 4 °C 下 5 分钟,然后小心地丢弃超高纳特。用 1 mL 的冷裂解缓冲器清洗颗粒 1x,并将其转移到微中心管。用 1 mL 的冷 1.25 倍限制缓冲器清洗颗粒 1 倍,并将每个细胞颗粒重新使用 360 μL 的 1.25 倍限制缓冲器。
- 每管加入11微升10%的硫酸钠(SDS)(0.3%的最终浓度),小心地通过管道混合,在37°C下孵育45分钟,在700-950转/分钟摇晃。在孵化过程中,上下吹笛以扰乱团块几次。
- 通过每管添加 75 μL 非离子表面活性剂(10% 溶液,参见 材料表)(最终浓度为 1.6%),并在 37 °C 下孵育 45 分钟,在 950 rpm 处摇晃,从而抑制 SDS。在孵化过程中,上下几次管道来破坏团块。
注意:如果团块较大且难以破坏,则在 SDS 和表面活性剂处理期间将旋转速度降低到 400 rpm。如果团块难以通过管道分解,则将样品拆分为两个:调整限制缓冲器、SDS 和表面活性剂的体积:继续渗透。接下来,以最小速度(200× 克)旋转原子核,小心地丢弃超高超,将样品集中到1倍限制缓冲器中,然后进行消化。以 10 μL 的阿利奎特作为未消化的样品 (UD)。
3. 酶消化
- 通过每管增加 200 单位 (U) Mbo I 来消化染色质,并在旋转时(950 rpm)在 37 °C 下孵育,时间从 4 小时到过夜不等。
- 第二天,每管额外加入 50 U 的 Mbo I,在旋转(950 rpm)时在 37 °C 下孵育 2 小时。
- 在 60 °C 下孵育管子 20 分钟,使酶灭活。把管子放在冰上。
注:以 10 μL 的阿利报价作为消化样本 (D)。
4. DNA末端的生物酸化
- 要填充限制片段悬垂和标记DNA结束与生物素,添加1.5μL每个10 mM dCTP,dGTP,dTTP,20微升0.4m生物素dATP, 17.5 μL 的 Tris 低 EDTA (TLE) 缓冲 [10 m M Tris-HCl, 0.1 m EDTA, pH 8.0], 和 10 μL 的 5 U/μL Klenow (DNA 聚合酶 I 大片段) 到所有管子.小心混合,在37°C下孵育75分钟。 每 10s 以 700 rpm 摇动 30s 。在准备结结混合物时,将所有管子放在冰上。
5. 连带
- 将每个消化的染色质混合物转移到一个单独的1mL管与结扎混合(100微升10倍结扎缓冲,10微升10毫克/mL牛血清白蛋白,15U T4 DNA韧带,和425微升双蒸馏水[ddH2O])。通过温和的管道彻底混合,并在16°C下孵育过夜。
6. 交叉链接反转和DNA纯化
- 每管加入 50 微升 10 毫克/mL 蛋白酶 K,并在 37 °C 下孵育 2 小时,从而降解蛋白质。通过将温度提高到 65 °C 并在一夜之间孵育来反转交互联。
- 通过添加 20 μL 的 10 毫克/mL RNase A 来降低 RNA,并在 37 °C 下孵育 1 小时。
- 执行酚:氯仿提取,然后是乙醇沉淀。
- 加入1卷酚-氯仿,通过反转彻底混合,获得均匀的白色相。
注:酚是一种危险化学品。遵守相应的健康和安全法规。在烟气罩里工作。 - 离心机在 15,000 × 克 15 分钟。将水相转移到新鲜的 2 mL 微中心管中。用 100 μL 的 TLE 缓冲器对下层进行反抽,并将起泡相转移到相同的 2 mL 管中。
- 通过添加 2 卷 100% 乙醇 (EtOH)、0.1 卷 3 M 醋酸钠和 2 微升 20 毫克/mL 糖原来沉淀 DNA。在 -20 °C 下孵育,持续 2 小时至过夜。
- 在 4 °C 下以 15,000 × g 旋转 30 分钟,用冰冷的 70% EtOH 清洗颗粒 2 倍。干燥 RT 的颗粒,并在 100 μL 的 TLE 缓冲器中重新暂停。根据制造商的说明(材料表),使用有选择地与DNA和荧光仪结合的荧光染料对DNA进行量化。
注:协议可以在此处暂停。短期内将粘合产品存放在 4 °C 或长期内存储在 -20 °C。使用材料中的阿利奎特 (100 ng) 作为配体样品 (L) 进行质量控制。
- 加入1卷酚-氯仿,通过反转彻底混合,获得均匀的白色相。
7. 评估高 C 模板质量
- 消化和连体定性控制
- 通过倒车交叉链接从 UD 和 D aliquot 中净化 DNA,并执行上述酚:氯仿提取和乙醇沉淀。
- 将 100 ng 的 UD、D 和 L 样品装载在 1.5% 的玫瑰凝胶中。寻找以D样本中500个基点为中心的涂片,而L样本的涂片以高分子量区间为中心(见具有代表性的结果)。
- 消化效率定量控制
注:为了更准确地评估消化效率,请使用 UD 和 D 样本作为模板,使用以下设计的引物执行定量聚合酶链反应 (qPCR)。- 设计一个引数对,放大包含用于消化的酶的DNA限制位点的DNA片段(本协议中的Mbo I),在公式中称为R,步骤7.2.3。
- 设计一个引线对,放大一个控制DNA片段,其中不包含用于消化的酶的限制部位(本协议的Mbo I),在公式中称为C,步骤7.2.3。
- 使用放大的周期阈值 (Ct 值) 根据下列公式计算限制效率:
% 限制 = 100 - 100/2[(Ctr - Ctc) D - (Ctr - Ctc) UD]
其中 CtR 是指片段 R 的 Ct 值,CtC 是指样本 D 和样本 UD 的片段 C 的 Ct 值。
注:限制百分比反映了限制酶切割受限(R)DNA片段的效率,而控制(C)DNA片段不包含限制DNA部位。建议限制效率为 ≥ 80%。
- 检测已知交互
- 执行 PCR 以放大内部连合控制,以检查短距离和/或中距离或远程交互(见具有代表性的结果)。
- 或者,设计引物以放大引物在相邻限制片段中处于前向或反向方向的连合产品。
- 填充和生物素标签控制
- 如上所述,通过放大和消化基因组中相邻限制片段之间的已知相互作用或粘合产物,验证高C标记和粘合效率。
注:成功填充和结结的Mbo I站点(GATC)生成了一个新的站点的限制酶Cla I (ATCGAT)在结结和再生Mbo I站点。 - 用 Mbo I、Cla I 或两者兼有地消化 PCR 产品。在1.5-2%的凝胶上运行样本后,通过量化切口和未切割带26的强度来估计3C和Hi-C结的相对数量。
注:所需的效率为> 70%(见具有代表性的结果)。
- 如上所述,通过放大和消化基因组中相邻限制片段之间的已知相互作用或粘合产物,验证高C标记和粘合效率。
8. 声波
- 对样品进行声波测试,以获得 200-500 bp DNA 片段。对于本协议中使用的仪器(参见 材料表),将样品(从 5 到 10 μg)稀释为每管 130 μL ddH2O,并将仪器的声波设置为 400 bp:填充级别:10:关税系数:10%:峰值事件功率 (w): 140:每次爆裂周期: 200:时间:80。
9. 生物素去除/端修复
注:下面显示的步骤调整为 5 微克高 C DNA。
- 要执行生物素去除,将样品 (130 μL) 转移到新鲜的微中心管中。添加 16 μL 的 10 倍结结缓冲、2 μL 的 10 mM dATP、5 μL 的 T4 DNA 聚合酶 (15U) 和 7 μL 的 ddH2O (总体积的 160 μL)。在 20 °C 下孵育 30 分钟。
- 添加 5 μL 的 10 mM dNTP,4 μL 的 10 倍结缘缓冲,5 μL 的 T4 多核苷酸激酶 (10 U/μL), 1 μL 的 Klenow, 和 25 μL 的 ddH2O (200 μL 的总体积).。在 20 °C 下孵育 30 分钟。
10. 尺寸选择
- 要选择主要在 250-550 bp 大小范围内的片段,请先使用 0.6 倍进行顺序固体相可逆固定 (SPRI) 尺寸选择,然后根据制造商的说明选择 0.90 倍,然后使用 100 μL 的 TLE 来提取 DNA。
11. 生物素拉下/尾矿/适配器连合
注:通过旋转重新悬回磁珠进行洗涤,在旋转轮上旋转样品 3 分钟,然后短暂地旋转样品并将其放置在磁架上。让珠子粘在磁铁上,丢弃超高分子,然后继续以下洗涤步骤。在 55 °C 的热挡上进行清洗,由旋转而不是旋转轮执行。
- 将最终体积组成到每个样品 300 μL,并配有 TLE 进行下拉。准备珠洗缓冲器: 1x 特温缓冲区 (TB) (TB: 5 mM Tris-HCl pH 8.0, 0.5 m EDTA, 1 M NaCl, 0.05% Tween), 0.5x TB, 1x 无特温缓冲 (NTB) (5 mM 特里斯 - HCl ph 8.0, 0.5 m EDTA, 1 M 纳克), 2x NTB.
- 每个库使用 150 μL 链球菌素链接的磁珠(参见 材料表)。用 400 微升 1x TB 清洗珠子 2 倍。然后以 300 μL 2x NTB 重放珠子。
- 将珠子与 300 μL Hi-C 材料混合,在 RT 上旋转轮上孵育 30 分钟,使生物素与链球菌素珠结合。
- 用 400 微升 0.5 倍 TB 清洗珠子,在 55 °C 下孵育 3 分钟,在 750 rpm 旋转。在 200 μL 的 1 倍限制缓冲中清洗珠子。
- 将珠子重新安装在 100 μL 的 dATP 尾随混合物中(5 μL 的 10 mM dATP,10 μL 的 10 倍限制缓冲器,5 μL 的 Klenow exo-和 80 μL 的 ddH2O)。在 37 °C 下孵育 30 分钟。
- 取出超高分子,在 55 °C 下孵育 3 分钟,在 750 rpm 时旋转,用 400 μL 的 0.5 倍 TB 将珠子洗 2 倍。
- 用 400 μL 的 1 倍 NTB 清洗珠子,然后用 100 μL 的 1x 结缘缓冲器清洗珠子。
- 将珠子重新悬浮在 50 μL 的 1x 结石缓冲器中,并将悬架转移到新管中。加入 4 μL 的预安非他明PE适配器(15 μM 库存)和 2 μL T4 韧带(400 U/μL,即 800 U/tube);在 Rt 孵育 2 小时。
注:通过添加PE 1.0和PE 2.0适配器(30 μM库存)的等量,并在RT孵育10分钟(参见 材料表),预对适配器进行预置。 - 通过去除超高分子,用400微升的结B洗珠2倍来夺回珠子。用 200 μL 的 1 倍 NTB 清洗珠子,然后用 100 μL 的 1 倍限制缓冲器清洗珠子,并在 40 μL 的 1x 限制缓冲器中重新使用珠子。
12. PCR 放大
- 设置 25 μL 体积的 PCR,具有 5、6、7 和 8 个周期。对于每个 PCR,请使用:
反应配方 高 C 珠子 2.5 微升 10 μM PE PCR 底漆 1(材料表) 0.75 微升 10 μM PE PCR 底漆 2(材料表) 0.75 微升 10 m dntp 0.6 微升 5 倍反应缓冲器 5 微升 脱氧核糖核酸聚合酶 0.3 微升 ddh2O 14.65 微升 总 25 微升 周期 温度 时间 1 98 °C 30s n 周期 98 °C 10s 65 °C 30s 72 °C 30s 1 72 °C 7 分钟
13. 最终PCR放大
- 使用上述相同条件和选择的周期数执行最终 PCR 放大。在 50 μL 反应中使用 5 μL 的 Hi-C 珠作为模板来分割样品。
- 收集所有 PCR 反应并将其转移到新管中。使用磁铁去除链球菌珠并恢复超高音(PCR 产品)。将珠子转移到新管中,按照第 11.2.9 步指示清洗珠子,并在 4 °C 的 1 倍限制缓冲中存储作为备份。
- 根据制造商的说明,使用 SPRI 珠的 0.85 倍体积净化 PCR 产品。Elute 与 30 微升的 Tle 缓冲器。
- 使用荧光仪对高 C 库进行量化,并通过基于芯片的毛细电电泳确认库的质量。
- 作为最后一个质量检查点,使用 Hi-C 库的 1 μL 作为模板,使用步骤 12.1 中描述的相同条件使用 10 个周期执行 PCR 反应。将 PCR 产品分成两个微中心管:用 Cla I 消化一个,然后让另一个未消化作为控制。以 1.5-2% 的玫瑰凝胶运行产品(见具有代表性的结果)。
- 在合适的测序平台上进行 50 bp 或 75 bp 配对端测序。
Subscription Required. Please recommend JoVE to your librarian.
Representative Results
下面描述的是一个成功的高C协议的结果(见图1A中的高C协议工作流程摘要)。在核中Hi-C实验期间,有几个质量控制检查点。样品在 (UD) 和 (D) 染色素限制步骤之前和之后以及连合 (L) 之后收集。十字线被逆转,DNA被净化,运行在阿加罗斯凝胶上。当与Mbo I的限制成功时,观察到200-1000个基点的涂片(图1B)。分子的预期大小取决于选择的限制酶。如果结结成功,在凝胶顶部可以看到一个高分子量带(图1B)。消化效率也可以由 qPCR 确认,如协议中详细描述的那样。可接受的消化效率为80%或更高(图1C)。
为了详细评估 Hi-C 粘合效率,引物可以设计成放大内部粘合产品控制,其中引物在相邻限制片段中处于前向或反向方向。或者,引物可以设计成放大已知的交互。 图2A 显示了德罗索菲拉25中已知中距离(300kb)相互作用的放大。高C结结产品(其中生物素标记、填充和结结成功发生)可以通过消化放大中回收的PCR产品来估算。填入和结结后,Hi-C 放大器将在原始 Mbo I 站点包含一个新的 Cla I 限制站点,该限制站点在钝端结结后保存下来。如果对 Cla I 的限制不完整,填充反应和生物素标记将效率低下。建议消化效率超过 70%,以避免测序后图书馆有大量非有用的读取(图 2A,比较 3C 的 Cla I 消化与 Hi-C 模板)。
为了确定足够的 PCR 放大周期以放大最终的高 C 库,使用 2.5 μL 的珠子上的给定库(如协议中所述)设置了 PCR 反应。最终放大的 PCR 周期数比可见涂片的周期数少一个周期(图 2B)。在这种情况下,选择了 4 个周期的 PCR 放大。作为最终的质量检查点,Hi-C 库的一个报价被重新放大,并与 Cla I 一起消化。图书馆的消化水平(涂片大小的减少)表示有效高C对的丰度,并反映从图书馆获得的有用读物的比例(图2C)。如果 Cla I 消化效率高,上尺寸范围(由 UD 样本中的大小决定)和 UD 和 D 样本中的底部大小范围的比例应产生 1 > 1 与消化样本的比例≤ 1 的比例。
配对端测序后,FASTQ 文件 (表1)使用 HiCPro28进行处理,生成的统计数据使用 MultiQC28进行绘图。HiCPro 的替代工具是 HiCUP30管道,该管道可产生类似的结果(未显示)。图3和表2显示序列读取的详细统计信息。报告修剪后的完整读取对齐和对齐。这两个类别对应成功对齐的读取,这些读数将用于后续分析以查找有效的 Hi-C 对。修剪后对齐类别是指跨越结结的读数,在第一步中未对齐,在结结位点进行修剪,然后将其 5' 四肢重新调整到基因组28(图 3B、C和表 2)。接触统计显示,Hi-C库质量高,有效对数为82.2%,非有用读数为7.6%,分为同片自圆、同片段悬空端、重新结合、过滤对和倾销对(图3A、图3D和表2)。此外,PCR 复制品的数量非常低,表明库的复杂性很高,PCR 周期引入的工件最少(图 3E和表2)。
使用独特的有效高C对,使用HiCPro27对配对进行基本分析。该实验产生了46.5%的独特cis接触≤20kbp,47.1%独特的cis接触>20kbp,和5.8%独特的跨接触(图3D)。cis 与跨有效对的分布与成功进行 Hi-C 实验的预期结果相对应,该实验中检测到的大多数相互作用都在同一染色体中。高比例的瞬态接触表示固定效率低下。使用 HiCPro27的 Hi-C 有效对,通过迭代校正和 eigenvector 分解 (ICE)30使矩阵正常化,使用 HiCPlotter30、31、32生成1kb 和 5 kb 分辨率矩阵。在1 kb和5kb分辨率的规范化接触矩阵呈现在德罗索菲拉的诺奇基因细胞位(图4A,图4C和图4D)。在图4A中,可以看到滴答声基因位点与APs、域l和II,以及沿位点的组石修饰(图4A和表1)。CRISPR-Cas9 删除的设计涉及 CTCF 和 M1BP(图 4B)的图案。
在删除位于诺奇点 5' 边界(5pN-delta343,表 1)的包含 CTCF 和 M1BP DNA 结合点的区域后,可以看到色质接触的戏剧性变化,与野生类型 (WT) 相比,诺奇点内的相互作用丧失,与上游 TAD 接触的增益 (图 4C,D)。最后,图4E显示了从Notch基因 5' UTR 的限制片段级别的 WT 和突变相互作用配置文件的详细全景图,显示与Notch基因位点的接触比例下降,与上游域的接触增加。使用 HiC-Pro27获得凹槽基因 5' UTR 的虚拟 4C 视图。另一种工具是 SeqMonk (SeqMonk (RRID:SCR_001913) 中可用的高 C 其他端量化。图4中提出的所有结果都是通过在WT和突变S2R+果蝇细胞中应用细胞内Hi-C协议而获得的,如阿尔扎特-梅亚等人所述。
图1:核内高C消化和粘合控制。 (A) 高C协议概述。细胞与甲醛相互关联,导致色度素片段(DNA片段:粉红色、紫色)和蛋白质之间共价联系。色度素被一种限制酶(用剪刀表示)消化,在本例中,Mbo I。由此产生的粘性末端填充了核苷酸,包括生物素化 dATP(深蓝色圆圈)。DNA被净化,生物石化结利用链球菌涂层的磁珠(灰色圆圈)丰富。交互片段由下一代配对端测序识别。(B) 两种生物复制品(高C 1和Hi-C 2)的高C消化和粘合质量控制。Hi-C 库在 1.5% 的玫瑰凝胶上解决了。两者都消化, D, 图书馆运行作为一个涂片约 600 bp 。利盖特样品,Lig,运行作为一个相当紧密的带大于10kb类似于未消化的UD样品。信号强度的差异是由于凝胶上加载的DNA量不均匀。(C) 高C消化定量控制由定量聚合酶链反应为相同的两个生物复制(B) (Hi-C 1和Hi-C 2) 使用循环阈值在协议中详细说明。成功的消化有≥80%的限制。 请单击此处查看此图的较大版本。
图2:核内Hi-C填料和钝端结结控制。(A )填料和生物素标签评估。X染色体中相距300千克的片段之间的已知相互作用被用作控制,并使用黑色箭头指示的引物(见方案顶部(B)、引物1(左)、引物2(右)、表1),生成347个基点的放大器。高C连合产品可以通过消化粘合部位来区别于3C实验中生产的产品。Hi-C 路口被 Cla I 在原始 Mbo I 站点消化, 因为这是在钝端结结形成的。Hi-C 和 3C 交汇点与 Mbo I 一起消化,因为约束位点在粘合(凝胶左侧)再生。相比之下,3C 路口不是由 Cla I 在 Mbo I 站点消化的,而只是由 Mbo I 消化的。 使用 Cla I 比较高 C 和 3C 产品的消化配置文件。通过消化 Hi-C 产品获得了 53 bp 片段(由于 Mbo I 站点形成的 Cla I 站点的限制以及该地区已经存在的 Cla I 站点的限制)。这个片段没有在3C产品消化中观察到,因为唯一可用的Cla I站点是该地区已经存在的片段。(B) 使用不同的 PCR 周期对 Hi-C 库进行 PCR 放大后,产品以 1.5% 的玫瑰凝胶运行。预计并观察到400-1000桶的污迹。最终放大 PCR 的适当数字周期应视为立即低于仅可见涂片的数字。(C) 最终图书馆克拉一消化。最后的图书馆的一个小库被重新放大和消化与克拉一。涂片的大小缩小证实,库中的很大一部分分子是有效的高C对。可以按照代表性结果部分的详细情况,对这种凝胶进行分量分析,以获得联合国和D样本之间的比例。请单击此处查看此图的较大版本。
图3:Hi-C库的HIC-Pro统计。(A)有效高C对的示意图表示,以及在实验期间可以生成并由HiCPro27过滤出的不同类型的非有效对(表2)。这些内容包括落入连续序列的读取、悬空端、同一片段、自圆、重新连结和 PCR 重复。(B) 制图统计。未对齐的读取显示(灰色),修剪后完全对齐的读取和读取分别显示为蓝色和浅蓝色。这两个类别表示后续分析中考虑的有用读数。(C) 配对统计。多对齐读数(深橙色)表示在基因组中多个区域对齐的读数。唯一对齐(深蓝色)读数表示基因组中对齐一次的读数对,单子(浅橙色)表示读取对,其中两个读数中只对一个基因组区域进行测序。(D) 过滤统计。有效读取对(蓝色)表示成功(A)中描述的Hi-C结结产品。自片段自圆(浅粉色)是无用的读数,因为它们表示(A)中显示的相同基因组片段。同一片段悬空端(橙色)表示单个限制片段的顺序读数。过滤和倾倒的对(棕色)也是无用的读数,具有错误的大小或结对产品无法重建。最后,重新连合读取(红色)表示读数,其中两个相邻的片段被重新粘合,从而产生无用的信息。(E) 有效读数对接触基因组中的分布。独特的 cis 联系人 (蓝色) 比唯一的跨接触 (绿色) 更频繁。请单击此处查看此图的较大版本。
图4:WT和突变S2R+细胞的高C接触矩阵和虚拟4C分析。(A) 以诺奇基因位点为中心的 1 kb 分辨率下 50 kb 区域的高 C 规范化热图。显示地盘的 TAD 分离分数32,以及将 Notch点划分为两个拓扑域(域 1 和域 2)。S2/S2R® 细胞34、35、36、37的 AP、RNA Pol II 和 histone 标记的 ChIP-seq 数据如下热图(表 1)。Notch域 1 边界的位置以浅绿色突出显示。(B) B1 边界 CRISPR 突变体的示意图表示。绿色矩形表示已删除的 343 bp 区域。剪刀表示用于CRISPR介导的基因组编辑的sgRNA。AP 的图案绑定站点显示为 CTCF 和 M1BP 的框。(A)中显示的DNA结合的AP的峰值也显示为35。(C) 高C以1千比比分辨率正常化热图,覆盖以WT和突变细胞为中心的50千巴区域。左图为WT细胞和突变细胞之间交互频率差异的日志2的Hi-C热图。(D) 覆盖以诺奇为中心的 250 kb 区域的高 C 规范化热图,分辨率为 5 kb,用于 WT 和突变细胞。左图为WT细胞和突变细胞之间交互频率差异的日志2的Hi-C热图。(E) 虚拟-4C用于 WT 和突变细胞,使用 5' UTR 的凹槽作为视点。上游基雷多曼-2、凹痕域1、凹痕域2和下游dnc域内的观点和区域之间的相互作用百分比显示为25。缩写: WT = 野生类型;TAD = 拓扑相关域;ChIP = 色质免疫沉淀;AP = 建筑蛋白;RNA 波尔 = RNA 聚合酶;S2R+ = S2 受体加;sg RNA = 单导 RNA;UTR = 未翻译区域。请单击此处查看此图的较大版本。
实验 | 样本 | GEO 加入编号 |
芯片 | CP190 | GSM1015404 |
芯片 | 苏 | GSM1015406 |
芯片 | 模组(mdg4) | GSM1015408 |
芯片 | 反恐委员会 | GSM1015410 |
芯片 | 伊布夫1 | GSM1133264 |
芯片 | 伊布夫2 | GSM1133265 |
芯片 | 豆夫32 | GSM1278639 |
芯片 | 皮塔 | GSM1313420 |
芯片 | 齐普奇 | GSM1313421 |
芯片 | RNA 波利 | GSM2259975 |
芯片 | H3K4me1 | GSM2259983 |
芯片 | H3K4me3 | GSM2259985 |
芯片 | H3K27ac | GSM2259987 |
芯片 | MSL2 | GSM2469507 |
芯片 | H4K16ac | GSM2469508 |
芯片 | M1BP | GSM2706055 |
芯片 | 加夫 | GSM2860390 |
芯片 | 输入 | GSM1015412 |
高 C | S2R+ WT 电池 | GSE136137 |
高 C | S2R+ 5pN-德尔塔343细胞 | GSE136137 |
表1:地球同步轨道加入数字。
高C-专业统计 | 读 | 百分比 |
制图统计 | ||
完整读取对齐 | 131515921 | 82.20% |
修剪读取对齐 | 16408309 | 10.30% |
未能对齐 | 12110964 | 7.60% |
配对统计 | ||
独特对齐 | 79428455 | 50.90% |
单身 人士 | 19063418 | 12.20% |
多对齐 | 57700021 | 36.90% |
过滤统计 | ||
有效对 | 71373989 | 90.12% |
同一碎片:自我循环 | 2340697 | 2.90% |
同一碎片:悬空结束 | 2578783 | 3.20% |
过滤对 | 2773043 | 3.50% |
倾销对 | 196565 | 0.20% |
联系统计 | ||
独特: cis ≤ 20 kbp | 33108815 | 46.50% |
独特: cis > 20 kbp | 33539888 | 47.10% |
独一无二: 转 | 4133602 | 5.80% |
重复读取对 | 398400 | 0.60% |
表2:HIC-Pro 统计。
Subscription Required. Please recommend JoVE to your librarian.
Discussion
这里介绍的核内Hi-C方法允许以高分辨率详细探索果蝇基因组拓扑学,提供不同基因组尺度的基因组相互作用的视图,从促进剂和增强剂等调控元素之间的染色质循环到TAD和大隔间识别25。同样的技术也有效地应用于哺乳动物组织与一些修改33。例如,当处理组织而不是单细胞悬浮时,组织通过 70 μm 过滤器进行筛选,裂解步骤在使用 Dounce 同质化器对材料进行均质化时执行。此外,由于哺乳动物基因组比果蝇基因组大25倍,因此构建1-5kb分辨率矩阵所需的有效读数对数量更大。核内高C方法不同于原来的Hi-C方法2,它避免核裂解与1%SDS在65°C之前粘合,从而保持核完整性,并通过粘合在1mL,而不是7mL23,24。
该协议有一些关键步骤,以确保高效率。引入消化和填充效率低下的第一步是在 0.3% SDS 渗透和表面活性剂处理过程中形成团块。如果团块很大且难以破坏,则在 SDS 和表面活性剂处理期间,旋转速度应降低到 400 rpm。如果团块仍然难以通过管道分解,则在进行渗透之前,应通过限制缓冲器、SDS 和非离子表面活性剂调整体积,将样品一分为二。接下来,核应以最小速度离心(200 × 克),超高敏剂小心丢弃,并将样品集中在 450 μL 的 1 倍限制缓冲器中,然后再进行消化。其次,消化效率的估计对于提供足够的DNA片段来填充和连合非常重要。如果经定性评估,发现消化效率低下,则应用限制酶进行第二轮消化,时间从4小时到一夜不等。
第三,对连带效率的估计很重要。如果在定性评估中发现连合效率低下(即,而不是高分子量带,观察到的涂片与观察到的消化样本相似),则通过在 200 × 克 离心离心,并使用新鲜的 10 倍绑带缓冲和韧带将它们重新吸收到连合混合物中来重复拼接。第四,应通过消化与 Cla I 预期相互作用的 PCR 放大器(用于 Mbo I 原始消化)来估计高 C 有效产品的百分比。预期相互作用的放大器的有效放大和消化证实了高C交汇点的成功结合和形成。如果放大器消化效率不高,大多数分子将是3C而不是Hi-C产品,如果库进行测序,则应考虑这一点。这也可以通过执行最终库 Cla I 消化控制来确认,如代表结果部分所述。最后,选择数量较低的 PCR 周期对于避免 PCR 重复非常重要。如果测序时发现读取对重复的百分比很高,PCR 周期的数量应进一步减少。
这种核内高C技术有一定的局限性。首先,此处描述的协议表示为细胞群执行的高 C 实验。因此,基因组接触频率的信号代表数百万具有可变个体构象的基因组。为了从单个基因组获得一组基因组接触,建议进行单细胞Hi-C实验22。其次,Hi-C是基于近似DNA片段的粘合。因此,如果基因组区域是大型蛋白质染色质复合体的一部分,则片段之间的距离可能会阻碍结扎。例如,已经表明跨接触在 Hi-C38中代表不足。此外,Hi-C 完成配对端测序,从而检索基因组接触对。然而,几个DNA片段可以同时在同一染色质复合物中相互作用。为了获得色度素复合物中多个DNA片段的身份,可以应用于Hi-C39,或者采用不同的实验策略,其中不进行结扎38,40,41。最后,虽然Hi-C测量基因组接触,但它没有透露调节相互作用的蛋白质的身份。必须采用替代方法来识别由感兴趣的特定蛋白质42或特定基因组元素43中蛋白质组合的特征所介质的基因组相互作用。
最后,与高质量的Hi-C实验,如这里描述的果蝇基因组(表2),矩阵可以建立在广泛的分辨率(从1,5kb,50千克或更低:见图4)。此外,如果基因组的特定区域必须按限制片段级别进行评估,则数据可用于构建所需视点的虚拟 4C 图(例如图 4E中的Notch基因 5' UTR)。SeqMonk 中的 Hi-C 其他端工具是一个非常用户友好的选项,可实现此景观的可视化。将 4C 量化工具(也是 SeqMonk 的一部分)应用于此景观可以产生具有统计学意义的联系人。
将这里描述的细胞核内实验应用于在TAD边界(图4)上具有改变APDNA结合位点的突变细胞系的集合,揭示了在边界上需要遗传元素来构建域内的果蝇基因组,并维持阿尔扎特-梅贾等人充分讨论的基因表达调控。因此,使用CRISPR/Cas9系统对调控元素进行基因编辑,并结合使用此处描述的核内Hi-C协议对基因组相互作用进行高分辨率分析,可以成为测试遗传元素结构功能的有力策略。
Subscription Required. Please recommend JoVE to your librarian.
Disclosures
作者声明没有相互竞争的利益。
Acknowledgments
这项工作得到了联阿特派团技术创新和研究支助方案(PAPIIT)赠款编号为207319和科学技术国家委员会(CONACyT-FORDECyT)赠款编号303068的支持。A.E.-L.是国家科学技术委员会(CONACyT)CVU号码968128支持的硕士生。
Materials
Name | Company | Catalog Number | Comments |
16% (vol/vol) paraformaldehyde solution | Agar Scientific | R1026 | |
Biotin-14-dATP | Invitrogen | CA1524-016 | |
ClaI enzyme | NEB | R0197S | |
COVARIS Ultrasonicator | Covaris | LE220-M220 | |
Cut Smart | NEB | B72002S | |
Dulbecco's Modified Eagle Medium (DMEM) 1x | Life Technologies | 41965-039 | |
Dynabeads MyOne Streptabidin C1 | Invitrogen | 65002 | |
Fetal bovine serum (FBS) sterile filtered | Sigma | F9665 | |
Klenow Dna PolI large fragment | NEB | M0210L | |
Klenow exo(-) | NEB | M0210S | |
Ligation Buffer | NEB | B020S | |
MboI enzyme | NEB | R0147M | |
NP40-Igepal | SIGMA | CA-420 | Non-ionic surfactant for addition in lysis buffer |
PE adapter 1.0 | Illumina | 5'-P-GATCGGAAGAGCGGTTCAGCAG GAATGCCGAG-3' |
|
PE adapter 2.0 | Illumina | 5'-ACACTCTTTCCCTACACGACGCT CTTCCGATCT-3' |
|
PE PCR primer 1.0 | Illumina | 5'-AATGATACGGCGACCACCGAGAT CTACACTCTTTCCCTACACGACG CTCTTCCGATCT-3' |
|
PE PCR primer 2.0 | Illumina | 5'-CAAGCAGAAGACGGCATACGAG ATCGGTCTCGGCATTCCTGCTGA ACCGCTCTTCCGATCT-3' |
|
Phenol: Chloroform:Isoamyl Alcohol 25:24:1 | SIGMA | P2069 | |
Primer 1 (known interaction, Figure 2A) | Sigma | 5'-TCGCGGTAATTTTGCGTTTGA-3' | |
Primer 2 (known interactions, Figure 2A) | Sigma | 5'-CCTCCCTGCCAAAACGTTTT-3' | |
Protease inhibitor cocktail tablet | Roche | 4693132001 | |
Proteinase K | Roche | 3115879001 | |
Qubit | ThermoFisher | Q33327 | |
RNAse | Roche | 10109142001 | |
SPRI Beads | Beckman | B23318 | |
T4 DNA ligase | Invitrogen | 15224-025 | |
T4 DNA polymerase | NEB | M0203S | |
T4 polynucleotide kinase (PNK) | NEB | M0201L | |
TaqPhusion | NEB | M0530S | DNA polymerase |
Triton X-100 | Non-ionic surfactant for quenching of SDS |
References
- Cremer, T., Cremer, C. Chromosome territories, nuclear architecture and gene regulation in mammalian cells. Nature Review Genetics. 2, 292-301 (2001).
- Lieberman-Aiden, E., et al. Comprehensive mapping of long-range interactions reveals folding principles of the human genome. Science. 326, 289-293 (2009).
- Dixon, J. R., et al. Topological domains in mammalian genomes identified by analysis of chromatin interactions. Nature. 485, 376-380 (2012).
- Sexton, T., et al. Three-dimensional folding and functional organization principles of the Drosophila genome. Cell. 148 (3), 458-472 (2012).
- Dixon, J. R., Gorkin, D. U., Ren, B. Chromatin domains: the unit of chromosome organization. Molecular Cell. 62, 668-680 (2016).
- Bonev, B., Cavalli, G. Organization and function of the 3D genome. Nature Reviews Genetics. 17, 661-678 (2016).
- Lupiáñez, D. G., Spielmann, M., Mundlos, S. Breaking TADs: how alterations of chromatin domains result in disease. Trends in Genetics. 32, 225-237 (2016).
- Phillips, J. E., Corces, V. G. CTCF: master weaver of the genome. Cell. 137 (7), 1194-1211 (2009).
- Hong, S., Kim, D. Computational characterization of chromatin domain boundary-associated genomic elements. Nucleic Acids Research. 45, 10403-10414 (2017).
- Zuin, J., et al. Cohesin and CTCF differentially affect chromatin architecture and gene expression in human cells. Proceedings of the National Academy of Sciences of the United States of America. 111 (3), 996-1001 (2014).
- Guo, Y., et al. CRISPR inversion of CTCF sites alters genome topology and enhancer/promoter function. Cell. 162, 900-910 (2015).
- Lupiáñez, D. G., et al. Disruptions of topological chromatin domains cause pathogenic rewiring of gene-enhancer interactions. Cell. 161, 1012-1025 (2015).
- Van-Steensel, B., Furlong, E. E. M. The role of transcription in shaping the spatial organization of the genome. Nature Reviews Molecular Cell Biology. 20, 327-337 (2019).
- Merkenschlager, M., Nora, E. P. CTCF and cohesin in genome folding and transcriptional gene regulation. Annual Review of Genomics and Human Genetics. 17 (1), 17-43 (2016).
- Hansen, A. S., Pustova, I., Cattoglio, C., Tjian, R., Darzacq, X. CTCF and cohesin regulate chromatin loop stability with distinct dynamics. Elife. 6, 1-10 (2017).
- Van Bortle, K., et al. Insulator function and topological domain border strength scale with architectural protein occupancy. Genome Biology. 15, 82 (2014).
- Ramírez, F., et al. High-resolution TADs reveal DNA sequences underlying genome organization in flies. Nature Communications. 9, 189 (2018).
- Ulianov, S. V., et al. Active chromatin and transcription play a key role in chromosome partitioning into topologically associating domains. Genome Research. 26, 70-84 (2016).
- Rowley, M. J., et al. Evolutionarily conserved principles predict 3D chromatin organization. Molecular Cell. 67, 837-852 (2017).
- Gavrilov, A. A., Golov, A. K., Razin, S. V. Actual ligation frequencies in the chromosome conformation capture procedure. PLoS One. 8, 60403 (2013).
- Gavrilov, A. A., et al. Disclosure of a structural milieu for the proximity ligation reveals the elusive nature of an active chromatin hub. Nucleic Acids Research. 41, 3563-3575 (2013).
- Nagano, T., et al. Single-cell Hi-C reveals cell-to-cell variability in chromosome structure. Nature. 502, 59-64 (2013).
- Rao, S. S. P., et al. A 3D map of the human genome at kilobase resolution reveals principles of chromatin looping. Cell. 159 (7), 1665-1680 (2014).
- Nagano, T., et al. Comparison of Hi-C results using in-solution versus in-nucleus ligation. Genome Biology. 16, 175 (2015).
- Arzate-Mejía, R., et al. In situ dissection of domain boundaries affect genome topology and gene transcription in Drosophila. Nature Communications. 11, 894 (2020).
- Schoenfelder, S., et al. Promoter capture Hi-C: high-resolution, genome-wide profiling of promoter interactions. Journal of Visualized Experiments. (136), e57320 (2018).
- Servant, N., et al. HiC-Pro: an optimized and flexible pipeline for Hi-C processing. Genome Biology. 16, 259 (2015).
- Philip, E., Måns, M., Sverker, L., Max, K. MultiQC: Summarize analysis results for multiple tools and samples in a single report. Bioinformatics. 10, 1093 (2016).
- Wingett, S., et al. HiCUP: pipeline for mapping and processing Hi-C data. F1000 Research. 4, 1310 (2015).
- Imakaev, M., et al. Iterative correction of Hi-C data reveals hallmarks of chromosome organization. Nature Methods. 9 (10), 999-1003 (2012).
- Akdemir, K. C., Chin, L. HiCPlotter integrates genomic data with interaction matrices. Genome Biolog. 16, 198 (2015).
- Ramirez, F., et al. High-resolution TADs reveal DNA sequences underlying genome organization in flies. Nature Communications. 9, 189 (2018).
- Ando-Kuri, M., et al. The global and promoter-centric 3D genome organization temporally resolved during a circadian cycle. bioRxiv. , (2020).
- Cuellar-Partida, G., et al. Epigenetic priors for identifying active transcription factor binding sites. Bioinformatics. 28 (1), 56-62 (2012).
- Zhang, Y., et al. Model-based analysis of ChIP-Seq (MACS). Genome Biology. 9, 137 (2008).
- Ong, C. -T., et al. Poly(ADP-ribosyl)ation regulates insulator function and intrachromosomal interactions in Drosophila. Cell. 155 (1), 148-159 (2013).
- Fresán, U., et al. The insulator protein CTCF regulates Drosophila steroidogenesis. Biology Open. 4 (7), 852-857 (2015).
- Quinodoz, S., et al. RNA promotes the formation of spatial compartments in the nucleus. Cell. 174, 744-757 (2018).
- Olivares-Chauvet, P., et al. Capturing pairwise and multi-way chromosomal conformations using chromosomal walks. Nature. 540 (7632), 296-300 (2016).
- Beagrie, R., et al. Complex multi-enhancer contacts captured by genome architecture mapping. Nature. 543, 519-524 (2017).
- Redolfi, J., et al. DamC reveals principles of chromatin folding in vivo without crosslinking and ligation. Nature Structural and Molecular Biology. 26, 471-480 (2019).
- Maxwell, R., et al. HiChIP: efficient and sensitive analysis of protein-directed genome architecture. Nature Methods. 13, 919-922 (2016).
- Gao, X., et al. C-BERST: Defining subnuclear proteomic landscapes at genomic elements with dCas9-APEX2. Nature Methods. 15 (6), 433-436 (2018).