Biology

增强的减少表示亚硫酸氢盐测序的DNA甲基化的评估，在碱基对决议

Published: February 24, 2015 doi: 10.3791/52246

Francine E. Garrett-Bakelman*¹, Caroline K. Sheridan*¹, Thadeous J. Kacmarczyk¹, Jennifer Ishii¹, Doron Betel^1,2, Alicia Alonso¹, Christopher E. Mason³, Maria E. Figueroa⁴, Ari M. Melnick¹

¹Department of Medicine, Weill Cornell Medical College, ²Institute for Computational Biomedicine, Weill Cornell Medical College, ³Department of Physiology and Biophysics, Weill Cornell Medical College, ⁴Department of Pathology, University of Michigan

* These authors contributed equally

Abstract

DNA甲基化模式的映射是大量研究在正常和病变组织。各种方法已被建立，以询问胞嘧啶甲基化模式中的细胞。全基因组测序的亚硫酸氢减少代表性的开发是为了定量检测碱基对分辨率的胞嘧啶甲基化模式在GC丰富的基因位点。这是通过结合使用一种限制性内切酶，随后通过亚硫酸氢盐转化的完成。增强精简表示亚硫酸氢盐测序（ERRBS）增加的生物相关的基因组基因座盖，并已用于分析胞嘧啶甲基化，从人，小鼠和其它生物的DNA。 ERRBS启动与DNA产生低分子量的碎片在文库制备使用限制性内切酶消化。这些片段进行标准库建设下一代测序。前的最后amplificati未甲基化的胞嘧啶的亚硫酸氢盐转化在步骤允许在有盖的基因组位点胞嘧啶甲基化水平的定量基本分辨率。该协议能在四天内完成。尽管低排序的前三个基地的复杂性，ERRBS库产生使用指定的顺序控制车道时，高质量的数据。然后，进行测绘和生物信息学分析和产率数据，可以与各种基因组范围的平台来容易地集成。 ERRBS可以利用小的输入材料数量使其可行处理人类临床样品和适用的范围内的研究应用。产生的视频演示了ERRBS协议的关键步骤。

Introduction

在胞嘧啶（5-甲基胞嘧啶）DNA甲基化是一个后生标记为各种生物过程中哺乳动物细胞至关重要的，包括但不限于印记，X染色体失活，发展和基因表达^1-8的调节。的DNA甲基化模式在恶性和其它病症的研究已经确定疾病特定图案，并有助于疾病的发病机制和可能的生物标志物的发现^9-17的理解。有迹象表明，询问表观基因组DNA甲基化状态的许多协议。这些可以分为基于亲和力的，限制性内切酶为基础的，而利用微阵列或测序平台下游重亚硫酸盐转化为基础的分析。此外，也有弥补这些一般类别，包括但不限于，结合亚硫酸氢盐限制性分析¹⁸和精简表示亚硫酸氢盐测序（RRBS ^19）几个协议。 RRBS最初由迈斯纳等人 ^19,20说明。该协议引入了一个步骤，以丰富随后亚硫酸氢盐测序，结果定量碱基对分辨率的数据是符合成本效益^21,22富含GC的基因组区域。所述富含GC的区域由MspI酶切位点（C ^ CGG）限制性内切酶有针对性的，和胞嘧啶甲基化是由胞嘧啶的亚硫酸氢盐转化率（未修饰的胞嘧啶到尿嘧啶脱氨），随后通过聚合酶链式反应（PCR）扩增得到解决。 RRBS覆盖大多数基因的启动子和CpG岛中所需的全基因组测序的一小部分;然而RRBS的CpG了海岸和生物相关的其他间隔区的覆盖范围有限。因为这改善后，这些基因组区域^23-25 的方法和产生的覆盖原始报表几组已发布更新RRBS协议。增强的减少代表色曲亚硫酸氢接近开关就是嵌入式（ERRBS）包括相比RRBS库准备修改和替代数据对齐方式^26。 ERRBS导致数生成的数据所代表的CpG更高，增加了覆盖范围的所有基因组区域的审问^26。这种方法已被用来解决在人类患者和其它动物标本^26-30 DNA甲基化模式。

所述ERRBS协议上描述所需完成和使用代表人类的DNA所产生的数据的所有步骤提供的信息（样品从先前报道，去识别患者样品³¹得到的，并从一个正常人供体的CD34 +骨髓样品）。该协议包括一个自动大小选择过程，从而降低了处理时间，每个样品，并允许在文库大小选择提高精度。该协议结合了一连串的既定的分子生物学技术。高分子量DNA被消化瓦特第i个甲基化敏感限制性内切酶（MspI酶切位点），其次是年底修复，A-拖尾，以及甲基化的适配器连接。所述富含GC的片段的大小选择之后是亚硫酸氢盐转化率和之前测序PCR扩增。亚硫酸氢盐转化一直是前面所述³²和数据分析和应用程序的详细审查超出了本文的范围，但是建议和参考文献包含了读者使用。该协议可以四天执行，并且是适合于小输入（50毫微克或更少）的材料的量。该协议为每个CpG位点不仅对于差分甲基化位点和区域确定而且对后生多态性检测足够高覆盖率描述产量数据所描述的Landan 等人 ^33。

Protocol

执行所有的程序都是由印第安纳大学医学院实验动物管理和使用委员会的批准，并按照卫生指引研究院。

1.手术技巧

这个过程通过使用无菌手套，仪器，并根据美国国立卫生研究院指南²⁵的无菌外科领域中保持无菌技术。消毒高压灭菌他们开始在手术前的工具（ 见表特定试剂/设备的完整列表）。使用玻璃珠灭菌的操作过程中，以消毒的工具。

2.麻醉和准备

麻醉小鼠在麻醉箱以0.9升/分钟的氧气和2.5％的异氟醚用兽医异氟烷蒸发器系统的混合物。确保鼠标并没有改变身体姿势从包装盒中取出前作出回应。
应用眼药膏谅解备忘录SE的眼睛以保护他们免受干燥。
从箱气流切换到鼻锥。将鼠标正视在其左侧上的加热垫覆盖有手术垫和吸收长凳纸与它的鼻子和嘴的锥体内。连续监测小鼠的呼吸节奏和速度，并调整异氟烷水平根据需要（2.5之间 - 3％异氟醚）以维持麻醉的适当水平，并且使用脚趾捏反射来确认总镇静。

3.手术方法

对齐并与外科领域关注的实体镜。调整鼻锥和磁带下来，以便它位于沿视野的边缘。
用鼠标卧在其左侧，用胶带将右耳到鼻锥体的边缘，在那里露出的切口将作出在耳后的区域。确保耳后静脉水平会穿过耳朵。需要注意的是T的正确位置他的动物和耳朵的录像都是为了快速找到面神经的关键。
润湿毛发上，并用70％乙醇在耳朵后面，刮胡子使用剃刀或手术刀刀片的外科手术部位。预湿的皮草，使剃须在这个解剖位置比较容易。
清洁与碘溶液，如聚维酮碘的外科擦洗（7.5％聚维酮碘），随后用70％乙醇的皮肤。重复该清洗2次以上，以彻底消毒的区域。
确定在何处作出切口，从耳尾端跟踪耳后静脉的区域后方的耳突起。使用弹簧剪刀，制作4毫米的切口2 - 3毫米后的突起。
通过解剖用钝性分离皮下脂肪和筋膜。避免直接切削用剪刀因为血管或肌肉组织很容易损坏。
如果发生出血，将压力施加到手术部位用无菌棉签为至少30秒。如果发生显著流体损失，以达到的用25或27G的针的无菌0.9％盐溶液0.5毫升腹膜内注入小鼠。
使用几个键标，副神经，耳道，和前二腹肌（下面描述），以定位面神经。剖析围绕这些地标，直到面神经的分支可视化。当它被发现的神经将显示为显著固体白色组织和一层筋膜附着到下面的结构。
1. 发现副神经，从头骨的尾部部分，其行进到支配斜方肌，一旦皮下脂肪和筋膜已解剖。面神经是深副神经。
2. 发现软骨耳道看起来珍珠白，并且可以看出延髓面神经。
3. 发现前二腹肌的肌腹的位于顶部和caudal面神经。
如果面神经的主要分支的可视化，跟踪他们背来找到自己的出身，从茎乳孔。用细尖杜蒙钳＃四十五分之五保持手术部位的开放，推进下面的神经路径的春天剪刀的提示，然后将镊子背侧，以保持新的先进地区开放。
可视面神经与颧骨，颊的躯干，并且在这一点上下颌缘分支。
注：颞支会发现接近孔。边际下颌神经分支到其上，下部分更靠近钳口，从而那些神经分支将不会在这个水平可见的。
1. 如果执行神经切断，轻轻稳定神经的精尖钳和切割神经与弹簧剪刀。避免将过多的牵引神经与血管钳，以防止avulsing从脑干神经。推树桩相互远离，或切割并移除远端神经的一部分，以确保没有重新连接可以发生。
2. 如果执行一个挤压伤，利用蒙特＃四十五分之五镊子压缩神经为30秒，使用恒定压力以切断所有轴突，则在垂直于第一粉碎部位的第二角度重复此压碎。避免将压力可变数量的30秒美眉期间，否则伤害将是动物之间的不一致。

4.关闭和恢复

重新定位的脂肪和肌肉在底层结构。
近似切口的边缘，并使用7.5毫米伤口夹闭合伤口。缝线或胶水还可以接受的伤口闭合。手术后止痛药可以在此时提供。
取下鼠标的耳朵磁带。关掉异氟烷流动，并允许小鼠呼吸纯氧为30秒至1分钟。 PL王牌鼠标在一个空笼没有被褥从麻醉中恢复。
当鼠标被回收，检查其面瘫的验证标志的行为。胡须就会瘫痪和角度背对着脸颊，鼻子就会偏离，并且眼睛也不会因空气的粉扑闪烁。
房子动物联合手术后，如果他们是女性。避免住房雄性小鼠联合，因为他们更积极，而且往往强行删除其cagemate的伤口剪辑，从而导致感染。如有必要，提供手术后止痛剂，此时，。
监测小鼠，每天一次，连续几天的操作后，以确保没有感染或其他并发症发生术后。手术后10天，如果他们没有倒下了自己 - 删除伤口片段7。
适用于润滑眼膏，以患眼每天以防止角膜并发症，无论是直到眨眼反射是重覆盖或直到安乐死。

Representative Results

图1提供ERRBS的概述，突出的关键步骤，这是在整个描述的协议说明。 ERRBS库用50纳克输入DNA准备。

评估准备的库的质量。图书馆例行的生产产量150-250基点和250-400基点（ 图3A-C）部分的大小。在样本库之间的尺寸分布略有差异的预期。注意，在较低和较高文库级分有非常激烈的DNA的大小，指示特定序列的富集。 MspI酶切位点的消化导致家庭重复DNA的序列富集存在于190基点，250基点和310基点的ERRBS库的人类基因组。这三个重复序列代表一个ERRBS库²⁰的特性的签名（参见图3A-C和3G）。代表性的文库进行测序上的下一代序列ř采用单端读取。当在上Illumina的HiSeq 2500序推荐的库加载浓度，对500,000-700,000每^平方毫米集群密度的预期。在这个聚类的聚类密度，81.6％±3.14％（N = 81），低通滤波器（ 图4A）。由于该文库插入物的低复杂度端（MspI酶切位点识别位点：C ^ CGG），测序过程中记录的强度值和质量分数，是在第3个碱基（ 图4B-C）的高度可变的，但是如果一个独立的对照泳道包括（见讨论），碱的85％将具有30或更大的质量得分（Q30值; 图4D）。

数据对准，如在协议收率碱基对分辨率的数据描述胞嘧啶甲基测定（ 表7）。人类基因组，一个51周期的单读测序的ERRBS图书馆在HiSeq 2500一条车道在高输出模式运行规律LY产生153194882±12918302共读，经过质量过滤和适配器修剪产量152231183±13189678读取输入到分析管道。平均映射效率为ERRBS库通常是62.95％±5.92％，与3183594±713547的CpG表示每10×的CpG的最小覆盖面积和每CpG的平均覆盖率84.94±16.29（N = 100）。

该ERRBS协议是经得起复用（见补充文件1：协议适配的复用测序）。从代表性的测序数据运行从复用测序运行（51周期单读测序运行总结在图5的数据; N = 128，每通道两个库; N = 11三，每个通道库; N = 11的四个库每泳道）进行比较，以一个ERRBS库的完整测序车道（51循环单阅读测序运行; N = 100），以及下采样单通道到模拟器上ê50％，33％和25％的每泳道读（2，3，和分别每泳道4样品多路复用; N = 3）。作为每个样品读取数与复用因子降低，覆盖在10倍的最小覆盖面积和每CpG的覆盖范围的CpG的数目减少，以及（图5和表8）。非CpG部位意味着转化率预计为99.85％±0.04％（N = 400）。转化率大于99％，降低可指示低于最佳重亚硫酸盐转化，可能导致虚假甲基化水平很高。

从具有代表性的人类基因组DNA准备了ERRBS库数据在研发2.15.2 ⁴⁵使用methylKit包^26（参见命令的详细信息补充代码文件1）分析。该数据可以被可视化中通常使用的基因组浏览器（ 图6A）。该胞嘧啶甲基化的数据被均等地来自于两条链（ 图6B）以及范围的整频谱潜在胞嘧啶甲基化水平（ 图6C）的。（先前描述图6E和 F和作为^26）从该数据的结果（ 图6D），并涵盖在基因组基因座的广谱的CpG之间有代表性的人的DNA样品的产量高的一致性分析的技术重复。虽然技术复制品将产生高R ²的值（大于97％），生物副本将产生，R ²值范围从0.92到0.96 ^26，和比较不同的人类细胞类型将产生，R ²值低于0.86的（数据未示出）。

图1：流程图的ERRBS协议的步骤。图代表的步骤，它可以在传统的工作日内完成。*表示潜在的暂停点（立即执行荷兰国际集团结扎清理和尺寸选择，协议的步骤5）之前在该样品可以在-20在进行协议的期限之前冻结℃。

图2：尺寸选择协议。（A）屏幕截图在ERRBS皮平准备协议中使用的设置（见协议第5.1.2 - 5.1.6）：（1）选择纸盒类型。（2）使用选择的标准。（3）选择每个通道的收集模式。（4）输入集合bp的范围。（5）保存协议协议第5.2节中使用的人工凝胶提取（B）阶段：（1）可视化凝胶梯子。（2）标记的尺寸为用刀片大小选择。切除标本（150-250 bp和更高的分数：250-400基点较低的分数）（3）图像。“>请点击此处查看该图的放大版本。

图3：质量控制结果从使用生物分析仪机人类DNA样本准备代表ERRBS库。（A）的凝胶状图象显示标准梯（1），低级文库级分（从皮平准备135-240碱基级分）; 2）和更高的文库级分（从皮平准备240-410碱基级分）; 3）（B）生物分析仪电泳预期低库分数（C）的预期高出库部分的生物分析仪电泳D - 。F）从质量较差库准备有代表性的数据。标准梯（1）的凝胶状图像（D）中 ，低级文库级分（2）和更高的文库级分（3）。在150bp的带标记有ARROw表示适配器过量。的下电泳（E）和更高的文库级分（F），在150碱基对（用箭头标记）过量适配器峰。一个汇集ERRBS库用于测序（G）的生物分析仪电泳。红色迹代表具有更高和更低的级分的平等代表高质量汇集库。蓝线代表一个汇集库不足以测序由于缺乏较高的和较低的分数平等代表权。请点击此处查看该图的放大版本。

图4：图表测序为代表ERRBS 51周期单读测序运行在HiSeq 2500测序的高输出模式。（A）的群集的密度（K /毫米² = 1000簇每平方毫米;蓝色）。和簇的密度通过过滤器（绿色）在两车道与ERRBS库（B）中与出现在第一30个循环中的车道的典型强度ERRBS库。请注意，从MspI酶切位点的消化前三周期的强度的CGG签名。用质量分数为30或更高（％> Q30），用于在一个ERRBS车道每个周期基地（C）的百分比。（D）质量分数分布在一个ERRBS车道全部循环。蓝色=小于Q30，绿色=大于或等于Q30。在这条胡同里，基地84.7％有30或更高的质量分数。

图5：排序输出结果。箱形图的实验数据，从每道测序る复用和单个样本纳秒（显示为绿框）从三个ERRBS库测序运行模拟下采样得出的数据和（显示为蓝色框;采样5次，每次测序运行），从51周的单读测序运行的复用系数对应每泳道ERRBS库的数目进行测序。 1 =整个车道或100％的读取和代表每通道单一ERRBS库数据; 2 = 50％车道，代表每线双ERRBS库中的数据;一泳道3 = 33％，并且表示为每泳道3 ERRBS库的数据;并且，车道4 = 25％，并代表从每泳道4 ERRBS库数据。（A）中的读出计数，或分析的序列号，每个多路复用因子。（B）中所涵盖的每个多路复用的测序数据的CpG的数因素。（C）每复用系数CpG的平均覆盖率。_blank“>点击此处查看该图的放大版本。

图6：从人类基因组DNA准备了ERRBS库代表数据（A）美国加州大学圣克鲁兹分校（UCSC）基因组浏览器⁴³的图像从ERRBS测序车道代表性的数据。 y轴比例尺条为0-100％甲基化，在覆盖有至少10倍的每个胞嘧啶。顶端定义轨道表示正向链及下部定制轨道表示反向链。示出的是chr12：6,489,523-6,802,422（hg19）含该基因组区域内的RefSeq基因和CpG岛（B）的分布的CpG覆盖直方图沿正向和反向链的代表性人CD34 +骨髓样品中的（C）的分布直方图的CpG甲基化水平沿两条链具有代表性的人CD34 +骨髓样品中。CpG甲基化水平从一个人的DNA样品的代表性技术复本（D）的相关性曲线图。（E）的饼图表示盖在ERRBS的CpG的比例而注释为CpG岛（浅绿色），CPG海岸（灰色）和其他地区（白色），从人类基因组DNA制成具有代表性的样本。（F）饼图说明包括在ERRBS的CpG其中注明为基因启动子的比例（红），外显子（绿色），内含子（蓝色）和间隔区（紫色）。请点击此处查看该图的放大版本。

<TD> 10×T4 DNA连接酶反应缓冲液

试剂	音量	评论
10微升
三磷酸脱氧核苷酸（的dNTP）混合的解决方案	4微升	混合的每个核苷酸的10毫米
T4 DNA聚合酶	5微升	3000单位/ ml
DNA聚合酶I大（Klenow酶）片段	1微升	5000单位/ ml
T4多核苷酸激酶	5微升	万单位/毫升
无DNase的水	45微升

表1：最终修复反应的试剂的试剂名，数量用在末端修复反应（协议步骤2.1）。

试剂	音量	评论
10×反应缓冲液	5微升	例如，NEBuffer 2中加入
1mM的2'-脱氧腺苷5'-三磷酸（的dATP）	10微升
Klenow片段（3'→5'外切）	3微升	5000单位/ ml

表2：尾反应试剂，试剂的名称和数量用于尾反应（协议的步骤3.1）。

试剂	音量	评论
在无DNase的水为15μm退火适配器	3微升	PE适配器1.0和PE适配器2.0; 见表4序列和参考
10×T4 DNA连接酶反应缓冲液	五81，L
T4 DNA连接酶	1微升	200万单位/毫升
无DNase的水	31微升

表3：适配器连接反应试剂的试剂名，并在适配器连接反应（协议步骤4.2）所使用的量。

表4：在整个连接反应（协议步骤4）和PCR扩增步骤（协议步骤7）ERRBS协议中使用的寡核苷酸在ERRBS协议中使用寡核苷酸的列表。

试剂	音量	评论
10倍的FastStart高保真反应缓冲液的Wi第18毫氯化镁	20微升
10毫米的dNTP混合解决方案	5微升
25μMPCR PE底漆1.0	4微升	见表4
25μMPCR PE底漆2.0	4微升	见表4
的FastStart高保真酶	2微升	5单位/微升的FastStart Taq DNA聚合酶
无DNase的水	125微升

表5：PCR反应试剂的试剂名，并在PCR扩增反应（协议步骤7.1）所使用的量。

协议的步骤	试剂/协议细节	输入DNA量
协议的步骤	试剂/协议细节	5-10纳克	25纳克	50纳克
1	MspI酶切位点的酶	1微升	2微升	2微升
1	MspI酶切位点消化反应体积	50	100	100
4	在连接反应适配器	1微升	2微升	3微升
4	连接反应体积	20微升	25微升	50微升
五	大小选择协议	只有手动胶	皮蓬准备或手动胶	皮蓬准备或手动胶
7	PCR引物浓度	25μM	25μM	10μM的14个循环; 25μM18次	PCR循环数	18	18	14-18

表6：协议步骤修改为输入材料数量范围从5-50纳克几个步骤在整个协议要求用来产生从不同数量的起始材料的高品质的文库试剂量的修饰。被更改的关键试剂的量包括在这里。调节在反应缓冲液和水体积相应。

CHR	基地	缕	复盖	freqC	freqT
CHR 1	10564	ř	366	85.52	14.48
CHR 1	10571	˚F	423	91.25	8.75
CHR 1	10542	˚F	432	91.2	8.8
CHR 1	10563	˚F	429	94.64	5.36
CHR 1	10572	ř	366	96.99	3.01
CHR 1	10590	ř	370	88.11	11.89
CHR 1	10526	ř	350	92	8
CHR 1	10543	ř	368	92.93	7.07
CHR 1	10525	˚F	433	91.92	8.08
CHR 1	10497	˚F	435	88.74	11.26

<P类=“jove_content”> 表7：代表ERRBS数据。获得碱基对数据的数据对齐和胞嘧啶甲基化的决心，经过对每个CpG的覆盖，对齐协议描述将决定基因组坐标（列：字符=染色体，基地和钢绞线），具体的位点的覆盖率（覆盖），以及检测胞嘧啶与胸苷百分数（freqC和freqT的分别率）。

每通道ERRBS库数量	平均数的唯一对准读取	平均覆盖的CpG数量	平均每CpG的覆盖范围
1	152231184±13189678	3183594±713547	85±16
2	77680837±7657058	2674823±153494	49±9
3	49938156±2436865	2552186± - 76624	39±2
4	34457208±4441686	1814461±144339	28±4

表8：从单一的测序和多路复用ERRBS图书馆代表的参数显示的是每个通道的数据，从51周的单读测序运行：均值和独特的排列标准偏差读，覆盖CpG岛的数量和覆盖面从每单测序获得的CpG位点每通道ERRBS库（N = 100），每通道2 ERRBS库（N = 128），每通道（N = 11）三种ERRBS库和每通道（N = 11）4 ERRBS库。

Discussion

胞嘧啶甲基化在生物相关的基因组区域的协议收益率呈现碱基对分辨率的数据。作为写入的50纳克原料优化的协议，但是，它可以适用于处理各种输入材料（5纳克或多个^）26。这将需要的一些协议的步骤的调整，如表6所示。该ERRBS库适合于配对末端测序和进一步的基因组的覆盖，也可通过测序完成读长于51个周期。多路复用测序将提供每个样品以较低的成本协议，然而，这将导致每个中的数据（图5和表8）表示CpG部位减少的覆盖范围，并且不会产生覆盖足够的深度来执行需要每高覆盖率的分析CpG部位（如所描述的Landan 等人^33）。最后，这个协议（或任何亚硫酸氢基protocoL）不能甲基胞嘧啶和羟甲基胞嘧啶^46,47之间的区别。然而，生成可与其它协议被集成的数据结果^48,49划定的不同的修改，以及其他的胞嘧啶修饰最近报道^50，它们应的兴趣。

高品质的库将出现如图3A-C，以及一旦合并用于测序产生了跟踪， 如图3G（红色迹线），代表来自两个文库的馏分等摩尔贡献。文库制备故障可导致在操作过程中的任何步骤。如果降解的DNA进行处理，将导致在使用在此协议中描述的测序参数不富含MspI酶切位点的片段，从而在低的CpG覆盖库。如果一种酶是无功能的或无意排除在反应之一，该协议将不会产生预期的库。如果结扎意图ction是低效的，适配器是在更高的浓度比预期的，和/或使用的引物浓度是限制性试剂的最终扩增步骤，库可能会发生故障。过量适配器（视为在生物分析结果的峰在〜150bp的图 ; 图3D-F），在库中还会干扰测序由于既库和过量的适配器的滥聚类。而这样的库可能顺序显然通常，的一个显著部读出将是仅仅接头序列。如果过量适配器库中观察到的，这是最好的，以重复文库制备，如果使用优化的输入材料到适配器数量比率的材料是可用的。最后，为了确保库的有效的PCR扩增，所述较低和较高文库级分被保持在整个重亚硫酸盐转化和PCR富集步骤分离的样品。如果不这样做会产生扩增的P期间差分效率较高和较低的级分的CR反应（如在图3G蓝色迹线所示）和用于各个基因组位点的测序过程中涉及的每个库馏分不等代表性的潜力。用户可以选择包括亚硫酸氢盐转化为以扩增而产生的库需要最佳PCR循环进一步滴定后定量PCR立即步骤。

ERRBS文库制备协议有其特定的试剂推荐几个关键步骤。在最终修复工序中，使用了四核苷酸dNTP混合物的允许端修复的不含CG突出端，如那些从MspI酶切位点的酶星活性和存在于原始DNA样品中剪切的DNA片段得到的任何产品。这导致在结果改进的CpG表示。在连接步骤，以确保关键是要使用高浓度的连接酶（2000000单位/ ml）和甲基适配器结扎reacti上是有效的，该亚硫酸氢盐转化不影响对于准确的数据对准所必需的接头序列。在PCR步骤中，使用能够扩增的亚硫酸氢处理的富含GC的DNA片段的聚合酶是必要的高特异性。最后，为了保证消除多余适配器和引物，SPRI珠粒纯化（例如：Agencourt AMPure XP）被推荐，而不是基于列的测定法用于连接和PCR产物隔离。

为了生成高质量的数据时，它以确保有效的亚硫酸氢盐转化是重要的。提出的控制提供了用户确定测序前的转换效率的能力。作为替代，非人类的DNA，例如λ噬菌体DNA可以用作内部对照（尖峰式）。由于品种的差异，这种类型的控件，可以直接计入下游测序（如所使用的玉等人^。34）。然而，如果尖峰在我š利用，它不能被用来确定前文库测序转换效率，除非唯一地放大，并独立地为之前文库测序测序。确定的转换率是基于在非CpG位点的甲基化状态。这可能不适合于在高的胞嘧啶甲基化非CpG上下文（例如胚胎干细胞）和平行的样品或评估可以用于此目的的转换效率的其它手段的情况下使用。

有几个注意事项，以地址是唯一的ERRBS库的顺序。测序的文库级分的前三个碱基为几乎均匀地非随机由于MspI酶切位点的识别剪切位点（C ^ CGG;参见图4B，C）。这导致了显著数据丢失的可能性，由于低质量读取从排序过程中，尽管明显高集群密度差集群的定位所致。为了克服这个障碍，包括一个独立的车道（PhiX管制或其他库型）作为专用车道控制在一个高度复杂的图书馆。高度复杂的图书馆有包含在测序的前四个基地的A，C，T和G均衡的代表性结束。合适的对照泳道包括例如RNA-SEQ，芯片起，全基因组测序，或通过测序机床制造商（例如 PhiX控制V3）提供一个控制库。当被指定为一个对照泳道用于各个测序运行，它可以作为基础，它在测序前四个碱基用来检测簇的位置的矩阵生成。高品质的读取捕获将提高每个CpG位点的平均覆盖5.2（N = 4）。可替代地，本技术难度也可以使用暗测序方法如先前所述²³克服。其他测序标准遵循每制造商的协议标准操作程序。最后，每个CpG的C中的覆盖面Hosen的用于数据分析将被用户和部分被引导通过感兴趣的生物的问题。 10倍覆盖范围的阈值提供了一个高覆盖率的分析方法，但是这个门槛可以降低应该是这样的兴趣。

ERRBS数据分析的完整讨论超出了本文的范围，但是，差异甲基化的胞嘧啶和地区可以使用开源工具^31,51-53确定。额外的分析考虑和方法已被充分描述^54,55，读者被鼓励以搜索文献为最适合于计划的分析工具。

相比其他公布方法，ERRBS提供，当为可重复性的描述产量高利率进行了为期四天的协议。相比黄金标准MassARRAY EpiTYPER ²⁶已经验证，具有成本效益的高覆盖率的数据，并适用于各种输入材料量（有利低频的临床样品的处理和其他类型的细胞）和测序的方法。它提供了碱基对分辨率在生物学相关基因座，可以在综合可用于其它技术分析基因组范围的转录因子结合，染色质重塑，表观遗传标记和其他感兴趣的胞嘧啶修饰的分析。在这些研究中ERRBS数据利用可以向一个全面的分子的方法，并允许在生物模型和人类疾病的研究高维分析。

Disclosures

作者有没有利益冲突披露。

Materials

Name	Company	Catalog Number	Comments
MspI	New England Biolabs	R0106M	100,000 units/ml
NEBuffer 2	New England Biolabs	B7002S	Reaction buffer for MspI enzyme; protocol step 1.2
Phenol solution	Sigma-Aldrich	P4557	Equilibrated with 10 mM Tris HCl, pH 8.0; see safety and handling instructions at http://www.sigmaaldrich.com/catalog/product/sigma/p4557
Chloroform	Sigma-Aldrich	C2432	See safety and handling instructions at http://www.sigmaaldrich.com/catalog/product/sial/c2432
Glycogen	Sigma-Aldrich	G1767	19-22 mg/ml
NaOAc	Sigma-Aldrich	S7899	3 M, pH 5.2
Ethanol	Sigma-Aldrich	E7023	200 proof, for molecular biology
Buffer EB	Qiagen	19086	10 mM Tris-Cl, pH 8.5
tris(hydroxymethyl)aminomethane (Tris)	Sigma-Aldrich	T1503	prepare a 1 M, pH 8.5 solution
Tris- Ethylenediaminetetraacetic acid (TE)	Sigma-Aldrich	T9285	Dilute to 1x buffer solution per manufacturer's recommendations
T4 DNA Ligase Reaction Buffer	New England Biolabs	B0202S	10x concentration
Deoxynucleotide triphosphate (dNTP) Solution Mix	New England Biolabs	N0447L	10 mM each nucleotide
T4 DNA Polymerase	New England Biolabs	M0203L	3,000 units/ml
DNA Polymerase I, Large (Klenow) Fragment	New England Biolabs	M0210L	5,000 units/ml
T4 Polynucleotide Kinase	New England Biolabs	M0201L	10,000 units/ml
QIAquick PCR Purification Kit	Qiagen	28104	Used for DNA product purification in protocol step 2.3
2'-deoxyadenosine 5'-triphosphate (dATP)	Promega	U1201	100 mM
Klenow Fragment (3'→5' exo-)	New England Biolabs	M0212L	5,000 units/ml
MinElute PCR Purification Kit	Qiagen	28004	Used for DNA product purification in protocol step 3.3
T4 DNA Ligase	New England Biolabs	M0202M	2,000,000 units/ml
Methylation Adapter Oligo Kit	Illumina	ME-100-0010
Agencourt AMPure XP	Beckman Coulter	A63881	Used in protocol sections that implement magnetic bead purification steps (steps 4.3 and 8.2). Equilibrate to room temperature before use.
Pippin Prep Gel Cassettes, 2% Agarose, dye-free	Sage Science	CDF2010	with internal standards
Certified Low Range Ultra Agarose	Bio-Rad	161-3106
Tris-Borate-EDTA (TBE) buffer	Sigma-Aldrich	T4415
Ethidium bromide solution	Sigma-Aldrich	E1510	10 mg/ml
50 bp DNA Ladder	NEB	N3236S
100 bp DNA Ladder	NEB	N3231S
Gel Loading Dye, Orange (6x)	NEB	B7022S
Scalpel Blade No. 11	Fisher Scientific	3120030
QIAquick Gel Extraction Kit	Qiagen	28704
EZ DNA Methylation Kit	Zymo Research	D5001	Used in protocol step 6.2
EZ DNA Methylation-Lightning Kit	Zymo Research	D5030	Alternative for step 6.2
Universal Methylated Human DNA Standard	Zymo Research	D5011	Used as bisulfite conversion control
FastStart High Fidelity PCR System	Roche	03553426001
Qubit dsDNA High Sensitivity Assay Kit	Life Technologies	Q32854	A fluorescence-based DNA quantitation assay; used in protocol steps 1.1, 9.1 and 10.1
DynaMag-2 Magnet	Life Technologies	12321D
High Sensitivity DNA Kit	Agilent Technologies	5067-4626
2100 Bioanalyzer	Agilent Technologies
PhiX Control v3	Illumina	FC-110-3001
HiSeq 2500	Illumina
Pippin Prep	Sage Science
Qubit 2.0 Fluorometer	Life Technologies	Q32872
TruSeq SR Cluster Kit v3-cBot-HS	Illumina	GD-401-3001
TruSeq SBS Kit v3-HS	Illumina	FC-401-3002
TruSeq RNA Sample prep	Illumina	RS-122-2001	Barcoded adapters used for multiplexing libraries; See Supplemental file for multiplexing protocol.
Microcentrifuge
Vortex Mixer
Dry Block Heater
Thermal Cycler
Water Bath
Gel electrophoresis system
Electrophoresis power supply
Gel doc
UV or blue light transilluminator