Waiting
Login processing...

Trial ends in Request Full Access Tell Your Colleague About Jove
Click here for the English version

Genetics

G2-seq: 一种基于高通量测序技术的基因组晚期复制区域识别方法

Published: March 22, 2018 doi: 10.3791/56286

Summary

我们描述了一种将流式细胞术和高通量测序相结合的技术来识别基因组的晚期复制区域。

Abstract

许多技术已经开发, 以跟踪 DNA 复制的进展, 通过 S 阶段的细胞周期。这些技术大多用于阐明基因组复制的地点和时间, 而不是完成。然而, 至关重要的是, 我们了解基因组中最后一个完成复制的区域, 因为这些区域的染色体断裂和突变水平较高, 并与疾病和衰老有关。在这里, 我们描述了我们如何扩展了一个技术, 已经被用来监测复制启动, 而不是确定这些区域的基因组最后完成复制。这种方法是基于流式细胞术和高通量测序相结合的。虽然本报告着重于酵母的应用, 该方法可以与任何细胞, 可以排序在流式仪根据 DNA 的内容。

Introduction

真核基因组复制是在多个离散站点上启动的, 称为复制的起源, 复制分叉在两个方向上进行 (在 Fragkos et、20151中进行了复查)。起源在他们的时间和射击的效率不同, 并且开发了几个技术监测复制起源活动并且阐明这变化的起因。个体起源的活动可以从单链 DNA2的水平推断出来, 它形成在活跃起源附近, 或者通过使用2D 凝胶电泳监测特定的复制中间体3, 两者都可以检测到放射性探针。这两种技术在酵母中比在哺乳动物细胞中更容易应用, 因为起源仅限于前者的特定已知序列。随着微阵列的出现, 可以评估全球发射的起源。这首先是通过标记 DNA 与重同位素, 将细胞从 G1 块释放到含有轻同位素的介质中, 然后在基因组4中监测重光杂交 dna 的形成。高通量测序的引入允许类似的全基因组监测源活动, 而不需要昂贵的同位素标记。根据 dna 含量及其 dna 进行深度测序, 对细胞进行排列。由于序列覆盖率从1x 到2x 在 s 阶段过程中进行, 因此可以通过比较 s 阶段中单元格的读深度与 G1 或 G256中的内容来评估相对复制计时。这些技术, 特别是适用于酵母, 导致了更深的理解如何 dna 序列, 染色质结构, 和 dna 复制蛋白调节起源时间和效率。

在细胞增殖过程中, 基因信息的忠实传递不仅需要成功地启动 DNA 复制, 这在起源上发生, 而且复制的成功完成是复制叉相遇的地方。与开始复制一样, 复制完成的时间在整个基因组中都不同, 某些区域甚至在细胞周期的晚期仍未复制。这些区域可能特别远离主动复制的起源, 也可能含有阻碍 DNA 聚合酶的序列或染色质结构。晚期复制区域可以表现为脆弱的站点, 这与染色体断裂和更高的突变率有关, 并且已经牵连到癌症和老化的7,8,9。然而, 尽管正确完成 DNA 复制在维持基因组稳定性方面的重要性, 但我们对其发生地点和方式的理解远远落后于复制启动。虽然研究了晚期复制与疾病有关的个别基因, 例如, qPCR10, 但目前还缺乏旨在阐明晚期复制的地点和根本原因的全球研究。在这里, 我们描述了一种技术, 我们称之为 "G2 序列", 我们结合流式细胞术与高通量测序, 以揭示完成的基因组复制在酵母11。随着小的变化, 这个协议可以适应任何细胞, 可以根据 DNA 的内容流排序。

Subscription Required. Please recommend JoVE to your librarian.

Protocol

1. 流式细胞仪分选细胞的制备

  1. 接种15毫升试管, 每 YEPD 汤8毫升, 这样, 在隔夜生长后, 每毫升的培养量达到 5 x 106到 1.5 x 107细胞的密度 (见讨论说明 1)。
  2. 向下旋转酵母细胞 (1400 x g, 在室温或4°c) 在15毫升螺丝帽离心机管为5分钟, 并用重悬细胞在1.5 毫升70% 乙醇, 并且转移到1.6 毫升离心管, 让这个坐 1 h 在室温或至少 3 h 在冰 (可以无限期地存储在4摄氏度) (参见讨论点 (2))。
  3. 在离心的酵母细胞 (1.4万 x g, 4 °c) 为1分钟, 并用重悬在1毫升50毫米柠檬酸钠, pH 7.2, 旋转下来 (1.4万 x g, 4 °c) 为1分钟, 吸出上清, 并用重悬在1毫升50毫米柠檬酸钠, pH 7。2, 含有0.25 毫克/毫升 RNAse 溶液, 1 小时在50摄氏度或隔夜在37°c 在热块或水浴。
  4. 添加50µL 蛋白酶 K 溶液 (20 毫克/毫升悬浮10毫米三 pH 7.5, 2 毫米 CaCl2, 50% 重到容量甘油) 和孵育 1 h 在50°c。
  5. 自旋下细胞 (1.4万 x g, 4 °c), 并用重悬细胞在1毫升50毫米柠檬酸钠, pH 值 7.2, 旋转下来 (1.4万 x g, 4 °c), 吸出上清与真空, 并用重悬在1毫升1µM 绿色核酸菌株悬浮在50毫米枸橼酸钠, pH 值 7.2, 在黑暗中孵育1小时室温, 油脂实验 2x, 每2秒 (输出功率2瓦)。

2. 细胞分类

  1. 使用细胞分拣器, 根据 DNA 含量将细胞分类为 G1、S、"早期 G2" 和 "晚期 G2", 从每个细胞周期阶段收集至少160万个单倍体细胞, 如图 1 (参见讨论点 (3))。
  2. 将细胞转移到离心管, 在 1.4万 x g 离心4摄氏度时, 将细胞旋转20分钟, 并吸进上清, 真空 (颗粒可无限期贮存在-20 °c 处; 参见讨论点 (4))。

3. DNA 提取和测序库的编制

注: 以下步骤是基于 "协议 I" 在酵母基因组 DNA 提取套件 (见材料表)。

  1. 添加120µL 的 "消化缓冲", 一个专有的缓冲, 允许酵母溶解酶消化细胞壁, 5 µL 酵母裂解酶, 并用重悬涡流, 孵化37°c 40-60 分钟。
  2. 添加120µL 的 "裂解缓冲", 一个专有的缓冲, 其中包含洗涤剂, 和漩涡硬的10二十年代。
  3. 添加250µL 氯仿-混合彻底1分钟。
  4. 在离心中以最大速度旋转2分钟。
  5. 将上清液载入 DNA 结合柱上, 离心机以最大速度在离心1分钟。
  6. 添加300µL "DNA 洗涤缓冲器", 一个专有的缓冲, 其中含有乙醇, 和离心机1分钟的最大速度在一个离心。丢弃流量, 添加300µL 的 DNA 洗涤缓冲液, 重复洗涤过程。
  7. 将旋转柱转移到新鲜的离心管, 添加60µL (不 TE)-等待 1-3 分钟, 然后离心机十年代洗脱的 DNA。
  8. 测量浓度通过添加5µL 的 DNA 到195µL 的 dsDNA 高灵敏度试剂已稀释 1:200 dsDNA 高灵敏度缓冲, 然后测量荧光荧光计, 使用10µL 的提供标准校准;预计10和50的 DNA 总产量。
  9. 油脂实验 (峰值事件功率 450, 值班系数 30%, 周期每突发 200, 治疗时间六十年代, 水位 6), 以打破 DNA 成 250-350 bp 碎片。
  10. 使用 dna 样本准备套件和序列 (至少 1000万 50 bp 单端读取) 在快速模式下的 dna 测序仪上准备一个库 (参见讨论说明 (5))。

4. 对序列数据的分析和复制配置文件的生成

  1. 使用 Gsnap12将序列与酿酒酵母sacCer3 基因组对齐 (请参阅讨论说明 (6))。
  2. 使用 Bedtools "genomeCoverageBed" 软件13确定每基对读取深度。
  3. 删除读深度中的 artefactual 峰值 (如果存在) (请参见讨论说明 (7))。
  4. 用中线在 20 kb 滑动窗口中使用 "runMean" 函数在 R 包 "caTools" 中, 通过染色体平滑读取深度 (参见讨论说明 (8))。
  5. 将 S 阶段、早期 G2 和后期 G2 的读取深度绘制为完全复制的读取深度的百分比 (请参见讨论说明 (9))。

Subscription Required. Please recommend JoVE to your librarian.

Representative Results

我们已经使用上面描述的程序来识别在萌芽的酵母中晚期复制的地点。使用已知的晚期复制区域对人工染色体进行测试, 证明该方法准确可靠。我们的结果还表明, 及时完成复制的生物学重要性表明, 7 号染色体上的一个晚期复制区域在我们的 G2-seq 结果的基础上被识别为晚复制, 大约损失了三倍, 比可比较的控制区域11更频繁。

图 2中显示了带有 G2-seq 的结果的特定示例。我们假设基因组的区域在缺乏蛋白质乙酰称为 Sir2 的细胞中复制得特别晚。图 2A显示了用于野生类型 (蓝色) 和sir2 (red) 的数据分析的进展情况。原始数据 (上一行) 包含较大的峰值, 其中大部分是由于 Ty 元素的存在。这些峰值被取消上限读深度在2.5x 的中间读深度为每个样品 (中间行)。然后用 20 kb 滑动窗口 (下一行) 平滑 despiked 数据。最后, 数据被规范化并绘制为与 G1 中的水平的比值。sir2突变体中出现的典型后期复制区域在图 2C中突出显示。

Figure 1
图 1.流式细胞仪显示细胞周期分数使用;所有门的外部界限标记。请单击此处查看此图的较大版本.

Figure 2
图 2.(A-B)用于野生类型 (A) 和sir2 (B) 的原始数据 (顶行)、despiked 数据 (中间行) 和平滑数据 (下一行) 的数据处理进度。(C) S 阶段、早期 G2 和晚期 G2-to G1 读深度的比率。在蓝色和sir2中为红色的野生类型。右上角的高亮区域显示特定于sir2突变体的后期复制区域。刻度表示完成 (2N) 复制的分数;一个完全未复制的单元格将出现在 0.5, 一个完全复制的单元格在1。请单击此处查看此图的较大版本.

Subscription Required. Please recommend JoVE to your librarian.

Discussion

虽然这项技术是稳健和相对直接的, 但应特别注意以下方面:

(1) 我们建议, 在达到对数阶段之前, 培养至少12小时, 因为在接种后达到所需密度仅为4小时时, 细胞周期分布的差异明显。我们的假设是, 一个已经达到相对稳定的平衡的细胞周期分布比分布在一个饱和的文化最近转移到新鲜的媒介, 更好地代表一个 "真正的" 日志阶段分布。

(2) 通过将100% 乙醇直接添加到酵母培养物中, 而不是在固定前将细胞向下旋转, 以使乙醇的最终浓度为70%。细胞可以生长在合成或丰富 (YEPD) 培养基中。

(3) 通过绘制细胞数作为 530 nm 发射面积的函数, 对细胞周期阶段进行可视化排序。我们发现, G1 和 s 和 G2 之间的拐点是描述 s 相位的有力地标, 我们利用 G2 最大值作为边界来分离早、晚 G2。我们使用 "早期 G2" 和 "晚 G2" 这一术语的清晰度和简洁性, 也许以牺牲准确性为代价, 即细胞在技术上处于 S 阶段, 直到 DNA 复制完成为止。虽然 G2-seq 的目标是确定非常晚复制的网站, 预计将揭示在后期 G2 分数, 我们收集 S 阶段和早期 G2 细胞, 以跟踪复制通过所有阶段的细胞周期。

(4) 在分拣后迅速剥离细胞是至关重要的。不要让细胞在旋转之前过夜。我们有问题恢复细胞的离心, 如果他们已经储存在4摄氏度, 表明他们变得脆弱后, 排序和溶解的时间。

(5) 少量500万读是充足的, 但情节变得不流畅以更低的读数。具有更少读取的数据集可以通过与大于 20 kb 的窗口平滑来容纳, 但我们没有尝试这样做。

(6) 任何广泛使用的对齐软件 (例如、领结14、Novalign (http://www.novocraft.com)、BWA15或 Gsnap12) 都将起作用。

(7) 来自酵母的高通量测序数据显示读深度中偶尔出现的峰值, 这通常反映了 Ty 元素。我们通过将2.5x 中值的读深度替换为在已知的区域之外的读深度 (例如, rDNA), 这些范围大于2.5x 中值, 从而消除了这些。rDNA 和染色体的末端被排除, 因为他们知道包含重复的元素。使用 R 语言的此 "despiking" 示例如下:

# 创建一个名为 "读取" 的数据框, 其中包含数据:
人权 <-代表 ("英联邦倡导", 10)
pos <-序列 (1, 10)
rd <-c (3, 4, 6, 5, 88, 2, 9, 10, 900, 1)

读取 <-数据框 (' 染色体 ' = 人权中心,
"位置" = pos,
"read_depth" = rd)

# "despike" 读取深度:
读 [, ' despiked '] <-ifelse (读 [, 3] > (2.5 * 中间 (读 [, 3])),
(2.5 * 中间 (读 [, 3])),
读 [, 3])

"上限" 或 "despiking" 也可以通过排除映射到多个位置的读取来实现, 但这将消除映射到两个位置的读取。当使用"酵母" 时, 映射到多个位置但仍提供有价值信息的读取实例并不少见, 因为它的基因组源于祖先复制16

(8) 在 r 包 "动物园" (https://cran.r-project.org/web/packages/zoo/index.html) 和 r 包 "caTools" (https://cran.r-project.org/web/packages/caTools/index.html) 中的 "runmean" 函数中, 我们获得了与 "rollmedian" 函数相似的结果。

(9) 我们尝试了许多方法来规范化读深度, 所有这些都给出了类似的结果。我们偏爱的方法是基于这样的假设, 即至少一些基因组区域在我们的 S 相样本中完全复制。我们确定了读取深度, 表示完全复制的中位读取深度在我们的数据集中在对应于12最早的发射高度信心 ("信心" 评分 > = 7) 的网站的起源在公开可用的数据集。(http://cerevisiae.oridb.org/data_output.php?main=sc_ori_studies & table=Raghu2001_ori & ext_format = & 格式 = 制表符)。对于大多数应用程序, 为规范化而采取的方法并不重要, 而且有许多合理的选项, 其中最简单的就是规范化读取计数总计。然而, 值得注意的是, 如果样本之间重复序列的数量存在很大差异, 则规范化到读取计数总计可能会产生误导。例如, 当比较两个 rDNA 阵列不同于几倍的菌株时, 规范化到总读计数可以使应变基因组的某些区域与较大的 rDNA 阵列 artefactually 比应变更晚地复制数组.

总之, G2-seq 表示复制分析的现有技术的逻辑扩展。与其他测序和微阵列技术一样, G2-seq 具有超过2D 凝胶分析的基因组覆盖范围和缺乏对复制起源位置的知识需求。后者在哺乳动物细胞中尤为重要, 与萌芽的酵母不同, 复制的起源并不局限于特定的序列。另一方面, 2D 凝胶提供了一个分辨率的分子中间体的 DNA 复制完全无法达到的 G2-seq. 将 G2-seq 扩展到其他有机体, 其细胞可以根据 DNA 含量排序, 应该是相对直接的,然而, 高真核生物基因组的高度重复性使得短读序列的排列更具挑战性。在这方面, 新出现的测序技术可能会很有用, 特别是因为 G2-seq 应该相对较长的错误率更高, 因为它可以与更大的读取17相关联。在我们的经验中, 最有可能导致问题的技术问题是让细胞在被分类和 DNA 分离之前就可以坐着。这些细胞看起来特别脆弱, 并且随着时间的推移溶解, DNA 应该在最多一两个小时的排序中被隔离。这项技术的未来方向包括将 S 和 G2 相分成越来越多的分数, 以获得更高分辨率的基因组复制的动力学, 从早期开始到晚期完成。

Subscription Required. Please recommend JoVE to your librarian.

Disclosures

作者没有什么可透露的。

Acknowledgments

这项工作得到了葛兰研究院 GM117446 的支持。

Materials

Name Company Catalog Number Comments
YeaStar Genomic DNA kit Genesee Scientific 11-323
1 µM SYTOX Green ThermoFisher 57020 resuspend in 50 mM sodium citrate, pH 7.2
50 mM sodium citrate, pH 7.2
RNase solution (0.25 mg / mL) Sigma R6513 0.25 mg / mL RNaseA resuspended in 50 mM sodium citrate, pH 7.2, boil RNase solution for 10 minutes before the first use only, and from then on store at -20°
proteinase K solution (20 mg / mL) ThermoFisher / Invitrogen 25530-015 resuspend in 10 mM Tris, pH 7.5, 2 mM CaCl2, 50% glycerol, store at -20°C
Model 50 Sonic Dismembrator Fisher Scientific FB50A220
BD Biosciences FACSAria II BD Biosciences 644832
Zymo-spin III columns Zymo Research C1005
Qubit dsDNA HS Assay Kit ThermoFisher Q32851
Qubit 3.0 Fluorometer ThermoFisher Q33216
Covaris Model LE220 Focused-Ultrasonicator Covaris 500219
Illumina TruSeq DNA LT Sample Prep Kit Illumina 15026486
Illumina HiSeq 2500 instrument Illumina SY–401–2501
gsnap alignment software open source software / Genentech http://research-pub.gene.com/gmap

DOWNLOAD MATERIALS LIST

References

  1. Fragkos, M., Ganier, O., Coulombe, P., Mechali, M. DNA replication origin activation in space and time. Nat Rev Mol Cell Biol. 16, 360-374 (2015).
  2. Santocanale, C., Diffley, J. F. A Mec1- and Rad53-dependent checkpoint controls late-firing origins of DNA replication. Nature. 395, 615-618 (1998).
  3. Brewer, B. J., Fangman, W. L. A replication fork barrier at the 3' end of yeast ribosomal RNA genes. Cell. 55, 637-643 (1988).
  4. Raghuraman, M. K., et al. Replication dynamics of the yeast genome. Science. 294, 115-121 (2001).
  5. Muller, C. A., Nieduszynski, C. A. Conservation of replication timing reveals global and local regulation of replication origin activity. Genome Res. 22, 1953-1962 (2012).
  6. Koren, A., Soifer, I., Barkai, N. MRC1-dependent scaling of the budding yeast DNA replication timing program. Genome Res. 20, 781-790 (2010).
  7. Lang, G. I., Murray, A. W. Mutation rates across budding yeast chromosome VI are correlated with replication timing. Genome Biol Evol. 3, 799-811 (2011).
  8. Durkin, S. G., Glover, T. W. Chromosome fragile sites. Annu Rev Genet. 41, 169-192 (2007).
  9. Dillon, L. W., Burrow, A. A., Wang, Y. H. DNA instability at chromosomal fragile sites in cancer. Curr Genomics. 11, 326-337 (2010).
  10. Widrow, R. J., Hansen, R. S., Kawame, H., Gartler, S. M., Laird, C. D. Very late DNA replication in the human cell cycle. Proc Natl Acad Sci U S A. 95, 11246-11250 (1998).
  11. Foss, E. J., et al. SIR2 suppresses replication gaps and genome instability by balancing replication between repetitive and unique sequences. Proc Natl Acad Sci U S A. 114, 552-557 (2017).
  12. Wu, T. D., Reeder, J., Lawrence, M., Becker, G., Brauer, M. J. GMAP and GSNAP for Genomic Sequence Alignment: Enhancements to Speed, Accuracy, and Functionality. Methods Mol Biol. 1418, 283-334 (2016).
  13. Quinlan, A. R., Hall, I. M. BEDTools: a flexible suite of utilities for comparing genomic features. Bioinformatics. 26, 841-842 (2010).
  14. Langmead, B. Aligning short sequencing reads with Bowtie. Curr Protoc Bioinformatics. , Chapter 11, Unit 11 17 (2010).
  15. Li, H., Durbin, R. Fast and accurate short read alignment with Burrows-Wheeler transform. Bioinformatics. 25, 1754-1760 (2009).
  16. Kellis, M., Birren, B. W., Lander, E. S. Proof and evolutionary analysis of ancient genome duplication in the yeast Saccharomyces cerevisiae. Nature. 428, 617-624 (2004).
  17. Goodwin, S., McPherson, J. D., McCombie, W. R. Coming of age: ten years of next-generation sequencing technologies. Nat Rev Genet. 17, 333-351 (2016).

Tags

遗传学 问题 133 晚复制 脆弱的站点 流式细胞术 高通量测序,酿酒酵母 酵母
G2-seq: 一种基于高通量测序技术的基因组晚期复制区域识别方法
Play Video
PDF DOI DOWNLOAD MATERIALS LIST

Cite this Article

Foss, E. J., Lao, U., Bedalov, A.More

Foss, E. J., Lao, U., Bedalov, A. G2-seq: A High Throughput Sequencing-based Technique for Identifying Late Replicating Regions of the Genome. J. Vis. Exp. (133), e56286, doi:10.3791/56286 (2018).

Less
Copy Citation Download Citation Reprints and Permissions
View Video

Get cutting-edge science videos from JoVE sent straight to your inbox every month.

Waiting X
Simple Hit Counter