Click here for the English version

Genetics

植物标本标本的鲁棒 DNA 分离与高通量测序库建设

Published: March 8, 2018 doi: 10.3791/56837

Saman Saeidi*¹, Michael R. McKain*^1,2, Elizabeth A. Kellogg¹

¹Donald Danforth Plant Science Center, ²Department of Biological Sciences, The University of Alabama

* These authors contributed equally

Summary

本文阐述了从植物标本室材料中提取 dna 隔离和高通量测序库的详细协议, 包括抢救异常质量较差的 dna。

Abstract

标本室是一种宝贵的植物材料来源, 可用于各种生物研究。植物标本标本的使用与一些挑战, 包括样本保存质量, 退化的 DNA, 和破坏性抽样稀有标本。为了更有效地利用大型测序工程中的植物标本库材料, 需要一种可靠、可伸缩的 DNA 分离和制备方法。本文展示了一种健壮的, 从不需要对单个样本进行修改的标本标本中进行的 DNA 隔离和高通量库构建的鲁棒的起始到端协议。本协议是为低品质干燥的植物材料量身定做的, 利用现有的方法, 优化组织磨削, 修改库尺寸选择, 并为低产量库引入可选的 reamplification 步骤。低产量 DNA 库的 Reamplification 可以拯救来自不可替代和潜在价值的植物标本标本的样本, 否定额外的破坏性取样的需要, 不引入可识别的顺序偏差, 共同系统进化应用。该议定书已在数以百计的草种上进行了测试, 但预计在验证后能适应其他植物血统的使用。这个协议可以受到极退化的 DNA 的限制, 在那里碎片不存在于所需的大小范围内, 而在某些植物材料中存在的次生代谢物会抑制干净的 dna 分离。总的来说, 该协议引入了一种快速而全面的方法, 允许 DNA 隔离和图书馆准备24样本在少于13小时, 只有8小时的主动动手时间与最小的修改。

Introduction

植物标本集是一个潜在的有价值的物种和基因组多样性的来源的研究, 包括系统学 1, 2, 3, 人口遗传学 4, 5, 保护生物⁶, 入侵物种生物⁷和特征演变⁸。获得丰富多样的物种、种群、地理位置和时间点的能力突出了 "宝箱"⁹ , 即标本馆。从历史上看, 植物标本所衍生的 DNA 退化的性质阻碍了 PCR 的项目, 往往贬低研究人员只使用高拷贝中发现的标记, 如叶绿体基因组的区域或核糖体的内部转录间隔 (其)rna.标本和 DNA 的质量因保存⁹^、¹⁰的方法而有很大的差异, 在干燥过程中使用的热的双绞碎和破碎是最常见的损害形式, 造成所谓的 90% DNA 锁定, 已使基于 PCR 的研究¹¹。除了碎片, 植物标本组学的第二个最普遍的问题是污染, 例如从内生真菌中提取的¹³或真菌在收集后死后被采集, 但在标本室中安装¹²之前, 虽然这个问题可以解决 bioinformatically 给出正确的真菌数据库 (见下文)。第三个和更不常见的问题是通过胞嘧啶脱氨作用 (C/G→T/A⁾14 进行序列修改, 虽然估计在标本^标本11 中的低 (~ 0.03%)。随着高通量测序 (高温超导) 的出现, 碎片问题可以通过短读取和排序深度¹²^,¹⁵来克服, 从而允许从许多质量较低的样本中获取基因组级数据。DNA, 甚至有时允许整个基因组排序¹⁵。

标本室标本越来越多地被使用, 是系统发育项目的一个更大的组成部分¹⁶。目前的挑战是使用植物标本标本为高温超导始终获得足够的双链 DNA, 一个必要的先决条件, 排序协议, 从众多物种及时, 不需要优化的方法, 个别标本.本文介绍了一种利用现有方法进行 DNA 提取和库标本制备的协议, 并对其进行修改, 以实现快速、可复制的结果。该方法允许从标本到24个样本库的完整处理, 在13小时, 具有8小时的动手时间, 或 16 h, 与 9 h 的实际操作时间, 当需要可选的 reamplification 步骤。同时处理更多的样品是可以实现的, 虽然限制因素是离心能力和技术技能。该协议的目的是只需要典型的实验室设备 (thermocycler, 离心机和磁性支架), 而不是专门的设备, 如喷雾器或 sonicator, 为剪切 DNA。

在高通量测序实验中, DNA 质量、片段大小和数量是限制标本标本使用的因素。其他隔离标本室 dna 和创建高通量测序库的方法表明, 使用10的 DNA¹⁶的效用不大;然而, 它们需要实验性地确定图书馆准备所需的最佳 PCR 周期数。当处理极少量可行的双链 DNA (dsDNA) 时, 这种方法变得不切实际, 因为有些标本标本只为单个库的制备提供了足够的 dna。这里提出的方法使用单一数量的周期, 不管样本质量如何, 所以在库优化步骤中没有丢失 DNA。相反, 当库不满足排序所需的最小金额时, 将调用 reamplification 步骤。许多植物标本是罕见的, 并拥有很少的材料, 使得难以证明破坏性抽样在许多情况下。为了对付这一问题, 所提出的协议允许 dsDNA 的输入大小小于1.25 到库的准备过程, 扩大了可行样本的范围, 以高通量测序, 并尽量减少对样本的破坏性抽样的需要。

下面的协议已经为牧草进行了优化, 并在标本室标本上对数以百计的不同物种进行了测试, 尽管我们预计该协议可以应用于许多其他植物群。它包括一个可选的恢复步骤, 可用于保存低质量和/或稀有标本。根据200余种标本标本, 本协议适用于组织投入和质量低的标本, 可通过最小的破坏性抽样保存稀有标本。这里表明, 该协议可以提供高质量的库, 可以为基于 phylogenomics 的项目排序。

Subscription Required. Please recommend JoVE to your librarian.

Protocol

1. 开始前

通过添加20克 CTAB, 使新的烷基铵溴化 (CTAB) 缓冲区¹⁷ , 10 克 polyvinylpyrrolidone (PVP) 40, 100.0 毫升1米三 ph 8.0, 40 毫升四乙酸乙二胺酸 (EDTA) ph 0.5, 8.0 毫升的280.0 米氯化钠, 和5毫升的试剂水一起, 并把总容积1升使用试剂级水。将 pH 值调整为8.0。
注: 附加试剂可添加到 CTAB, 取决于个别分类群中的次生化合物。见艾伦等。¹⁸用于添加试剂的详细列表。
添加10µL 的β巯基乙醇每5毫升的 CTAB 缓冲区。
注: 这可以分批50毫升, 并储存在室温下3–4周。
1. 在65摄氏度的水浴中加热 CTAB 溶液。
冷却迫击炮和杵在-20 °c 至少20分钟。
标签4套 2 x n 2 毫升管 (其中 n = 样本数)。把1套标记的管子放在冰上。
在冰上或在-20 摄氏度冰箱中冷却异丙醇。
从冰箱中移除固相可逆固定化 (SPRI) 珠 (参见材料表), 并允许它们平衡室温 (至少30分钟)。
准备80% 乙醇。
选择标本标本提取和检索〜1厘米², 或10毫克, 每标本组织, 最好叶材料。

2. DNA 提取

用 prechilled 迫击炮和杵研磨 ~ 1 厘米²预选的标本室组织。加入液氮和30–50镁消毒砂。研磨直到组织变成细粉。
注:10 毫克或更多的组织是可取的, 但较少也在某些情况下工作。一旦液氮蒸发, 添加更多的需要, 直到组织完全地面。另一个常见的破坏细胞和组织的方法是使用珠搅拌器。然而, 这种方法被发现对这些实验所用的标本没有很好的效果。
将冷冻粉末转移到两个2毫升管 (增加不超过一半的管的体积)。将600µL 的暖 CTAB 溶液加入每管, 并通过反转和涡流彻底混合管。
注: 由于标本室材料的数量和质量往往很低, 两次重复执行 DNA 分离有助于获得较高的产量。
在65摄氏度水浴中孵化样品, 1–1.5 h, 涡流每15分钟。
离心机样品在 1万 x g 5 分钟. 将上清液转移到一组新的标记管 (~ 500 µL)。使用标准的非氯化处理程序丢弃颗粒。
添加4µL 的 RNase (10 毫克/毫升) 每管和混合通过反转或吹打。在热块或水浴中孵育37摄氏度的样品15分钟。
当管子达到室温后, 添加一个相等体积 (500 µL) 的 25:24:1 phenol:chloroform:isoamyl 酒精混合物。通过吹打和/或反演彻底混合。离心管在 1.2万 x g 15 分钟. 将水层 (上层) 转移到一组新的标记管 (~ 400 µL)。将有机层丢弃到氯化废料容器中。
注: 如果植物材料中预计有大量的次生化合物, 步骤2.6 可能会重复。
添加等量 (400 µL) 的24:1 氯仿: 异戊醇混合物。通过吹打和/或反演彻底混合。离心管在 1.2万 x g 15 分钟. 将水层 (上层) 转移到一组新的 prechilled, 标记管 (~ 300 µL)。将有机层丢弃到氯化废料容器中。
将 prechilled 异丙醇的等量容积 (~ 300 µL) 和2.5 米醋酸钠的12µL 添加到每个管中。孵育样品在-20 °c 为 30–60 min。
注: 潜伏期可以延长 (直至夜间孵化), 但 DNA 质量会降低样品孵化的时间。
取出冰箱里的样品, 将管子离心在 1.2万 x g 的15分钟内, 轻轻地取出并丢弃上清液, 不干扰颗粒。用新鲜的70% 乙醇 (大约300–500µL), 用悬浮液清洗颗粒。对于每一个加倍的样品, 把两个单独的小球合并成一个与伴随的乙醇。
注: 样品应先用乙醇合并成一管, 然后再进行。不需要单独用乙醇清洗每个样品。
离心管在 1.2万 x g 10 分钟去除和丢弃上清, 不干扰颗粒。空气干燥颗粒。
注: 使用干热块 (不超过65摄氏度) 可快速干燥样品。确保样品不会过度干燥, 因为这样可以降低 DNA 的最终产量。
将分离的 DNA 悬浮在50µL 的 1x TE 中。贮存在-20 °c 冷藏柜中, 用于长期贮存或4°c, 供下星期使用。

3. 质量控制 (QC)

用琼脂糖凝胶进行质量检查。
1. 通过添加54克三基、27.5 克硼酸和3.75 克 EDTA 二钠盐, 制备1x 三/硼酸/edta (no) 缓冲液, 使总容积达到5升, 使用试剂级水。
2. 通过添加1克琼脂糖到100毫升 1x, 制备1% 琼脂糖凝胶。微波溶液直到没有琼脂糖可见。添加0.01% 核酸凝胶染色 (请参阅材料表)。让瓶子冷却, 直到它是温暖的触摸。搅拌均匀。将琼脂糖倒入凝胶托盘中, 让它凝固。
3. 混合3µL 的样品, 2 µL 的试剂级水, 1 µL 6x 的负载染料。将样品装入凝胶基质中, 注意它们的顺序。
4. 在 60–70 v 的60–70中运行样品, 在紫外光下对凝胶进行正确的曝光和聚焦。
  注意: 存在一个清晰的高分子量带是高质量 dna 的标志, 而涂片通常表明 dna 降解。大多数标本标本都被降解。
运行 dsDNA 量化分析 (见材料表), 以确定双链 DNA 的数量。
1. 使用2µL 的样品进行分析。
  注: 对标本室材料的定量分析不需要稀释, 因为它们的数量往往很少。成功的图书馆已经从这一步的 dsDNA 总的1.26。

4. DNA 剪切

注意: 这是商业双绞 fragmentase 协议的优化版本 (请参见材料表)。

将 dsDNA 碎片酶放在涡流后的冰上3秒。
在无菌0.2 毫升聚合酶链反应 (PCR) 管, 混合1–16µL 分离的 DNA 与2µL 伴随的碎片反应缓冲。通过添加核酸酶自由水, 将总体积提高到18µL。添加2µL dsDNA 破碎酶和涡旋的混合物为 3 s。
注: 所需 dna 数量因 dna 浓度而异 (瞄准管中的 200)。
将样品孵化37摄氏度, 8.5 分钟。然后添加5µL 0.5 米 EDTA 的管。
注意: 此步骤需要在潜伏期结束后立即执行, 以终止反应并防止 DNA 样品过度剪切。

5. 珠清理

融汇 SPRI 珠涡流。
通过添加25µL 核酸酶游离水, 将被剪切 DNA 的总体积提高到50µL。添加45µL 室温 SPRI 珠 (90% 卷) 到50µL 的剪切 DNA, 并彻底混合吹打上下。
注: 在总试样体积的90% 处添加珠子是为了去除最小的 DNA 片段, 通常低于200基对。
让样品孵化5分钟. 把管子放在磁板上, 让它们坐5分钟. 小心地取出并丢弃上清。
注意: 小心不要打扰珠子, 因为它们含有所需的 DNA 目标。
在磁性支架上加入200µL 新鲜80% 乙醇的管子。在室温下孵化三十年代, 然后仔细去除并丢弃上清。重复此步骤一次。空气干燥的珠子5分钟, 而管是在磁性立场与它的盖子打开。
注意: 避免过度干燥的珠子。这可能导致 DNA 的回收率降低。
把管子从磁铁上取下。洗脱的 DNA 从珠子变成55µL 的 0.1x TE, 并彻底混合吹打上下。在室温下孵育5分钟, 将管子放在磁性支架上, 等待溶液转晴 (~ 2 分钟)。
把上清的52µL。对样品进行 DNA 定量分析, 以检查回收和进入图书馆准备的初始浓度。
注: 图书馆的总 dsDNA 估计不到1.25 吴, 但在每种情况下 reamplification 是必需的。

6. 图书馆准备工作

注意: 这是一个商业上可用的库套件的修改版本 (请参见材料目录协议)。

结束准备
1. 添加3µL 的限制性和磷酸盐尾矿酶, 和7µL 的伴随反应缓冲50µL 清洗, 剪切 DNA。通过上下吹打彻底混合。旋转管子以除去气泡。
  注: 总容积应为60µL。
2. 将样品放在 thermocycler 中, 以下列程序:30 分钟在20°c, 30 分钟在65°c, 然后举行在4°c。
  注: 加热盖设置为≥75°c
适配器结扎
1. 稀释适配器25–50折叠 (工作适配器集中的0.6–0.3 µM)。添加30µL 结扎主混合, 1 µL 结扎增强器, 2.5 µL 适配器的高通量短读测序的管。
  注: 总容积应为93.5 µL。
2. 通过上下吹打彻底混合。旋转管子以除去气泡。将试管孵化20摄氏度, 15 分钟。
3. 添加3µL 的商业混合物的尿 dna glycosylase (UDG) 和 DNA glycosylase 裂解酶限制性 VIII (见材料表) 的管。确保总容积为96.5 µL. 混合彻底和孵化37摄氏度15分钟使用 thermocycler。
  注: 盖子应设置为≥47°c。原始版本的商业协议有大小选择后, 适配器结扎步骤, 其次是珠清理作为最后一步。该协议实现了更高的收益率, 切换这些步骤的顺序, 并实现大小选择作为最后一步。
清除酶和小碎片
1. 融汇磁珠由涡流。
2. 添加78µL SPRI 磁性珠 (80% 卷), 并彻底混合吹打上下。
  注: 在总试样体积的80% 处添加珠子, 以去除最小的 DNA 片段, 这些碎片通常少于250基对。更严格地去除小的 DNA 片断是 (i) 去除多余的适配器和 (ii) 在以下步骤强调放大更大的片断。
3. 让样品孵化5分钟. 把管子放在磁板上5分钟. 小心地移除并丢弃含有所需尺寸范围外的 DNA 的上清。
  注意: 注意不要干扰含有所需 DNA 靶的珠子。
4. 在磁性支架上加入200µL 新鲜80% 乙醇的管子。在室温下孵化三十年代, 然后仔细去除并丢弃上清。重复此步骤一次。空气干燥的珠子5分钟, 而管是在磁性立场与盖子打开。
  注意: 避免过度干燥的珠子。这可能导致 DNA 的回收率降低。
5. 把管子从磁铁上取下。洗脱通过添加17µL 0.1x TE, 并通过上下吹打彻底混合, 将 DNA 目标从珠子中提取出来。
6. 在室温下孵育5分钟, 将管子放在磁性支架上, 等待溶液转晴 (~ 2 分钟)。
7. 把上清的15µL。
PCR 扩增
1. 添加25µL 高保真 PCR 主混合, 5 µL 高吞吐量短读测序库准备 5 ' 底漆, 5 µL 的高通量短读测序库准备 3 ' 底漆, 到15µL 清洗适配器-结扎 DNA。
  注: 总容积应为50µL。
2. 和涡流混合。使用在表 1中找到的设置将示例放入 thermocycler 中: thermocycler 放大设置。
  注: 由于输入 DNA 数量少, 需要大量的循环。

循环步骤	临时.	时间	周期
初始变性	98°c	三十年代	1
变性	98°c	十年代	12
退火/延伸	65°c	七十五年代	12
最终扩展名	65°c	5分钟	1
举行	4°c

表 1: PCR 协议变性、退火和延长时间和温度.对本协议中的试剂进行了温度和时间的优化。如果试剂被改变, 温度和时间应该再优化。

所需库大小的大小选择
注: 此珠子步骤将删除目标范围上方和下方的碎片。
1. 融汇 SPRI 珠涡流。
2. 添加25µL (50% 体积) 室温磁性珠, 并彻底混合吹打上下。让样品孵化5分钟. 把管子放在磁板上, 让它们坐5分钟. 小心地移除和转移上清到一组新的标记管。
  注意: 此卷可以根据所需的库大小进行调整。上清含有所需大小的 DNA 片段。在第一个珠孵化, 珠子是绑定较大的库片段。它们被移除, 以集中于400–600基对范围中的那些。上清中含有较小的碎片。
3. 添加6µL 室温 SPRI 珠到上清, 并彻底混合吹打上下。让样品孵化5分钟. 把管子放在磁板上, 让它们坐5分钟。
  注意: 该卷可以根据所需的库大小进行调整, 按照步骤6.5.2。
4. 小心取出并丢弃上清。
  注意: 注意不要干扰含有所需 DNA 的珠子。在第二个珠孵化, 珠子是绑定到留下的碎片后, 最初删除的最大的 DNA 片段。这组片段通常在所需的大小范围内。
5. 在磁性支架上加入200µL 新鲜80% 乙醇的管子。在室温下孵化三十年代, 然后仔细去除并丢弃上清。重复.空气干燥的珠子5分钟, 而管是在磁性立场与盖子打开。
  注意: 避免过度干燥的珠子。这可能导致 DNA 的回收率降低。
6. 把管子从磁铁上取下。洗脱的 DNA 目标从珠子成33µL 0.1x TE, 并彻底混合吹打上下。
7. 在室温下孵育5分钟, 将管子放在磁性支架上, 等待溶液转晴 (~ 2 分钟)。拉出30µL 的上清, 转移到2毫升管 (参见材料表) 进行存储。
  注意: 图书馆可以保存在-20 ˚C, 用于长期存储。
质量控制
1. 在 DNA 库上运行质量控制测试。请参阅步骤3.1 和3.2。
  注: 对于 DNA 库, 在 96 v 上运行凝胶45分钟。
库 reamplification: 如果库数量不足, 则可选。
注意: 使用以下步骤可以 reamplified 10 nM 以下的样本库浓度。低浓度库的 Reamplification 可以实现排序的可行结果, 但 Reamplification 可能导致基本组成多样性的适度转移, 尽管收集的数据 (表 3) 表明, 对于某些度量标准来说, 这是微不足道的。.
1. 用 0.1x reamplification 稀释普通的引物10倍。
2. 添加25µL 高保真 PCR 主混合, 5 µL 稀释通用 reamplification 底漆 1 (AATGATACGGCGACCACCGA), 5 µL 稀释通用 reamplification 底漆 2 (CAAGCAGAAGACGGCATACGA) 到15µL 低浓度的图书馆。注: 总容积应为50µL。
3. 和涡流混合。使用在表 1中找到的设置将示例放入 thermocycler 中: thermocycler 放大设置
  注: 由于输入 DNA 数量少, 需要大量的循环。
4. 珠清理
5. 融汇 SPRI 珠涡流。添加45µL 室温 SPRI 珠 (90% 卷), 并彻底混合吹打上下。
6. 让样品孵化5分钟. 把管子放在磁板上5分钟。
7. 小心地除去并丢弃含有不需要的 DNA 的上清。
  注意: 注意不要干扰含有所需 DNA 靶的珠子。
8. 在磁性支架上加入200µL 新鲜80% 乙醇的管子。在室温下孵化三十年代, 然后仔细去除并丢弃上清。重复此步骤一次。
9. 空气干燥的珠子5分钟, 而管是在磁性立场与它的盖子打开。
  注意: 避免过度干燥的珠子。这可能导致 DNA 目标的恢复降低。
10. 把管子从磁铁上取下。洗脱的 DNA 目标从珠子成33µL 0.1x TE, 并彻底混合吹打上下。
11. 在室温下孵育5分钟, 将管子放在磁性支架上, 等待溶液转晴 (~ 2 分钟)。
12. 把上清的30µL。这些库可以存储在-20 摄氏度, 用于长期存储。
质量控制
1. 在 DNA 库上运行质量控制测试。请参阅步骤3.1 和3.2。对于 DNA 库, 在 96 v 上运行凝胶45分钟。
  注: 如果在凝胶中看到双带, 这可能是从 reamplification 步骤的底漆耗尽的后果。可以通过重复6.9 移除带区, 但在表 1中描述的 PCR 程序中只使用一个周期。

Subscription Required. Please recommend JoVE to your librarian.

Representative Results

DNA 分离与最终图书馆产量
在这项研究中, 使用五十种不同的样本, 从1920年和2012年最年轻的人 (表 2) 中, 证明了隔离标本室 DNA 和恢复高质量测序库的协议的有效性。对于每个样品, 大约10毫克的叶组织被用于 DNA 分离。绿色的叶子组织是有利的, 如果有, 并且没有被选择的有明显的真菌污染的组织。成功的隔离可以使用黄色或褐色的组织, 虽然产量应预期较低。从最初的隔离中提取的双链 DNA (dsDNA) 的总数从 3.56 ng 到2610。如所料, 从植物标本标本获得的 DNA 高度退化 (图 1A,补充图 1)。这些隔离的一部分用于酶剪切 (1.26–464)。虽然标本室 DNA 已经通过保存过程进行了剪切, 但是优化该协议需要额外的剪切来提高整个库的产量。dsDNA 后的总回收率从 < 1% 到51% 的输入 dsDNA, 使图书馆准备的起始 DNA 至少少于 1.25 ng, 最大为 328 ng。dna 在某些样品中的极度损失, 可以归因于酶剪切之前的大部分 dna 中已经很小的碎片大小 (图 1A,补充图 1)。使用90% 卷珠清理被剪切的 dna 故意删除最小的 dna 片段, 以丰富的更大, 更可取的碎片大小。这些小片段特别在示例 TK463、TK657 和 TK694 中看到, 这是100基对标记 (图 1A) 上的一个强烈信号所表示的。

库后大小选择的总数量从 1.425 ng 到 942.5 ng (表 2, 补充表 1) 不等。对于23的样本, 初始提取和库准备没有产生足够数量的图书馆 (< 10 nM;表 2, 补充表 1), 因此这些示例受到协议的 reamplification 和恢复步骤的执行, 从而导致总库的14–680x 增加 (表 2, 补充表 1)。最终库导致350和500基对之间的频带 (图 1B、补充图 2)。有时, 出现的第二个频带大于预期的库大小 (图 1B、补充图 2)。这种情况发生时, reamplification PCR 用尽可用引物和开始退火图书馆适配器的非同源 DNA 片段。这创造了一个分子, 在那里两端 (适配器) 是正确的退火, 但 DNA 插入没有。这种 "冒泡" 的分子出现在凝胶上较大, 因为它通过凝胶基质缓慢移动。这些退火误差是通过从已经 reamplified 的库中准备另一个 reamplification 反应来确定的, 并在一个周期内运行。这个单一周期提供了适当的退火和放大的底漆, 删除第二个波段 (补充图 3)。

图书馆的 Reamplification 促进了至少10毫微米的最后图书馆集中。这些浓度允许图书馆被稀释为相等的浓度和汇集在相等的表示法, 帮助否认可能出现的问题以不平等的样品质量和排序图书馆产量。如果一个项目的目标是叶绿体基因组测序, 那么所需的总测序量将因不同的血统和组织在来自叶绿体 DNA¹⁹的读数的总百分比上不同而不同。通常, 50–100x 投射的叶绿体基因组的覆盖率足以用于组装, 而测序运行可以汇集多达70个人, 取决于物种和测序方法。

Reamplification 引起的污染、偏差和变异测试
高温超导测序的一个值得关注的问题是通过广泛的 PCR 放大²⁰引入到图书馆的偏见。为了测试 reamplification 在植物标本库中常见的系统发育应用中的潜在偏差, 我们比较了一个成功的测序图书馆 (TK686) 与同一个图书馆稀释1:5 和 reamplified (指定 TK686-R)。TK686 和 TK686-R 都在伊利诺斯州大学罗伊 j. 卡弗生物技术中心和密歇根州立大学研究技术支持设施的 Illumina HiSeq4000 上进行了排序, 分别使用配对的端150基对读取 (请参见表 3用于排序详细信息)。原始读数已存入 NCBI (SRP128083)。使用 Trimmomatic v 0.36²¹进行的读取操作包括使用纳布适配器序列的适配器修剪, 个基对滑动窗口的平均 phred 评分20的质量筛选, 以及40基对的最小截止大小。作为植物标本标本的主要问题之一是真菌污染, 污染是估计通过映射读取的一部分 JGI MycoCosm 真菌基因组数据库²² (312 核基因组和79线粒体基因组) 使用 bowtie2 v.使用 "非常敏感本地" 参数集 2.2.9²³ 。TK686 和 TK686-R 库在核真菌污染 (分别为9.24% 和 9.68%) 和线粒体真菌污染 (0.94% 和 0.8%) 上没有区别。(表 3)。虽然这只是一个例子, 但它确实表明, 植物标本的真菌污染是不可忽略的, 应该在使用植物标本的序列数据之前删除。用于识别和清除真菌污染的数据库和命令可以在磁共振 McKain 的 GitHub 存储库植物标本组学²⁴中找到。

叶绿体基因组测序通常用于系统发育分析, 而标本标本越来越多地用作源材料¹²。为了测试 reamplification 在叶绿体基因组组装中的保真度, TK686 和 TK686-R 的叶绿体基因组在默认设置下使用快速塑料 v 1.2. 5²⁵进行组装, 并将领结索引设置为 Poales。TK686-R 获得完整的叶绿体基因组, 但 TK686 叶绿体基因组聚集成七重叠, 原因是阅读深度较低。TK686 重叠是在 McKain et的情况下手动组装的。²⁶完全组装的叶绿体基因组在基于 GUI 的对齐软件 (参见材料表) 中相互排列, 并评估了程序集之间的变化。在 TK686 和 TK686-R 的叶绿体组件之间发现了总共12个 snp 和一个 indel。对于每个变体, TK686 和 TK686-R 的读取集都对覆盖率进行了评估。在所有情况下, 最常见的变体在两个库之间是相同的。TK686 演示了一个 T→C, 一个 G→A, 一个 G→T, 一个 G→, 一个 C→A, 一个 T→A, 和四 C→A 变形。其中五种变种发生在一个均聚物串中, 这表明它们在组装过程中可能是由于测序误差和整体覆盖率低造成的。其他的可能是叶绿体单体型变异, 排序错误, 或胞嘧啶脱氨作用, 或这些因素的一些组合的结果。TK686-R 有一个 C→T, 一个 G→T, 一个 A→G。C→T 和 G→T 变种被发现在一个可聚物如上面。最终, 完全相同的完整的叶绿体基因组是从两个读集识别。TK686 的单个叶绿体基因组用翠绿的²¹进行了注释, 并与部落 Andropogoneae 的其他成员进行了比较。所有标准叶绿体特征被标注: 8 rRNAs, 38 tRNAs 和84蛋白质编码基因。完整的叶绿体基因组可从基因库 (MF170217) 和翠绿的²⁷中获得。

通过估计 GC 百分比和总估计座子含量, 也确定了图书馆 reamplification 的潜在偏差。使用自定义脚本²⁴估计 GC 百分比。两种样品的 gc 含量差异可忽略不计, 在 TK686-R 中 TK686 和 51.2% gc 中有 49.7% gc。使用 Transposome²⁸估计座子组合。对于这两个库, 都随机 subsampled 10万个读取, 座子组合的估计使用的百分比标识为 90, 分数覆盖率为 0.55, 簇大小为 100, 重复21.10 草重复引用集²⁹。这是重复100次, 以执行座子估计从这些数据集的引导。从 Transposome 输出中提取随着转座子主要亚科的总基因组百分比, 估计100种复制的平均和标准偏差。用于生成这些输出的所有脚本都可以在磁共振 McKain 的 Github 存储库随着转^座子30 中找到, 所有结果都已存入树精 (10.5061/树妖. r8t2m)。使用两个最常用的座子亚科作为指示器 (Copia和吉普赛长终端重复座子), 结果与Copia在 33.52 @ 4.00% 和 31.68 @ 2.94% 和吉普赛在24.83 里几乎完全相同。2.72% 和24.00 在 TK686 和 TK686-R 中分别为2.35% 个 (表 3)。这些测试结果表明, 该协议的 reamplification 步骤并没有为高级别基因组指标创造有意义的排序偏差。但是, 应该指出, 这个单一的例子可能并不完全代表所有 reamplified 库。这个单一的测试表明, reamplification 步骤是没有固有的偏置基因组指标在 TK686/TK686-R。引入偏倚不会影响叶绿体基因组的组装, 因为它有足够的测序覆盖率, 但建议在与 TK686/TK686-R 的研究中提出的实验是在目标血统上进行的, 以验证偏倚不是在调查转座因子元素多样性的研究中发生。

图 1: 琼脂糖凝胶图像 A) DNA 隔离和 B) 最终测序库来自十个标本标本。对于每条车道, 使用了3µL 的 DNA 或图书馆。(A) DNA 在所有标本隔离中均有降解, 如一般涂片所见。(B) 最终测序库描述了300-500 基对的主带, 其分布范围更广, 为200-1、000基对;后者在 reamplified 图书馆更普遍。通过示例标识了两个 (A) 和 (B) 的车道, 可以将其与表 2中的结果进行比较。梯子大小被描述了在基对 (bp)。请单击此处查看此图的较大版本.

图 2: 圆形绘图区Schizachyrium 花棒(TK686) 具有注释的叶绿体基因组.从标本室衍生 DNA 的猎枪测序中完全组装的基因组显示总长度为139296基对 (bp), 一个大单拷贝区域 () 81401 bp, 一个反向重复区域 (IR) 22669 bp 和一个小单一拷贝区域 (SSC) 12557bp.所有标准蛋白编码基因, tRNAs 和 rRNAs 的成员的 Andropogoneae 部落在注释中确定。请单击此处查看此图的较大版本.

表 2:DNA 提取和库准备结果为十个标本室标本和四 reamplified 图书馆.在协议的各个步骤中, 总双链 DNA 显示了可变质量的方式, 尤其是在筛选大小时. 请单击此处下载此表.

表 3: TK686 和 reamplified TK686R 的排序统计信息.Reamplification 不影响真菌基因组污染的总发生率, GC 含量估计, 座子成分估计, 或组装整个叶绿体基因组的能力。请单击此处下载此表.

补充表 1: DNA 提取和库准备结果四十个额外的植物标本, 包括二十个 reamplified 库.协议中各个步骤中的双链 DNA 总计显示了可变质量的方式, 尤其是在筛选大小时. 请单击此处下载此表.

补充图 1: 琼脂糖凝胶图像四十额外 DNA 隔离从标本标本.这两个 (A) 和 (B) 都描述了二十个单独的 dna 隔离, 并表明了植物标本所衍生 dna 的特征降解。对于每条车道, 使用了3µL 的 DNA。通过示例标识了两个 (A) 和 (B) 的车道, 可以将其与补充表 1中的结果进行比较。梯子大小在基对 (bp) 描述。图像上的白色斑点是由于在凝胶成像仪中的手工制品无法通过清洗而去除的。请单击此处下载此图.

补充图 2: 琼脂糖凝胶图像四十额外测序库从植物标本所衍生的 DNA.为每条车道, 使用了3µL 图书馆。最终排序库在两个 (A) 和 (B) 中都找到, 平均大小为300-500 个基对。在一些放大的样本中看到的次要波段暗示着图书馆的 "冒泡"。(A) 和 (B) 的车道由示例标识, 可与补充表 1中的结果进行比较。梯子大小在基对 (bp) 描述。请单击此处下载此图.

补充图 3: 用附加单周期 PCR 步骤去除二次带的琼脂糖凝胶图像.请单击此处下载此图.

Subscription Required. Please recommend JoVE to your librarian.

Discussion

本协议是一种综合可靠的方法, 用于 DNA 分离和测序库的干燥标本的制备。该方法的一致性和最小的需要改变它的基础上标本质量, 使它可伸缩的大型植物标本的排序项目。为低收益库包含一个可选的 reamplification 步骤, 允许包含低质量、低数量、稀有或历史上重要的样本, 否则将不适合排序。

初始 DNA 产量的重要性
标本室衍生的 dna 通常被降级为最初的标本保存¹¹, 与300岁以下的标本 dna 降解为从动物遗骸分离的 dna, 是数以千年的历史³¹^,³². 因此, 初始 DNA 产量的优化对于获得足够高品质的 dsDNA 为成功的测序库准备至关重要。对于草种, 最佳产量是通过在初始研磨步骤中结合使用灭菌的沙子和液氮来实现的, 从而更彻底地破坏细胞壁和释放核酸。此方法增加了可取的较大 dsDNA 和不需要的较小片段 (图 1、补充图 1、表2、补充表 1)。随后的珠清理步骤隔离和丰富了适合于排序 (300–500基对) 的大小片段, 大大减少了恢复, 但也丰富了更长的碎片 (表 2, 补充表 1)。为了减少次级代谢物对下游处理¹⁸的影响, 可能需要根据取样的血统对初始 DNA 隔离步骤进行修改。

图书馆适配器的优化
结扎用适配器的浓度直接影响到成品库中的适配器二聚体的数量。适配器脂肪酸由于存在样本不足而导致适配器自结扎, 并且污染排序运行³³。从标本室标本中获得的总 dsDNA 相对较低, 必须在结扎前稀释适配器。适配器可以从15µM 的库存集中稀释50倍 (请参见协议部分), 方便了高通量库的准备, 而无需单独测量和稀释每个样本的适配器 (表 2, 补充表1). 虽然适配器的饱和度原则上可以降低总的库产量, 但植物标本室标本在这种过量的适配器中不太可能产生 dsDNA。

提高产量的珠清理步骤的变化
测序库编制中的尺寸选择通常是在适配器结扎后进行的, 允许在所需尺寸范围内放大碎片;这是通过删除比目标大小更大、更小的片段来完成的。在这一步的大小选择后, dsDNA 的标本室衍生的低数量的图书馆准备工作更加严重, 导致最终图书馆 unworkably 低总 dsDNA 和最终低产量。通过在结扎后使用90% 卷珠进行标准的珠清洗步骤, 更多的 dsDNA 在放大步骤中保持浓缩。极小的 DNA 片段优先删除使用90% 卷珠。尺寸选择是在放大库的最后一步进行的, 它确保了所需片段大小的丰富性。可以调整珠子的总体积, 以选择所需的范围, 尽管优化了两步卷25µL 和6µL 的珠子, 以检索该协议中400-500 个基对插入的库 (图 1B, 辅助图 2)。

图书馆 Reamplification 的样本救援
尽管在 DNA 隔离和图书馆准备方面的最佳做法, 测序库的最终浓度可能不足以进行进一步的测序。取样的破坏性性质和标本室标本中经常被限制的消耗品并不总是允许重复的 DNA 分离。通过 reamplifying 图书馆多达12个额外的 PCR 周期, 即使是异常糟糕的图书馆也可以保存。标准的底漆对用于放大, 这与双索引或单一的已编制的库协议兼容。reamplification 的主要关注是引入偏倚, 通常是通过减少基因组²⁰中富含 GC 的部分。通过使用高保真聚合酶 (参见材料表), 可能会避免这些潜在的偏差。这是通过序列化库 TK686 和 TK686-R 的 GC 内容的最小变化 (表 3) 来演示的。作为第二个验证, 估计了 TK686 和 TK686-R 的座子内容并没有明显的差异 (表 3)。最后, 该加入的整个叶绿体基因组由 TK686 和 TK686-R 组装而成, 在对两个组件 (图 2、表 3) 之间的 SNP 变化进行密切检查后, 产生了相同的序列。这些测试表明, 标准基因组指标, 如 GC 含量和座子组成, 以及组装完整的叶绿体基因组的能力, 可能不会受到 reamplification 的影响。这就开辟了将标本室标本纳入 phylogenomic 研究的可能性, 而不考虑通过 PCR 引入偏倚。这些 reamplified 库也可以用于序列捕获³⁴, 尽管有必要测试 SNP 调用是否有偏差。建议对每个项目进行小规模的偏倚测试, 以验证是否将偏差引入到排序库中。

限制和可能的修改
尽管这项议定书已经对数以百计的标本标本进行了研究, 但保存不良的组织仍可能在任何步骤中失败。然而, 由于 DNA 提取成功, 图书馆无法从组织中失败, 特别是在通过 reamplification 的图书馆救援之后。可以修改大小选择步骤以针对不同大小的碎片, 或减少在某些最终库中看到的范围很广的片段。与所有基于植物的萃取协议一样, 可能需要采取步骤来去除可能妨碍整个协议的沿袭特定的次级化合物。该协议提供了一种用于草标本标本的 DNA 分离和高通量库准备的标准方法, 通过验证和试验, 可能会修正其他植物血统。

Subscription Required. Please recommend JoVE to your librarian.

Disclosures

作者声明他们没有竞争的兴趣。

Acknowledgments

我们感谢泰勒 AuBuchon-长老, 约旦 Teisher 和克里斯汀娜 Zudock 协助取样标本, 和密苏里植物园, 以获得植物标本标本的破坏性取样。这项工作得到了国家科学基金会 (DEB-1457748) 的资助。

Materials

Name	Company	Catalog Number	Comments
Veriti Thermal Cycler	Applied Biosystems	4452300	96 well
Gel Imaging System	Azure Biosystems	c300
Microfuge 20 Series	Beckman Coulter	B30137
Digital Dry Bath	Benchmark Scientific	BSH1001
Electrophoresis System	EasyCast	B2
PURELAB flex 2 (Ultra pure water)	ELGA	89204-092
DNA LoBind Tube	Eppendorf	30108078	2 ml
Mini centrifuge	Fisher Scientific	12-006-901
Vortex-Genie 2	Fisher Scientific	12-812
Mortar	Fisher Scientific	S02591	porcelain
Pestle	fisher Scientific	S02595	porcelain
Centrifuge tubes	fisher Scientific	21-403-161
Microwave	Kenmore	405.7309231
Qubit Assay Tubes	Invitrogen	Q32856
0.2 ml Strip tube and Cap for PCR	VWR	20170-004
Qubit 2.0 Fluorometer	Invitrogen	Q32866
Balance	Mettler Toledo	PM2000
Liquid Nitrogen Short-term Storage	Nalgene	F9401
Magnetic-Ring Stand	ThermoFisher Scientific	AM10050	96 well
Water Bath	VWR	89032-210
Hot Plate Stirrers	VWR	97042-754
Liquid Nitrogen	Airgas	UN1977
1 X TE Buffer	Ambion	AM9849	pH 8.0
CTAB	AMRESCO	0833-500G
2-MERCAPTOETHANOL	AMRESCO	0482-200ML
Ribonuclease A	AMRESCO	E866-5ML	10 mg/ml solution
Agencourt AMPure XP	Beckman Coulter	A63882
Sodium Chloride	bio WORLD	705744
Isopropyl Alcohol	bio WORLD	40970004-1
Nuclease Free water	bio WORLD	42300012-2
Isoamyl Alcohol	Fisher Scientific	A393-500
Sodium Acetate Trihydrate	Fisher Scientific	s608-500
LE Agarose	GeneMate	E-3120-500
100bp PLUS DNA Ladder	Gold Biotechnology	D003-500
EDTA, Disodium Salt	IBI Scientific	IB70182
Qubit dsDNA HS Assay Kit	Life Technologies	Q32854
TRIS	MP Biomedicals	103133	ultra pure
Gel Loading Dye Purple (6 X)	New England BioLabs	B7024S
NEBNext dsDNA Fragmentase	New England BioLabs	M0348L
NEBNext Ultra II DNA Library Prep Kit for Illumina	New England BioLabs	E7645L
NEBNext Multiplex Oligos for Illumina	New England BioLabs	E7600S	Dual Index Primers Set 1
NEBNext Q5 Hot Start HiFi PCR Master Mix	New England BioLabs	M0543L
Mag-Bind RXNPure Plus	Omega bio-tek	M1386-02
GelRed 10000 X	Pheonix Research	41003-1
Phenol solution	SIGMA Life Science	P4557-400ml
PVP40	SIGMA-Aldrich	PVP40-50G
Chloroform	VWR	EM8.22265.2500
Ethanol	Koptec	V1016	200 Proof
Silica sand	VWR	14808-60-7
Reamplification primers	Integrated DNA Technologies	see text
Sequencher v.5.0.1	GeneCodes

DOWNLOAD MATERIALS LIST

References

Savolainen, V., Cuénoud, P., Spichiger, R., Martinez, M. D. P., Crèvecoeur, M., Manen, J. F. The use of herbarium specimens in DNA phylogenetics: Evaluation and improvement. Plant Syst Evo. 197 (1-4), 87-98 (1995).
Zedane, L., Hong-Wa, C., Murienne, J., Jeziorski, C., Baldwin, B. G., Besnard, G. Museomics illuminate the history of an extinct, paleoendemic plant lineage (Hesperelaea, Oleaceae) known from an 1875 collection from Guadalupe Island, Mexico. Bio J Linn Soc. 117 (1), 44-57 (2016).
Teisher, J. K., McKain, M. R., Schaal, B. A., Kellogg, E. A. Polyphyly of Arundinoideae (Poaceae) and Evolution of the Twisted Geniculate Lemma Awn. Ann Bot. , (2017).
Cozzolino, S., Cafasso, D., Pellegrino, G., Musacchio, A., Widmer, A. Genetic variation in time and space: the use of herbarium specimens to reconstruct patterns of genetic variation in the endangered orchid Anacamptis palustris. Conserv Gen. 8 (3), 629-639 (2007).
Wandeler, P., Hoeck, P. E. A., Keller, L. F. Back to the future: museum specimens in population genetics. Tre Eco & Evo. 22 (12), 634-642 (2007).
Rivers, M. C., Taylor, L., Brummitt, N. A., Meagher, T. R., Roberts, D. L., Lughadha, E. N. How many herbarium specimens are needed to detect threatened species? Bio Conserv. 144 (10), 2541-2547 (2011).
Saltonstall, K. Cryptic invasion by a non-native genotype of the common reed, Phragmites australis, into North America. PNAS USA. 99 (4), 2445-2449 (2002).
Besnard, G., et al. From museums to genomics: old herbarium specimens shed light on a C3 to C4 transition. J Exp Bot. 65 (22), 6711-6721 (2014).
Särkinen, T., Staats, M., Richardson, J. E., Cowan, R. S., Bakker, F. T. How to open the treasure chest? Optimising DNA extraction from herbarium specimens. PLoS ONE. 7 (8), e43808 (2012).
Harris, S. A. DNA analysis of tropical plant species: An assessment of different drying methods. Plant Syst Evo. 188 (1-2), 57-64 (1994).
Staats, M., et al. DNA damage in plant herbarium tissue. PLoS ONE. 6 (12), e28448 (2011).
Bakker, F. T., et al. Herbarium genomics: plastome sequence assembly from a range of herbarium specimens using an Iterative Organelle Genome Assembly pipeline. Bio J of the Linn Soc. 117 (1), 33-43 (2016).
Camacho, F. J., Gernandt, D. S., Liston, A., Stone, J. K., Klein, A. S. Endophytic fungal DNA, the source of contamination in spruce needle DNA. Mol Eco. 6 (10), 983-987 (1997).
Hofreiter, M., Jaenicke, V., Serre, D., Von Haeseler, A., Pääbo, S. DNA sequences from multiple amplifications reveal artifacts induced by cytosine deamination in ancient DNA. Nucl Acids Res. 29 (23), 4793-4799 (2001).
Staats, M., et al. Genomic treasure troves: Complete genome sequencing of herbarium and insect museum specimens. PLoS ONE. 8 (7), e69189 (2013).
Bakker, F. T. Herbarium genomics: skimming and plastomics from archival specimens. Webbia. 72 (1), 35-45 (2017).
Doyle, J. J., Doyle, J. L. A rapid DNA isolation procedure for small quantities of fresh leaf tissue. Phytochem Bul. 19, 11-15 (1987).
Allen, G. C., Flores-Vergara, M. A., Krasynanski, S., Kumar, S., Thompson, W. F. A modified protocol for rapid DNA isolation from plant tissue using cetryltrimethylammonium bromide. Nat Prot. 1, 2320-2325 (2006).
Twyford, A. D., Ness, R. D. Strategies for complete plastid genome seqeuncing. Mol Eco Resour. , (2016).
Aird, D., et al. Analyzing and minimizing PCR amplification bias in Illumina sequencing libraries. Genome Bio. 12 (2), R18 (2011).
Bolger, A. M., Lohse, M., Usadel, B. Trimmomatic: A flexible trimmer for Illumina sequence data. Bioinf. 30, 2114-2120 (2014).
Grigoriev, I. V., et al. MycoCosm portal: gearing up for 1000 fungal genomes. Nucl Acids Res. 42 (1), D699-D704 (2014).
Langmead, B., Salzberg, S. L. Fast gapped-read alignment with Bowtie 2. Nat Meth. 9 (4), 357-359 (2012).
McKain, M. R. Herbarium Genomics. , Github Repository https://github.com/mrmckain/ (2017).
McKain, M. R., Wilson, M. A. Fast-Plast: Rapid de novo assembly and finishing for whole chloroplast genomes. , Github Repository https://github.com/mrmckain/ (2017).
McKain, M. R., McNeal, J. R., Kellar, P. R., Eguiarte, L. E., Pires, J. C., Leebens-Mack, J. Timing of rapid diversification and convergent origins of active pollination within Agavoideae (Asparagaceae). Am J Bot. 103 (10), 1717-1729 (2016).
McKain, M. R., Hartsock, R. H., Wohl, M. M., Kellogg, E. A. Verdant: automated annotation, alignment, and phylogenetic analysis of whole chloroplast genomes. Bioinf. , (2016).
Staton, S. E., Burke, J. M. Transposome: A toolkit for annotation of transposable element families from unassembled sequence reads. Bioinf. 31 (11), 1827-1829 (2015).
Bao, W., Kojima, K. K., Kohany, O. Repbase Update, a database of repetitive elements in eukaryotic genomes. Mobile DNA. 6 (1), 11 (2015).
McKain, M. R. Transposons. , Github Repository https://github.com/mrmckain/ (2017).
Weiß, C. L., et al. Temporal patterns of damage and decay kinetics of DNA retrieved from plant herbarium specimens. Royal Soc Open Sci. 3 (6), 160239 (2016).
Sawyer, S., Krause, J., Guschanski, K., Savolainen, V., Pääbo, S. Temporal patterns of nucleotide misincorporations and DNA fragmentation in ancient DNA. PLoS ONE. 7 (3), e34131 (2012).
Head, S. R., et al. Library construction for next-generation sequencing: overviews and challenges. BioTechniques. 56 (2), 61-64 (2014).
Grover, C. E., Salmon, A., Wendel, J. F. Targeted sequence capture as a powerful tool for evolutionary analysis. Am J Bot. 99, 312-319 (2012).

Genetics

植物标本标本的鲁棒 DNA 分离与高通量测序库建设

Summary

Abstract

Introduction

Protocol

Representative Results

Discussion

Disclosures

Acknowledgments

Materials

References

Tags

Cite this Article

Summary

Abstract

Introduction

Protocol

Representative Results

Discussion

Disclosures

Acknowledgments

Materials

References

Tags

Cite this Article

Get cutting-edge science videos from JoVE sent straight to your inbox every month.