Genetics

用于下一代测序的近全长 HIV-1 Proviruses 的扩增

Published: October 16, 2018 doi: 10.3791/58016

Bonnie Hiener¹, John-Sebastian Eden¹, Bethany A. Horsburgh¹, Sarah Palmer¹

¹Centre for Virus Research, The Westmead Institute for Medical Research, University of Sydney

Summary

全长单个前病毒测序 (翻转) 为单、近全长 (完好和有缺陷) HIV-1 proviruses 的扩增和测序提供高效和高通量的方法, 并可确定其电位复制能力。翻转克服了先前用于序列化潜伏 HIV-1 油藏的检测的局限性。

Abstract

全长单个前病毒测序 (翻转) 检测是一种高效和高通量的方法, 旨在放大和序列单, 接近全长 (完好和缺陷), HIV-1 proviruses。翻转允许在细胞种群内测定综合 HIV-1 的基因组成。通过识别在反转转录过程中出现的 HIV-1 前病毒序列中的缺陷, 如大的内部删除、有害的停止密码子/超变异、移码突变以及 cis 作用元素所需的突变/删除对于 virion 成熟, 翻转可以识别无法复制的集成 proviruses。翻转检测可用于识别缺乏这些缺陷的 HIV-1 proviruses, 因此可能具有复制能力。翻转协议涉及: HIV-1 感染细胞的裂解, 近全长 HIV-1 proviruses 的嵌套 PCR (使用 HIV-1 5 ' 和 3 ' LTR 的引物), DNA 纯化和定量, 用于下一代测序 (ngs) 的库准备, ngs,前病毒重叠的从头组装, 以及一个简单的消除过程, 用于识别具有复制能力的 proviruses。翻转提供了优于传统方法的优势, 它们用于序列化集成 HIV-1 proviruses (如单前病毒测序)。翻转放大和序列接近全长 proviruses 启用复制能力被确定, 也使用较少的扩增引物, 防止底漆不匹配的后果。翻转是了解综合 HIV-1 proviruses 的遗传景观的有用工具, 特别是在潜伏油藏内, 然而, 它的利用可以扩展到任何应用, 在其中需要综合 HIV-1 的基因组成。

Introduction

潜伏 HIV-1 水库的遗传表征, 在长期抗逆转录病毒疗法 (ART) 的个人中仍然存在, 对于理解大多数综合 proviruses 是有缺陷和复制不称职的¹至关重要的。^,². 在反转转录过程中, 错误被引入到集成的前病毒序列中。产生缺陷前病毒序列的一些机制包括容易出错的 HIV-1 逆转录酶³、模板切换⁴和/或 APOBEC 诱导的超变异⁵^、⁶。最近的两项研究发现, 从长期艺术中分离出来的 HIV-1 proviruses 约有5% 是基因完整的, 可能是复制能力强的, 并且可能有助于 HIV-1 血浆水平在停止艺术时迅速反弹。¹^,²^,⁷. 以前的研究发现, 具有复制能力的 HIV-1 proviruses 在天真和静止记忆 CD4⁺ T 细胞子集 (包括中枢、过渡和效应器记忆 T 细胞) 中持续存在, 表明针对这些细胞在未来根除战略²^,⁸^,⁹。

通过利用单前病毒测序 (SPS) 方法, 对 HIV-1 基因组的子基因组区域进行遗传表征, 初步了解潜伏 HIV-1 油藏的分布、动态和维护情况¹⁰ ^,¹¹^,¹²^,¹³。SPS 是一个多才多艺的工具, 能够从单个感染的细胞中序列一个单一的 HIV-1 能。但是, SPS 无法确定 proviruses 的复制能力, 因为它只序列子基因组区域, 并且遗漏了在引物绑定站点内包含大量删除的 proviruses。先前的一项研究表明, SPS 通过选择性地测序完整的子基因组区域², 将复制能力高估的储层大小调整为13至17倍。

为了解决 SPS 的局限性, 何等。⁴和布鲁纳等。¹开发了接近全长 HIV-1 proviruses 序列的检测。这使得基因完整的频率和潜在的复制能力, HIV-1 proviruses 在个人上长期的艺术要确定。这些检测放大和排序 (通过桑格测序) 子基因组区域, 然后组装, 以获得一个序列 (完整或有缺陷) HIV-1 能。三这种方法的局限性是: 1) 使用多个测序引物增加了无意中引入缺陷到前病毒序列的风险, 2) 底漆不匹配可能会阻止特定 proviruses 的放大, 3) 通常由于这些方法的技术性, 无法解决整个前病毒序列。

为了克服现有全长 HIV-1 前病毒测序检测的局限性, 我们开发了Full 胜任I个体 Proviral Sequencing (翻转) 测定法。翻转是一种基于下一代测序 (NGS) 的检测方法, 可在高通量和高效方式下放大和序列接近全长 (完好或有缺陷) HIV-1 proviruses。翻转比以前的检测具有优势, 因为它限制了所使用的引物的数量;因此, 它减少了引物不匹配的几率, 这可能会限制捕获的 proviruses 的种群或无意中将缺陷引入病毒序列。翻转在技术上比以前的检测方法更不具挑战性, 并且涉及6主要步骤: 1) HIV-1 感染细胞的裂解, 2) 通过嵌套 PCR 进行 HIV-1 proviruses 的扩增, 使用特定于高度守恒的引物进行限制稀释HIV-1 5 ' 和 3 ' U5 LTR 区域 (图 1A), 3) 扩增产品的纯化和量化, 4) 图书馆为 ngs、5) ngs 和6的扩增 proviruses 进行了编序 proviruses, 以获得每个重叠个人能。

由翻转生成的序列可以经过严格的消除过程来识别那些基因完整且可能具有复制能力的 (图 1C)²。基因完整的 proviruses 缺乏所有已知的缺陷, 导致产生复制不称职的能。这些缺陷包括: 反转序列, 大内部删除, 超变异/有害停止密码子, frameshifts, 或突变在 5 ' 包装信号或主要剪接捐赠者 (MSD) 站点。

图 1: 全长单个前病毒测序 (翻转) 检测中的关键步骤.(A) HIV-1 DNA 基因组与引物结合点在 5 ' 和 3 ' U5 LTR 区域使用由翻转通过嵌套 PCR 放大接近全长 (缺陷和完好) HIV-1 proviruses。(B) 96 孔 PCR 板的布局, 其中包含80个采样孔 (每稀释20个孔)、4负控制井和1正控制井。(C) 消除过程, 用于识别基因完整的、可能具有复制能力的 HIV-1 proviruses。这个数字已经从 Hiener等修改。².请点击这里查看这个数字的更大版本.

Protocol

这里描述的所有方法都已被加州大学旧金山分校和西悉尼当地卫生区的机构审查委员会批准, 其中包括韦斯特米德医学研究所。

1. HIV-1-infected 细胞的裂解

注: 细胞可能与外周血、leukapheresis 样本、骨髓活检或组织活检分离。细胞种群可以使用荧光活化细胞分类 (流式) 进行排序。

制备含有10毫米三盐酸盐、0.5% Nonidet P-40、 0.5% Tween-20 和0.3 毫克/毫升蛋白酶 K 的裂解缓冲液。对于细胞颗粒, 每 1 x 10⁶细胞添加100µL 裂解缓冲液。移液器上下混合。孵育在55摄氏度1小时后85摄氏度15分钟裂解细胞和释放基因组 DNA PCR 扩增。
注: 细胞裂解足以获得基因组 DNA 进行扩增。不需要 DNA 分离或纯化。该协议可以暂停在这一点上, 基因组 DNA 可以存储在-20 °c 无限期。

2. 通过嵌套 PCR 扩增单 HIV-1 DNA Proviruses

将表 1中列出的第一轮 PCR (PCR1) 的试剂混合 (见材料表)。将38µL 的主混料添加到1孔 PCR 板的85孔 (80 个样本、4个负控制、96正控制) 中 (按照图 1B中的布局)。指定此板 "PCR1"。

试剂	最终浓度	PCR1 板容积 (µL)	PCR2 板容积 (µL)
正向底漆	1µM	32。3	23。8
反向底漆	1µM	32。3	23。8
缓冲器 (10x)	1x	323	238
MgSO₄ (50 毫米)	2毫米	129。2	95。2
dNTP (10 毫米)	0.2 毫米	64。6	47。6
DNA 聚合酶 (5 U/µL)	0.025 U/µL	16。2	11。9
超纯 H₂O		2632。5	1939。7

表 1:PCR 主混合物的试剂和体积.

注意: 用于 PCR1 的引物是:
BLOuterF: 5 '-AAATCTCTAGCAGTGGCGCCCGAACAG-3 ' (HXB2 位置 623-649)
BLOuterR: 5 '-TGAGGGATCTCTAGTTACCAGAGTC-3 ' (HXB2 位置 9662-9686)

在准备好主混合物后, 将 PCR1 板移至指定用于添加基因组 DNA 的清洁区域。
1. 序列稀释基因组 DNA 从1:3 到1:81 与三盐酸 (5 毫米, pH 8), 为每稀释准备45µL (足够为每稀释20井)。将2µL 的稀释基因组 DNA 添加到每个样品井, 2 µL (5 mM, pH 8) 到每个负控制井 (按照图 1B中的布局)。密封 PCR1 板的所有井, 不包括正控制井, 使用透明粘合剂密封 (见材料表)。
  注: 上述推荐的稀释剂仅用作确定终点稀释的起始指南。稀释将取决于样品中集成 HIV-1 DNA 的浓度。
移到指定用于添加正控制的区域。将2µL 的阳性对照 (pNL4-3 稀释到 10⁵份/µL) 到 PCR1 板的正控制井中, 并密封板。在 PCR 板微调器或离心机中短暂旋转 PCR1 板 (在室温下为十年代的 400 x g ), 从井侧提取残余物。
在利政中运行 PCR1 板:94 摄氏度, 2 分钟;然后94°c 为三十年代, 64 °c 三十年代, 68 °c 10 分钟3周期;94°c, 三十年代, 61 摄氏度三十年代, 68 °c 10 分钟3周期;94°c, 三十年代, 58 摄氏度三十年代, 68 °c 10 分钟3周期;94°c, 三十年代, 55 摄氏度三十年代, 68 °c 10 分钟21周期;然后68°c 10 分钟 (总共30个周期)。保持在4摄氏度。
注意: 该协议可以在这里暂停和 PCR1 板保持在4°c 长达2天。
混合在表 1中列出的第二轮 PCR (PCR2) 的试剂。在新的1孔 PCR 板上添加28µL 至85孔 (80 个样本、4个负控制、96正控制) (按照图 1B中的布局)。指定此板 "PCR2"。

注意: 用于 PCR2 的引物是:
275F: 5 '-ACAGGGACCTGAAAGCGAAAG-3 ' (HXB2 位置 646-666)
280R: 5 '-CTAGTTACCAGAGTCACACAACAGACG-3 ' (HXB2 位置 9650-9676)

在 PCR 板微调器或离心机中短暂旋转 PCR1 板 (在室温下为十年代的 400 x g ), 从井侧提取残余物。将三盐酸 (5 mM, pH 8) 的80µL 添加到 PCR1 板的每个孔中。
1. 使用多通道移液器将 PCR1 板的2µL 转移到 PCR2 板上。确保样品顺利转移 (即PCR1 板 A1 的2µL 转移到 PCR2 板的井 A1)。使用透明粘合剂密封 PCR2 板 (见材料表)。
2. 在 PCR 板微调器或离心机中短暂旋转 PCR2 板 (在室温下为十年代的 400 x g ), 从井侧提取残余物。用热封膜密封 PCR1 板, 在-20 摄氏度 (见材料表) 上长期贮存。
在利政中运行 PCR2 板:94 摄氏度, 2 分钟;然后94°c 为三十年代, 64 °c 三十年代, 68 °c 10 分钟3周期;94°c, 三十年代, 61 摄氏度三十年代, 68 °c 10 分钟3周期;94°c, 三十年代, 58 摄氏度三十年代, 68 °c 10 分钟3周期;94°c, 三十年代, 55 摄氏度三十年代, 68 °c 10 分钟31周期;然后68°c 10 分钟 (总共40个周期)。保持在4摄氏度。
注意: 该协议可以在这里暂停和 PCR2 板保持在4°c 长达2天。
在 PCR 板微调器或离心机中短暂旋转 PCR2 板, 从井侧提取残余物。使用多通道移液器, 将三盐酸 (5 mM, pH 8) 的60µL 添加到每个井中。
1. 运行15µL 每井 2 x 48 井预制1% 琼脂糖凝胶含有溴化乙锭 (0.1 \ u20120.3 µg/毫升, 见材料表)。使用范围高达 10 kb 的梯子 (参见材料表)。可视化以识别包含放大产品及其近似大小的井。保存凝胶图像。
  注: 确保正控制井包含放大产品。如果负控制井包含放大的产品, 考虑污染和无视板。
确定被放大的产品中不超过30% 的油井是正的稀释。
注: 这是最终点稀释, 其中大多数 (80%) 的油井包含放大的产品从一个单一的模板。这种稀释应在随后的 PCRs 中制备和使用, 以获得进一步的前病毒扩增子。记录每个放大产品的近似大小。

3. DNA 纯化和定量

在 PCR 板微调器或离心机中短暂旋转 PCR2 板, 从井侧提取残余物。将40µL 从含有放大产品 (在终点稀释的位置或下方) 的井中转移到一个新的96孔中长板 (井容积为 0.8 mL, 见材料表)。
注: 在电子表格中记下每个放大产品的原始位置和新井位, 作为每个放大产品的记录进行排序。
使用磁珠 PCR 纯化试剂盒 (见材料表) 去除引物、核苷酸、酶、油和盐, 纯化扩增的 DNA 产品。开始前, 将磁珠带到室温, 准备新鲜的80% 乙醇。适当时使用新的移液器提示, 避免 DNA 样本交叉污染。
1. 涡磁珠, 确保它们完全重悬。使用多通道移液器, 在 0.8 mL 96 孔 midi 板中添加40µL 珠子到放大产品的40µL。轻轻的移液器向上和向下10次混合。或者, 将该溶液密封, 然后在 1800 rpm 的微孔板振动筛上摇动2分钟, 然后在室温下孵育5分钟。
2. 将盘子放在磁性支架上 (见材料表) 2 分钟, 取出并丢弃上清液。
3. 通过在支架上添加200µL 80% 乙醇, 并将其与板材配合使用, 洗涤珠子。在室温下孵育三十年代. 移除并丢弃上清。重复一次。使用多通道移液器和细吸头, 在第二次洗涤后去除多余的乙醇。在支架上的板, 让珠子空气干燥15分钟。
4. 从支架上取下板。将30µL 的洗脱缓冲液 (见材料表) 添加到每个井中。轻轻的移液器向上和向下10次混合。或者, 将该溶液密封, 然后在 1800 rpm 的微孔板振动筛上摇动2分钟, 然后在室温下孵育2分钟。
5. 将盘子放在磁性支架上2分钟. 使用多通道移液器, 将25µL 上清 (纯化 DNA) 转移到新的96孔 PCR 板上。确保样品顺利转移 (即, 0.8 毫升板中 A1 的上清液转移到新96孔板的井 A1)。
  注: 5 uL 的洗脱样品留在后面, 以确保不转移残余纯化珠。
使用分光光度计 (波长为 260 nm 的吸光度), 确定并记录每个放大后的 DNA 产品的近似浓度。
注意: 在这个阶段, 测量每个放大产品的近似浓度是必要的, 以确保在纯化步骤中没有样品丢失, 并且近似浓度在下一阶段使用的标准曲线范围内 (0.001–1 ng/µL DNA 在100µL 的体积)。该协议可以在这里暂停和清洁的样品可以存储在-20 °c 长达6月。
使用 dsDNA 定量试剂盒量化每个纯化产品的 DNA 浓度 (见材料表)。
注意: 这涉及到使用标准曲线来确定样品中 dsDNA 的浓度。该试剂盒包括缓冲液 (10 毫米三盐酸, 1 毫米 EDTA, pH 7.5), 耐磨达 dsDNA 标准和荧光染料。把所有的试剂放在冰上。用铝箔覆盖含染料的管子, 避免暴露在光线下。三份测量每个放大产品的浓度。
1. 稀释缓冲液至1x 无菌 DNase₂o. 将99µL 的缓冲液添加到适当数量的空井 (要测量的放大产品的3倍, 见表 2中的示例布局) 的扁平底组织培养板。将100µL 的缓冲液添加到3个空白井中。
2. 对于要测量的每个放大的产品, 将1µL 纯化 DNA (从步骤 3.2.5) 添加到每个包含缓冲区的井中 (参见表 2中的示例布局)。
3. 要准备标准, 稀释耐磨达 dsDNA 10 倍从 2 ng/µL 到 0.002 ng/µL. 将每个µL 标准的 100 dsDNA 添加到3孔。
  注: 以下步骤 3.4.4, 标准的最终浓度将介于1至 0.001 ng/µL
4. 用缓冲器稀释荧光染料1:200。快速将100µL 添加到包含样品、毛坯和标准的每个井中。用吸管混合上下。用箔盖板以避免接触光。
5. 在微孔板读取器上读取荧光发射 (激发在 480 nm, 发射在 520 nm)。在电子表格中记录结果。
6. 使用记录的荧光测量测定每个样品中 dsDNA 的浓度。从样品和标准中减去在空白井中测量的荧光。从且中确定每个样品和标准的平均荧光。根据标准的荧光测量得出标准曲线。确定样品的浓度相对于标准。

一个

标准 (1 ng/毫升)

标准 (0.1 ng/毫升)

标准 (0.01 ng/毫升)

标准 (0.001 ng/毫升)

空白

100毫升

100毫升缓冲器

标准 (1 ng/毫升)

标准 (0.1 ng/毫升)

标准 (0.01 ng/毫升)

标准 (0.001 ng/毫升)

空白

100毫升

100毫升缓冲器

标准 (1 ng/毫升)

标准 (0.1 ng/毫升)

标准 (0.01 ng/毫升)

标准 (0.001 ng/毫升)

空白

100毫升

100毫升缓冲器

示例 1:

示例 2:

示例 3:

示例 4:

示例 5:

示例 6:

示例 7:

示例 8:

示例 9:

示例 10:

示例 11:

示例 12:

1毫升 DNA + 99 毫升缓冲液

电子邮件

示例 1:

示例 2:

示例 3:

示例 4:

示例 5:

示例 6:

示例 7:

示例 8:

示例 9:

示例 10:

示例 11:

示例 12:

1毫升 DNA + 99 毫升缓冲液

示例 1:

示例 2:

示例 3:

示例 4:

示例 5:

示例 6:

示例 7:

示例 8:

示例 9:

示例 10:

示例 11:

示例 12:

1毫升 DNA + 99 毫升缓冲液

表 2: 用于定量 dsDNA 的96孔板的示例布局。

稀释每个纯化的产品 (在步骤3.2.5 中获得) 与 H₂O 至 0.2 ng/µL。

4. 排序库准备

使用 ngs dna 库制备试剂盒为 ngs 制备放大和纯化的前病毒 dna (见材料表)。按照制造商的说明进行所有 tagmentation、PCR 扩增和清理步骤 [除了包括输入 DNA (从步骤 3.5) 中的反应体积可以减半, 以延长库制备试剂的使用]。
使用基于 qPCR 的 NGS 库量化工具包 (参见材料表) 手动规范化库, 以确定能的单个浓度。将等摩尔中的单个能库合并为 4 nM 的最终浓度, 或由排序服务提供程序指定。
注意: 协议可以在这里暂停, 池库存储在-20 摄氏度。
使用步骤3.4 中使用的相同 dsDNA 量化工具包量化最终池库。按照制造商的说明进行操作。通过使用适当的试剂盒在自动电泳系统上运行1µL 池库, 确定平均片段长度 (参见材料表)。使用浓度和平均片段长度来确定共用库的摩尔浓度。
将共用库的5µL 与5µL 0.2 N 氢氧化钠相结合, 变性库。加入5µL 200 毫米三盐酸来中和。在测序前立即使用冷冻杂交缓冲液稀释最终库至 12.5 pM (可与 DNA 库制备试剂盒一起使用)。
在适当的 NGS 平台上执行 2 x 150 核苷酸 (nt) 配对端排序 (见材料表)。
注意: 每次运行时索引96前病毒库时, 这将产生大约2000万个配对端读取每运行或20万次读取每个单独的能库进行分析后再多路复用。步骤4.4 和4.5 通常由排序工具执行。

5. 序 HIV-1 Proviruses 的从头组装

注意: 为了获得每个放大的能的遗传序列, 重叠是从配对端读取中从头组装而来的。许多平台 (例如, CLC 基因组学工作台¹⁴), 允许设计自定义工作流的全新装配。其他开源软件, 如 FastQC¹⁵、Trimmomatic¹⁶、Cutadapt¹⁷和 FLASH¹⁸也可用于处理读取, 以及工具, 如 Bowtie2¹⁹和黑桃²⁰用于读取映射和从头组装。下面概述了 HIV-1 重叠使用特定商业平台 (参见材料表) 的全新组装步骤 (图 2)。可根据要求提供自定义工作流文件。

导入序列和检查质量: 将配对序列读取 (以 fastq 格式) 导入到软件中, 然后将其合并为单组配对读取。生成序列 QC 报告并检查数据的质量。
质量控制
1. 根据 QC 报告执行读取修剪。删除任何适配器序列和不明确的核苷酸。修剪十五 5 ' 和两个 3 ' 末端核苷酸。丢弃长度小于50核苷酸的读取。使用严格的质量限制0.001 对应的 QC phred 评分30。
合并重叠对
1. 通过将已配对的正向和反向读取与重叠区域合并, 形成单个扩展读取。
从头组装
1. 使用本机 CLC 基因组学新汇编与一个字 (或 k mer) 大小 30 nt 和最大气泡大小 65 nt 组装随机小子1万非重叠配对读取。对于全新组装的 contig , 预期覆盖率为 ~ 9 kb 序列的 200 x。
  注意: 此次像素采样可以减少计算负担, 以便大多数标准台式计算机可以处理装配和分析, 并考虑到每个能的克隆性 (一个库是一个能), 这不会限制多样性。
将所有读取重新映射到重叠
1. 要获得每个能的最终多数共识序列, 请将完整读取集映射到全新组装的 contig。仅接受最小平均覆盖率为1,000x 的重叠, 并确保最终 contig 长度对应于原始琼脂糖凝胶上的波段大小 (步骤 2.8.1)。将最终多数协商一致序列保存为. fasta 文件。
  注意: 大多数重叠可以使用上述步骤进行组装。但是, 在某些情况下, 对于单个能, 会装配具有类似覆盖范围的多个重叠。在这种情况下, 重叠与来自同一参与者的近乎全长 (约 9 kb) 的共识序列对齐, 并手动组装成单个 contig。所有读取然后映射到手动组装的 contig 和最终协商一致接受, 如果读覆盖率甚至整个程序集和没有单核苷酸多态性 (snp) > 40% 存在。
进一步的质量控制
1. 为了确保每个 contig 代表单个能, 而不是由于单个井内多个 proviruses 的放大, 屏幕读取覆盖率和最终 contig 的变体调用。
2. PCR 过程中存在的多个前病毒模板通常通过非常不均匀的读取覆盖率 (由于不同大小的 proviruses 的共同放大) 来识别, 当映射到来自同一参与者的全长协商一致时, 或者存在 snp 与频率 > 40% (见代表性结果,图 4)。在后续分析中无视混合种群。
对准
1. 将每个前病毒序列的最终共识导入序列查看软件, 如分子进化遗传学分析 (巨型) 7²¹。手动将每个序列与 HXB2 参考序列对齐。修剪 5 ' 和 3 ' 末端的位置666-9650 的 HXB2, 以去除底漆序列。
2. 以 fasta 格式导出序列列表, 然后使用 MAFFT 版本 7²²对齐, 并在适当时手动编辑以获得最终对齐方式。
  注意: 如果任何序列不对齐, 则第一次反转补充序列。如果序列仍未对齐, 请执行爆炸搜索以确保序列 HIV-1。这是可能的放大 non-HIV-1 模板, 这些可以确定在这个阶段。如果序列是 HIV-1 的但不对齐, 请考虑反转的存在 (请参阅步骤 6.1)。

6. 确定 HIV-1 前病毒序列的潜在复制能力

注意: 为了识别基因完整的序列, 并具有潜在的复制能力, HIV-1 proviruses 遵循严格的消除过程 (图 1C)。前病毒序列缺乏反转, 大的内部删除, 有害停止密码子/超变异, 移码突变, 和/或 MSD 站点或包装信号的缺陷被认为是基因完整的, 可能复制胜任。

反演
1. 在对齐阶段, 标识反转。反转是序列不与引用 HXB2 对齐的区域, 除非该区域是反向补充的。
  注意: 根据数据的应用情况, 可能需要从进一步分析中省略包含反转的序列。
较大的内部删除
1. 在对齐阶段识别具有较大内部删除 (> 600 bp) 的重叠。除非删除位于nef内, 否则序列可以定义为有缺陷。
  注意: 任何有内部删除 < 600 bp 的序列都将被基因切割器 (步骤 6.3.1) 识别为具有不完整的基因序列。
有害停止密码子, 移码突变和删除
1. 检查所有重叠长度 > 8400 核苷酸的存在有害停止密码子, frameshifts 和不完整的基因序列使用洛斯阿拉莫斯国家实验室 HIV 序列数据库基因切割工具²³。
  注: 基因切割工具将前病毒序列分成基因插科打诨、pol、vif、vpr、tat、rev、vpu、env和nef, 并将其转化为氨基酸。基因切割器, 然后屏幕上存在的停止密码子和移码突变 (由于插入或删除)。重叠包含停止密码子或 frameshifts 在任何基因, 不包括nef²⁴, 被归类为有缺陷。基因切割器也识别不完整的基因序列和任何 proviruses 与删除 < 600 bp 在一个基因以外的nef可以重新归类为缺陷由于大量的内部删除。
超变异
1. 使用洛斯阿拉莫斯国家实验室 HIV 序列数据库共识制作工具 (简单共识制造商)²⁵, 生成剩余全长前病毒序列的共识。将共识序列添加到仅包含剩余全长前病毒序列的对齐顶部。使用此路线和洛斯阿拉莫斯国家实验室 HIV 序列数据库 Hypermut 工具²⁶识别 APOBEC 诱导的 G A 超变异在剩余的全长前病毒序列。
MSD 和包装信号中的缺陷
1. 检查每个剩余的重叠是否存在 MSD 和封装信号 (HXB2 区域 670-810) 中的缺陷, 这会导致前病毒序列缺陷⁴。查找 MSD 站点中的点突变 (序列 GT、HXB2 744-745) 或包装信号四阀杆环路 (SL1 (HXB2 691-734)、SL2 (HXB2 736-754)、SL3 (HXB2 766-779) 和 SL4 (HXB2 790-810)) 中的任何删除。

Representative Results

翻转检测放大和序列单, 接近全长 HIV-1 proviruses。该协议涉及6步骤, 以获得接近全长前病毒序列。这些步骤包括: 裂解被感染的细胞, 全长 (完整和有缺陷) 的嵌套 PCR HIV-1 proviruses, DNA 纯化和定量, 测序库制备, NGS , 和 proviruses 序的组装。每一个步骤的结束可以被认为是一个检查点, 在其中的产品质量 (例如放大的 dna, 纯化的 dna, 排序库或序列) 可以在下一步之前评估。下面概述了每个步骤结束时进行的评估和预期结果。

在嵌套 PCR 后, 放大的产品在1% 琼脂糖凝胶上运行 (图 3)。PCR 的初始质量可以通过检查阴性和阳性对照来确定。含扩增产物的负控制井表明, 放大后的产品未出现污染和正控制井表示放大不足。接下来, 选择包含放大产品的井进行测序。为了避免含有多个扩增 proviruses 混合物的油井, 只有在末端稀释时才会将含有放大产品的油井视为测序。根据泊松分布, 当30% 的油井对扩增产物呈阳性时, 会发现末端点稀释。在这种稀释, 有80% 几率这些水井包含单个放大能。此外, 在这个阶段, 包含多个不同长度的扩增 proviruses 的水井可以在凝胶上出现多个波段时进行可视化。不应选择这些井进行测序 (图 3)。

经过纯化的扩增 proviruses 选择用于测序, 定量确保在纯化阶段不会丢失前病毒 DNA。如果放大能的 DNA 浓度为 < 0.2 ng/µL, 则 PCR2 板中的剩余样品可以纯化。在库准备之后会出现类似的检查点, 其中每个库都是量化的。这确保了在测序之前, 单个 proviruses 被适当地分割、标记和放大。单个前病毒库汇集在等摩尔中, 相当于最终库浓度为 4 nM (或由排序提供程序指定)。如果单个前病毒库的浓度过低, 则可以将其从排序库池中排除, 或者重新编写单个库。在确定平均片段长度之前, 对共用库的浓度进行最后检查, 然后进行排序。

在全新装配阶段之前的质量控制步骤可确保用于组装最终前病毒 contig 的读数的质量。这些步骤包括: 移除适配器序列、修剪 5 ' 和 3 ' 核苷酸、严格的质量限制和忽略短读。CLC 基因组学工作台可以提供质量控制报告, 可用于评估读取和引导修剪设置的初始质量, 然后确定修剪是否足以去除低质量区域。此外, 对于重叠组装, 可以评估装配式的质量 (> 1000X) 和覆盖均匀度 (图 4A)。在此阶段也可以确定混合种群。多个全长 (约 9 kb) proviruses 的混合物通过具有大于40% 的频率的多个 snp 的存在来识别, 而短的混合物 (包含较大的内部删除) 和全长 proviruses 可以通过不均匀从同一参与者 (图 4B) 到全长参考的映射后读取覆盖范围。

根据应用程序的不同, 最终对齐方式可以使用工具 (如 "R: 用于统计计算的语言和环境") 中的 ggtree 作为包进行可视化.²⁷。在最近的一项研究中, 翻转被用来序列 HIV-1 proviruses 从天真的, 中央的, 过渡的和效应器记忆 CD4⁺ T 细胞独立于长期艺术的个体, 目的是确定是否特定的细胞子集显示更高基因完整性和潜在复制能力的比例 HIV-1²。在此, 将显示从本研究的一个参与者 (参与者 2026) 中分离出来的序列的视觉表示 (图 5)。在这个参与者中, 大多数 (97%) 序列都有缺陷, 在效应器和过渡记忆 CD4⁺ T 细胞中发现完整的序列。此可视化工具可用于显示大量内部删除的序列数及其在基因组中的位置。它可以进一步标注, 以指示在 MSD 站点和/或包装信号中具有有害停止密码子、移码突变和删除/突变的序列。

翻转试验的一个应用是鉴定基因完整和潜在复制胜任的 HIV-1 proviruses。在最近的一项研究中, 从长期艺术的6名参与者中分离出来自 CD4⁺ T 细胞的531序列, 26 (5%) 基因完整的 HIV-1 proviruses 被确定为²。其余缺陷 proviruses 包括反转序列 (6%)、大内部删除 (68%)、有害停止密码子/超变异 (9%)、移码突变 (1%) 和 MSD 站点中包装信号和/或突变中的缺陷 (11%).

图 2: HIV-1 proviruses 的从头组装工作流概述。工作流中的主要步骤包括: 1) 序列读取质量控制, 2) 合并重叠对, 3) 的重新组装, 和 4) 重新映射和共识建设分别是红色, 蓝色, 绿色和橙色。这个数字已经从 Hiener等修改。².请点击这里查看这个数字的更大版本.

图 3: PCR 扩增 HIV-1 proviruses 的琼脂糖凝胶示例.水井1、2、3、6、9和10包含放大的 HIV-1 proviruses。井10包含一个大的内部删除能, 以及2包含两个 HIV-1 proviruses 的共同放大不同长度 (混合物), 以及12包含正控制。注意包含放大产品的井的百分比为 60%, 高于隔离单个模板所需的百分比。请点击这里查看这个数字的更大版本.

图 4: 读取映射的示例输出.(a) 由于单个全长 HIV-1 能的放大, 证明甚至覆盖范围的例子。之后 , 所有读取都映射到组装的 contig, 以生成一致的序列。软件平台允许对映射的读取进行足够甚至覆盖的检查。(B) 示范两个不同长度 (混合物) 的 HIV-1 proviruses 的共同扩增的例子。为了确定混合物, 读取被映射到一个完整长度 (~ 9 kb) 参考序列从同一参与者和读取映射检查。不均匀覆盖的存在表示混合物。此图转载于 Qiagen¹⁴的许可。请点击这里查看这个数字的更大版本.

图 5: HIV-1 前病毒序列的示例可视化, 从个人的 CD4⁺ T 细胞子集中分离出长期艺术。单个 HIV-1 前病毒序列由水平线表示。这个数字已经从 Hiener等修改。².请点击这里查看这个数字的更大版本.

Discussion

翻转法是一种高效的高通量方法, 用于放大和排序单, 接近全长 HIV-1 proviruses。确定了影响所获得序列数量和质量的协议中的多个因素和关键步骤。首先, 细胞数量和细胞种群的 HIV-1 感染频率影响 proviruses 的增多。例如, 在以前的出版物中, 与效应器内存 CD4⁺ t 细胞相比, 从相同数量的天真 CD4⁺ t 细胞获得了大约一半的序列。这是因为天真的细胞通常比效应器记忆细胞²的感染频率更低。其次, 细胞裂解比基于柱的萃取方法更好地获得基因组 dna, 因为在萃取过程中没有丢失 DNA 的风险。最后, 与任何基于 PCR 的检测一样, 防止污染是至关重要的。应指定分离的清洁区域, 以准备主混合物、处理基因组 DNA、添加阳性对照、DNA 纯化和定量以及库制备。这对于单拷贝检测尤其重要, 如此处介绍的方法。

翻转试验的实施应首先包括运行一个积极的控制, 如 pNL4-3 质粒, 而不是参与者样本。这将允许在使用 HIV-1 阳性细胞之前进行任何故障诊断, 因为所获得的序列可以与这些质粒的可用参考序列进行比较。当使用 HIV-1 阳性细胞时, 重要的是考虑 HIV-1 子类型 (设计为翻转的引物是特定于亚型 B) 和细胞种群的感染频率, 如果很少到没有 proviruses 被放大。底漆序列可以修改/重新设计以匹配其他子类型。此外, 每种 PCR 都应包括一个含有阳性对照的井。

翻转已经克服了以前的测序检测 (包括 SPS) 的局限性。通过放大和排序接近全长 HIV-1 proviruses, 翻转可以确定 HIV-1 proviruses 的潜在复制能力。这是不可能使用 SPS, 这只排序子基因组区域, 因此选择的序列与完整的底漆绑定站点。此外, 翻转克服了使用多个扩增和测序引物的局限性, 正如以前的全长测序检测¹^、⁴所采用的那样。通过两轮 PCR 瞄准 HIV-1 LTR 区域与 NGS 结合, 翻转减少了所需引物的数量和复杂性。因此, 翻转不容易受到引物不匹配的后果, 即错误识别缺陷的 proviruses 和无法在人群中放大某些 proviruses。翻转协议也更高效, 并允许比以前的方法更高的排序吞吐量。

显然, 翻转提供了与确定 HIV-1 proviruses 的遗传组成的现有方法的优势。然而, 重要的是要承认翻转的局限性。首先, 翻转试验没有被开发作为测量潜伏 HIV-1 油藏大小的工具, 作为分析, 以确定是否翻转放大每个 HIV-1 能存在在细胞种群尚未完成。翻转对于对不同细胞种群之间的储层组成进行相对比较是有用的²。其次, 在不进行活体分析的情况下, 无法确定完整的 HIV-1 proviruses 的复制能力, 如 Ho等。⁴. 第三, 翻转不是为了确定 HIV-1 proviruses 的集成站点。

翻转协议的细微变化可以增加其应用。例如, 引物序列中的更改可允许对不同的和多个 HIV-1 子类型进行放大和排序。通过在嵌套 PCR 之前加入 cDNA 合成, 可以对血浆 HIV-1 病毒进行测序。单分子测序方法的未来应用, 将消除对从头组装的需求。

综合 HIV-1 proviruses 的遗传测序提高了我们对潜伏 HIV-1 储层的认识。翻转是未来研究的重要工具, 用于阐明潜伏储层的组成和分布。然而, 翻转的应用可以延伸到油藏之外。未来的研究可能利用翻转来确定 CRISPR 技术的特定目标, 或协助识别编码和非编码区域, 使病毒对延迟反转代理的响应更灵敏。通过观察大的内部缺失的结点, 可以更好地理解病毒重组。

Disclosures

作者没有什么可透露的。

Acknowledgments

这项工作支持了1U19AI096109 的研究型企业 (敢于) 寻找治疗方法 (1UM1AI126611-01);艾滋病研究基金会 (amfAR 108074-50-RGRL) amfAR 艾滋病毒根除 (凯旋) 合作研究资助研究联合会;澳大利亚艾滋病毒和肝炎病毒学研究中心 (ACH²);加州大学旧金山分校-GIVI 艾滋病研究中心 (P30 AI027763);澳大利亚国家卫生和医学研究理事会 (AAP1061681)。我们要感谢韦斯特米德医学研究研究所的基因组设施经理, 他在图书馆准备和使用他的设施, 以及 Ramaciotti 基因组学中心 (新南威尔士大学, 澳大利亚悉尼)。进行测序。我们感谢为本研究捐赠样品的参与者。

Materials

Name	Company	Catalog Number	Comments
UltraPure 1 M Tris-HCI, pH 8.0	Invitrogen	15568025	Dilute to 5 mM for nested PCR
Nonidet P 40 Substitute solution	Sigma	98379
Tween-20	Sigma	P9416
Proteinase K Solution (20 mg/mL)	Promega	AM2548
96 well thermocycler			Any 96 well thermocycler can be used
Platinum Taq DNA Polymerase High Fidelity	Invitrogen	11304011
10x High Fidelity Buffer [600 mM Tris-SO₄ (pH 8.9), 180 mM (NH₄)₂SO₄]	Invitrogen	11304011
50 mM MgSO₄	Invitrogen	11304011
PCR Nucleotide Mix, 10 mM	Promega	C1141
Ultrapure H₂O	Invitrogen	10977023
PCR1 and PCR2 Primers			Desalted. Dilute to (100 µM) with H₂O
PCR Plate 96 Well, Half Skirt, Single Notch Corner, Clear	Axygen	PCR-96M2-HS-C
Microseal 'B' Adhesive Seals	BioRad	MSB1001	Required to seal 96 well PCR plates
HIV-1 NL4-3 Infectious Molecular Clone (pNL4-3)	The following reagent was obtained through the NIH AIDS Reagent Program, Division of AIDS, NIAID, NIH: HIV-1 NL4-3 Infectious Molecular Clone (pNL4-3) from Dr. Malcolm Martin (Cat# 114).		Diluted to 10⁵ copies/mL and used as positive control
PCR plate spinner or benchtop centrifuge
E-GEL 48 1% Agarose	Invitrogen	G800801	Precast 1% agarose gels (two gels used per 96 well plate). Any 1% agarose gel can be substituted. Contains ethidium bromide.
DirectLoad Wide Range DNA Marker	Sigma	D7058	Any ladder with a range up to 10 kb can be substituted
Mother E-Base device	Invitrogen	EBM03	Required for running precast 48 well 1% agarose gels
Gel Doc EZ Gel Documentation System	BioRad	1708270	Any visualisation system for ethidium bromide containing agarose gels can be used
PlateMax Peelable Heat Sealing	Axygen	HS-200	Heat sealing film for long term storage
96 Well 0.8 mL Storage Plate	ThermoFisher Scientific	AB0765	0.8 mL 96 well plate required for magnetic bead based PCR purification
Agencourt AMPure XP (PCR purification kit)	Beckman Coulter	A63880	Magnetic bead based PCR purification kit. Other PCR purification kits can be substitued here (e.g. QIAquick PCR Purification Kit (Qiagen Cat#28106)
Ethyl alcohol, Pure. 200 proof, for molecular biology	Sigma	E7023
Magnetic Stand-96	Invitrogen	AM10027
Microplate shaker			Optional
Buffer EB	Qiagen	19086	Elution buffer
Quant-iT PicoGreen dsDNA Assay Kit	Invitrogen	P11496	A fluorescence based stain for measuring dsDNA concentration
Microplate reader
Nextera XT DNA Library Preparation Kit	Illumina	FC-131-1096
Nextera XT Index Kit	Illumina	FC-131-2001
Hard-Shell 96-Well PCR Plates	Biorad	HSP9601	Required for Nextera XT DNA library preparation kit
Library Quantification Kit - Illumina/Universal	Kapa Biosystems	KK4824	Other library quantification kits can be substitued (e.g. JetSeq DNA Library Quantification Lo-Rox Kit (Bioline Cat#BIO-68029)
2100 Bioanalyzer	Agilent Technology		Automated electrophoresis system . Use in conjunction with a High Sensistivity DNA kit
High Sensistivty DNA kit	Agilent Technology	5067-4626
Illumina MiSeq Platform	Illumina