汇集DNA测序检测与大同伙的复杂表型相关的罕见的变异是一个快速和具有成本效益的战略。在这里,我们描述的汇集,32个癌症相关的基因,利用分裂软件包下一代测序的计算分析。这种方法可扩展性,适用于任何利益型。
随着DNA测序技术已经明显提前2近年来,它已成为越来越明显,任何两个人之间的遗传变异量是大于以前认为的3。相比之下,基于阵列的基因分型并没有确定一个共同的序列变异4,5的常见疾病的表型变异的重大贡献。两者合计,这些意见已导致常见疾病的演化/罕见的变异假说,表明多数是“缺失的遗传”中常见的和复杂的表型,而不是由于个人的个人资料罕见的或私人的DNA变异6-8 。然而,表征罕见的变异如何影响复杂表型需要许多受影响的个人,在许多基因位点的分析,是理想到不受影响的队列中的类似调查相比。尽管今天的平台,所提供的电源排序许多基因位点和随后的计算分析所需的人口为基础的调查仍让许多研究者望而却步。
为了满足这一需要,我们开发了汇集的测序方法1,9和一个新的软件包,从得到的数据高度准确的稀有变异检测1。从受影响的个人和整个人口调查的遗传变异程度在多个有针对性的地区,在一个单一的测序库池基因组的能力提供了极好的节约成本和时间,传统的单一样本的测序方法。平均每25倍的基因测序覆盖,我们的自定义算法,分裂,使用内部变量,调用控制策略调用4个碱基对的插入,删除和替换从高灵敏度和特异性的长度可达池1在500个人的突变等位基因。这里,我们描述为准备汇集小号的方法,其次equencing库如何使用汇集测序分析(碎片包一步一步的指示http://www.ibridgenetwork.org/wustl/splinter )。我们展示了汇集了947个人的测序之间的比较,所有的人也经历了全基因组阵列,超过20KB每人测序。标签的基因分型,并呼吁汇集样品中的新变种之间的一致性都非常优秀。这种方法可以很容易地扩展到任何数量的基因位点和任何个人。通过整合内部的正面和负面的扩增控制模拟研究人口的比率,该算法可以进行校准,以获得最佳性能。这一战略也被修改为与杂交捕获或个别特定条形码的使用,可应用于自然异质性样本,如肿瘤DNA测序。
有越来越多的证据表明,发病率和治疗反应常见的,复杂的表型和8肥胖,高胆固醇血症,高血压7和其他疾病,如可由个人档案罕见的变异主持。确定基因和途径,这些变种在受影响的人口聚集的地方将产生深远的诊断和治疗的影响,但单独分析受影响的个人,可以是时间和成本过高。人口为基础的分析提供了一个更有效的方法测量在多个位点的遗传变异。
我们提出一个新的池DNA测序协议旨在确定这个种群之间的遗传变异类型的与斯普林特软件的包配对。我们证明这种方法的准确性,在确定和量化次要等位基因在947个人的人口大汇集,包括罕见的变异从头从汇集测序和个人的焦磷酸测序验证。我们的策略主要是从其他协议不同,由一个积极的成立和在每一个实验的阴性对照。这允许分裂,以达到更高的精度和电源相比,其他方法1。每个等位基因的25倍,最佳的覆盖范围是固定的,独立池的大小,大池分析是可行的,这一要求与池大小的唯一尺度线性。我们的做法是非常灵活,可以应用于任何利益的表型,但也自然异构的样品,如混合细胞群和肿瘤活检。由于汇集从大的目标区域,如外显子组或基因组的测序日益增长的兴趣,我们的图书馆准备和碎片分析与自定义捕捉和全外显子组测序兼容,但没有被设计为在分裂包的对齐工具大引用序列。因此,我们已经成功地利用动态规划对准,Novoalign,从汇集的样本(拉莫斯等。提交)调用的变种的全基因组的路线。因此,我们汇集的测序战略可以成功扩展到较大的池,越来越多的靶序列。
The authors have nothing to disclose.
这项工作得到了在儿童探知研究所授予的MC-二-2006年-1(RDM的和泰德),在NIH的表观遗传学蓝图补助金[1R01DA025744-01和3R01DA025744-02S1](RDM并且FLMV),U01AG023746(SC)的,在Saigh基金会(FLMV和TED),1K08CA140720-01A1和亚历克斯的柠檬水摊位“一奖”支持(TED)。我们感谢与基因组分析的帮助下,在华盛顿大学医学院遗传学系的基因组技术访问中心。该中心的部分支持NCI癌症中心支援津贴#P30的CA91842 Siteman癌症中心和ICTS /铁协批准UL1RR024992从NationalCenter研究资源(NCRR),美国国立卫生研究院(NIH)的一个组成部分,并国立卫生研究院医学研究路线图。本刊物完全是作者的责任,并不代表NCRR或NIH的官方意见。
Reagent Name | Company | Catalogue Number | Section |
PfuUltra High-Fidelity | Agilent | 600384 | 1.4 |
Betaine | SIGMA | B2629 | 1.4 |
M13mp18 ssDNA vector | NEB | N4040S | 1.5 |
pGEM-T Easy | Promega | A1360 | 1.5 |
T4 Polynucleotide Kinase | NEB | M0201S | 2.2 |
T4 Ligase | NEB | M0202S | 2.2 |
Polyethylene Glycol 8000 MW | SIGMA | P5413 | 2.2 |
Bioruptor sonicator | Diagenode | UCD-200-TS | 2.3 |