Summary
我们描述条形码DNA文库和随后的杂交为基础的外显子捕获检测的关键癌症相关的基因突变在临床肿瘤标本通过大规模并行的“下一代”测序的准备。靶向外显子的测序提供了高吞吐量,低成本,以及深的序列覆盖率的好处,从而产生较高的灵敏度,用于检测低频率突变。
Abstract
努力发现和调查的关键致癌基因突变已被证明有价值的,以方便对癌症患者进行相应的处理。高通量的建立,大规模并行“下一代”测序已经资助了许多这样的突变的发现。以提高该技术的临床和平移工具,平台必须是高通量,成本效益,并用福尔马林固定,石蜡包埋(FFPE)组织样品可能产生少量的退化或受损的DNA兼容。在这里,我们描述了随后靶向外显子用于癌症相关的突变在新鲜冰冻和石蜡包埋的肿瘤通过大规模平行测序检测的基于杂交的捕获条形码和复用DNA文库的制备。这种方法使序列突变的识别,拷贝数变化,并选择涉及所有目标基因的结构重排。针对外显子测序提供吨他同样拥有高通量,低成本,和深序列覆盖率,从而赋予高灵敏度检测低频率突变。
Introduction
在关键的癌基因和肿瘤抑制基因的“驱动器”肿瘤的遗传事件的识别起着许多癌症1的诊断和治疗的重要作用。利用大规模并行“下一代”测序大规模的研究工作已经启用了很多这样的癌症相关的基因,近年来2的鉴定。然而,这些测序平台通常需要大量的DNA从新鲜冰冻组织中分离,从而构成一个重大的限制在从保存组织,如福尔马林固定,石蜡包埋(FFPE)的肿瘤样品表征和分析DNA突变。改进的努力,高效,可靠地从FFPE肿瘤样本的特征“可操作的”基因组信息将使以前存入银行的标本进行回顾性分析,并进一步鼓励个性化的方法对癌症的管理。
传统上,分子ðiagnostic实验室一直依赖耗时,低通量的方法,如Sanger测序及实时荧光定量PCR进行DNA突变分析。最近,利用复用PCR或质谱基因分型高通量方法已被开发来调查在关键的癌基因3-5复发性体细胞突变。这些方法,但是,只有预先指定的“热点”的突变进行了检测,使得它们不适合用于检测失活突变的肿瘤抑制基因受到限制。大规模并行测序提供了这些策略的几个优点,包括审问整个外显子为双方共同和稀有突变的能力,才能看到其他类基因组改变,如拷贝数收益和损失的能力,异构样品6,在更高的检测灵敏度7 。全基因组测序为代表的突变的发现的最全面的方法,虽然它是相对的LY昂贵,即被用于数据分析和存储大量的计算需求。
对于临床应用,其中的基因组中的仅一小部分可能是临床利益,在测序技术2特别的创新已经变革。首先,通过基于杂交的外显子捕获,可以分离DNA对应键与癌症相关的基因突变有针对性的分析8。第二,通过分子条形码( 即 DNA序列的6-8个核苷酸长)的结扎,可以有数百个每个测序运行样品并充分利用大规模并行测序仪器10不断增加的容量的优点。合并后,这些创新使肿瘤可为异形更低的成本和更高的吞吐量,更小的计算需求11。进一步,通过重新分配序列覆盖,只有那些基因最关键的特定应用,可以achie已经较大的测序深度为低等位基因频率较高的事件检测灵敏度。
在这里,我们描述了我们的影响分析(中可操作的癌症靶点整合突变图谱),使用自定义的寡核苷酸捕获所有蛋白质编码外显子和选择的279键的癌症相关基因的内含子(它利用外显子捕获的条形码序列库池通过杂交表1 )。这一战略使基因突变,插入缺失,拷贝数改变的识别,并选择涉及这些279个基因的结构重排。我们的方法是与DNA来自新鲜冷冻和FFPE组织以及细针抽吸等细胞学标本中分离出兼容。
Subscription Required. Please recommend JoVE to your librarian.
Protocol
1。 DNA和试剂制备
注意:该协议描述了24个样本( 例如,12种肿瘤/正常对)的同时进行处理和分析,但可以适用于更小和更大的批次。 DNA样本可能来自FFPE或新鲜冷冻组织,细胞学标本,或血液。通常,这两种肿瘤和正常组织的来自同一患者将异形在一起,以便从遗传多态性区分的体细胞突变。该协议将立即开始DNA提取以下。
- 等分试样50-250纳克(250纳克推荐)每个样品中提取的DNA,稀释在1x的Tris-EDTA(pH值8.0)缓冲液中,以50微升的最终体积,为单独的Covaris圆底试管中。
- 剪切力对Covaris E220仪器的DNA在以下剪切设置:360秒,10占空因数,175画中画,每爆裂200次。
- 解冻AMPure XP珠( 表2)至室温。解冻所有BUffers和酶在冰上之前的适当步骤。
2。文库制备 - 完维修模块
- 使用每个样品以下几卷准备结束维修师傅混在一个无菌的离心管:10微升10X NEBNext结束修复反应缓冲液( 表2),5微升NEBNext结束修复酶混合物( 表2),35微升无菌核酸游离H 2 O。
- 分装50μl的每个剪切的DNA到96孔板的单独的孔中。加入50微升的准备结束维修师傅组合到每个反应。在20℃下孵育在热循环仪进行30分钟
3。结束后的修复清理
- 添加AMPure XP珠( 表2)的2倍体积(200微升),以每个样品,并使用多道移液器轻轻地吸取了整个音量向上和向下10倍。在室温下孵育15分钟。
- 广场上的磁性支架( 表2
- 轻轻取出并丢弃上清液,注意不要打扰珠。一些液体可能会留在井中。
- 与在支架管,轻轻地加入200微升新鲜制备的80%乙醇中的每个样品,孵育板在室温下持续30秒。小心,通过吸管除去乙醇。
- 重复步骤5,共2乙醇洗涤。确保所有的乙醇已被删除。从磁性支架取出,放于干燥室温下5分钟。
- 重悬干燥珠粒与44.5微升无菌H 2 O。轻轻地,移液管整个音量上下10X充分混合。确保珠粒不再连接到井的侧面。
- 孵育再悬浮珠粒在室温下持续2分钟。将磁静置5分钟,直到样品出现明显的。
- 轻轻地转移42微升含有样品到一个新的好清楚上清液。
该程序可以安全地停在这个STEP并储存在-20℃下7天的样品。要重新启动,继续操作前解冻冷冻样本置于冰上。
4。文库制备 - DA-泰陵模块
- 5微升10倍NEBNext大拖尾反应缓冲液( 表2),3微升(3'-5'外切)Klenow片段( 表2:使用每样以下几卷准备大拖尾预混液在无菌的离心管)。
- 加入8μL准备好的大拖尾主结构,每孔含42微升的最终修复的DNA。在37℃下孵育在热循环仪进行30分钟
- 执行后大拖尾清理:用无菌H 2 O至33.75微升,最终体积2倍体积(100微升)的珠子,但重悬,重复步骤3.1-3.8。
该程序可以安全地停止在该步骤中,保存于-20℃下进行长达7天的样品。要重新启动,解冻冷冻样品上,然后再继续冰。</ LI>
5。文库制备 - 接头连接模块
- 10微升5倍NEBNext快速连接反应缓冲液(New England Biolabs公司, 表2),5微升快速T4 DNA连接酶( 表2):使用每个样本以下几卷准备结扎预混液在无菌的离心管。
- 加入15微升连接主结构,每孔含DA尾的DNA。
- 加入1.25微升适当的25微米NEXTflex条形码适配器( 表2),每孔。每个样品应接受一个单独的条形码适配器。在20℃下孵育在热循环仪进行15分钟
- 在无菌H 2 O的使用珠1X体积(50μL)重复步骤3.1-3.8,但重悬至50微升,最终体积:执行后接头连接清理。
- 对于第二个1X卷(50微升)清理重复步骤3.1-3.8,但重悬在无菌H 2 O至一23微升最终体积。
该程序可以安全地停止在该步骤中,保存于-20℃下进行长达7天的样品。要重新启动,继续操作前解冻冷冻样本置于冰上。
6。文库扩增
- 准备KAPA高保真主结构中使用下列卷每个样品的无菌微量离心管:25微升2倍KAPA高保真HS马币( 表2),每个100μM引物1和2( 表3),1微升。
- 加27微升主混合物到每个孔中含有的连接产物。设置吸至50μl,轻轻吸取整个音量上下10倍。
- 放置在热循环仪中进行以下PCR循环:45秒,在98℃初始变性,10个循环15秒,在98℃,30秒,60℃,30秒,72℃,1分钟的最终延伸在72°C。
- 进行扩增后的清理:使用重复步骤3.1-3.8AMPure XP珠的1X卷(50微升),重悬在无菌水中,以30微升的最终体积。
- 量化每个库的根据制造商的说明书,使用量子比特宽范围测定(Life Technologies公司, 表2)的浓度。
7。罗氏NimbleGen SeqCap的EZ图书馆杂交,洗涤和扩增
- 解冻普及和指数寡核苷酸阻断剂( 表3),SeqCap的EZ图书馆和NimbleGen的捕捉组件(COT的DNA,2个杂交液,杂交和成分A, 表2),在冰上。所有的寡核苷酸阻断剂都存放在1毫米工作股。我们SeqCap的EZ图书馆是捕获探针涵盖的279癌症相关基因的所有蛋白质编码外显子,但是可以使用其他自定义和目录设计定制设计的游泳池。
- 准备对应于所述特定条形码的广告索引寡核苷酸阻断剂的1 mM的池在文库制备用于aptor序列。结合1μl的各阻断剂,和涡流。
- 在一个新的无菌的1.5 ml离心管中,加入5微升1mg/ml的COT的DNA,2微升1毫米通用阻滞剂和2微升指数寡核苷酸阻断剂的1 mM的游泳池。
- 池24条形码库到一个单一的反应。一共有1-3微克汇集,条形码序列库(上述制备)加入到捕捉混合物中。对于24个样品,每个样品100纳克建议。当汇集肿瘤和匹配的正常样本,我们建议增加更多的肿瘤库( 如每个肿瘤和正常每50毫微克100毫微克),使它们测序,以更深入的报道。
- 关闭该管帽,使15-20的孔中具有18-20 G或更小的针帽的顶部。 Speed Vac中扩增样本库/ COT DNA /在高温(60℃)的DNA真空浓缩寡核苷酸。
- 一旦完全干燥下来,补充水分与7.5微升2倍的有杂交zation缓冲液和3微升杂交组分A的管现在应包含以下内容:5微克(COT)的DNA,可变微克放大样品库1000皮摩尔通用和指数寡核苷酸,7.5微升2×杂交缓冲液,在3微升杂交A组份10.5μl总体积。
- 覆盖在帽上的孔与一小块实验室胶带。旋涡样,持续10秒,并以最大速度离心10秒。
- 孵育样品在95℃下10分钟以使DNA变性,然后离心以最大的速度持续10秒在RT。
- 在新0.2毫升的PCR条管,准备SeqCap的EZ图书馆捕获探针和2.25微升无菌无核酸酶的H 2 O的的2.25微升等分,并添加7.7步的内容。轻轻吸取整个音量上下10倍。
- 孵育在热循环仪在47℃下进行48-96小时。设置和维护的热循环仪的盖子温度为57°C。
- 折伞在NimbleGen的SeqCap的EX图书馆SR用户指南V3.0( 表2)进行洗涤和捕获的DNA的回收第6章低步骤。
- 如下在罗氏NimbleGen协议所捕获的DNA进行了以下修改的放大的第7步:
- 使用2个KAPA高保真聚合酶代替的Phusion高保真PCR扩增预混试剂( 见表2)
- 使用100μM的引物1和引物2在表3中列出。
- 运行以下PCR条件:在98℃起始变性30秒,11个循环的98℃10秒,60℃30秒,72℃30秒,72℃最后延伸5分钟。保持在4°C。
- 量化,根据制造商的说明使用量子比特的高灵敏度测定( 表2)的扩增捕获的DNA的浓度。
- 分析使用安捷伦Bio捕获DNA的质量分析器的DNA芯片HS( 表2)按照制造商的说明。
- 将PCR产率至少应为100毫微克(范围100-1000毫微克)。
- 的平均片段长度应该是150-400个碱基对之间。
8。 Illumina公司的Hi-序列测序
- 稀释扩增的DNA捕获到下午2点,并装入样品上的Illumina的HiSeq 2000流动池的单一车道。根据制造商的说明书序列配对末端75个碱基对的读取。根据我们的经验,一个车道就足以产生每个样品500-700X唯一的序列覆盖整个279基因的24个样品池。
- Illumina公司的软件(实时分析)将高分辨率的图像转换为集群强度为基础的呼叫和质量分数。使用CASAVA根据条形码的身份去复用数据,并生成单个FASTQ文件,每个样品。
9。数据分析ysis
- 从序列的3'端修剪接头序列读取使用Cutadapt(FASTQ文件http://code.google.com/p/cutadapt/ )。最小搭接长度(-O)为3 1%的错误率(-E)。最低基数长度保持配对的修剪是25后读取。
- 排列顺序来读取使用Burrows-惠勒调校工具(BWA)12参考人类基因组hg19。执行后处理步骤,包括根据自己的标准最佳实践(使用基因组分析工具包(GATK)重复的标记,当地多序列调整和基本质量得分重新校准http://www.broadinstitute.org/gatk/guide/topic?名称=最佳实践 )13。当分析来自同一患者的多个样品( 例如,匹配的肿瘤和正常),本地多序列调整应的perforMED联合。这些后处理步骤的输出是对每个样品,其中包含的所有序列,质量和取向信息,可直接加载到结合基因组浏览器(IGV),用于读取和序列变体14的可视化的单独的BAM文件。
- 使用皮卡德工具计算序列的性能指标( http://picard.sourceforge.net/ )。信息化指标包括对齐率,片段大小分布,GC含量相关报道的偏见,对目标的捕获特异性,PCR重复率,库的复杂性,和平均目标覆盖。代表值被显示在图1。等位基因频率在使用DepthOfCoverage从GATK计算常见多态性位点被用来从无关的DNA污染监测,并确保匹配样本来自同一患者。
下面的计算分析依赖于匹配的存在肿瘤和正常样本进行体细胞的遗传改变的检测。无与伦比的肿瘤也可以使用一个单独的正常对照样品进行分析,但大多数的体细胞突变不能容易地从继承的序列变体区分开来。 - 利用体细胞突变来电,如muTect 15,SomaticSniper 16,或Strelka 17各肿瘤对正常体细胞调用单核苷酸变异(SNVs)。我们使用muTect具有修饰的过滤标准,允许与正常样品中的低(非零)等位基因计数只要等位基因频率是至少5倍的程度,在肿瘤的变种。变种循环地称为在正常的DNA面板也将被移除排序或排列的可能系统性文物。每个SNV通过过滤器,然后仔细审查使用IGV。
- 叫躯体插入缺失对每个肿瘤对正常使用的算法如SomaticIndelDetector 13,Dindel 18,或19 SOAPindel
- 从序列覆盖在目标外显子外推套数状态。对于每一个样本,为所有目标外显子,回归了GC比例进行平均序列覆盖的黄土正常化。减去黄土配合和添加样品的全覆盖中位数调整,非标准化的覆盖值。计算比例,在所有目标外显子的肿瘤对正常正规化序列覆盖率。如果没有匹配的正常样本和/或降低噪声,其他与性别相匹配的二倍体正常对照缺乏种系拷贝数变异体也可使用。确定体拷贝数得失的基础上的覆盖率增加或减少。
- 调用涉及癌基因,其中至少一个基因组中断点落在范围内或附近的基因组的目标间隔体细胞重排。建议的算 法包括GASV 20,Breakdancer 21,CREST 22,和dRanger 23。染色体内的倒位,缺失,和串联重复可以根据支撑的相对位置和方向读取不和谐对区别开来。所有考生重排,应人工审查使用IGV。我们建议实验验证通过在假定的重排断点PCR和Sanger测序。
Subscription Required. Please recommend JoVE to your librarian.
Representative Results
使用对应于279癌基因的所有蛋白质编码外显子探针24条形码序列库(12肿瘤对正常)一池被抓获,并测序为2×75 bp的读取上一个的HiSeq 2000流动池的单一车道。肿瘤和正常库汇集以2:1的比例。冷冻肿瘤DNA样品的样品池的性能指标示于图1,其中包括对应率,片段大小分布,对靶标捕获的特异性,和平均目标覆盖范围。例如体细胞突变,插入,缺失和拷贝数改变的示于图2-4中 。
图1。序列性能指标的代表性人物。一 )集群密度和比对率,B)是指目标覆盖, > C)插入大小分布,以及d)捕获的特异性。 点击这里查看大图 。
图2。一体化的基因组浏览器(IGV)的图象,显示序列覆盖于EGFR的肺癌(顶部)外显子和匹配的正常组织(底部)的特异性。灰色条代表独特的序列读数。在右侧,杂合T> G突变是目前在读的在肿瘤和0%的正常读取,这表明它是一个躯体L858R氨基酸替代24%。 点击这里查看大图 。
3“FO:内容宽度=”6英寸“SRC =”/ files/ftp_upload/50710/50710fig3.jpg“宽度=”600px的“/>
图3。插入缺失的大肠癌肿瘤对正常的例子:。在APC 一 )体移码插入二)体细胞移码缺失的TP53 7个碱基对点击这里查看大图 。
图4。拷贝数改变的肿瘤对正常。每个数据点代表从279靶基因的单一外显子。拷贝数盈亏均来自推断的增加和减少肿瘤的序列覆盖率。 点击这里查看大图 。
表1:探头设计特点进行目标捕获。
总的外显子 | 4,535 |
总内含子 | 14 |
单核苷酸多态性* | 1042 |
总目标的领土 | 879966个碱基对 |
总计探头领土 | 1400415个碱基对 |
表2。试剂和试剂盒。
名称试剂/材料 | 公司 | 目录号 |
NEBNext结束修复模块 | New England Biolabs公司 | E6050L |
NEBNext DA-尾矿模块 | New England Biolabs公司 | E6053L |
NEBNext快速连接模块 | New England Biolabs公司 | E6056L |
Agencourt公司AMPure XP | 贝克曼库尔特基因组学 | |
ÑEXTflex PCR-免费条码 - 24 | BIOO科学 | 514103 |
高保真库扩增试剂盒 | KAPA生物系统公司 | KK2612 |
COT人类的DNA,荧光级 | 罗氏诊断 | 05 480 647 001 |
NimbleGen的SeqCap的EZ杂交和清洗套装 | 罗氏NimbleGen | 05 634 261 001 |
SeqCap的EZ图书馆诱饵 | 罗氏NimbleGen | |
的QIAquick PCR纯化试剂盒 | Qiagen公司 | 28104 |
量子比特的dsDNA宽范围(BR)检测试剂盒 | Life Technologies公司 | Q32850 |
量子比特的双链DNA高灵敏度(HS)检测试剂盒 | Life Technologies公司 | Q32851 |
安捷伦的DNA HS试剂盒 | 安捷伦科技公司 | 5067-4626,4627 |
安捷伦2100生物分析仪 | 安捷伦科技公司 | |
Covaris E220 | Covaris | |
磁性表座-96 | Ambion公司 | AM10027 |
Illumina公司的Hi-SEQ 2000 | Illumina公司 |
表3。指数寡糖受体阻滞剂和引物序列。
TS-HE通用拦截器 | AATGATACGGCGACCACCGAGATCTACACTCTTTCCCTACACGACGCTCTTCCGATCT |
TS-INV-HE指数1拦截器 | CAAGCAGAAGACGGCATACGAGATCGTGATGTGACTGGAGTTCAGACGTGTGCTCTTCCGATCT |
CAAGCAGAAGACGGCATACGAGATACATCGGTGACTGGAGTTCAGACGTGTGCTCTTCCGATCT | |
TS-INV-HE指数3拦截器 | CAAGCAGAAGACGGCATACGAGATGCCTAAGTGACTGGAGTTCAGACGTGTGCTCTTCCGATCT |
TS-INV-HE指数4拦截 | CAAGCAGAAGACGGCATACGAGATTGGTCAGTGACTGGAGTTCAGACGTGTGCTCTTCCGATCT |
TS-INV-HE指数5拦截 | CAAGCAGAAGACGGCATACGAGATCACTGTGTGACTGGAGTTCAGACGTGTGCTCTTCCGATCT |
TS-INV-HE指数6拦截器 | CAAGCAGAAGACGGCATACGAGATATTGGCGTGACTGGAGTTCAGACGTGTGCTCTTCCGATCT |
TS-INV-HE指数7拦截 | CAAGCAGAAGACGGCATACGAGATGATCTGGTGACTGGAGTTCAGACGTGTGCTCTTCCGATCT |
TS-INV-HE指数8拦截器 | CAAGCAGAAGACGGCATACGAGATTCAAGTGTGACTGGAGTTCAGACGTGTGCTCTTCCGATCT |
TS-INV-HE指数9拦截 | CAAGCAGAAGACGGCATACGAGATCTGATCGTGACTGGAGTTCAGACGTGTGCTCTTCCGATCT |
TS-INV-HE指数10拦截 | CAAGCAGAAGACGGCATACGAGATAAGCTAGTGACTGGAGTTCAGACGTGTGCTCTTCCGATCT |
TS-INV-HE指数11拦截 | CAAGCAGAAGACGGCATACGAGATGTAGCCGTGACTGGAGTTCAGACGTGTGCTCTTCCGATCT |
TS-INV-HE指数12拦截 | CAAGCAGAAGACGGCATACGAGATTACAAGGTGACTGGAGTTCAGACGTGTGCTCTTCCGATCT |
TS-INV-HE指数13拦截 | CAAGCAGAAGACGGCATACGAGATTTGACTGTGACTGGAGTTCAGACGTGTGCTCTTCCGATCT |
TS-INV-HE指数14拦截 | CAAGCAGAAGACGGCATACGAGATGGAACTGTGACTGGAGTTCAGACGTGTGCTCTTCCGATCT |
TS-INV-HE指数15拦截 | CAAGCAGAAGACGGCATACGAGATTGACATGTGACTGGAGTTCAGACGTGTGCTCTTCCGATCT |
TS-INV-HE指数16拦截 | CAAGCAGAAGACGGCATACGAGATGGACGGGTGACTGGAGTTCAGACGTGTGCTCTTCCGATCT |
TS-INV-HE指数18拦截 | CAAGCAGAAGACGGCATACGAGATGCGGACGTGACTGGAGTTCAGACGTGTGCTCTTCCGATCT |
TS-INV-HE指数19拦截 | CAAGCAGAAGACGGCATACGAGATTTTCACGTGACTGGAGTTCAGACGTGTGCTCTTCCGATCT |
TS-INV-HE指数20拦截 | CAAGCAGAAGACGGCATACGAGATGGCCACGTGACTGGAGTTCAGACGTGTGCTCTTCCGATCT |
TS-INV-HE指数21拦截 | CAAGCAGAAGACGGCATACGAGATCGAAACGTGACTGGAGTTCAGACGTGTGCTCTTCCGATCT |
TS-INV-HE指数22拦截 | CAAGCAGAAGACGGCATACGAGATCGTACGGTGACTGGAGTTCAGACGTGTGCTCTTCCGATCT |
TS-INV-HE指数23拦截 | CAAGCAGAAGACGGCATACGAGATCCACTCGTGACTGGAGTTCAGACGTGTGCTCTTCCGATCT |
TS-INV-HE指数25拦截 | CAAGCAGAAGACGGCATACGAGATATCAGTGTGACTGGAGTTCAGACGTGTGCTCTTCCGATCT |
TS-INV-HE指数27拦截 | CAAGCAGAAGACGGCATACGAGATAGGAATGTGACTGGAGTTCAGACGTGTGCTCTTCCGATCT |
引物1 | 5'-AATGATACGGCGACCACCGAGATCT-3' |
引物2 | 5'-CAAGCAGAAGACGGCATACGAGAT-3' |
Subscription Required. Please recommend JoVE to your librarian.
Discussion
我们的影响分析产生的高定位速度,较高的目标速度,目标高覆盖,高灵敏度检测基因突变,插入缺失和拷贝数变化。我们已经证明我们的影响分析的能力,同时从新鲜冰冻的DNA序列和归档低的DNA输入FFPE样品。通过执行主要癌症相关的基因有针对性的外显子测序,可以达到非常深的序列覆盖率为这些最关键的基因的外显子从而最大限度地检测低频率突变的能力。使用条形码和复用的,可实现更高的吞吐量,每个样品的成本更低,和DNA的低输入量。
靶向方法的一个好处是,它是可行的,优化的捕获探针,使得所有外显子,覆盖均匀且充分地进行突变检测。如表1所示,本设计包括4535个外显子中279个基因。下面的迭代改进我们的设计中,典型的测序实验产生不超过2%的外显子中位数覆盖整个样品的小于20%。因此,对于测序,以500倍的序列覆盖率(如显示在图1的保守估计)肿瘤,> 98%的外显子的费用将由> 100倍的深度,确定低频突变保证高灵敏度。覆盖的这种均匀性在很大程度上归因于NimbleGen的SeqCap的系统,其中探针可以被合成到不同的长度在不同的核苷酸组成的区域的灵活性。我们还成功地使用从集成的DNA技术(IDT)单独合成生物素标记的寡核苷酸,以新的内容加入到我们的面板,以提高难以捕捉和/或序列区域的覆盖。也通过捕捉反复地重排基因内含子的选择,我们能够确定产生融合基因的结构重排,即使只有一个FUSIOÑ伙伴被捕获。
这种有针对性的测序方法确实具备检测“司机”遗传改变在肿瘤的能力两大局限。首先,基因组只有一小部分被询问。有针对性的测序是,本质上,有限的。作为新的癌症基因从基因组学系统的工作出现,它们可以快速地加入到捕获板上,但在功能上重要的突变可能被错过,将通过全基因组或整个外显子测序来检测。第二,它仅限于基于DNA的改变。的异常表达的转录本,新的剪接异构体,和基因融合的检测需要RNA的序号或类似的技术24。表遗传学改变如染色质修饰和DNA甲基化也可能在肿瘤发生和发展中起关键作用。随着测序技术的不断提高,人们可以设想的综合战略运用全基因组测序,RNA测序和互补approaCHES全面例行25上表征遗传和表观遗传化妆单个肿瘤。作为完整的集成策略是目前成本和计算望而却步,有针对性的测序提供了一个实用的替代捕捉最显着的基因组特征的临床和转化应用。
我们的协议假定肿瘤测序与来自同一患者采取匹配的正常组织。这个正常控制的目的是为了确定在肿瘤检测的序列变体是否是继承或体细胞获得的。在没有匹配的正常,可以推断,在变体突变热点(在其他癌症复发的体细胞突变,即点)发生都可能是体细胞。此外,可以用非转基因匹配的正常二倍体样品进行的拷贝数盈亏分析。对于所有其他新的基因变异,在simultane匹配的正常组织项分析大大简化所产生的突变数据的解释,强烈推荐。
这里所描述的协议影响的说明冷冻样品的一致性和高品质的性能。与FFPE样本工作时,我们观察到偶尔的变化,虽然。取决于FFPE样品的寿命和质量,该DNA可能是严重退化或化学修饰的,并因此可能使测序和分析困难26。话虽这么说,我们已经发现了这些实验条件下是可靠的大部分FFPE样品的。我们还成功地应用这个协议来描述其他临床相关标本,如活检,细针抽吸,和细胞学标本。正是由于这个原因,在灵活性,以适应不同类型的变量质量,数量和异质性,即样本这种方法代表来影响诊断的癌症患者的D处理在临床上。
Subscription Required. Please recommend JoVE to your librarian.
Disclosures
Berger博士已收到的咨询费和科研经费从基础医学,癌症诊断公司。
Acknowledgments
我们感谢艾格尼丝的Viale博士和MSKCC基因组学核心实验室提供技术援助。此协议是从杰弗里比尼癌症研究中心和农民家庭基金会的支持下开发的。
Materials
Name | Company | Catalog Number | Comments |
NEBNext End Repair Module | New England Biolabs | E6050L | |
NEBNext dA-Tailing Module | New England Biolabs | E6053L | |
NEBNext Quick Ligation Module | New England Biolabs | E6056L | |
Agencourt AMPure XP | Beckman Coulter Genomics | ||
NEXTflex PCR-Free Barcodes – 24 | Bioo Scientific | 514103 | |
HiFi Library Amplification Kit | KAPA Biosystems | KK2612 | |
COT Human DNA, Fluorometric Grade | Roche Diagnostics | 05 480 647 001 | |
NimbleGen SeqCap EZ Hybridization and Wash kit | Roche NimbleGen | 05 634 261 001 | |
SeqCap EZ Library Baits | Roche NimbleGen | ||
QIAquick PCR Purification Kit | Qiagen | 28104 | |
Qubit dsDNA Broad Range (BR) Assay Kit | Life Technologies | Q32850 | |
Qubit dsDNA High Sensitivity (HS) Assay Kit | Life Technologies | Q32851 | |
Agilent DNA HS Kit | Agilent Technologies | 5067-4626, 4627 | |
Agilent 2100 Bioanalyzer | Agilent Technologies | ||
Covaris E220 | Covaris | ||
Magnetic Stand-96 | Ambion | AM10027 | |
Illumina Hi-Seq 2000 | Illumina |
References
- Stratton, M. R., Campbell, P. J., Futreal, P. A. The cancer genome. Nature. 458 (7239), 719-724 (2009).
- Meyerson, M., Gabriel, S., Getz, G. Advances in understanding cancer genomes through second-generation sequencing. Nat. Rev. Genet. 11 (10), 685-696 (2010).
- Thomas, R. K., Baker, A. C., Debiasi, R. M., et al. High-throughput oncogene mutation profiling in human cancer. Nat. Genet. 39 (3), 347-351 (2007).
- Macconaill, L. E., Campbell, C. D., Kehoe, S. M., et al. Profiling critical cancer gene mutations in clinical tumor samples. PLoS One. 4 (11), e7887 (2009).
- Dias-Santagata, D., Akhavanfard, S., David, S. S., et al. Rapid targeted mutational analysis of human tumours: a clinical platform to guide personalized cancer medicine. EMBO Mol. Med. 2 (5), 146-158 (2010).
- Macconaill, L. E., Van Hummelen, P., Meyerson, M., Hahn, W. C. Clinical implementation of comprehensive strategies to characterize cancer genomes: opportunities and challenges. Cancer Discov. 1 (4), 297-311 (2011).
- Taylor, B. S., Ladanyi, M. Clinical cancer genomics: how soon is now. J. Pathol. 223 (2), 318-326 (2011).
- Gnirke, A., Melnikov, A., Maguire, J., et al. Solution hybrid selection with ultra-long oligonucleotides for massively parallel targeted sequencing. Nat. Biotechnol. 27 (2), 182-189 (2009).
- Mamanova, L., Coffey, A. J., Scott, C. E., et al. Target-enrichment strategies for next-generation sequencing. Nat. Methods. 7 (2), 111-118 (2010).
- Craig, D. W., Pearson, J. V., Szelinger, S., et al. Identification of genetic variants using bar-coded multiplexed sequencing. Nat. Methods. 5 (10), 887-893 (2008).
- Wagle, N., Berger, M. F., Davis, M. J., et al. High-throughput detection of actionable genomic alterations in clinical tumor samples by targeted, massively parallel sequencing. Cancer Discov. 2 (1), 82-93 (2012).
- Li, H., Durbin, R. Fast and accurate short read alignment with Burrows-Wheeler transform. Bioinformatics. 25 (14), 1754-1760 (2009).
- Depristo, M. A., Banks, E., Poplin, R., et al. A framework for variation discovery and genotyping using next-generation DNA sequencing data. Nat. Genet. 43 (5), 491-498 (2011).
- Robinson, J. T., Thorvaldsdottir, H., Winckler, W., et al. Integrative genomics viewer. Nat. Biotechnol. 29 (1), 24-26 (2011).
- Cibulskis, K., Lawrence, M. S., Carter, S. L., et al. Sensitive detection of somatic point mutations in impure and heterogeneous cancer samples. Nat. Biotechnol. 31 (3), 213-219 (2013).
- Larson, D. E., Harris, C. C., Chen, K., et al. SomaticSniper: identification of somatic point mutations in whole genome sequencing data. Bioinformatics. 28 (3), 311-317 (2012).
- Saunders, C. T., Wong, W. S., Swamy, S., Becq, J., Murray, L. J., Cheetham, R. K. Strelka: Accurate somatic small-variant calling from sequenced tumor-normal sample pairs. Bioinformatics. 28 (14), 1811-1817 (2012).
- Albers, C. A., Lunter, G., Macarthur, D. G., Mcvean, G., Ouwehand, W. H., Din del Durbin, R. Accurate indel calls from short-read data. Genome Res. 21 (6), 961-973 (2011).
- Li, S., Li, R., Li, H., et al. Efficient identification of indels from short paired reads. Genome Res. 23 (1), 195-200 (2013).
- Sindi, S., Helman, E., Bashir, A., Raphael, B. J. A geometric approach for classification and comparison of structural variants. Bioinformatics. 25 (12), 222-230 (2009).
- Chen, K., Wallis, J. W., Mclellan, M. D., et al. BreakDancer: an algorithm for high-resolution mapping of genomic structural variation. Nat. Methods. 6 (9), 677-681 (2009).
- Wang, J., Mullighan, C. G., Easton, J., et al. CREST maps somatic structural variation in cancer genomes with base-pair resolution. Nat. Methods. 8 (8), 652-654 (2011).
- Drier, Y., Lawrence, M. S., Carter, S. L., et al. Somatic rearrangements across cancer reveal classes of samples with distinct patterns of DNA breakage and rearrangement-induced hypermutability. Genome Res. 23 (2), 228-235 (2012).
- Wang, Z., Gerstein, M., Snyder, M. RNA-Seq: a revolutionary tool for transcriptomics. Nat. Rev. Genet. 10 (1), 57-63 (2009).
- Roychowdhury, S., Iyer, M. K., Robinson, D. R., et al. Personalized oncology through integrative high-throughput sequencing: a pilot study. Sci. Transl. Med. 3 (111), 111ra121 (2011).
- Kerick, M., Isau, M., Timmermann, B., et al. Targeted high throughput sequencing in clinical cancer settings: formaldehyde fixed-paraffin embedded (FFPE) tumor tissues, input amount and tumor heterogeneity. BMC Med. Genomics. 4, 68 (2011).