Summary

单次读取和配对的最终从10微克总RNA的mRNA - Seq的Illumina的图书馆

Published: October 27, 2011
doi:

Summary

在这里,我们描述了读取和配对的单端Illumina公司的mRNA – Seq的测序基础上的T7线性RNA扩增的基因表达分析库的制备方法。该协议只需要10微克启动总RNA,并产生了高度一致库代表整个笔录。

Abstract

全转录组测序的mRNA – Seq的是现在被广泛用于执行全球基因表达,突变,等位基因特异性表达,其他的全基因组分析。甚至打开的mRNA – Seq的非基因组测序的基因表达分析的大门。的mRNA – Seq的提供高灵敏度,大动态范围,并允许测量样品中的转录拷贝数。 Illumina公司的基因组分析仪进行测序一个大数目相对较短的序列(> 10 7)读取(<150 bp的)。“配对结束”的方法,其中一个单一的长读是在两个其两端测序,允许跟踪交替剪接路口插入和缺失,是有用的De Novo转录大会。

研究人员面临的主要挑战之一是数量有限的起始原料。例如,开始在激光微解剖,可收获细胞实验总RNA米AY在毫微克的措施。从这些样品中的mRNA – Seq的库的制备已被描述 1,2,但涉及显著PCR扩增,可能会引入偏差。其他RNA – seq的图书馆建设以最小的PCR扩增程序已经出版3,4,但需要启动总RNA微克金额。

在这里,我们描述的Illumina的Genome Analyzer的II平台库的准备,避免显著的PCR扩增和只需要10微克的总RNA测序的mRNA – Seq的协议。尽管这个协议已经前面描述的单端测序,它表明的情况下引进显著放大偏置定向库验证,在这里我们验证它进一步用于配对的最终协议。我们选择性地放大聚腺苷酸化的信使RNA,从开始使用总RNA,T7基于Eberwine线性扩增法,创造了“T7洛杉矶“(T7线性扩增)。扩增聚一个mRNA的是零散的,反转录和适配器结扎,以产生最后的测序库。对于读取和配对的单端运行,序列映射到人类转录 6和规范化,使从多次运行数据可以比较,我们的报告基因表达的转录每百万为单位测量(TPM),这是一个出众的措施RPKM 比较样本7时。

Protocol

1。提取总RNA 加入1ml Trizol试剂细胞/组织,和同质化18-22如果有必要的纱布针。 添加200μL氯仿,并在30分钟14000转的自旋在4 ° C 取出顶部的水层,添加0.5μL线性丙烯酰胺,再加入500μL异丙醇。让我们在室温下坐了20分钟。 转速14000 RPM在4℃,洗涤沉淀,用70%乙醇,真空干燥。 悬浮在1μL的核酸游离水和转移200μLPCR管。 2。准备双链的cDNA 以上1μLRNA 1μL100微米寡DT – T7反转录引物(5' – GGCCAGTGAATTGTAATACGACTCACTATAGGGAGGCGGTTTTTTTTTTTTTTTTTTTTTTTT -3“),热在70 ° C为5分,和单元冰酷(加热块)。 加入1μL的5倍财政司司长缓冲区,0.5μL的DTT,0.5μLdNTP混合液0.5μLRnaseOUT(上标第二包)。 加热至42° C的PCR仪1分钟,再加入0.5μL标II逆转录酶。孵育1小时,在42 ° C。 热火在70 ° C为10分钟,冷却至4 ° C。 在冰上,上述反应中添加以下: 核酸自由水 – 22.75μL 5X第二链缓冲 – 7.5μL dNTP混合液 – 0.75μL 大肠杆菌DNA连接酶 – 0.25μL 大肠杆菌DNA聚合酶 – 1μL RnaseH – 0.25μL 孵育2小时,在16 ° C,然后加入1μLT4 DNA聚合酶,和额外的10分钟孵育16 ° C。 转移到1.5 mL Eppendorf管,并加入80μl水。 加入0.5μL线性丙烯酰胺。 加入72μL3米NH4OAc和480μL100%冷乙醇。沉淀为1小时在-20 ° C 在14000转的自旋在4 ° C 30分钟,用1 ml 70%乙醇,在14000转离心2分钟,真空干燥约10分钟。 3。 通过体外转录扩增聚一个基因上述基因重悬在3.5μL的核酸游离水。 以上,加1μL的dNTPs(共4μL),1 10X反应缓冲液和1μL的T7聚合酶,并从Megascript套件RnaseOUT 0.5μL。 在37 ° C过夜PCR仪。 下一步准备就绪。可存放于-80 ° C。 4。一个基因扩增聚碎裂上述反应和4μL10X碎片试剂加入26μL水。 热火在PCR仪在70 ° C整整7分钟。 添加5μL碎片停止缓冲区,把冰样本。 5。 RNA的清洁上述反应中,加入60μl水和缓冲区的RNeasy MinElute试剂盒的RLT 350μL,由吹打混合。 添加到离心柱250μL乙醇,吹打的组合,和吸管。 在8000 RCF为20秒旋转。 洗一次与视网膜色素上皮,旋转20秒,用80%的乙醇,自旋为2分钟,5分钟旋转的干栏的第二时间。 洗脱RNA在10μL的核酸游离水。 6。 cDNA合成第一链合成为单读库: 在PCR管中,添加以下内容: 零碎聚一个基因 – 10μL NotI nonamer随机引物 – 1μL 在70 ° C孵育5分钟,在热循环,并在冰上快速寒意。 NotI Nonamer引物(5' – TGAATTCGCGGCCGCTCAAGCAGAAGACGGCATACGAGCTCTTCCGATCT NNNNNNNNN -3“)。 5'近端序列NotI酶切位点,而直到随机地区的下一个序列是从芯片序列套件Illumina的适配器B序列的反向补充。 <ol开始=“2”> 上述措施外,新增的冰以下(标III套件): 5X第一链缓冲-4μL 数码地面电视 – 2μL dNTP的混合物* – 1.5μL 放在热循环42℃2分钟,加标III逆转录酶1μL,42℃孵育1小时。 *而不是dCTP,5 – 甲基dCTP在dNTP的混合物。 第一链合成配对结束库: 在PCR管中,添加以下内容: 零碎聚一个基因 – 10μL 随机六聚体引物 – 1μL 在65 ° C孵育5分钟,在热循环,并在冰上快速寒意。 上述情况,添加以下上冰(上标firststrand III套件): 5X第一链缓冲 – 4μL 数码地面电视 – 2μL dNTPs(从试剂盒) – 1.5μL 放在热循环1分钟,在45 ° C,加入标III逆转录酶1μL,在45 ° C孵育1小时。 第二链的合成(两个库): 上述情况,添加冰以下(标第二包): 水(核糖核酸免费) – 91μL 5X第二链缓冲 – 30μL dNTPs(套件) – 3μL 大肠杆菌DNA连接酶 – 1μL 大肠杆菌DNA聚合酶 – 4μL 大肠杆菌核糖核酸酶H – 1μL 颠倒混合管,短的自旋和孵化在16 ° C,2小时。 7。净化的cDNA Zymo列,单一的读取和配对结束库30μL水,水在40μL洗脱纯化cDNA样本。 8。结束维修对于一个读库: <p c姑娘=“jove_content”>(使用Illumina的芯片序列样品制备试剂盒) 上述40μL的cDNA,地址: 用10mm ATP T4 DNA连接酶缓冲液 – 5μL dNTP混合液 – 2μL T4 DNA聚合酶 – 1μL Klenow酶(用水稀释1:5 1U /μL) – 1μL T4 PNK – 1μL 在30分钟的热循环仪孵育20 ° C。 对于配对年底库: (使用Illumina的配对结束样品制备试剂盒) 上述30μL的cDNA,地址: 核糖核酸酶DNA酶自由水 – 45μL 用10mm ATP T4 DNA连接酶缓冲液 – 10μL 10MM的dNTP混合 – 4μL T4 DNA聚合酶 – 5μL Klenow酶 – 1μL T4 PNK – 5μL 在30分钟的热循环仪孵育20 ° C。 9。 cDNA的清洁起来彗星瘦最多的cDNA使用Zymo列。在34μL的EB单一的读取和配对结束库32μLEB洗脱。 10。新增“A”基地的3'的DNA片段结束对于一个读库: 准备以下的反应组合: DNA样本 – 34μL 的Klenow缓冲 – 5μL dATP的 – 10μL 出的Klenow – 1μL 30分钟在37 ° C。 对于配对年底库: 准备以下的反应组合: DNA样本 – 32μL 的Klenow缓冲 – 5μL dATP的 – 10μL 出的Klenow – 3μL 30分钟在37 ° C。 11。 cDNA的清洁起来清理的cDNA使用zymo列。在10μL的EB洗脱。 12。适配器结扎jove_step“>单个读库: (使用Illumina的芯片序列样品制备试剂盒) 准备以下的反应组合: DNA样本 – 10μL 适配器寡糖组合 – 1μL 2X DNA连接酶缓冲液-15μL DNA连接酶 – 4μL 在室温15分钟孵育。适配器应解冻的冰和稀释1:20。 对于配对年底库: (使用Illumina的配对结束样品制备试剂盒) 准备以下的反应组合: DNA样本 – 10μL PE适配器寡糖混合 – 10μL 2X DNA连接酶缓冲液 – 25μL DNA连接酶 – 5μL 孵育15分钟,在20 ° C。适配器应解冻的冰和稀释1:20。 13。连接反应清理使用ZY清理连接反应莫列。在44μL水洗脱单个读库和5μL的EB的另一个配对结束库洗脱6μLEB。 执行NotI消化,只对单一的读库基因 – 44μL NEB缓冲3 – 5μL 牛血清白蛋白 – 0.5μL NotI – 1μL 2小时至过夜孵育37 ° C,并净化反应zymo列。 6缓冲区的EB液流出,其次是与5μLEB的第二洗脱。 14。尺寸选择/凝胶净化执行以下使用2%SYBR安全电子凝胶自Invitrogen。 运行程序的0 – PreRun 2分钟。 负载自Invitrogen稀释1:4 1KB再加上阶梯,并载入10μL。 加载所有的DNA样本,并填写10μL水空车道。 运行程序的1 EGel 2%,运行28分钟。 大小选择200-300 bp的凝胶SLICE与一个新的刀片。 15。洗脱DNA的凝胶片称取凝胶片,并添加3卷缓冲区QG 1凝胶的体积(使用凝胶提取试剂盒自Qiagen) 孵育50 ° C为10分钟或直到凝胶片溶解。 添加ispropanol 1卷,倒置或移液混合。 添加到列,最高速度为1分钟的旋转,并丢弃流过。 加入500μlQG到列的缓冲区,为1分钟,以最大的速度旋转,并丢弃流过。 加入750μl的Buffer PE的列,最高速度为1分钟旋转,并丢弃流过。 离心机最高速度为1分钟。 在36μL的EB单一的读取和配对结束库23μLEB洗脱。 16。 PCR扩增对于一个读库: (使用Illumina的芯片序列样品制备试剂盒) 准备的followin克PCR反应的组合: 的DNA – 36μL 5X Phusion缓冲区 – 10μL dNTP混合液 – 1.5μL PCR引物1.1 – 1μL PCR引物2.1 – 1μL Phusion聚合酶 – 0.5μL 使用下面的PCR协议: 30秒98 ° C 10个循环: 10秒98 ° C 30秒65 ° C 30秒72 ° C 5分钟72 ° C 保持在4 ° C *套件是用于第一次,与EB缓冲液稀释的PCR引物1:2。 对于配对年底库: (使用Illumina的配对结束样品制备试剂盒) 准备以下的PCR反应: 的DNA – 23μL Phusion DNA聚合酶 – 25μL PCR引物PE 1.1 – 1μL PCR引物PE 2.1 -1μL 放大使用下列PCR协议: 30秒98 ° C 10个循环: 10秒98 ° C 30秒65 ° C 30秒72 ° C 5分钟72 ° C 保持在4 ° C *套件是用于第一次,与EB缓冲液稀释的PCR引物1:2。 17。图书馆清洁清理库使用zymo列。洗脱12μLEB 18。定量库定量库使用量子比特。这是准备进行测序。测序引物从Illumina的单一读取集群生成工具包V4或更高的单读库和Illumina的配对结束集群代包V4或更高配对结束库使用。 19。数据分析领结6是用来米AP读取的RefSeq基因组(NCBI的构建36.1)。单端读取(30个核苷酸)和对端读取(42个核苷酸)映射允许多达10场比赛的基因组,并允许每读取两个不匹配。每百万(TPM)值的转录来衡量使用RSEM 7(RNA – seq的期望最大化)的基因表达。 20。代表性的成果:我们T7LA库读取和配对的单端从1微克,100微克,10微克,1微克和100 PG总RNA(图1)开始运行。评价我们的协议,我们没有T7 RNA 10μg总RNA被称为“MinAmp”这些控制库,开始放大的单读取和配对月底库,具有最小的放大。他们所接受的唯一的扩增PCR的协议结束近10个周期,以结扎Illumina的测序适配器,一步步共同所有的图书馆。所有RNA用于分离从H14人类胚胎干细胞8。 我们首先计算由各种库(表1和补充表1)发现的基因数目。对于读取和配对的单端库,为10 ng T7LA库确定为10微克MinAmp库几乎相同数量的基因,与10个或更多的TPM。 10吴T7LA库在单个读库的情况下,确定由10微克非放大库中确定的8500基因的100%。 10吴T7LA库配对结束库,发现86%的非放大10微克库(7961)的9267个基因中发现的基因。低于10 ng库没有能够找出许多基因。例如,在单个读协议,1毫微克库只认〜50%,由10微克MinAmp库确定出的基因,促使我们T7LA协议为10 ng总RNA的最低金额限制。此外,一个看家基因的映射, GAPDH的(图2)显示所有T7LA至少开始的RNA 10ng库确定所有外显子,包括极端的5'外显子。 10吴T7LA单读和配对与MinAmp库年底库的比较,显示了高度的相似性(Spearman相关,R = 0.90和0.95,图3a和b)。我们还比较了两个单读取和配对的结束,从10 ng总RNA库,他们有很高的相关系数(R = 0.92),表明这两种类型的图书馆使用T7LA协议产生了一个非常类似的基因表达签名(图3c)。因此,T7LA方法是能够产生可靠和全面MinAmp库的测序库的,但是从1000倍的起点较低的材料。 图1中的模式和单个读库准备协议配对结束。 jove_content“> 图2的所有读取和配对的单端库,一个看家基因GAPDH的基因组浏览器的图片。单个读库左侧的比例尺显示350共读。配对结束库中心的比例尺表示5000共读。横轴代表的GAPDH的基因组序列。 图3基因表达的相关性之间的各种库(斯皮尔曼):在单读吴T7LA 10和10微克MinAmp库显示,这两个库有一个非常相似的基因表达模式(R = 0.90)B.配对结束C.基因表达的相关性吴T7LA 10和10微克MinAmp库演示了他们的基因表达图谱的相似性( R = 0.95)。10吴配对月底和10毫微克的单个读库之间的pressions显示T7LA方法编写这些库(R = 0.92)之间的相似程度高。 图4的人类胚胎干细胞所有读取和配对的单端库的具体genes5鉴定。 图书馆 类型° 原材料集群 集群通过 ​​过滤器( %) 对齐到基因组% %的误差率 基因鉴定 MinAmp 10ug 单读 225602 + / – 4952 65.48 + / – 2.58 47.61 + / – 0.53 0.62 + / – 0.06 8500 1ug T7LA 单读 144818 + / – 6513 82.21 + / – 6.45 48.09 + / – 0.27 0.42 + / – 0.03 8757 100ng T7LA 单读 27385 + / – 1818 81.33 + / – 11.75 44.46 + / – 4.53 0.49 + / – 0.10 8709 10ng T7LA 单读 11184 + / – 985 60.70 + / – 3.70 14.96 + / – 1.15 0.99 + / – 0.30 8589 1ng T7LA 单读 12695 + / – 1365 53.27 + / – 16.76 4.08 + / – 0.79 2.25 + / – 1.56 4720 100pg T7LA 单读 10390 + / – 1398 72.99 + / – 2.90 1.48 + / – 0.20 1.51 + / – 0.39 1121 MinAmp 10ug 配对完R1 95786 + / – 12937 90.77 + / – 2.79 58.50 + / – 0.95 0.94 + / – 0.38 9267 配对完R2的 95786 + / – 12937 90.77 + / – 2.79 58.13 + / – 1.13 0.99 + / – 0.37 1ug T7LA 配对完R1 297669 + / – 10196 91.35 + / – 0.36 46.​​89 + / – 0.14 0.47 + / – 0.01 7334 配对完R2的 297669 + / – 10196 91.35 + / – 0.36 45.52 + / – 0.12 0.51 + / – 0.01 100ng T7LA 配对完R1 205602 + / – 9932 90.53 + / – 0.76 63.44 + / – 1.00 0.48 + / – 0.02 8011 配对完R2的 205602 + / – 9932 90.53 + / – 0.76 61.80 + / – 8.09 0.60+ / – 0.36 10ng T7LA 配对完R1 214622 + / – 11155 89.98 + / – 1.13 56.32 + / – 1.94 0.80 + / – 0.26 7961 配对完R2的 214622 + / – 11155 89.98 + / – 1.13 46.​​41 + / – 18.39 2.48 + / – 2.68 ; 1ng T7LA 配对完R1 144951 + / – 19841 90.54 + / – 1.19 3.91 + / – 0.16 8.71 + / – 0.86 8124 配对完R2的 144951 + / – 19841 90.54 + / – 1.19 3.27 + / – 1.21 9.11 + / – 3.52 100pg T7LA 配对完R1 1876​​00 + / – 11759 89.52 + / – 1.11 1.78 + / – 0.05 13.42 + / – 0.50 6623 </TD> 配对完R2的 1876​​00 + / – 11759 89.52 + / – 1.11 1.99 + / – 0.23 15.29 + / – 0.96 · R1和R2是正向和反向序列标记 *≥10的TPM 表1:集群数字,基因识别,错误率,%读取和配对的单端库的对齐方式。 补充表1。所有基因的名单和所有样品的TPM值,单个读取和配对结束。

Discussion

1微克至2.5微克10日起的总RNA量之间的配对结束库当前的协议要求。在这里,我们目前我们对直线的T7扩增(T7LA)的方法来准备,此方法允许读取和配对的单端Illumina的测序库,并显示生成低至10纳克的总RNA库,生产数据是可比的,微创(MinAmp)放大1000倍以上的起始原料(10μg总RNA)的库。为10 ng图书馆不仅找出类似的基因总数,但也产生类似(图3a和b)的基因表达签名。此外,读取和T7LA方法产生配对的单端库是对方(图3c),这使研究人员能够比较无论从协议中作出的库产生的数据非常相似。由于这些库准备从人类胚胎干细胞的RNA,我们搜索为30个干细胞库中的特定基因,并发现,几乎所有这些基因(93-100%)发现至少10启动总RNA(图4)吴库,从而验证了我们的协议。我们相信,我们的协议将是非常有用的,为研究人员,特别是在诸如流量排序细胞或激光微解剖组织起始原料限制的情况下,。在这种情况下,我们的协议将允许从开始量大得多,因为我们的协议产生的表达谱,在至少3订单开始RNA的幅度相媲美的库生成的基因表达数据相媲美。

Disclosures

The authors have nothing to disclose.

Acknowledgements

这项工作是从莫格里奇研究所的研究和威斯康星大学基金会的资金支持。我们感谢克里斯塔伊士曼社论援助。

Materials

Company Kit/Reagent Catalog # Special Comments
Ambion Fragmentation reagent AM8740  
Ambion Liner Acrylamide AM9520  
Ambion MEGAscript T7 Kit AM1334  
Ambion Non DEPC treated nuclease free water AM9932  
Fermentas dNTP set R0181  
Fermentas methylated dNTPs R0431 For Single Read sample prep only
Illumina TruSeq SR Cluster Generation kit v5 GD-203-5001 For Single Read sample prep only
Illumina TruSeq Seq Kit v5 36 cycles FC-104-5001  
Illumina Chip Seq Sample Prep Kit IP-102-1001 For Single Read sample prep only. Can be replaced with NEB DNA sample prep Master Mix Set 1 Cat# E6040S
Illumina TruSeq PE Cluster Generation kit v5 PE-203-5001 For paired end sample prep only
Illumina Paired End Sample Prep Kit PE-102-1001 For paired end sample prep only
Invitrogen 1kb plus ladder 10787-018  
Invitrogen E. coli Rnase H 18021-014  
Invitrogen Rnase Out 10777-019  
Invitrogen 2nd strand buffer 5x 10812-014  
Invitrogen E. coli DNA polymerase 18010-017  
Invitrogen E-gel SYBR safe 2% G521802  
Invitrogen Superscript III (with 5X FS buffer and 0.1M DTT) 18080-085  
Invitrogen Trizol 12183555  
Invitrogen RNA quibit assay kit Q32852  
Invitrogen dsDNA HS qubit assay kit Q32851  
Invitrogen E. coli DNA ligase 18052-019  
Invitrogen T4 DNA Polymerase 18005-025  
Invitrogen Ultra Pure Dnase Rnase water 10977-015  
Invitrogen Superscript II double stranded cDNA synthesis kit 11917-020  
Invitrogen Random Primer (invitrogen) 48190-011 For paired end sample prep only
IDT Not1Nonamer B primer N/A For Single Read sample prep only
IDT Oligo dT T7 N/A  
NEB Not1 digestion kit R0189S For Single Read sample prep only
Qiagen Rneasy Minelute kit 74204  
Qiagen RNEasy Mini Kit (50) 74104  
Qiagen Gel purification kit 28604  
Qiagen Dnase set 79254  
Qiagen Rneasy MinElute kit 74204  
Zymo Research DNA clean and concentrator (250X) D4014  

References

  1. Tang, F., Barbacioru, C., Wang, Y., Nordman, E., Lee, C., Xu, N., Wang, X., Bodeau, J., Tuch, B. B., Siddiqui, A., Lao, K., Surani, M. A. mRNA-Seq whole-transcriptome analysis of a single cell. Nature Methods. 6, 377-382 (2009).
  2. Armour, C. D., Castle, J. C., Chen, R., Babak, T., Loerch, P., Jackson, S., Shah, J. K., Dey, J., Rohl, C. A., Johnson, J. M., Raymond, C. K. Digital transcriptome profiling using selective hexamer priming for cDNA synthesis. Nature Methods. 6, 647-649 (2009).
  3. Mortazavi, A., Williams, B. A., McCue, K., Schaeffer, L., Wold, B. Mapping and quantifying mammalian transcriptomes by RNA-Seq. Nature Methods. 5, 621-628 (2008).
  4. Mamanova, L., Andrews, R. M., James, K. D., Sheridan, E. M., Ellis, P. D., Langford, C. F., Ost, T. W., Collins, J. E., Turner, D. J. FRT-seq amplification-free, strand-specific transcriptome sequencing. Nature Methods. 5, 130-132 (2010).
  5. Sengupta, S., Ruotti, V., Bolin, J., Elwell, A., Hernandez, A., Thomson, J., Stewart, R. Highly consistent, fully representative mRNA-Seq libraries from ten nanograms of total RNA. Biotechniques. 49, 898-904 (2010).
  6. Langmead, B., Trapnell, C., Pop, M., Salzberg, S. L. Ultrafast and memory-efficient alignment of short DNA sequences to the human genome. Genome. Biology. 10, R25-R25 (2009).
  7. Li, B., Ruotti, V., Stewart, R. M., Thomson, J. A., Dewey, C. N. RNA-Seq gene expression estimation with read mapping uncertainty. Biotechniques. 26, 493-500 (2010).
  8. Thomson, J. A., Itskovitz-Eldor, J., Shapiro, S. S., Waknitz, M. A., Swiergiel, J. J., Marshall, V. S., Jones, J. M. Embryonic stem cell lines derived from human blastocysts. Science. 282, 1145-1147 (1998).

Play Video

Cite This Article
Sengupta, S., Bolin, J. M., Ruotti, V., Nguyen, B. K., Thomson, J. A., Elwell, A. L., Stewart, R. Single Read and Paired End mRNA-Seq Illumina Libraries from 10 Nanograms Total RNA. J. Vis. Exp. (56), e3340, doi:10.3791/3340 (2011).

View Video