Genetics

エラー修正 DNA ・ RNA シーケンスを用いた珍しいイベント検出

Published: August 3, 2018 doi: 10.3791/57509

Wing H. Wong*^1,2, R. Spencer Tong*^1,2, Andrew L. Young^1,2, Todd E. Druley^1,2

¹Department of Pediatrics, Division of Hematology and Oncology, Washington University School of Medicine, ²Center for Genome Sciences and Systems Biology, Washington University School of Medicine

* These authors contributed equally

Summary

次世代シーケンス (NGS)、プラットフォーム (~0.5–2.0%) の高い誤り率によって制限されるゲノム解析の強力なツールです。NGS のエラーレートを未然に防ぐし、バリアントアレル分 0.0001 のようにまれに突然変異を検出するエラー修正のシーケンスの我々の方法をについて説明します。

Abstract

従来の次世代シーケンシング技術 (NGS) は、10 年以上の巨大なゲノム解析を許可しています。具体的には、NGS は悪性腫瘍にクローン変異のスペクトルを分析するために使用されています。従来サンガー、NGS 闘争その高い誤り率 ~0.5–2.0% によるまれなクローンと subclonal 突然変異を識別するよりもはるかに効率的です。したがってがある突然変異の検出限界を持つ標準的な NGS > 0.02 バリアントアレル分数 (エン)。患者のまれな突然変異の臨床的意義、知られている病気は、明白でなく残ることがなく白血病の治療を受けた患者が大幅に向上成果残存病変が < フローサイトメトリーによる 0.0001。NGS のこの artefactual 背景を軽減するために多くの方法が開発されています。ここでエラー修正 DNA および RNA シーケンス (ECS)、エラー訂正のため 16 bp ランダムインデックスと多重化のための 8 bp 患者固有のインデックスの個々の分子のタグ付けを含むため手法について述べる。本手法は検出し、バリアントアレル分数 (VAFs) 2 桁の NGS の検出限界よりも低く、0.0001 エンのようにまれにクローン変異を追跡できます。

Introduction

我々として年齢、変異原性物質と細胞分裂結果、ゲノム、これで身体異常の蓄積で中確率のエラーへの暴露の基となる悪性転化の根本的な病因神経疾患、小児障害と正常な老化¹^,²。病気運転可能性と体細胞突然変異は、早期発見とリスク管理³^,⁴^、⁵の重要な診断と予後バイオマーカーです。生理学的な clonogenesis が理解するために臨床通知し、意思決定、定量の正確さおよびこれらの突然変異の特性を研究する重要です。次世代シーケンス (NGS) は、異種の DNA サンプルにクローン変異の研究に現在使用されてただし、NGS は突然変異を識別する制限 > 0.02 バリアントアレル分数 (エン)-0.5-2.0 の固有の誤り率のためシーケンスプラットフォーム⁶^,⁷^,8%。その結果、診断と予後追跡低いエンで重要な体の亜種では得られない標準 NGS。

近年、様々なメソッドは、NGS⁸^,⁹^,¹⁰^,¹¹のエラー率を回避するために開発されています。これらのメソッドは、シーケンス処理の後のエラー訂正を可能分子タギングを利用します。各分子やゲノム断片配列ライブラリでは付くと、ランダムなユニークな分子識別子 (UMI) その分子に固有です。行政は、無作為化ヌクレオチド (8-16 N) の文字列の順列を構築されています。2 番目サンプル固有のバーコードも、ワークフロー実行同じ NGS シーケンスに複数のサンプルを多重伝送が可能に統合されます。Pcr は分子タグライブラリで実行され、シーケンス処理用ライブラリを送信するその後。ライブラリの準備中、エラーでがゲノムフラグメントを pcr とシーケンス⁸中にランダムに導入されることが期待されます。ランダムなシーケンスエラーを削除するには、生配列読み取りが UMI に従ってグループ化されます。シーケンスからの人工物は真のバリアントが忠実に増幅し、同じ海を共有すべての読み取りでシーケンスに対し導入の確率論的性質同じゲノムの位置に同じ海ですべての読み取りに存在することは行われません。成果物が削除されます bioinformatically です。ここでは、3 つのメソッドのエラー修正のシーケンス (ECS) 研究所単一のヌクレオチドの亜種 (SNVs) と小さな挿入削除 (オクターリピート) を識別するために DNA および RNA 遺伝子発現下の定量化を容易にするための最適化について述べる、NGS のエラーのしきい値。

最初の方法では、研究者によって設計された遺伝子特異的プライマーを用いた珍しい体イベントを探す方法について説明します。ライブラリの準備の前に研究者は興味のかけらをターゲットにプライマーを設計する必要があります。Web アプリ Primer3 を使いました (http://bioinfo.ut.ee/primer3-0.4.0/)。200-250 bp の産物は、これらは、行政が組み込まれて一度ポリメラーゼの連鎖反応 (PCR) に最適、ペアエンドリード 150 bp ペアエンドリードでの重複を生成します。使用する最適なプライマー設計条件: 最小プライマーサイズ = 19;最適なプライマーサイズ = 25;最大プライマーサイズ = 30;最小 Tm = 64 ° C;最適な Tm = 70 ° C;最大 Tm = 74 ° C;Tm 差の最大値 = 5 ° C;GC の最小の内容 = 45;最大 GC コンテンツ = 80。返される数 = 20;最大 3' 端安定性 = 100。

方法 2 のクローン SNVs と小さなオクターリピート 0.0001 エン amplicons の数百を含む市販遺伝子パネルを使用してのようにまれにイルミナ化学と ECS DNA のプロトコルを組み合わせる手法について述べる.TruSight 骨髄性シーケンスパネル (イルミナ) を実験に使用し、小児の骨髄性疾患のための興味の遺伝子を含むように拡張されたパネルを設計しました。これらのパネルがこれらのパネルに独自のアダプターの戦略を追加しましたので、エラー訂正を促進するようなユニークな分子識別子 (Umi) を提供していません。ECS が動作するはずです同様に他のさまざまな病気と関連付けられる遺伝子の豊かに設計のパネルのいずれかで。次の DNA の隔離および組織または目的の標本から後続の定量化、それは少なくとも 500 に勧め株 DNA 試料当りの ng。我々は日常的に 250 を使用して単一配列ライブラリを作る ng の下流をできるだけ多くユニークなゲノムフラグメントとしてキャプチャするために DNA の重複とエン計算を読み取ります。残りの 250 とオプションの複製シーケンスライブラリを作ることができる DNA の ng。標本あたり 2 つのライブラリのレプリケートを常に確認、真陽性として両方の複製で独立して検出されたイベントのみを考えます。⁴^,¹³を呼び出すバリエーションの精度を高めるためのゲノム位置特異的二項エラーモデルを実施します。

最後に、ECS を市販の QIAseq ターゲット RNA パネル (Qiagen) を使用して転写定量化のための RNA シーケンスに結合手法について述べる。重複除外に必要な行政とエラー訂正は、キットに盛り込まれているし、研究者は、ライブラリの製造元の推奨事項に従います。Bioinformatically、研究者は、ECS-DNA のプロトコルセクションで詳細に説明するために概説パイプラインを従うことができます。

Protocol

1. ターゲット dna シーケンスのエラー修正

興味のゲノム断片の PCR の拡大。
1. (材料表項目 1) amplicons を増幅するのに高忠実度 DNA ポリメラーゼを使用します。サーマルサイクラーに以下の条件で PCR 反応を増幅する: 30 98 ° c; s10 の 18-40 のサイクル 98 ° c、30 秒 66 ° c、s と 30 s 72 ° c;72 ° C で 2 分4 ° C で保持します。
2. 常磁性ビーズ (材料表項目 2) PCR の製品を浄化します。1: 1.8 インチ比でビーズに PCR 反応を追加 (PCR の反作用ボリューム: ボリュームをビーズ) 製造元のプロトコルに従って。DdH₂o. の 20 μ L の溶出します。
3. (材料表項目 3) DNA の最終濃度を決定する DNA の濃度を定量化します。
4. 2% アガロースゲル (材料表アイテム 4)、産物のサイズを確認するための DNA の因数を実行します。
  注: 代わりに、研究者は、増幅されたゲノム断片のサイズだけでなく、製品の濃度を決定する PCR の製品のバイオアナライザー分析を実行を選択できます。
アダプター熱処理シーケンス
1. I7 アダプター (材料表項目 5) を取得します。以降の手順のためのものです、それらを使用します。
2. 次の oligo シーケンス (材料表の項目 6) と商業的 16N i5 アダプターを購入: AATGATACGGCGACCACCGAGATCTACAC(N1:25252525)(N1)(N1)(N1)(N1)(N1)(N1)(N1)(N1)(N1)(N1)(N1)(N1)(N1)(N1) (N1) ACACTCTTTCCCTACACGACGCTCTTCCGATCT
  メモ: 16N i5 アダプター交換標準 i5 アダプター、ECS を容易にするために 16 のランダムな塩基配列の文字列でアダプターです。
3. 16N i5 アダプター実用的なソリューションを作る: 100 μ M 16N i5 アダプター在庫 40 μ、10 μ L TE バッファーの 500 μ M の塩化ナトリウム溶液 10 μ L。
4. 個別 PCR 井戸に 1.2.3 のステップで、i5 作業溶液の分注 7.5 μ。
5. 対応する井戸にサンプル固有 i7 アダプターの 5 μ L を追加します。
6. 95 ° C、5 分インキュベートし、すべての 30 の 1 ° C でクールなサーマルサイクラーに 4 ° C に s。
7. 4 ° C で保持します。
最後修理 & ライブラリの dA テーリング
注: でアダプターがアニール処理と並行して、1 つに対して実行できます最後の修理や dA テーリング手順 1.1 から PCR 産物。これらの手順が完了した後、修理終了と PCR 産物の dA 尾にステップ 1.2 から焼鈍のアダプターの ligation が実行されます。次のアダプターの ligation ECS ライブラリーの構築は完了です。
1. せいぜい 1 μ g の DNA を開始始まる (最小 ~ 200 ng)
2. Amplicons (材料表項目 7) で終了-修理および dA 尾を実行します。
  1. 終了準備酵素ミックス 3.0 μ と終わり修理バッファーの 6.5 μ L を追加します。
  2. ミックス 65 ° C で 30 分間、20 の ° C で 30 分間インキュベートし、4 ° C で保持
3. 焼なましアダプター (材料表項目 8) で結紮を実行します。
  1. ステップ 2、鈍/TA リガーゼマスターミックスの 15 μ L、結紮エンハンサーの 1 μ L から焼鈍アダプターの 2.5 μ L を追加します。
  2. 37 ° C で 15 分間、20 の ° C で 15 分間のミックスを孵化させなさい
4. 磁気ビーズ (材料表項目 2) ライブラリのクリーンアップ: 修正 1: 0.75 の比率でビーズに PCR 反応を追加 (PCR の反作用ボリューム: 磁気ビーズ容積)。
  1. 1.2.7 のステップからの PCR の製品の 83.5 μ L に磁気ビーズソリューションの 62.6 μ L をピペットします。
  2. 1.5 mL 低バインドチューブに混合物を転送します。
  3. 10 回以上でピペッティングを上下で徹底的にミックスします。
  4. 5 分間室温で放置に混合物を残します。
  5. マグネットホルダーにチューブを置きます。室温でまたは清まで 2 分間インキュベートは明らか。
  6. 上清を除去します。
  7. 70% エタノール 200 μ L でビーズを洗浄します。
  8. 30 s. 削除エタノール間インキュベートします。
  9. エタノールの洗浄ステップをもう一度繰り返します。
  10. ビーズを風乾します。
  11. DdH₂o. の 20 μ L の溶出します。
    注: 磁気ビーズ比 PCR の反作用のこの変更は、200 より小さい DNA のフラグメントが削除されます優先的に bp。
液滴による定量化デジタル PCR
注: 正確な突然変異定量化シーケンサーに読み込まれた各ライブラリの分子の数の厳守が必要です。これを達成するため、個々のライブラリ単位体積あたりの分子数を定量化は実行 QX200 液滴デジタル PCR (ddPCR) プラットフォームを使用して-量的な PCR は、代替オプションです。DdPCR 分析、次の読み出しはライブラリごと μ L あたりの分子の数を指定します。
1. PCR ストリップ管の 10 倍段階希釈して ECS ライブラリ縮尺を希釈します。
2. 1.5 mL チューブに ddPCR の次のマスターミックスを準備: 10 μ L の PCR ミックス (材料表項目 9)、プライマー P5、P7 プライマー、ステップ 1.4.1 から ECS クリーンアップ製品の 5 μ L の 0.2 μ L の 0.2 μ L、と 4.5 μ ddH₂o.。
3. それぞれにマスターミックスの 20 μ L 分注のサンプルも 8 の倍数があることを確かめます。
  1. 分注 70 μ L 各油井に液滴生成油 (材料表、項目 10)。ゴム製のガスケットとカセットをカバーします。
4. 液滴の液滴形成配列装置 (材料表、項目 11) を使用してください。
5. マルチチャンネルピペットを使用して、確保する PCR プレートに DNA をせん断を避けるために 5 秒のスパンでゆっくりと行われるサンプル分注ステップ 1.4.4 で生成された液滴をロードします。
6. 次の条件を使用して熱 cycler で 40 サイクルの液滴に信号を増幅する: 95 ° C、5 分30 の 40 のサイクル 95 ° C、63 ° C で 1 分で s4 ° C、90 ° C で 5 分間で 5 分4 ° C で押し
7. DdPCR テンプレート液滴リーダーマシン (材料表、項目 11) を準備します。絶対定量および使用するためのパラメーター指定ください、 QX200 ddPCR エバーグリーンスーパーミックス。
8. DdPCR 分析が完了すると、すべてのサンプルの間で同じの不和を生じるしきい値を設定するを確認してください。
9. QX200 液滴リーダー、因数後続の手順に必要な分子数を導入する適切なボリュームから濃度読み出しを使用しています。
シーケンス処理用ライブラリの PCR の拡大
1. 1.4.9 のステップから分子の所望の数の次のマスターミックスの準備: Q5 マスターミックス (材料表項目 1) P5 プライマーの 2.5 μ L を 25 μ l 添加 (10 μ M)、P7 プライマーの 2.5 μ L (10 μ M)、dna の ddH₂o. の 20 X μ L X µL
2. 次の条件を使用してサーマルサイクラーのステップ 1.5.1 からライブラリを増幅する: 30 98 ° c; s10 の 20 サイクル 98 ° c、30 秒 63 ° c、30 s 72 ° c; s72 ° C で 2 分4 ° C で押し
3. 磁気ビーズ (材料表、項目 2) ライブラリのクリーンアップ: 磁気に PCR の反作用は 1: 0.75 比変更されるのビーズを追加 (PCR の反作用ボリューム: 磁気ビーズボリューム)。
  1. 磁気ビーズソリューションの 37.5 μ L のピペットステップ 1.5.2 から 50 μ L の PCR の製品に。
  2. 1.5 mL 低バインドチューブに混合物を転送します。
  3. 10 回以上でピペッティングを上下で徹底的にミックスします。
  4. 5 分間室温で放置に混合物を残します。
  5. マグネットホルダーにチューブを置きます。室温でまたは清まで 2 分間インキュベートは明らか。
  6. 上清を除去します。
  7. 70% エタノール 200 μ L でビーズを洗浄します。
  8. 30 s. 削除エタノール間インキュベートします。
  9. エタノールの洗浄ステップをもう一度繰り返します。
  10. ビーズを風乾します。
  11. DdH₂o. の 20 μ L の溶出します。
4. 産物のサイズを確認するため 2% の agarose のゲルの DNA の因数を実行します。
5. (材料表項目 3) 別々の ECS ライブラリの濃度を決定する DNA の濃度を定量化します。
6. 等モル量でライブラリをプールします。
  注: たとえば、研究者をプールできます 400 万開始まで 4 億読み取りを出力シーケンスプラットフォームを使用して配列の分子のモルのグループ⁴の 8 つのライブラリ。保守的、分子あたりのエラー訂正のための 10 の raw 読み取りの平均を使用することをお勧めします。これは 3 億 6000 万ヒットを取るだろう (400 万分子 * 8 ライブラリ * 10 読み取りエラー訂正のため)。ライブラリあたり 400 万ユニークな分子増幅 (遺伝子パネルから 400 万/568 amplicons) あたり 7042 x の報道を読む理論的な平均のコンセンサスを得るために研究者が期待できます。
7. (材料表項目 3) プールの ECS ライブラリの濃度を決定する DNA の濃度を定量化します。
8. 約 4 でプールされた ECS ライブラリを提出 nM。
9. イルミナシーケンスプラットフォーム (MiSeq、HiSeq または NextSeq) 次のシーケンス設定を提供する: 2 x 144 ペアエンドを読み取り、8 サイクルインデックス 1 と 16 サイクルインデックス 2。

2. 遺伝子 DNA のシーケンスをエラー修正パネル

遺伝子パネルから oligos の交配
注: この手順で Umi (材料表、項目 17) を組み込むイルミナ TruSight または TruSeq の修正されたプロトコルを使用してシーケンスライブラリの構築が一つ。
1. ゲノムフラグメント製造元のプロトコルを次に oligos を交配させます。DNA (または開始材料の任意の希望の金額) の使用 250 ng。
2. 非連結 oligos 次の製造元のプロトコルを削除します。
3. 拡張子結紮を行う次の製造元のプロトコル。
  注: 以下製造元のプロトコルへの変更を開始します。
PCR によって i5 および i7 のアダプターの組み込み
1. 適切なボリュームサイズのチューブに以下の試薬を分注して PCR マスターミックスを準備: Q5 マスターミックス (材料表項目 1)、6 μ 10 μ M 16N i5 アダプター (で詳細な方法 1、ステップ 1.2.2) i7 アダプター (使用異なる i7 の 6 μ L の 37.5 μ L多重の個別サンプルのアダプター)、およびステップ 2.1.3 のビーズを使った拡張結紮ソリューションの 22 μ L。
  メモ: Q5 マスターミックスは、イルミナによって提供されるポリメラーゼのマスターミックスを置き換えられます。Q5 ポリメラーゼは、高い再現性と導入エラーを減らすゲノム断片を増幅させます。
2. 次のパラメーターを使用してサーマルサイクラー PCR プログラムを実行: 30 s 98 ° C で、10 の 4-6 サイクル 98 ° c、30 秒 66 ° c、30 s 72 ° c; s72 ° C および 4 ° C で、保留で 2 分
  注: サイクルの数はパネルの大きさに依存します。500-600 組 oligos のパネルに PCR の 6 サイクルが必要ですが私たちの経験から 4 サイクルの PCR で遺伝子パネル遺伝子特定 oligos の約 1,500 の別のペアを持っている場合は十分です。
3. (材料表、項目 2) 磁気ビーズの PCR の反作用のクリーンアップ: 修正された 1 PCR の反作用の磁性ビーズに PCR 反応を追加: 0.75 磁気ビーズ比。
  1. 2.2.2 のステップからの PCR の製品の 75 μ L に磁気ビーズソリューションの 56.25 μ L をピペットします。
  2. 1.5 mL 低バインドチューブに混合物を転送します。
  3. 10 回以上でピペッティングを上下で徹底的にミックスします。
  4. 5 分間室温で放置に混合物を残します。
  5. マグネットホルダーにチューブを置きます。室温でまたは清まで 2 分間インキュベートは明らか。
  6. 上清を除去します。
  7. 70% エタノール 200 μ L でビーズを洗浄します。
  8. 30 s. 削除エタノール間インキュベートします。
  9. エタノールの洗浄ステップをもう一度繰り返します。
  10. ビーズを風乾します。
  11. DdH₂o. の 20 μ L の溶出します。
QX200 ddPCR プラットフォームを使用してライブラリを定量化します。
1. 方法 1 で手順 1.4。
  注: 400 万分子サンプルライブラリ⁴代表的な結果 (図 2) にあたり 7,042 固有インデックス化された分子 (400 万 568 遺伝子特定 oligos で割った値) の理論的な平均値を得るために正規化されました。
増幅し、シーケンス処理用ライブラリを正規化します。
1. 必要な合計 50 μ L 最終的な PCR のための次のマスターミックスを用いた分子数を増幅する: Q5 マスターミックス、P5 のプライマーの 2 μ L の 25 μ L (1 μ M)、P7 プライマーの 2 μ L (1 μ M) と 21 μ L の DNA 分子の。
2. 次のパラメーターを使用してサーマルサイクラー PCR プログラムを実行: 30 98 ° c; s10 の 16 サイクル 98 ° c、30 秒 66 ° c、30 s 72 ° c; s72 ° C で 2 分4 ° C で押し
3. (材料表項目 2) 磁気ビーズを用いたシーケンスライブラリのクリーンアップ: 修正された 1 PCR の反作用の磁性ビーズに PCR 反応を追加: 0.75 磁気ビーズ比。
  1. 2.4.2 のステップから 50 μ L の PCR の製品に磁気ビーズソリューションの 37.5 μ L をピペットします。
  2. 1.5 mL 低バインドチューブに混合物を転送します。
  3. 10 回以上でピペッティングを上下で徹底的にミックスします。
  4. 5 分間室温で放置に混合物を残します。
  5. マグネットホルダーにチューブを置きます。室温でまたは清まで 2 分間インキュベートは明らか。
  6. 上清を除去します。
  7. 70% エタノール 200 μ L でビーズを洗浄します。
  8. 30 s. 削除エタノール間インキュベートします。
  9. エタノールの洗浄ステップをもう一度繰り返します。
  10. ビーズを風乾します。
  11. DdH₂o. の 20 μ L の溶出します。
4. 溶離された DNA の因数を実行 (〜 3 μ L) 2% の agarose ゲル、産物のサイズを確認します。
5. (材料表項目 3) 別々の ECS ライブラリの濃度を決定する DNA の濃度を定量化します。
6. 等モル量でライブラリをプールします。方法 1 の手順 1.5.6 を参照してください。プーリングの詳細についても議論。
7. 約 4 でプールされた ECS ライブラリを提出 nM。
8. イルミナシーケンスプラットフォーム (MiSeq、HiSeq または NextSeq) 次のシーケンス設定を提供する: 2 x 144 ペアエンドを読み取り、8 サイクルインデックス 1 と 16 サイクルインデックス 2。
ECS バイオ情報処理・解析
1. シーケンサーからサンプルにデマルチプレックスした読み取りを取得したり、カスタムスクリプトで i7 アダプターシーケンス bioinformatically を使用してさまざまなサンプルに塩基配列読み取りの逆多重化を行います。
2. 遺伝子パネルからオリゴのシーケンスを削除する各デマルチプレクスされた読み取りの最初 30 ヌクレオチドを切り落とします。
3. 読み取りの家族を形成する互いに同じ行政を共有読み取りを合わせます。
  メモ: 読み取り家族を抽出する MAGERI¹³など海対応ソフトウェアは、研究者が使用できます。法の特異性を高めるため、この実験で海シーケンス内のハミング距離は許可されません。
4. 重複およびエラー訂正次のパラメーターを使用して実行します。
  1. 使用 ≥5 読む同じペアの家族。読み取りの 3 つのペアの最小値をお勧めします。
  2. 同じ読み取りファミリのすべての読み取りの間であらゆる位置にある塩基配列を比較し、コンセンサス塩基を生成する 90% 以上がある場合特定の塩基配列を読み取るの一致。塩基位置の 90% の契約より小さい N がある場合を呼び出します。
  3. 持っているコンセンサス読み取りを破棄 > (名) と呼ばれているコンセンサス塩基数の合計の 10%
5. Hg19 または hg38 のいずれかの人間の参照ゲノム Bowtie2、BWA など研究者の最寄りの aligner(s) を使用してローカルにすべての保有コンセンサス読み取りを合わせます。
6. プロセスパラメーターを使用して Mpileup の読み取りを揃えます-BQ0-d エンに関係なく適切な玉突き事故出力を確保するカバレッジしきい値を削除する 10,000,000,000,000。
7. 1000 未満 x 合意報道を読むと位置を除外します。
  メモ: 研究者は任意各ヌクレオチドの位置の最小範囲を決定、勧め下流解析のための報道を読む、少なくとも 500 x コンセンサスを持っています。
8. 二項分布を使用して、次のパラメーターでステップ 2.5.7 から保有データの単一のヌクレオチドの亜種 (SNPs) を呼び出します。二項分布の統計は、ゲノムの位置固有のエラーモデルに基づいているが。その特定の位置のためのすべてのサンプルのエラー率を加算した後、それぞれのゲノム位置は独立してモデル化します。次の例。
  所定ゲノムの位置、 pにヌクレオチドプロファイルの確率
  ∑ バリアント RF2 σ 合計 RFs
  = 26/255505
  = 0.000101759
  24 バリアント 35911 合計 RFs、 Pから RFs の二項確率 (X ≥ x) サンプル K
  1-binomial(24, 35911, 0.000101759) を =
  = 2.26485E-13
  注: 照会各ゲノムの位置にある 3 つの可能な変異 (すなわち、A > T、A > C、A > G) とそれぞれの背景の成果物として表現されます。ボンフェローニ補正後背景と異なっている体細胞のイベントが保持されます。表 1に示す例では、実行したテストの数が 11、それ故、ボンフェローニ修正p-≤0.00454545 の値 (0.05/11) 重要な統計としてイベントを呼び出すために必要だった。
9. 体細胞イベントが同じ標本; から両方のレプリケートに存在する必要があります。そうしないと、誤検知として考えてください。

Table 1
表 1: この例位置特異的二項誤差モデルを構築する方法を示します。

3 エラー訂正 RNA の塩基配列決定

DNA レベルでの突然変異の評価に加えて RNA レベルで稀または低豊富なトランスクリプトを検出する様々なターゲット RNA シーケンスパネルと ECS を統合します。市販の Qiagen RNA シーケンスパネルと ECS を組み合わせて、ハウスキーピング遺伝子に対する正規化を必要とせず 10 冊ほど成績の遺伝子発現の定量を行った。エラー訂正のために必要な行政は、パネルに統合されています。
1. 総 RNA の抽出 (材料表、アイテム 20) を実行します。
2. 製造元のプロトコル (材料表、項目 19) によると ECS RNA ライブラリの準備を行います。
3. ステップ 2.5.1–2.5.6 によるとバイオインフォマティクスパイプラインを実行します。前のセクションで説明されているメソッド 2。2.5.6 のステップの後は、遺伝子ごとの一直線に並べられたコンセンサス読み取りの数は遺伝子の長さの正規化を必要とせず遺伝子の発現レベルを表します。

Representative Results

Targeted Error-Corrected は、DNA の配列に突然変異患者商業の genomic DNA の DNA を希釈原理検証実験の証拠を行った。患者は、GATA1 突然変異 (chrX:48650264、C > G) 0.19 の元エンと。図 1に ECS が単一のヌクレオチドのバリアントのため 1: 10,000 レベルを定量的であることを示します。

図 1: GATA1 SNV が ECS が 1: 10,000 レベルを定量的であることを示す希釈系列。この図の拡大版を表示するのにはここをクリックしてください。

また、ECS DNA は確実に高齢健常者⁴成人急性骨髄性白血病 (AML) における反復的遺伝子のまれなクローン変異を検出.バンク約離れて〜 10 年ナースの健康における 20 健常者からバフィーコートのサンプルを入手しました。我々はこれらのサンプルに ECS DNA パネルプロトコルを適用されます。この実験は、我々イルミナ TruSight 骨髄性シーケンスパネル 568 amplicons (詳細 https://www.illumina.com/products/by-type/clinical-research-products/trusight-myeloid.html の遺伝子リスト) で構成される適応し、シーケンス20 人から 80 ライブラリ (異なる時点での 2 コレクションは、時間ごとに個別あたり 2 複製ポイント) 4770 万ペアエンド読み取りの平均と 340 万エラー修正の平均を生成するイルミナ NextSeq プラットフォームを使用してライブラリ⁴ごとコンセンサス配列。ライブラリあたり平均ヌクレオチド報道約 6,000 (3.4 百万 568 で割った値) x だった。各サンプルでは、同じサンプルからはシーケンスのライブラリを使用して位置固有のエラープロファイルを構築しました。我々は、少なくとも 1 つのコレクションの時間ポイントの両方のレプリケートに存在していた 109 のクローン体細胞の突然変異を見つけた。これらの突然変異があるエン 0.0003-0.1451 に至る。既知の宇宙の表現と 21 の突然変異を選択し、ddPCR を使用して 1 つまたは 2 つのコレクションの時間ポイントのすべての 21 の変異を検証 (n = 34、図 2、若いら2016⁴から適応)。

図 2: ECS によって識別される突然変異が高い一致 VAFs と ddPCR を介して確認した。(n = 34、若いら2016⁴から変更)。この図の拡大版を表示するのにはここをクリックしてください。

(QIAseq 人間癌トランスクリプトームパネルから適応)、種々の癌と関連付けられる知られていた 416 の遺伝子で構成される QIAseq 化学を用いた遺伝子パネルをカスタマイズしました ECS RNA のプロトコルを使用して表現のエラー訂正レベルに関してある特定の遺伝子 (遺伝子リスト補足資料1) の最も一般に表されたエクソンを増幅します。我々はライブラリあたり 830 万読み取りの平均を与えたペアエンド形式でイルミナ MiSeq プラットフォームを使用してライブラリを塩基配列し、41 万 7000 エラー修正コンセンサスシーケンスの平均値を取り込むことができた。低豊富な転写産物の発現レベルを示した (< 1,000 トランスクリプト数 50 ng のトータル RNA の) 複製間再現性の高い、(データポイント n = 300、図 3)。DdPCR (表現の度合いの六つの選択した遺伝子) を使用した検証は、遺伝子の発現レベルが正しく正規化を必要とせず ECS プロトコルによって捕獲されていたことを示した。

図 3: 同じサンプルの複製の間 ECS RNA によって上部には、トランスクリプトの相関をカウント (n = 300).下、ECS で識別されるカウントは ddPCR によって立証されたトランスクリプト (n = 6)。この図の拡大版を表示するのにはここをクリックしてください。

Discussion

ここでは、さまざまな病気で低 VAFs と突然変異を研究する簡単に実装することができますシーケンスのエラー修正プロトコルのスイートを紹介します。最も重要な彼らは raw 読み取りのエラー訂正を有効にすると各分子シーケンスの前に行政の混入であります。ここで説明する方法は、市販遺伝子パネルおよび自己設計されていた遺伝子特定 oligos の両方にカスタマイズされた行政を組み込む研究者を許可します。

NGS の標準プロトコルシーケンスエラー率 2% 以下エンと遺伝子変異の検出を排除する、これは稀な変形の検出は重要な研究の NGS のアプリケーションを制限します。標準の NGS 誤り率を回避、ECS これら生の変異体の高感度検出できます。例えば、これらの突然変異は最初 (したがって、低エン) 起こるとき病原性の変異の検出は病気¹⁴^,¹⁵の早期介入を通知することが不可欠。白血病研究、最小残差の検出の病 (治療後残存白血病細胞) がリスク層別化を通知し、バイナリ流れフローサイトメトリー評価できない方法で治療の選択肢が通知される可能性があります。さらに、ECS は循環腫瘍核酸を検出し、プライマリの特性は、特定の突然変異のバリアントの負担と同様に有無を評価することによって固形腫瘍患者における転移能を評価する適切です腫瘍¹⁶。

表 1に示されているように、バリアントを呼び出す位置固有のエラーの二項分布に基づくモデルを使用しての力はエラーモデルの構築に使用されるシーケンスの深さと同様に、シーケンスされたライブラリの数に大きく依存します。エラーモデルのロバスト性のサンプルと詳細シーケンス数の増加とともに増加します。各サンプルのエラープロファイルを構築するサンプルあたり 3000 x のエラー修正リードカバレッジの平均で少なくとも 10 シーケンスされたサンプルを使用することをお勧めします。位置特定方法と同じです、MAGERI がすべての六つの異なる置換タイプの集計エラー率を使用しての代わり (A > C/T > G、A > G/T > C、A > T/T >、C > A/G > T、C > G > C、C > T/G > A)¹³, 我々はすべての位置で独立して各置換モデルします。例えば、C のエラー発生率 > 所定ゲノムの位置に T は別の位置から異なる。我々のアプローチも考慮シーケンスバッチ効果シーケンス実行の 1 つにみられる塩基置換率は別の実行から異なる場合があります。したがって異なるシーケンスの実行からのサンプルはモデルの構築にプールされる場合は特にすべての置換型のそれぞれの位置をモデル化することが重要です。

ECS 実験を設計するときの重要な考慮事項は、所望の検出のしきい値です。NGS 研究の美しさは遺伝子/ターゲットの興味、(配列の深さによって決定)、検出しきい値および照会個体数の面で、簡単に縮小できます。たとえば、研究者が 0.0001 の検出閾値を持つ 2 つの産物のまれな突然変異を見つけるに興味があるなら、MiSeq V2 化学まで 1500 万読み取りを出力を使用して実行、単一シーケンスで最大限に 75 検体をプールできる (2 amplicons * 10,000分子 * 10 読み取りエラー補正 * 75 検体 = 1500 万配列読み取り)。研究者は分子シーケンスまたは検出しきい値を調整するために実行する単一シーケンスでプールされたサンプルの数に入るの数を変更できます。私たちの研究で検出しきい値を持つ 0.0001 エン (1:10, 000) の突然変異を見つけることを目指しましたイルミナ遺伝子パネルを使用します。我々は日常的に 250 を使用して十分な分子が前述の検出閾値を達成するためにキャプチャされるように DNA の開始の ng。研究者は、DNA の低量の開始する選ぶことができます (50 ng をお勧めします) 目的の検出限界がある場合 > 0.001 エン。

行政は、i5 のインデックスに追加されます、シーケンス設定はそれに応じて改正されるあります。たとえば、16 の N 行政を使いました、シーケンス設定された 2 x 144 対最後の読み取り、インデックス 1 の 8 サイクル、インデックス 2 の通常 8 サイクルではなくインデックス 2 の 16 のサイクル。インデックス 2 サイクルの増加は、読み取りに割り当てられた合計回数の減少によって補償されています。研究者は 12 n Umi¹⁰^,¹⁷を使用することを選ぶ、設定はインデックス 2 の 12 のサイクルを変更する必要があります。

この海ベースのシーケンスのメソッドは、シーケンスエラーの修正に最適です。すべて増幅方式のための問題である PCR 表示をあつかう上で最適ではないままです。ポストシーケンスと ddPCR を使用してポストバイオインフォマティクス検証のラウンドを行い、我々はほとんど PCR 表示による任意の偽陽性を検出します。それにもかかわらず、研究者が低増幅エラー高忠実度ポリメラーゼを用いた実験を行うことをお勧めします。

Disclosures

著者が明らかに何もありません。

Acknowledgments

我々は腫瘍グループ AAML1531 子どもと看護師の保健研究患者サンプルの形で彼らの貢献のために参加者に感謝します。この仕事、国立衛生研究所 (UM1 CA186107、RO1 CA49449 RO1 CA149445)、子供の発見研究所のワシントン大学とセントルイス子供病院 (MC-II-2015-461) とイーライセス・マシューズ白血病財団によって資金を供給されました。

Materials

Name	Company	Catalog Number	Comments
Q5 High Fidelity Hot Start Master Mix	New England BioLabs	M0492S
Agencourt AMPure XP	Beckman Coulter	A63880
Qubit dsDNA HS Assay Kit	Thermo Fisher Scientific	Q32854
SYBR Safe DNA Gel Stain	Thermo Fisher Scientific	S33102
Truseq Custom Amplicon Index Kit	Illumina	FC-130-1003
UMI i5 adapter sequences	Integrated DNA Technologies	-
NEBNext Ultra End Repair/dA-Tailing Module	New England BioLabs	E7442S
NEBNext Ultra II Ligation Module	New England BioLabs	E7595S
QX200 ddPCR EvaGreen Supermix	Bio-Rad	1864034
QX200 Droplet Generation Oil for EvaGreen	Bio-Rad	1864005
QX200 Droplet Digital PCR System	Bio-Rad	1864001
ddPCR 96-Well Plates	Bio-Rad	12001925
DG8 Cartridges for QX200/QX100 Droplet Generator	Bio-Rad	1864008
DG8 Gaskets for QX200/QX100 Droplet Generator	Bio-Rad	1863009
Bioanalyzer	Agilent Genomics	G2939BA
TapeStation	Agilent Genomics	G2991AA
TruSight Myeloid Sequencing Panel	Illumina	FC-130-1010
Bowtie 2	Johns Hopkins University	-
Customized QIAseq Targeted RNA Panel	Qiagen	-
Rneasy Plus Mini Kit (50)	Qiagen	74134