Biology

レトロウイルス統合サイトの増幅、次世代シーケンシング、およびゲノムDNAのマッピング

Published: March 22, 2016 doi: 10.3791/53840

Erik Serrao¹, Peter Cherepanov², Alan N. Engelman¹

¹Department of Cancer Immunology and AIDS, Dana-Farber Cancer Institute, ²Chromatin Structure and Mobile DNA, The Francis Crick Institute

Abstract

両方のローカルおよびグローバルなスケールでレトロウイルスの展示署名統合好み。ここでは、（2）各ウィルスのゲノムの位置をマッピングする、ライゲーション媒介PCR（LM-PCR）増幅および次世代シークエンシング（NGS）を使用して、レトロウイルス組込み部位の多様なライブラリーの（1）の生成のための詳細なプロトコルを提供しますBEDToolsを用いて接合をホストし、そして（3）統計的関連性のためにデータを分析します。感染細胞から抽出したゲノムDNAを制限酵素で、または超音波処理による消化によって断片化されます。適切なDNA末端修復した後、二本鎖リンカーは、DNAの末端にライゲーションされ、半ネステッドPCRは、ウイルスの長い末端反復（LTR）の端部と連結させたリンカーDNAの両方に相補的なプライマーを用いて行われます。 PCRプライマーは、別々のアダプターライゲーションのための要件を否定、NGS中にDNAのクラスタリングに必要な配列を運びます。品質管理（QC）は、DNA断片のサイズ分布を評価し、適応させるために行われますNGSの前にDNAの取り込みを小胞体。シーケンス出力ファイルは、LTR-含む読み込みのためにフィルタリングされ、及びLTRおよびリンカーを定義するシーケンスが離れてトリミングされます。トリミングされた宿主細胞の配列は、BLATを用いて基準ゲノムにマッピングされ、参照ゲノムにおけるユニークな点に最小限97％の同一性のためにフィルタリングされます。ユニークな組み込み部位は、様々なゲノム機能に隣接するヌクレオチド（nt）の配列および分布の相対のために精査されています。このプロトコルを使用して、高い複雑性の組込み部位のライブラリーは、三日中のゲノムDNAから構築することができます。組込み部位の解析に影響を受けやすい組織培養細胞の外因性のウイルス感染を包含する全体の手順は、従って、約1〜2週間で行うことができます。この技術の最近のアプリケーションでは、HIV感染患者からの組込み部位の長手方向の分析に関連しています。

Introduction

宿主細胞ゲノムへのウイルスDNA（vDNA）の統合は、レトロウイルスのライフサイクルに不可欠なステップです。統合を安定挿入プロウイルス¹の確立につながる二つの異なる触媒プロセスを実行するウイルス酵素インテグラーゼ（IN）、によって達成されます。サブユニットにある多量^2-4によって一緒に保持端vDNAと高次intasomeを形成し、逆転写により生成された線形vDNAの端部に係合します。切断する3'-処理として知られているプロセスにおける配列の3 '下流不変5'-CA-3からvDNAの'末端は、3 '陥凹残す各vDNA末端^5-8で反応性ヒドロキシル基で終わります。 intasomeは、その後、ホストの大規模アセンブリおよびプレインテグレーション複合体^{（PIC）9-11}として知られているウイルスタンパク質の一部として核にインポートされます。細胞標的DNA（TDNA）が遭遇した後、INは3'-ヒドロキシルグロvDNAを使用しています同時に千鳥状にTDNAトップとボトム鎖を切断するアップとは、鎖転移^12,13の過程を経てTDNA 5 'リン酸基にvDNAを結合します。

ローカルおよびグローバルなスケールでレトロウイルス展示組込み部位の好み。局所的には、コンセンサス組込み部位は、上流と下流のvDNA挿入部位^14,15から約5〜10塩基対から及ぶ弱く保存されたパリンドロームTDNAの配列からなります。世界的に、レトロウイルスは特定のクロマチンの注釈^16をターゲット^にしています。イプシロン、レンチ、およびspumaを通じてアルファ - 7つの異なるレトロウイルス属があります。ガンマレトロが優先的に、転写開始部位（のTSS）とアクティブエンハンサー領域^18-20に統合しながら、HIV-1を含むレンチウイルスは、積極的に転写される遺伝子¹⁷の本体内での統合を好みます。著しく対照的に、スプーマを強くheterochromに偏っていますこのような遺伝子に乏しいラミナ関連ドメイン²¹とATICの地域、。地元のTDNAの基本設定は、INとTDNA ^13,22,23間の核の連絡先の特定のネットワークによって決定される大部分があります。レンチウイルス及びガンマレトロのために、ゲノムのアノテーションへの統合の相対は、INと同族の細胞因子^24-27間の相互作用によって支配大部分です。因子の相互作用^{25-27,29-32は、}それぞれ、ローカルおよびグローバルレベルでの統合を再ターゲットするための戦略を証明しているIN-ホストIN-TDNAの相互作用ネットワーク^13,22,23,28の仕様を変更し、破壊し、またはリエンジニアリング。

レトロウイルスの組み込み部位をカタログするために使用するDNA配列決定手順のパワーは、過去数十年にわたって非常に増加しています。組込み部位は、研究^33,34ごとにユニークなサイトのほんの一握りを得るために面倒な精製および手動クローニング技術を用いて、先駆的な仕事に回収しました。外因性の組織培養細胞の感染から回収サイトの数が数千¹⁷に数百に増加して、フィールドを形質転換したヒトおよびマウスのドラフトゲノムに個々の組込み部位をマッピングする機能を持つLTR-宿主DNA接合のLM-PCR増幅の組み合わせ^、18。 NGSの方法論とLM-PCRのより最近の組み合わせは、ライブラリの深さ急騰を送信しました。 DNAのクラスタリングを使用することにより、配列決定ライブラリがユニークな配列^19-21,39数百万を得ることができるしながら具体的には、パイロシーケンシングは、ユニークな組込み部位^30,35-38数万のオーダーで得られました。ここでは、DNAのクラスタリングNGSを使用して、レトロウイルス組込み部位を増幅し、配列決定するための最適化されたLM-PCRプロトコルを記述します。この方法は、それによってsequenする前に、追加のアダプターライゲーション工程の必要性を排除し、直接増幅されたDNA分子に、したがって、PCRプライマーに必要なアダプター配列を組み込み、^40を cing。 LTR-宿主DNA接合の生配列決定データの解析からのゲノムの機能を適切にする固有の組み込み部位のマッピングのバイオインフォマティクス解析パイプラインは、また、一般的に記載されています。この分野^36,38,41-43における従来の方法論のプロトコルから確立された優先順位に応じて、カスタムスクリプトは、バイオインフォマティクスパイプライン内の特定のステップの完了を支援するために開発することができます。プロトコルの有用性および感度は、増幅することにより、代表的なデータで示さシーケンシング、および1.0の感染のおおよその多重度（MOI）、並びに、このDNAの滴定シリーズで感染組織培養細胞からのHIV-1組込み部位をマッピングしています6.4×10 ^-5のおおよそ同等のMOIを得15625：1の最大希釈の5倍ステップで非感染細胞DNAを介して希釈しました。

Subscription Required. Please recommend JoVE to your librarian.

Protocol

1.ウイルスストックを生成します

注意：このプロトコルのウェットベンチ態様のフローチャートを図1に示されたウイルスストックの産生および組織培養細胞のその後の感染の詳細は、一般的にレトロウイルスの異なるタイプに適用されます。いくつかの実験のために、標的細胞は、内因性ウイルス受容体（複数可）を発現しないことがあり、そのような場合、異種ウイルスエンベロープ糖タンパク質を保有する偽型レトロウイルス粒子の構造は、 例えば、水疱性口内炎ウイルス（VSV-G）からのG糖タンパク質、あろう感染^44,45のために必要。

注：HIV-1で作業するときの注意事項が取られるべきです。具体的なガイドラインは、機関から機関に異なりますが、すべてのウイルスベースの作業は（典型的には、組織培養フードと呼ばれる）専用の、オペレータ制限生物学的安全キャビネット内で行われるべきです。適切な個人用保護具それは顔の保護、靴カバー、二重の手袋層、およびフルボディカバーオールスーツを常に着用するが含まれています。ウイルス関連の実験から得られたすべての廃液は漂白剤（10％最終濃度）で不活性化されるべきであり、固形物を含む全ての廃棄物は、廃棄前にオートクレーブ処理する必要があります。

トランスフェクションの1日前に、10％（v / v）のウシ胎児血清および1％を補充したダルベッコ改変イーグル培地（DMEM）10ml中のプレート3.3×10 ⁶ HEK293T細胞（v / v）のペニシリン/ストレプトマイシン（10,000 U / mlストック）5 100mm皿の各インチ
注：補完機能-DMEMを上この点からDMEM-FPSと呼ばれています。
その後の日には、市販のトランスフェクション試薬またはリン酸カルシウムを使用して、VSV-G発現構築物を1μgとエンベロープ削除シングルラウンドベクトルの10の完全長のレトロウイルス分子クローンを有するプラスミドμgのまたは9μgので細胞をトランスフェクトします。
1. Cをインキュベート5％CO ₂の加湿細胞培養インキュベーター中で37℃でells（この状態以降は「組織培養インキュベーター」と呼びます）。後約48時間、メスピペットを用いて、ウイルス含有細胞培地を収穫し、重力流によって0.45μmのフィルターを通してそれを渡します。
2. 4℃で1時間、200,000×gで超遠心によりウイルスを濃縮します。 20 UのDNaseを含む500μlのDMEM-FPSにおけるウイルスペレットを再懸濁し、37℃で1時間インキュベートします。
  注：DNアーゼステップは、トランスフェクション手順から解決したプラスミドDNAの矛先を排除することによって、望ましくないプラスミド配列の回収を低減するのに役立ちます。
製造元の指示に従って、HIV-1 p24抗原捕獲キットを使用してのp24濃度^46を決定^します。
注：ウイルス濃度は、逆転写酵素活性アッセイ^47,48によって決定することができます。また、機能性ウイルスのレベルができますMOIを測定することによって決定されます。これは、最も容易にそのような高感度緑色蛍光タンパク質などの蛍光レポーター遺伝子を発現するウイルスを蛍光活性化セルソーティングを使用して行われます。最適化された細胞株として感染の同じレベルをサポートしていない可能性が初代細胞での作業時MOIの決意は、特に有用であり得ます。

ウイルス2.感染細胞

プレート3.0×10 2.5ミリリットルDMEM-FPSで6ウェルプレート中のウェルあたり⁵ HEK293T細胞および組織培養インキュベーターで一晩インキュベートします。
注意：このプロトコルで回収固有の組み込み部位の数は、細胞および感染症に使用される活性ウイルスの量の数に正比例します。
組織培養インキュベーター中で2時間、500μlの新鮮なDMEM-FPSの最終容量で500 ng / mlでの最終的なウイルスのp24濃度の細胞に感染し、2 mlのDMEM-FPSは、ウェル当たり37℃に予熱追加インキュベーションを継続します。
に感染後48時間で、培地を除去し、2mlのリン酸緩衝生理食塩水（PBS）で細胞を洗浄します。 0.5ミリリットルトリプシン-EDTA 37℃に予熱したを追加し、数秒後に視覚的に細胞脱落のための井戸を検査します。
2ミリリットルを予め温めておいたDMEM-FPSを追加し、〜メスピペットでアップ/ダウン穏やかなピペッティングにより10回の細胞を再懸濁します。 DMEM-FPS予め温めた18 mlを含む75cm ²の組織培養フラスコに溶液を移し、組織培養インキュベーター中で細胞をインキュベートします。
感染の開始から最低限5日後、5 mlのPBSで洗浄し、培地を除去することによって細胞を採取2ミリリットル予め温めておいたトリプシン-EDTAを追加し、ピペッティングにより5ミリリットル予め温めておいたDMEM-FPSで再懸濁します。 2500×gで室温で5分間この溶液を遠心分離し、上清を捨てます。
注：約48時間の感染後^49,50でこれらの条件のプラトーの下で統合は、文化の追加の3日間はsufficientlするために必要とされているが、yは、細胞ベースのDNAの組換えまたはウイルス媒介autointegrationから生じる統合されていないDNA分子の濃度を希釈します。
市販のキット（ 例えば ^、51を参照）を用いて細胞ペレットからゲノムDNAを抽出します。 10 mMトリス - 塩酸、pH8.5の200μlで供給されたイオン交換カラムからDNAを溶出します。
注：細胞のアリコートを前NGSへの適切なウイルス感染を確実にする感染性アッセイのために48時間の感染後（ステップ2.3）に配分されるべきです。

3.断片ゲノムDNAを超音波処理によって、または制限酵素消化により

注：超音波処理は、事実上の配列に依存しない方法でゲノムDNAを断片化し、（比較的低いMOIで開始例えば 、感染した患者の細胞または感染症）、低期待される回収率を有する試料の配列を決定する際にこのように断片化の好ましい態様です。さらに、超音波処理は1つがパルティのPCR重複を区別することができます感染患者におけるプロウイルス含有細胞のクローン増殖を区別することが重要です同じ部位でユニークな統合からcular統合部位配列（以下のステップ11を参照^{）39,52-54。}
注：DNAは、LM-PCRの間に内部のウイルス配列の増幅を減少させるために、上流LTRからすぐ下流の切断されるべきです。上流U5配列から43塩基対下流に位置しており、それはのMseIで生成されたDNAと、その後の連結のための互換性がありません制限酵素BglIIでは、多くのHIV-1株（ 図1B）とよく作品を終了します。超音波処理によりDNAを調製する場合、内部の切断制限酵素は、（ - Eとステップ以下4.3 図1Cを参照）リンカーライゲーションの後に適用されるべきです。

超音波処理のために、120μlの最終体積にヌクレアーゼフリー水でゲノムDNAの10μgのを混ぜます。（500塩基対の平均破断サイズのパラメータを使用して、以下のパラの2ラウンドを超音波処理メートル：デューティ・サイクル：5％;強度：3。バーストあたりのサイクル：200;時間：80秒）。
PCR精製キットを用いて、超音波処理したDNAを精製します。 DNAは、DNA末端修復キットを使用して末端修復し、PCR精製キットを用いてDNAを精製します。テールクレノウエキソを用いてDNA ^-酵素及びPCR精製キットを用いて、A尾DNAを精製します。キットの使用方法の詳細については^51,52を参照してください。
制限エンドヌクレアーゼ消化のために、と同様に、製造業者および5'-TAオーバーハングを生成する（各100 U）の酵素カクテルにより供給される緩衝液を用いて100μlの容量で、37℃で一晩ゲノムDNAの10μgのをカットなどのBglIIなど、互換性のない酵素上流ウイルスLTRの下流に切断します。 PCR精製キットを使用して、翌日DNAを精製します。
注：制限酵素のいずれも端末内LM-PCRプロトコルで増幅されたウイルスDNAの末端の約30塩基対を切断するべきではありません。このプロトコルは、具体的にはU5を増幅しますHIV-1 DNAの末端。

4.アニールリンカーオリゴヌクレオチドおよび断片化ゲノムDNAに連結

注：上記のDNA断片（このプロトコルで利用されるオリゴヌクレオチドの配列については表1を参照）と互換性のあるオーバーハングを含む非対称のリンカーを準備します。 MseI消化DNAのためのリンカーが互換性の5'-TAオーバーハング（ 図1）が含まれている必要がありながら、超音波処理DNAで使用されるリンカーは、互換性のT-3 'オーバーハングを含んでいなければなりません。短いリンカー鎖は、さらに、目的のDNAに向けて、その後の増幅反応を制約するために、このような3'-アミンとして、非伸長化学修飾を含んでいなければなりません。
注：同じ塩基配列決定ランで並列および/または多重化のユニークなサンプル中の複数の異なる組み込み部位のライブラリーを調製する場合、サンプルのクロスcontaminの可能性を制限するために、各サンプルのためのユニークなリンカーを使用することをお勧めしますPCR中エーション。これはさらに、半ネステッドPCR（後述）の際に、各サンプルのためのユニークなリンカープライマーの使用を意味します。ユニークなリンカー鎖とリンカープライマーは、同様の全体の％のGC含量および適用突出位置を維持しながら、表1に列挙されたリンカーオリゴヌクレオチド配列をスクランブルすることによって設計することができます。

90℃に加熱することにより10mMトリス - 塩酸、pHが8.0から0.1 mMのEDTA（各オリゴヌクレオチドの10μMの最終濃度）35μlの中で短いと長いリンカー鎖をアニーリングし、ゆっくりと1度のステップで室温まで冷却しました毎分C。
50μlのリンカー、1μgの断片化DNA、及び800 UのT4 DNAリガーゼを連結した1.5μMが含まれているゲノムDNA試料当たり少なくとも4つの並列連結反応を、準備します。 12℃で一晩ライゲーション。 PCR精製キットで翌日精製します。
超音波処理によって調製された試料については、restricの100 Uを有する精製ライゲーション反応をダイジェスト化酵素一晩メーカー推奨の条件の下で、上流LTR（HIV-1のための例えば 、のBglII）から下流に切断すること。 PCR精製キットを用いてDNAを精製します。

半ネステッドPCR 5.アンプリファイウイルスLTR-ホストゲノムDNAジャンクション

注：回収されたライゲーション反応のDNA濃度に応じて、最適なライブラリーの多様性のために少なくとも4-8並列のPCRを確保するためには、両方のPCRラウンドのために、各サンプルのために準備されるべきです。 DNA鋳型濃度は、分光光度法により定量化されるべきです。このプロトコルでPCRの第一および第二ラウンドは、ネストされたLTRに特異的なプライマーを使用する、同じリンカー特異的プライマーは、両方のラウンド（ 表1）のために使用されます。第二ラウンドLTR特異的プライマーとDNAのクラスタリングのためのリンカー特異的プライマーエンコードアダプター配列ならびに配列決定プライマー結合部位。ネストされたLTR特異的プライマーはまた、WH、6塩基インデックス配列をコードしますICHは同じシークエンスラン内の多重化ライブラリの異なるプライマーの間で変化させることができます。

表2に示すようにチューブあたりの成分を含有する第一ラウンドのPCRを準備します。
注：リンカー特異的プライマーは、リンカーの末端3 'から15~16塩基対上流に位置する端部」53°C、45％のGC含量、およびその3の溶融温度に相補性の22塩基を保有異なるリンカー長いストランド（ 表1）。最初のラウンドの27塩基LTRプライマーは、59°C、48％のGC含量の融解温度を有し、その3 '末端は、HIV-1 U5末端から34塩基対上流に位置します。 HIV-1 LTRに相補的な第二ラウンドの26塩基LTRプライマーの領域は、60°C、50％のGC含量、およびその3 '末端の融解温度を有するウイルスU5から18塩基対上流に位置します末端。ユーザーがあれば、オリゴヌクレオチドの融解温度及びGC-コンテンツは、これらのパラメータを模倣することをお勧めします（他のレトロウイルスで使用するために含む）改変された配列を有する設計PCRプライマー^21。
以下のサーモサイクラーパラメータの下で最初のPCRラウンドを実行します。1サイクル：2分間94°C; 30サイクル：15秒94℃、30秒、45秒、68℃55℃。 1サイクル：10分間68℃。
反応をプールし、PCR精製キットを用いて精製します。。表3に従って、チューブあたりの成分を含有する第二ラウンドのPCRを準備するステップ5.2で説明したサーモサイクラーパラメータを用いたPCRの第二ラウンドを実行します。反応をプールし、製造者の指示に従って商業PCR精製キットを用いてDNAを精製します。
注：DNAクラスタリングNGSと互換性のある推奨インデックスの種々の配列が⁷¹用意されています。

6.実行QC及びNGS（典型的には、シーケンシング機能によって完成）

（QCアッセイ＃1）フルオロを使用して、手順5.3ライブラリーのDNA濃度を確認しますメートル^55。簡単に言えば、200μlのヌクレアーゼフリー水の最終容量で規格と実験サンプルを準備します。 2-3秒間ボルテックスチューブは、2分間室温でインキュベートし、その後、蛍光光度計でサンプルをお読みください。
注：サンプルは、15μlの最小容量の2 nMのライブラリーDNAの最小濃度を含むべきです。
（QCアッセイ＃2）は、テープベースのアッセイ^56を使用して^、DNA断片サイズ分布を確認します。
注：理想的な分布は、長さが500塩基対を中心に比較的広いDNAのピークです。材料のかなりの量が1 KBよりも大きい場合、クラスタリング中ブリッジ増幅を妨げるであろう、より長いDNA種を除去するためにサイズ選択手順を組み込むことが推奨されます。重要なピークが100〜200 bpの周りには明らかである場合にはこれとは対照的に、プライマーダイマーは、PCRの間に形成された可能性があります。この場合、手順は、プライマーダイマーの形成を最小限にするために最適化されるべきです。
（QC検定＃3）共同定量PCR ⁵⁷によってDNAライブラリーへのアダプターの適切な組み込みをnfirm。
メーカーのアプリケーションの文学以下のNGSを実行します。 10％のスパイクでの活用（w / w）のシークエンスランにバランスのとれたベース組成物を提供することにより、リアルタイムの品質指標を最適化するΦX174DNA、。
注：統合サイトシークエンシング実験は、通常、シングルエンドの150bp（SE150）またはペアエンドの150bp（PE150）配列決定に供されています。 PE150は、各DNA分子（ 例えば 、宿主細胞クローン増殖の証拠のための組み込み部位を精査するとき）に、リンカーの結合点をキャプチャするために特に有用です。

7. LTR-含む配列、作物離れLTRとリンカー配列についての配列決定データを解析するためにカスタマイズされたのPythonやPerlスクリプトを使用し、BLATでリファレンスゲノムにマップ

LTR含有配列のスキャンFASTAファイルが離れホストゲノムDNA配列から、作物のLTRおよびリンカー配列を読み取り、新しいFASTAファイルにこれらの配列をエクスポートします。マップは、出力統合サイトは、以下の設定を使用して、個別の.txtファイルにエクスポート座標との両方の参照ゲノム（ 例えば 、ヒトゲノムのバージョンhg19またはGRCh38）に読み込んで、BLAT ^58を使用して、ウイルスゲノムクロップ：
ステップ幅= 6、minIdentity = 97、およびmaxIntron = 0
autointegrationsを削除.txtファイル、BLAT出力（LTR端はウイルスDNAゲノムの内部領域に統合したこと、すなわち証拠）を解析し、他の配列マッピングHIV-1ゲノムに、そしてここで別の出力.txtファイルを作成しますすべての重複組み込み部位は、単一の、ユニークな座標ヒットに凝縮されています。

8. FASTAファイルにこれらを変換し、統合をめぐる15-NTの間隔を含む.bedファイルを作成し、ベースの環境が統合サイトを取り巻く表示するシーケンスのロゴを作成

拠点の間隔をリスト.bedファイルを作成します。各組込み部位。少なくとも15塩基（5上流と下流の10）は、配列ロゴの生成のために提案されています。 BEDTools ⁵⁹からfastaFromBed機能し、このコマンドを使用して、これらの.bedファイルからFASTAファイルを生成します。
fastaFromBed -fi /ディレクトリ/に/参照/ゲノム/ -name -s - ベッド15_base_pair_file.bed -fo output_file.fasta
注：不変ウイルス5'-CA-3 'ジヌクレオチドは、統合時にDNAをホストするために入社し、細胞DNAへのLTR末端の接合性を検証することは善意の統合部位を同定するための重要な初期フィルタです。我々はさらに、実験結果を検証するために、このホストDNA配列集団からシーケンスのロゴをコンパイルします。レトロウイルスは、それらの組込み部位^14,15の周囲^のシグニチャベースのプリファレンスを表示するように、シーケンスのロゴは、マッピングされたゲノムのサイトは、このような非相同DNAなどの他の組換え機構と比較して、IN-媒介統合によって生じたことを検証するのに役立ちます最後は^60,61を接合^します。
使用WebLogo 3は（http://weblogo.threeplusone.com/create.cgi）FASTAファイルからシーケンスのロゴを作成します。 FASTAファイルをアップロードするには「ファイルを選択」し、次の設定を使用]をクリックします：出力形式、PDF（ベクトル）。ロゴのサイズ、大;最初の位置番号、-5;ロゴ範囲、-5〜5。 Y軸スケール、0.1、Y軸の目盛間隔、0.5、配色、古典（NA）。

9.サンプルのクロスコンタミネーションをチェックし、中央塩基対は、ファイルの.bed作成し、関連のあるゲノム機能への相対的なユニークな統合サイトの分布地図

レトロウイルスの統合はTDNAストランド全体に千鳥状に発生するので、ゲノム機能へのゲノム分布の相対的な正確なマッピングのための標的部位の重複の中央塩基対を反映するために、組み込み部位の正確な座標を調整します。
1. したがって、HIV-1のようなウイルスを複製する5 bpのために、私からのオフセット中央塩基対と.bedファイルを作成しますプラス鎖に統合マッピングのための下流の2塩基、およびマイナス鎖に統合マッピングのための上流の2つの塩基によってntegrationサイト。
中央の塩基対は、2つの異なるサンプルのためと、このコマンドを次でファイルを.bed交差するBEDTools機能を交差使用して、別のライブラリ間で共通の組込み部位の数を計算し、サンプルのクロスコンタミネーションを確認するには：
bedtools交差-a central_basepair_1.bed -b central_basepair_2.bed -f 1.00 -r -s> overlap1v2.txt
次のコマンドを使用して、2つのライブラリーの間で一般的な部位の正確な数を定量化するために、出力overlap1v2.txtファイル内の行数を数えます：
トイレ-l overlap1v2.txt
UCSCゲノムアノテーションデータベースからの組込み部位のマッピングに使用された参照ゲノムのバージョンのためのRefSeqの注釈.bedファイル（ 例えば http://hgdownload.cse.ucsc.edu/goldenPath/hg38/daをダウンロード^{tabase）62。}
1. RefSeqは、このコマンドの次のファイルを.bedとサンプル用に生成された中央の塩基対.bedファイルを交差するようにBEDTools機能を交差使用してのRefSeq遺伝子内に入る組込み部位の数を計算します。
  bedtools交差-a central_basepair_1.bed -b RefSeq_hg38.bed -u> RefSeq_sample1.bed
次のコマンドを使用してのRefSeq遺伝子に落下サイトの正確な数を定量化するために、出力RefSeq_sample1.bedファイル内の行数を数えます：
トイレ-l RefSeq_sample1.bed
繰り返し間隔.bedファイルが提供されている関心のある他の注釈に9.3とマッピング組込み部位のための9.4を繰り返します。ステップ9.4の指示に従ってUCSCゲノムアノテーションデータベースからの関心の参照ゲノムの最新のCpGアイランドアノテーション.bedファイルをダウンロードします。
1. 特定のディ内に入る組込み部位の数を計算しますBEDTools 窓関数を使用して、このコマンドに従って、CpGアイランドのスタンス（この例で説明されている5キロバイトウィンドウです）：
  bedtoolsウィンドウ-w 2500 central_basepair_1.bed -b CpG_hg38.bed -u> CpG_sample1.bed
次のコマンドを使用して、上流または下流のCpGアイランドの2.5キロバイトの範囲内にあるサイトの正確な数を定量化するために、出力CpG_sample1.bedファイル内の行数を数えます：
トイレ-l CpG_sample1.bed
繰り返しは、マッピング組み込み部位近くのTSS 9.6と9.7を繰り返します。ゲノムは、二つ以上の遺伝子にマッピング座標RefSeq.bedファイルの別のバージョンを生成し、その位置に存在する唯一の単一の遺伝子を反映するために調整されています。これは、組み込み部位の周囲の遺伝子密度の過大評価を防ぐことができます。 BEDTools 窓関数を使用して、このコマンドに従って、各組込み部位の周囲の1 Mbの領域に遺伝子密度を計算します。
このコマンドに従うことによって、データセット内のすべての統合のための平均遺伝子密度を計算します。
awkの（合計+ = $ 7）END（プリント "平均="、和/ NR）」GeneDensity_sample1.bed

10.統計的にRに両側フィッシャーの正確確率検定と両側ウィルコクソン順位和検定を使用したサンプルのうち、統合サイト分布を比較

RefSeq遺伝子内またはCpGアイランドまたはのTSSのウィンドウ内に組み込み部位の割合を比較するための使用フィッシャーの正確確率検定を、しかし、組込み部位の周囲の遺伝子密度に分布を比較するためのWilcoxonの順位和検定を使用します。注意してください。 Rプログラムはhttp://www.r-project.org/で入手可能です。
フィッシャーの正確確率検定、両側検定：

ステップ9.4および9.7の指示に従って計算された数字を使用して、CR観察出現このコマンドに従うことによってサイトを残りの対（注釈内や注釈を囲むウィンドウ内の統合）のRの各比較のために行列をeate：
（annotation_of_interest < - マトリックス（C（SampleA＃で、SampleA＃が残り、SampleB＃は残りSampleB＃で）、nrow = 2、dimnames =リスト（ハ（ 'センター'、 '剰余'）、C（ 'SampleA」、「SampleB '））））
次のコマンドを使用して、フィッシャーの正確検定、両側検定による比較のためのP値を計算します。
fisher.test（annotation_of_interest、代替= 'two.sided'）$のp.value
ウィルコクソンの順位和検定、両側検定：
各列は一番上のセルにサンプル名が含まれているタブ区切りの.txtファイルを作成し、（ステップ9.9で生成された.bedファイルから取得）、そのライブラリ内のすべての組み込み部位のための遺伝子密度の値によって以下に続きます。次のコマンドを使用してRにこのタブ区切りの.txtファイルをインポートし、ナ正しいファイルディレクトリにvigating：
FILENAME < - as.data.frame（read.delim（file.choose（）、ヘッダ= T、check.names = FALSE、= TRUE、9月= 'トン'）を記入）
次のコマンドを使用して、両側ウィルコクソンの順位和検定による比較のためのP値を計算します。
wilcox.test（FILENAME $ペアリングSampleA、FILENAME $ SampleB、代替= 'two.sided'、= F、正確な= T）$のp.value
注：P値は、プログラムによって返されるゼロた後、Rのみで特定の（非常に低い）限界まで計算することができます。 RでP = 0をもたらす大規模異なるサンプルについては、2.2×10 ^-308 <としてP値を推定します。

11.統合されたウイルスDNAを含む細胞のクローン増殖の証拠のために生のシーケンシングデータを調べ

注：小さな電位が参照ゲノムの正確な同じNTつ以上の統合の必要性が存在します。あるいは、単一でtegrationイベントが原因で、ライブラリ調製中および/またはDNA調製に先立って、細胞複製によるPCRの使用に配列決定データで重複存在になることがあります。 HIV感染患者からのゲノムDNAの最近の分析は、同一の組み込み部位^52-54を含むDNA配列内に（のみPCRの前に発生する可能性がある）のユニークな超音波処理せん断ポイント/リンカの接続点を識別することによって、これらの可能性を区別しています。クローン増殖、細胞内に宿されたプロウイルスは、ウイルス潜伏リザーバに寄与し、ひいてはそれがヒト患者における組み込み部位を研究する際の膨張のレベルを特徴づけるために特に重要であるかどうかの議論は現在あり。

ステップ8.1に記載された手順と同様に、この場合には、拡張する拠点の間隔をリスト.bedファイルを生成し、25ヌクレオチド下流それぞれのユニークな組込み部位から（上流の塩基が、ここで不要です）。の手順に従って、（これらの.bedファイルからFASTAファイルを生成BEDToolsからfastaFromBed機能を使用して、このコマンドを次のようバイステップ8.1）：
fastaFromBed -fi /ディレクトリ/に/参照/ゲノム/ -name -s - ベッド25_base_pair_file.bed -fo output_file.fasta
注：検索各の特異性を改善するために、分析クローン拡大のために、各組込み部位からヌクレオチド下流少なくとも25を抽出することをお勧めします。
好ましくは、カスタマイズされたスクリプトを使用して、それぞれのユニークな組込み部位の下流に25ヌクレオチドに完全一致を含むすべての文字列の生のシーケンスデータFASTAファイルを検索し、新しいファイルにこれらの配列を堆積させます。生の文字列からLTRおよびリンカー配列をトリム。 PEのシーケンスをマージすると、LTRおよびリンカー配列をトリミング、逆相補に読み込み、文字列はntの重複少なくとも20を共有している場合、次にそのREAD1ペアにREAD2文字列を割り当てる変換して読み込みます。
各組込み部位のブロックのリンカアタッチメントポイントをスキャンします。クローン増殖＆ "として各積分の分類＃34;リンカーの付着点である場合≥3離れ沸点。
注：シーケンスを読み取りマージせずにクローン増殖分析のためのプロトコルは^、52に記載されています。
注：超音波処理することにより、正確に同じ位置でのゲノムの断片化は、クローン増殖の程度の過小評価につながり、結果として得られる実験的なバイアスを修正するための方法は^、63,64に記載されています。

Subscription Required. Please recommend JoVE to your librarian.

Representative Results

表4に、代表的な実験の結果は、感染細胞の培養物からの組込み部位を回収するためのNGSの感度を例証します。非感染細胞DNAが直列平均して各セル一積分^40を含有する感染からのゲノムDNAを希釈するために利用されました。 15,625：希釈は1の最大希釈の5のステップで調製しました。滴定シリーズのゲノムDNAは、その後、超音波処理によって断片化または制限で消化することにより、LM-PCRに続いてのMseIおよびBglIIを、エンドヌクレアーゼました。固有の組み込み部位の数、ならびに選択されたゲノム注釈の近位にマッピングするサイトの数は、上記のプロトコルに従って計算しました。データ分析は、理論的には唯一の15625には、感染した細胞から調製したライブラリーから回収されたユニークな組込み部位の数十（ニートゲノムDNAから回収量の1〜2％）を明らかにしました。統合サイトのデータセットを分析するとき、マッチしたランダム制御またはMRCと呼ばれるランダムなゲノム部位の一致したセットにデータを比較することが重要です。代表的な結果は、制限酵素消化によって、または超音波処理によって、ゲノムDNAを剪断したように、二つの異なるMRCデータセットを構築しました。 MRC _ランダム抱い万のサイトが設定され、ゲノムマーカーからの距離を正規化することなく、生成されたのに対し、MRC _ENZは、無作為のMseIおよびBglII制限酵素消化部位に近接してhg19からサイトを選択することによって生成50,000ユニークゲノム部位を含んでいます。ユニークなゲノム位置に戻ってマッピングすることができる唯一のサイトでは、MRCのデータセットで使用されるべきです。配列の偏りを本質的に含まない超音波処理ばさみゲノムDNAとしては、MRC _{ランダムは} 、超音波処理によりDNAの断片化によって生成されたデータセットへのより適用とみなすことができます。制御統合の代替スタイルサイトデータセットは、LM-PCRおよびNGSプロトコール²¹以下その後、タンパク質中の組換え体を反応させることにより、in vitroで生成された²¹ intasome核タンパク質複合体、または脱タンパクのゲノムDNAで急性感染させた細胞¹⁷から抽出されたのPICとすることができます。

組込み部位の分布が回復制限消化（比較はきちんとしたサンプル間である）、ならびに_ランダム MRC _ENZとMRCと比較するために、図2に表示されている。対超音波処理によって回収組込み部位の分布を比較するためのP値次の超音波処理は、CpGアイランドの近くの点で明らかに最大の分散で、酵素調べたすべての注釈のために制限消化によって回収されたものと同様でした。予想されたように^18,65の両方のデータセットはのRefSeq遺伝子および遺伝子D内の統合の面でのMRCから有意に異なりました両方のデータセットは、CpGアイランドとのTSSへの分配の相対的な面でのMRCと同様であった一方で、平均積算部位を取り囲むensity。比較的少数のHIV-1の統合サイトはサイトの合計数は回復し増加し、CpGアイランドまたはTSSの2.5キロバイト以内にマッピングするので、データセット（表4および図2）との間で発生する可能性が変動性を減少させる可能性が高いです。統合サイトのデータの真正性を確認するためのシーケンスのロゴ、図3に示されている。コンセンサスHIV-1組込み部位^{14,22（-3）TDG} （G / V）TWA（C / B）CHA（7）（生化学ベースコードの国際連合を使用して書かれ、バックスラッシュは参加プラス鎖vDNAの位置を示し、下線は5-bpの配列は、HIV-1の統合およびDNA修復、次の重複を示している）の両方の断片化技術により調製ライブラリのは明らかです、確信度は、感染細胞の増加希釈減少するもののDNA。対照的に、MRCのデータセットから整列ランダムな部位は、基本設定のかなりのレベルを生成することができませんでした。

図1：統合サイトライブラリの準備のフローチャートでは、（A）、48時間後HEK293T細胞、収穫およびフィルタリング上清をトランスフェクトする超遠心分離によって濃縮し、そしてウイルスの適切な濃度で標的細胞に感染させることにより、ウイルスストックを生成します。感染後少なくとも5日間は、ゲノムDNAを抽出します。追加の実験の詳細については、本文のセクション1と2を参照してください。（B及びC）断片を制限酵素で、または超音波処理による消化により、ゲノムDNAを精製しました。制限酵素カクテルは、下流、上流ウイルスLTRから切断するには、カウンターを選択することを酵素（ 例えば BglIIで）LM-P用を含める必要があります内部vDNA系列のCR増幅。緑色アスタリスク及び（C）中の分枝の矢印をBglIIリンカーライゲーション後に適用されるべきであることを意味します。黒のハイライトは、細胞配列をホストしながら、レッドは、ウイルス配列を強調しています。暗黙のDNAブレークポイント（正確な縮尺ではない）「X」でマークされていHIV-1は、多くのMseIおよびBglII部位を含みます。唯一のプロトコルに関連するものが示されています。マップ上のブラケットは、優先的LM-PCRによって増幅U5、細胞DNAの領域を意味します。 （D）は （その後、超音波処理の場合とテール・修理を終了）および（E）互換性の非対称リンカー分子（青色）に連結断片化DNAを精製します。 （D）におけるマゼンタ円が増幅される組込み部位を示しています。リンカー短鎖の3 '末端におけるアスタリスクは、アミノブロッキング修飾を意味します。 （F）は、最初のラウンドLTRプライマー（赤）とリンカープライマー（青）を使用して、半ネステッドPCRの最初のラウンドを実施します。トンでLTRプライマーは、そのような配列を欠いている間、彼のPCRラウンド、リンカープライマーは、（青リンカープライマーと緑の付属物としてグループ化された）DNAクラスタリングとNGSプライマー結合配列をコードします。 （G）第一ラウンドのPCR産物を精製し、半ネステッドPCRの第二ラウンドを行っています。 PCRのこのラウンドでは、一緒にDNAクラスタリングとNGSのプライマー結合配列を有する第二ラウンドLTRプライマー（赤）と同様に多重化するためのバーコード（と、最初のラウンド（青+緑付属物）と同じリンカープライマーを使用赤LTRプライマーと緑の付属物）としてグループ化されました。（H）（マゼンタ円でマークされた組み込み部位で、マゼンタに箱入り）の最終統合部位ライブラリように、第2ラウンドのPCR産物を精製します。 QCとNGSのためのシーケンシング施設への一定分量を提出してください。この図の拡大版をご覧になるにはこちらをクリックしてください。

図2： 統合サイト増幅の比較のための P 値 は、それぞれのMRC対超音波処理によって、または制限酵素消化によってDNA断片化に続いては、のRefSeq遺伝子内の組込み部位と近くのCpGアイランドとのTSSの数だけでなく、地域の遺伝子密度プロファイルは、に記載されています。太字や斜体で強調表示され≥0.05 表4 P値 Wilcoxonの順位和検定により算出し、フィッシャーの正確確率検定^のb P値によって計算されたP値^C MRC _{ENZ：。。。}ランダム制御と一致しました。 50,000ユニークな組み込み部位のセットがランダムHGビルドでのMseI / BglII制限部位に近接した位置を選択することにより製造した19 ^日間 MRC _ランダム：ランダムなSelectIによって生成万のユニークな組込み部位を含むランダム制御と一致しました制限部位近傍に正規化することなくhg19でngの位置。この図の拡大版をご覧になるにはこちらをクリックしてください。

図3：代表的な実験ライブラリからの配列ロゴス描いたHIV-1ベースの環境 WebLogoソフトウェアを使用して整列させた制限酵素（A）消化または（B）の超音波処理によって調製したライブラリから統合サイト。一番下にある15625：滴定シリーズの各希釈は1の最大希釈の図の上部にきちんとしたDNAから、描かれています。 （C）50,000ユニークなゲノムサイトのMRCのためのシーケンスのロゴ。エラーバーは、本質的に、任意の特定の位置での塩基の取り込みの標準偏差を表します。具体的には、T各エラーバーのotal高さが比較的小さいデータセット内に存在するエントロピーの過小評価のための制御二回小さなサンプル補正^66、と等価です。 x軸は、ポイントゼロでの統合の部位に対して、宿主細胞のゲノムDNAの塩基の位置を表している。この図の拡大版をご覧になるにはこちらをクリックしてください。

。表1：リンカー構築およびPCR増幅のためのオリゴヌクレオチド配列リンカー固有および第二ラウンドLTRプライマーは、色分けされた次のとおりであるDNAクラスタリングアダプター配列、エンコード：黒、リンカーに、またはHIV-1 LTRと相補的な塩基を、赤、一意のインデックスまたはバーコード;緑、結合部位配列決定プライマー; DNAのクラスタリングのための青、アダプター配列。シングルエンド（SE）のシーケンシングレアペアエンド（PE）の反応は（READ1とREAD2）配列決定プライマーの両方を使用する一方ctionsは、第二ラウンドLTRプライマーREAD1（緑）の配列にアニールする配列決定プライマーを利用します。リンカ短いストランドが変更をブロック3 'アミノが含まれています。この表の拡大版をご覧になるにはこちらをクリックしてください。

試薬	反応あたり追加します
最初のラウンドLTRプライマー（15μM）：	2.5μlの
リンカー特異的プライマー（15μM）：	0.5μlの
10×PCR緩衝液：	2.5μlの
dNTP（各2.5mM）	0.5μlの
DNAポリメラーゼミックス。	0.5μlの
ライゲーション反応：	100 ngの
ヌクレアーゼフリー水：	最大25μlの

表2：第一ラウンドPCRのためのレシピ各個体のPCRチューブに添加される、指定された各試薬の量が示されています。

試薬	反応あたり追加します
第二ラウンドLTRプライマー（15μM）：	2.5μlの
リンカー特異的プライマー（15μM）：	0.5μlの
10×PCR緩衝液：	2.5μlの
dNTP（各2.5mM）	0.5μlの
DNAポリメラーゼミックス。	0.5μlの
最初のラウンドのPCR： 100 ngの
ヌクレアーゼフリー水：	最大25μlの

表3：第二ラウンドPCRレシピ各PCRチューブに添加される各試薬の量が示されています。

<TD>ダイジェスト、1：125

ライブラリ	#Uniqueサイト	％のRefSeq ^A	％のCpG +/- 2.5キロバイトの^B	％TSS +/- 2.5キロバイト^C	平均。遺伝子密度+/- 500キロバイト^dの
超音波処理、ニート	3169	71.2	5.1	3.7	15.8
超音波処理、1：5	366	75.1	2.7	3	16.3
254	74	7.1	5.1	16.7
超音波処理、1：125	430	69.8	6.9	6	14.6
超音波処理、1：625	314	65.6	5.6	6.7	13.5
超音波処理、1：3,125	116	73.6	3.5	2.5	13.1
超音波処理、1：15,625	72	62.5	0	1.4	14.7
きちんとしたダイジェスト、	7428	69.8	3.6	2.9	15.2
ダイジェスト、1：5	1460	71.4	4.4	3.4	14.9
ダイジェスト、1時25分	394	68.8	4.3	3.3	15.8
172	71	0	3	14
ダイジェスト、1：625	134	73.9	3.7	3.7	14.1
ダイジェスト、1：3,125	100	83.1	6.4	5.2	19.1
ダイジェスト、1：15,625	73	74	4.1	1.4	9.7
MRC _ENZ ^電子	50,000	44.7	4.2	4	8.7
MRC _ランダム ^F	10000	41.3	5.3	4.2	8.6

表4： 代表滴定シリーズからの統合サイトのゲノム分布番目の合計組み込み部位の割合。TSSの2.5キロバイト内のCpGアイランドの2.5キロバイト内^BのRefSeq遺伝子内に入ると^、cにおける^D平均積算部位を取り囲む1 Mbの内の遺伝子密度^電子 MRC _ENZ：。。ランダム制御と一致しました。 50,000ユニークな組み込み部位のセットがランダムにhg19中のMseI / BglII制限部位に近接して位置を選択することで生成された_ランダム MRC ^F：。ランダムに固定された位置に正規化することなく、hg19における位置を選択することにより製造万のユニークな組込み部位を含むランダム制御と一致しました。

Subscription Required. Please recommend JoVE to your librarian.

Discussion

ゲノムの分布パターンのマッピングを介して、最初のウイルス感染の段階からのレトロウイルス組込み部位の分析のためのプロトコルは、記載されています。このプロトコルは、任意のレトロウイルスと任意の感染可能細胞型にも適用可能です。さらに、アッセイパイプラインは、6.4×10 ^-5のMOIで開始感染のそれにゲノムDNAと同等の連続希釈液からのユニークな組込み部位の十分な数を回復する可能性のある、非常に敏感です。細胞の小部分のみが組み込まれたプロウイルスを保有します低ウイルス量を含有することができる感染患者からのサンプルに適用すると、この感度は、プロトコルは特に有用となります。この分野^36,38,41-43における従来の方法論の論文と一致して、このプロトコルのバイオインフォマティクス部における複数のステップは、配列データの大きなファイルを処理するためにカスタマイズされたスクリプトの開発から利益を得るであろう。 BLAT ⁵⁸ミリアンペアですがこのプロトコルで説明するユーティリティをpping、ユーザーが適切な代替であるとボウタイ^{67（http://bowtie-bio.sourceforge.net/index.shtml）}を見つけることができます。

代替的なバイオインフォマティクスパイプラインは、最近、モロニーマウス白血病ウイルス（MoMLV）組込み部位¹⁹の決意のために報告されました。それは公的に入手可能であり、それはもともと独特のMoMLV組込み部位の数十万人をマッピングするために使用されたことに非常に強力であるスタンドアロンのソフトウェアに開発されたもので、そのパイプラインが便利です。最近、アデノ随伴ウイルスとTol2のを含むように拡張されたしかし、利用可能なソフトウェアは、もともと具体的に報告されたのMoMLVデータセットを再分析するように設計された、などの実験計画（ツールの機能を交互にパイプラインをカスタマイズするために必要となる再プログラミングとAC / Dsのトランスポゾン）が^{68ベクトル} 。また、そのプロトコルは、予備的な組み込み部位の生成を説明し.bedファイル、しかし、ゲノム注釈を関連するサイトをマッピングするために必要な具体的な手順をレイアウトしていませんでした。読者はここに記載されているプロトコルを使用して生成NGS配列を解析するのに有用な現在の原稿の審査中にリリースされた「ベクトル統合サイト分析」サーバ^69を、見つけることができます。

レトロウイルス組込み部位のデータセットを分析するために、任意のプロトコルを使用する場合、特定の点が強調されるべきです。タンデムで複数のライブラリを調製する場合、大きな潜在的可能性は、サンプルの交差汚染のために存在します。サンプルのクロストークのであっても非常に小さいレベルでは使用できないNGSランをレンダリングするレベルに結果を不明瞭にすることができます。したがって、すべてのウェットベンチワークは滅菌、専用の層流フードまたはPCRワークステーションで完了する必要があります。ピペットおよびヌクレアーゼを含まない水などの試薬のセットは、組み込み部位の増幅専用にする必要があります。各ライブラリーを調製するためのユニークなリンカーの使用は、可能性を制限することができますまた、クロスオーバーの同定を可能にするクロス増幅のために、生FASTAファイル内の各ライブラリ内で読み込みます。

ゲノムDNAを断片化するために制限エンドヌクレアーゼ消化に対する超音波処理を使用しての長所と短所を考慮することが重要です。一方で、超音波処理は、せん断点の比較的ランダムな分布を提供していますが、その後に必要なDNA修復およびA-テーリングの手順では、一貫して、制限酵素で生成された粘着末端で行わライゲーションと比較して、リンカーライゲーション生成物の収率を減少させます。一方、制限酵素消化は必ず回復されたデータの一部のバイアスを紹介しますせん断点の少ない支出集団を提供します。両方の場合において、上流のLTR配列を廃棄する制限エンドヌクレアーゼを利用します（ 図1）ゲノム内のその部位の上流に位置する組込み部位のごく一部の損失をもたらします。広告することができます可能性があり、任意のデータの偏りライブラリー調製の間のプロトコルからの酵素消化を省略し、配列決定データから上流のLTR配列を、得られた多数のをフィルタリングすることで服を着ました。

現在のプロトコルは非常に敏感で、ユニークな組込み部位^21,40の何百万を生成することが可能であるが、利用可能なすべての統合の約三分の一はあっても、ライブラリの製剤（参考文献の最良と所定の実験で増幅されることが期待されるかもしれない^。70そして未発表の観察）。低ウイルス量を抱い低MOI感染や患者からのサンプルを分析する際には、合併症を引き起こす可能性があります。この制限は、繰り返し同じライブラリ調製物を配列決定および/または並列に同一のDNA試料に由来する複数のライブラリを配列決定することによって部分的に克服することができます。アッセイ感度における今後の増加は、それに応じて、レトロウイルス組み込み部位の塩基配列決定の進める翻訳アプリケーションに非常に有益であろう。

Subscription Required. Please recommend JoVE to your librarian.

Acknowledgments

私たちは、エンゲルマンラボにおけるレトロウイルス組み込み部位の配列決定のためNGSプロトコルを確立することが重要であった助言のための私達の同僚スティーブン・ヒューズとヘンリー・レヴィンに感謝しています。この作品は、米国国立衛生研究所によってサポートされていましたAI039394とAI052014（ANE）とAI060354（エイズ研究のためのハーバード大学センター）を付与します。

Materials

Name	Company	Catalog Number	Comments
DMEM	Gibco	11965-084	Standard cell culture medium, compatible with HEK293T cells
Fetal Bovine Serum	Thermo Scientific	SH 30088.03	Different lots of serum may need to be pre-screened for optimal viral production
Penicillin/Streptomycin	Corning	30-002-Cl	Antibiotics to be added to DMEM
Phosphate-Buffered saline	Mediatech	21-040-CV	Used to wash cells
Trypsin EDTA	Corning	25-053-CI	Used to detach adherent cells from tissue culture plates
PolyJet	SignaGen Laboratories	SL100688	DNA transfection reagent
0.45 µm Filters	Thermo Scientific	09-740-35B	Used to filter virus particle-containing cell culture media
Turbo DNase	Ambion	AM2239	Used to degrade carryover plasmid DNA from virus stocks
HIV-1 p24 Antigen Capture Assay	ABL Inc.	5447	Used to quantify yield of virus production
DNeasy Blood & Tissue Kit	Qiagen	69506	Used to purify genomic DNA from cells
Sonicator	Covaris	S2	With this model of sonicator perform two rounds of duty cycle, 5%; intensity, 3; cycles per burst, 200; time, 80 sec
Nuclease-Free Water	GeneMate	G-3250-125	Commercially-available water is recommended to reduce the possibility of sample cross-contamination
QIAQuick PCR Purification Kit	Qiagen	28106	Used to purify DNA during library construction
End-It DNA End-Repair Kit	Epicentre	ER81050	Used to repair DNA ends of sonicated DNA samples
Klenow Fragment (3'-5' exo–)	New England Biolabs (NEB)	M0212S	Used with dATP to A-tail repaired DNA fragments
dATP	Thermo Scientific	R0141	Deoxyadenosine triphosphate
MseI	NEB	R0525L	Restriction endonuclease for genomic DNA cleavage
BglII	NEB	R0144L	Restriction endonuclease to suppress amplification of upstream HIV-1 U5 sequence
T4 DNA Ligase	NEB	M0202L/6218	Enzyme for covalent joining of compatible DNA ends
DNA Oligonucleotides	Integrated DNA Technologies	custom	Have the company purify the oligos. HPLC purification suffices for DNAs <30 nucleotides; PAGE purify longer DNAs
Advantage 2 Polymerase Mix	Clontech	639202	Commercial mix containing DNA polymerase for PCR
dNTPs (100 mM solutions)	Thermo Scientific	R0181	Dilute the four chemicals on ice with sterile water to reach the intermediate worrking concentrations of 2.5 mM each dNTP
NanoDrop	Thermo Scientific	NanoDrop 2000	Spectrophotometer for determination of DNA concentration
Qubit Fluorimeter	Life Technologies	Qubit® 3.0	Fluorometer used to confirm integration site library DNA concentration
2200 TapeStation System	Agilent	G2964AA	Tape-based assay to confirm integration site library DNA size distribution
MiSeq	Illumina	SY-410-1003	Used for NGS