RESEARCH
Peer reviewed scientific video journal
Video encyclopedia of advanced research methods
Visualizing science through experiment videos
EDUCATION
Video textbooks for undergraduate courses
Visual demonstrations of key scientific experiments
BUSINESS
Video textbooks for business education
OTHERS
Interactive video based quizzes for formative assessments
Products
RESEARCH
JoVE Journal
Peer reviewed scientific video journal
JoVE Encyclopedia of Experiments
Video encyclopedia of advanced research methods
EDUCATION
JoVE Core
Video textbooks for undergraduates
JoVE Science Education
Visual demonstrations of key scientific experiments
JoVE Lab Manual
Videos of experiments for undergraduate lab courses
BUSINESS
JoVE Business
Video textbooks for business education
Solutions
Language
ja
Menu
Menu
Menu
Menu
Research Article
Please note that some of the translations on this page are AI generated. Click here for the English version.
Erratum Notice
Important: There has been an erratum issued for this article. View Erratum Notice
Retraction Notice
The article Assisted Selection of Biomarkers by Linear Discriminant Analysis Effect Size (LEfSe) in Microbiome Data (10.3791/61715) has been retracted by the journal upon the authors' request due to a conflict regarding the data and methodology. View Retraction Notice
このプロトコルでは、マッピング mRNA 3' 末端のサイトを処理する方法について説明します。
過去 10 年間の研究は、複雑で動的なさまざまな mRNA の開裂と起こる反応を明らかにしました。長い 3' 非翻訳領域 (UTRs) の Mrna は、細胞の増殖は優先的に短い 3' UTRs と成績証明書を表現に対し分化した細胞で生成されます。今起こるサイト ゲノムのマップ、mRNA の 3' 終わり処理の規制を検討し開発された、2 番目のバージョンでは seq プロトコルについて述べる。また現在このプロトコルを活用 polyadenylate (豊かに完全に処理された mRNAs のためにほとんどの哺乳類の mRNAs の器官の中に追加される poly(A)) 尾。4 番目の位置にある deoxyuracil の DNA アダプター mRNA 3' 端フラグメントの配列のための精密加工が可能します。細胞培養、一晩を含まないプロトコルは約 8 h ハンズオン時間を必要があります。それに伴い派生シーケンス データの分析のための簡単に使用できるソフトウェア パッケージを提供しています。A seq2 と関連付けられた解析ソフトウェア 10 から、条件の広い範囲で最終的に、mRNA 3' のマッピングに効率的かつ信頼性の高いソリューションを提供する6または少ないセル。
キャプチャと mRNA の 3' 端のシーケンスは、mRNA プロセシングの研究と遺伝子の発現定量をことができます。真核生物 Mrna がポリ a の尾のためビードを固定化したオリゴ チミジン (cDNA 合成の主なことができます oligo(dT)) 分子と合計セル lysates から効率的に精製することができます。ただし、このアプローチには、2 つ欠点があります。最初、トラン スクリプト内部にある A の伸張できる cDNA 合成、スプリアス多サイトの結果の主要なも。第二に、均質多ストレッチは、トラン スクリプト識別のための情報されていない別のシーケンスの特定課題を提起します。ポリ a を逆転写など、これらの制限を回避するために様々 なアプローチが提案されているツインテール RNase H 消化 (3 P seq 1)、続いて 20 で終わるカスタム配列のプライマーの使用 Ts (2 P seq 2) の選択基準RNase H 消化 (3' 読み取り3)、そしてヘアピン (A seq 4) で 3' アダプターを含むオリゴ dT プライマーの使用によって続いて CU5T45プライマーで 50 以上のヌクレオチドのポリ a の尾を持つ RNA 断片。
最近開発された A seq2 方法5は多と特に発生するアダプターの自己 ligation によって生成されるダイマーの割合を最小限に抑えるために同時にシーケンスをバイパスすることを目的とするときのアダプターのモル濃度挿入濃度を上回る。この問題は、両方のアダプターが、seq2、3' アダプターが逆転写後の RNA のフラグメントと Cdna の 5' 末端に 5' アダプターの 5' 端に結紮がようにポリヌクレオチド終了の同じ型に組み合わされてときに排除できます。方法は当社従来 - seq - シーケンスが、5'-に - 3 年より便利な ' により、正確に方向制御 RNA 断片化-、ポリ a サイトの識別の高精度を維持しながら。典型的なサンプルのシーケンス処理された読み取りの約 80% はゲノムに一意にマップし、以上 20,000 多サイト クラスター、注釈付き 3' UTRs と重複の 70% 以上の識別に 。
簡単に言えば、A seq2 プロトコルは mRNA の断片化と逆の補数 3' 5' RNA のフラグメントの端にアダプターの ligation から始まります。ポリ (A)-含む Rna は、リバース 3' 末端、位置 4 dU および 5' 端、ビオチンでアンカー ヌクレオチドを含む 25 のヌクレオチド (nt) 長いランダムプライマー プライマーと転写磁気ストレプトアビジン ビーズに cDNA のバインディングが可能です。、ビオチンを含むプライマーのほとんどはウラシル DNA グリコシラーゼ (UDG) と DNA グリコシラーゼ リアーゼ エンドヌクレアーゼ VIII を含むユーザー酵素ミックスによるデュで胸の谷間で cDNA から削除されます。胸の谷間に残るポリ a テールの位置をマークするこの反応 5' アダプター、および 3 つの Ts 左の結紮のためそのまま終了を残します。受信者の 5' 端に結紮 5' と 3' の両方のアダプターが添付されているので、アダプターの二量体は生成されません。4 ヌクレオチド ランダム-mers 読み取りの初めに導入された最新のシーケンシングの楽器のクラスター分解能を可能し、検出と PCR 増幅アーチファクト除去のため分子意識 (UMI) としても利用できます。UMI のサイズは、他の研究6ではさらに増加することができます。プロトコルすべて無作為化の四量体で、5' 端始まるによって PCR 増幅デジタルアーティファクトの補正で 3 診断 Ts を持っている読み取りの 3 ts 処理に続いて始まる mRNA 3' 端に相補的な逆が読み取りを生成します。行政、3' アダプター配列除去を悪用し、逆に補完。A 豊富なサイトは内部でランダムプライマー プライミングから由来している可能性があります読み取りまた計算識別、破棄されます。偽のサイトは一般的に 18 の特徴の一つを欠いているとする必要があります保存された多信号 〜 21 ヌクレオチド上流明らか胸の谷間サイト7の。
プロトコル細胞培養と一晩をカウントされません約 8 h の実践的な時間が必要です。解析ソフトウェアで高精度な多サイト id を関連付けられている読みます。ポリ a サイトからクラスターが作成この注釈付きの遺伝子とこれらの原稿 (コントロール siRNA と si HNRNPC 処理細胞の 2 つの生物学的複製) 84% 重複と 3' UTR、75% の重複、86% どちらかとさらに強調表示 4 のサンプルに基づいて、3' UTR またはターミナル エクソン。3' 端レプリケートのサンプルでの発現のピアソンの相関係数は 0.92 と、0.9 以上の値は、通常、メソッドで取得します。したがって、A seq2、非常に再現性のある結果を与える便利な方法です。
1 ですセル成長および mRNA 分離
2. 5 ' リン酸化と DNase 処理終了
3。ブロック 3 ' 三リン酸コルジセピンで終わる
注: ブロック、3 が不可欠です ' 以降ライゲーション反応 3 で自分の concatemerization を避けるために RNA のフラグメントの端 '、(既にブロックされていない終了。3 の付加によって扱われる加水分解後の繰返し) リン酸 ' dATP (三リン酸コルジセピン) チェーン ターミネーター塩基ポリ a ポリメラーゼの助けを借りて。ここでは、0.5 mg/mL の濃度で表現され、 8 で説明されているように精製酵母ポリ a ポリメラーゼ (yPAP) が使用されました。酵母や 大腸菌 PAP 両方 3 を追加するためほぼ同じ活動がある ' dATP をし、商業的に購入することができます (資料の表を参照してください).
4。逆に 3 の結紮 ' 5 アダプター ' RNA のフラグメントの末尾
5。逆に転写 (RT)
6。ウラシル DNA グリコシラーゼ酵素ミックス消化
7。5 の結紮 ' 5 アダプター ' cDNA の端
8。PCR 増幅のライブラリ、サイズ選択をパイロット
9。データ処理
注: gitlab リポジトリ (https://git.scicore.unibas.ch/zavolan_public/A-seq2-processing) で使用可能なソフトウェア (fastq 形式) での結果のシーケンス データが処理されます。分析には 4 つの主な手順が含まれています: (1) ダウンロード git リポジトリ、仮想環境のインストール (2) (3) 特定のパラメーターの設定構成ファイルと (4) で起動による分析 ‘ snakemake ’ 10. ステップ 4 で実行全体の分析 1 つだけコマンドが必要です。分析の詳細なステップバイ ステップの説明は、gitlab リポジトリ内の README ファイルで見つけることができます、簡単な説明は以下。すべての個別の処理ステップが公開されているツールは、いずれかの外部ソースからの実行あるいは社内準備します。計算のパイプラインは、snakemake パッケージの利用できる 10 anaconda ベース 11 python 3 仮想環境に依存します。それは Unix ライクなオペレーティング システムを持つマシン上で実行し、インストールされている CentOS 6.5 オペレーティング システムと Linux 環境で 40 GB 使用可能な RAM 試験しました。ソフトウェアの依存関係は、仮想環境内で自動的に制御されます。次の公に利用可能なソフトウェア ツールが必要でありそれにより環境と共にインストール: snakemake (v3.9.1) 10, fastx ツールキット (v0.0.14) 12 星 (v2.5.2a) 13、cutadapt (v1.12) 14, samtools (v1.3.1) 14 , 15, bedtools (v2.26.0) 16 , 17.
ポリ (A)-アルカリ加水分解による断片化の培養細胞から分離された RNA を含むと Cdna のランダムプライマー プライマーが付いているトランスクリプションを逆で作られました。結果として得られる cDNA はストレプトアビジン ビーズに固定化した、ウラシル特定切除反応でデュ開裂、5 ' アダプターを結紮、3' 端に裂かれたフラグメントの挿入されました。図 1は、実験のグラフィカルな概要を示しています。
Hela 細胞 HEK293 細胞の 10 の6セルされたプロシージャの終わりに蛋白質のコーディングの遺伝子の大半のためのポリ a サイトを特定するのに足りる。ただし、他の種類の細胞や組織の識別された多サイト数実験で使用されているセルの数と彩度をテストする必要があります増加します。パイロットの PCR の代表の結果のステップし、DNA のフラグメントのシーケンスの前にサンプルの分析は、図 2に示します。
シーケンサーから得られるゲノムにマップする準備ができている品質チェック、アダプターによりトリミングされた読み取りで終わる fastq ファイルから始まって計算の分析の前処理のステップを図 3に示します。図 4は、mRNA 3' 末端処理特定のサンプルで特定されたサイトのカタログに対応するゲノムと末尾に読み取りのマッピングで始まる解析手順を示します。複数のサンプルを分析するときの追加手順が個々 のサンプルで発見されたサイトを処理して、3' 末端に一致し、サンプルの間で彼らの余剰を報告する実行されます。これらの手順は、図 5のとおりです。
したがって、サンプル化されている、利用可能な処理パイプラインを通じて (fastq 形式) のファイルを読み取り結果のシーケンスの分析は簡単です。サンプルについての情報を構成ファイルに追加すると、パイプラインの実行は出力ファイルの 2 つの主なタイプになります: 1) ベッド-ファイルとすべて 3' 終了 (は例えば「個々 のサンプルの識別処理サイトsample1.3pSites.noIP.bed.gz「)、2) 研究のすべてのサンプルの間ですべてのポリ a サイト クラスター (clusters.merged.bed) とベッド ファイル。出力では、すべての読み取り (例: "sample1 それぞれの個々 のサンプルからのゲノム座標も含まれています。STAR_out/Aligned.sortedByCoord.out.bam") その後 IGV16のようなゲノムのブラウザーで表示できます。読み取りのプロファイルの外観検査は一般的にポリ a ゲノムの研究で実施された特定の摂動によって発生する変更サイトで配信の最初の一見を提供します。たとえば、図 6の HNRNPC 蛋白質のノックダウンする特定の遺伝子の応答が表示されます。
これらのゲノム広い分布の概要は (表 1) を設けています。具体的には、"カウント/annotation_overlap"ディレクトリ内の出力ファイルを含む特定の注釈機能と重複サイトの分数 (gtf ファイルから入力として提供; 注釈: 3' UTR、ターミナルのエクソン、エクソン、イントロン、遺伝子間)。最後に、各サンプルは、個別の処理ステップの結果は、("sample1.summary.tsv"など) をも保存されます。これの数が含まれています: ゲノムに一意に対応する各サンプル、5' 末端の予想される構造の読み取り、読み取りにおける PCR 重複を崩壊した後で、読み取り、高品質 9.2 のステップで定義されている条件に従って読む読み取り(シーケンス エラーに起因するそれらを崩壊した後手順 9.5 を参照)、複数のマッピングを読み取り (シーケンス エラーに起因するそれらを崩壊した後手順 9.5 を参照)、生 (クラスター化されていない) 3' 端の各サンプルでは、raw 3' 末端処理サイトのサイトを処理候補内部プライミングすることがなくユニークな 3' 終了処理サイト内部プライミング候補と最終的なポリ a サイトのクラスターのセットなしすべてのサンプルから。

図 1: A seq2 プロトコルの主な手順です。個々 のステップは、図の左側に示されます。挿入の RNA のフラグメントは、逆のトランスクリプション; 後の cDNA の赤く緑の線として描かれています。アダプターは、明るい青またはオレンジに着色されています。この図の拡大版を表示するのにはここをクリックしてください。

図 2: パイロット PCR および最終製品プロファイル。PCR の反作用から (、) の因数は異なるサイクルで収集された、2% アガロースゲル上区切られます。左に数字は、ヌクレオチド DNA の梯子のそれぞれのバンドのサイズを示します。この実験で 12 サイクル (*) は、大規模な PCR の反作用のため選ばれました。サイズの後サンプルの例 (b) 選択は、明らかに平均サイズは約 280 のヌクレオチドのフラグメント サイズ アナライザーで実行します。[FU] 左に数字は相対的な信号強度を示します。この図の拡大版を表示するのにはここをクリックしてください。

図 3: 読み取りをシーケンシングの前処理のアウトライン。シーケンサー機器関連ソフトウェアによって生成される読み取り fastq ファイルは、対応するゲノムにマップする高品質の読み取りを識別するために処理されます。「データ処理」に記載されているプロトコル個々 手順へのリンクが、パイプライン個々 ステップの入力/出力仕様を示します。この図の拡大版を表示するのにはここをクリックしてください。

図 4: シーケンスの概要読んで処理、個別 3' 末端の世代にゲノムにマッピングの手順から処理サイト。図は i へのリンクと、パイプラインの個々 のステップの入力/出力仕様「データ処理」に記載されているプロトコル個々 手順を実行。ユーザーに配信される主な出力ファイルは、太字で示されます。この図の拡大版を表示するのにはここをクリックしてください。

図 5: 共同規制 3' 末端配列サイトのクラスターを生成する撮影されている手順の概要です。「データ処理」に記載されているプロトコル個々 手順へのリンクが、パイプライン個々 ステップの入力/出力仕様を示します。メイン出力ファイルは、太字で示されます。この図の拡大版を表示するのにはここをクリックしてください。

図 6: 3' のプロファイルの例の結果終了 IGV 16ゲノム ブラウザーに表示される NUP214 遺伝子のターミナルのエクソンに沿って処理読み取ります。A seq2 読み取り HEK 293 細胞、コントロール siRNA または HNRNPC siRNA との 2 つのサンプルの調製。解析パイプラインによって注釈が付けられる多サイト記載されている読み取り IGV のゲノムのブラウザーへの入力として使用された BAM 形式で保存されました。MRNA 3' にマップ読み取りピークの 3' 端 Ensembl で注釈が終了します。プロファイルは、HNRNPC ノック ダウン時に長い 3' UTR アイソの使用の増加を示します。この図の拡大版を表示するのにはここをクリックしてください。
| si コントロール複製 1 | si コントロール複製 2 | |
| id: 29765 | id: 32682 | |
| raw 読み取りの数 | 44210258 | 68570640 |
| トリミングとフィルタ リングは有効な読み取りの数 | 14024538 | 21211793 |
| 一意にマッピングの読み取り数 | 6953674 | 13946436 |
| 多遺伝子座にマップの読み込み回数 | 2040646 | 2925839 |
| 個別 3' 末端処理サイトの数 | 1107493 | 1710353 |
表 1: 解析パイプラインの出力例。個々 のステップで得られた読み取りの概要。
著者が明らかに何もありません。
このプロトコルでは、マッピング mRNA 3' 末端のサイトを処理する方法について説明します。
著者らは、細胞培養のヘルプについて夫人 Béatrice Dimitriades をありがとうございます。この作品は、スイスの全米科学財団の補助金 #31003A_170216 と 51NF40_141735 によって支持された (国立がん RNA & 病)。
| Materials | |||
| アガロース、超高純度 | Invitrogen | 16500-500 | |
| 2100 バイオアナライザー | アジレント | G2940CA | |
| コルジセピン三リン酸 (3' dATP) | SIGMA | C9137 | |
| DNA 低結合バイアル、1.5 ml | エッペンドルフ | 22431021 | |
| ダルベッコ’S リン酸緩衝生理食塩水 | SIGMA | D8637 | |
| Dynabeads mRNA-DIRECT Kit | Ambion | AM61012 | |
| GR-Green 色素 | Excellgen | EG-1071 | 1:10,000 dillution |
| HiSeq 2500 または NextSeq 500 次世代シーケンサー | を使用Illumina | サプライヤーにお問い合わせください | |
| KAPA HiFi Hotstart DNA ポリメラーゼミックス | KAPA/Roche | KK2602 | |
| ヌクレアーゼフリーウォーター | Ambion | AM9937 | |
| Poly(A) polymerase, yeast | Thermo Fisher Scientific | 74225Z25KU | |
| Poly(A) polymerase, E.coli | New England Biolabs | M0276L | |
| Polynucleotide kinase | Thermo Fisher Scientific | EK0032 | |
| QIAEX II Gel Extraction Kit | Qiagen | 20021 | |
| QIAquick PCR精製キット | Qiagen | 28104 | |
| QIAquickゲル抽出キット | Qiagen | 28704 | |
| RNAリガーゼ1、高濃度 | ニューイングランドバイオラボ | M0437M | には、PEG-8000 |
| RNeasy MinElute RNAクリーンアップキットが含まれています | キアゲン | 74204 | |
| RNase H | ニューイングランドバイオラボ | M0279 | |
| RNasin Plus、リボヌクレアーゼ阻害剤 | Promega | N2618 | |
| Superscript IV 逆転写酵素 | Thermo Fisher Scientiific 18090050 | ||
| Turbo DNase | Ambion | AM2238 | |
| USER enzyme mix | New England Biolabs | M5505 | |
| Dyna-Mag-2 磁気ラック | Thermo Fisher Scientific | 12321D | |
| Thermomixer C | Eppendorf | 5382000015 | 加熱式ふた付き加熱ミキサー |
| MicroSpin カラム | GE-Healthcare | 27-5325-01 | |
| 名前 | 会社名 | カタログ番号 | コメント |
| Buffers | |||
| Alkaline加水分解バッファー、1.5 x | Mix 1 1 部 0.1 M Na2CO3 および 9 部 0.1 M NaHCO3。EDTAを1 mMに加えます。pHを9.2に調整します。アリコートは-20°Cで保管してください。 | ||
| 5x ポリ(A)ポリメラーゼ緩衝液 | Thermo Fisher Scientiific | 100 mM Tris-HCl、pH 7.0、3 mM MnCl2、0.1 mM EDTA、1 mM DTT、0.5 mg/ml アセチル化 BSA、50% グリセロール | |
| ビオチン結合緩衝液 | 20 mM TrisCl pH 7.5、2 M NaCl、0.1% NP40 | ||
| TENバッファー10 | mM TrisCl、pH 7.5、1 mM EDTA、0.02% NP40 | ||
| 名前 | 会社 | カタログ番号 | Sequence |
| Oligonucleotides according to Illumina TruSeq Small RNA Sample Prep Kits, for GA-IIx and Hiseq2000/2500 sequencers | strong> | ||
| revRA3 (RNA) | マイクロシンセ | 5' aminoCCUUGGCACCCGAGAAUUCCA3フィート | |
| revDA5 | マイクロシンセ | 5' aminoGTTCAGAGTTCTACAGTCCGAC GATCNNNN-3' | |
| Bio-dU-dT25、RTプライ | マーMicrosynth | 5 'ビオチン-TTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTT-dU-TTTVN 3 '(V = G、AまたはC) | |
| PCRプライマーフォワード、RP1 | Microsynth | 5 'AATGATACGGCGGACCACCGAGA TCTACACGTTCAGAGTTCTACAG TCCGA 3'PCR | |
| プライマーリバース、RPI1、太字のMicrosynth | のバーコード5' CAAGCAGAAGACGGCATACGAG ATCGTGATGTGACTGGAGTTCCT TGGCACCCGAGAATTCCA 3' | ||
| 名称 | 企業名 | カタログ番号 | strongComments |
| >Illumina TruSeq HT-Small RNA Sample Prep Kits, for HiSeq2000/2500 and NextSeq500 sequencers | |||
| HT-rev3A (DNA/RNA) | マイクロシンセ | 5'-アミノ-GTGACTGGAGTTCAGACGTG CTCTTCCrGrAUrC-3'HT-rev5A | |
| Microsynth | 5' アミノ-ACACTCTTTCCCTACACGACGCT CTTCCGATCTNNNN | ||
| 3'Bio-dU-dT25, RT プライマー | Microsynth | 5' Biotin-TTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTT-dU-TTTVN 3'PCR | |
| プライマー フォワード (D501-506) | Microsynth または Illumina | 5'-AATGATACGGCGACCACCGAGAT CTACAC[i5]ACACTCTTTCCCTACA CGACGCTCTTCCGATCT -3'PCR | |
| プライマー リバース (D701-D712) | Microsynth または Illumina | 5'-CAAGCAGAAGACGGCATACGAG A[i7]GTGACTGGAGTTCAGACGTG TGCTCTTCCGATC-3' | |
| イルミナ多重化のドキュメンテーション: | イルミナ | https://support.illumina.com/content/dam/illumina-support/documents/documentation/chemistry_documentation/experiment-design/illumina-adapter-sequences_1000000002694-01.pdf |