Questo protocollo descrive un metodo per la mappatura pre-mRNA 3′ fine elaborazione siti.
Gli studi nell’ultimo decennio hanno rivelato una varietà complessa e dinamica di pre-mRNA clivaggio e poliadenilazione reazioni. mRNA con lungo regioni 3′ non tradotta (UTR) vengono generati in cellule differenziate, mentre le cellule proliferanti esprimono preferenzialmente trascrizioni con breve 3′ UTR. Descriviamo il protocollo A-seq, ora alla sua seconda versione, che è stato sviluppato per mappare siti di poliadenilazione genoma e studiare la regolazione del pre-mRNA processamento dell’estremità 3′. Anche questo protocollo attuale sfrutta la polyadenylate nel (poly(A)) code che vengono aggiunti durante la biogenesi dei mRNAs più mammiferi per arricchire per mRNA completamente elaborato. Un adattatore di DNA con deoxyuracil alla sua quarta posizione permette la lavorazione precisa di mRNA 3′ fine frammenti per la sequenza. Non compresa la coltura delle cellule e le legature durante la notte, il protocollo richiede circa 8 h tempo di hands-on. Insieme ad essa, viene fornito un pacchetto facile da usare software per l’analisi dei dati di sequenziamento derivata. A-seq2 e il software di analisi associati forniscono una soluzione efficiente e affidabile per il mapping del pre-mRNA 3′ finisce in una vasta gamma di condizioni, da 106 o meno cellule.
La cattura e la sequenza di mRNA 3′ estremità permette lo studio dell’elaborazione di mRNA e la quantificazione dell’espressione genica. A causa di loro code di poli (a), mRNA eucariotico può essere efficacemente purificato da lisati cellulari totali con perlina-immobilizzata oligo-deossitimidina (molecole di oligo(dT)), che può anche innescare la sintesi di cDNA. Tuttavia, questo approccio presenta due svantaggi. In primo luogo, tratti della A interne a trascrizioni possono anche innescare la sintesi di cDNA, conseguente spurie poli (a) siti. Poli (a) in secondo luogo, omogeneo tratti pongono sfide specifiche per il sequenziamento, oltre a non essere ben informato per l’identificazione di trascrizione. Vari approcci sono stati proposti per aggirare queste limitazioni, come trascrizione d’inversione attraverso poli (a) Code seguite da digestione RNasi H (3P-seq 1), utilizzo di un primer di sequenziamento personalizzato che termina in 20 Ts (2P-seq 2), preselezione di Frammenti di RNA con code di poli (a) di oltre 50 nucleotidi con un primer di45 CU5T seguita da digestione RNasi H (3′ letture 3) e l’utilizzo di un primer oligo-dT contenente l’adattatore 3′ in un tornante (A-seq 4).
L’A-seq2 metodo sviluppato di recente 5 mira a bypassare il sequenziamento attraverso poli (a) e allo stesso tempo per ridurre al minimo la percentuale di dimeri generati da auto-legatura degli adattatori, particolare che si verificano quando la concentrazione molare di adattatori supera la concentrazione di inserto. Questo problema può essere eliminato quando entrambe le schede sono legate allo stesso tipo di polinucleotide estremità come in A-seq2, dove le schede 3′ sono legate all’estremità 5′ di frammenti di RNA e le schede di 5′ a 5′ estremità dei cDNA dopo trascrizione inversa. Il metodo è più conveniente della nostra precedentemente proposta A-seq – in cui sequenziamento è stato in 5′-a-3′ direzione quindi che richiedono precisamente controllata RNA frammentazione-, pur mantenendo un’elevata precisione di identificazione del sito di poli (a). Circa l’80% delle letture sequenziate in campioni tipici associati in modo univoco al genoma e condurre all’identificazione di oltre 20.000 cluster di sito di poli (a), più del 70% delle quali sovrapposte con annotata 3′ UTR.
In breve, il protocollo A-seq2 inizia con frammentazione di mRNA e la legatura del inverso-complemento 3′ adattatori alle estremità 5′ dei frammenti di RNA. Poli (A)-contenente RNA è quindi inverso trascritto con un primer oligo lungo 25 nucleotidi (nt) che contiene un nucleotide di ancoraggio all’estremità 3′, un dU in posizione 4 e una biotina all’estremità 5′, consentendo l’associazione del cDNA di branelli magnetici streptavidina. La maggior parte del primer, tra cui la biotina, viene rimosso da cDNA tramite fenditura al dU tramite il mix di enzima di utente, contenente Uracil DNA glicosilasi (UDG) e il DNA glicosilasi-liasi endonucleasi VIII. Questa reazione lascia intatti finisce per la legatura di un adattatore per 5′ e tre Ts sinistra dopo fenditura rimangono per contrassegnare la posizione della coda di poli (a). Perché schede di 5′ e 3′ sono collegate tramite la legatura al destinatario 5′ estremità, non vengono generati dimeri di adattatore. Quattro nucleotidi casuale-mers introdotto all’inizio di letture permette la risoluzione di cluster su strumenti di sequenziamento di state-of-the-art e può anche servire come identificatore univoco molecolare (UMI) per il rilevamento e la rimozione di artefatti di amplificazione di PCR. La dimensione della Umi può essere ulteriormente aumentata come fatto in altri studi 6. Il protocollo genera letture che sono invertire complementare al mRNA 3′ estremità, tutti che iniziano con un tetramero randomizzato seguito da 3 Ts. elaborazione di letture che hanno le 3 Ts diagnostica a loro 5′ fine inizia con la correzione di artefatti di amplificazione di PCR di sfruttando l’UNMIS, rimozione delle sequenze 3′ adattatore e invertire la complementazione. Si legge che potrebbero trarre origine da oligo adescamento a siti A ricchi interni sono anche identificati informaticamente e scartati. I siti spuri generalmente privi di uno dei 18 ben caratterizzati e segnali di poli (a) conservati che dovrebbero essere situato ~ 21 nucleotidi a Monte del clivaggio apparente sito 7.
Il protocollo richiede circa 8 h tempo di hands-on, senza contare la coltura delle cellule e le legature durante la notte. L’associato leggere analisi software consente un’identificazione del sito di poli (a) altamente accurate. Dal sito di poli (a) i cluster creato in basati a 4 campioni ulteriormente evidenziati in questa sovrapposizione di 84% manoscritto (due replicati biologici di controllo siRNA e cellule si-HNRNPC-trattate) con un gene con annotazioni e di questi, sovrapposizione di 75% con una 3′ UTR e l’86% sia con un 3′ UTR o un esone terminale. Il coefficiente di correlazione di Pearson di espressione di 3′ estremità nei campioni replicati è 0.92, e valori di superiore allo 0,9 sono in genere ottenuti con il metodo. Così, A-seq2 è un metodo conveniente che dà risultati molto riproducibili.
La moltitudine di core e fattori ausiliari che sono coinvolti nel processamento dell’estremità 3′ del pre-mRNA si riflette in un paesaggio di poliadenilazione corrispondentemente complesse. Inoltre, è sensible a reagire ai cambiamenti in altri processi come la trascrizione e splicing poliadenilazione. 3′ siti di fine taglio in pre-mRNA vengono in genere identificati in base le code di poli (a) caratteristica che vengono aggiunti ai prodotti di clivaggio 5′. Maggior parte dei metodi utilizzare primer oligo (distacco) di lunghezza variabile che consentono la conversione specifica di poli (A)-contenente mRNA da cDNA in una reazione di trascrizione inversa. Un problema comune di questo approccio è innesco interno alle sequenze A ricchi conseguente siti di fenditura artifactual. Sono stati proposti due metodi che mirano ad eludere questo artefatto nella fase di preparazione del campione. Nel metodo 3P-seq 1, adattatori sono specificamente legati alle estremità delle code di poli (a) con l’aiuto di una stecca oligo seguita da digestione parziale di RNAsi T1 e trascrizione d’inversione con TTP nella reazione come l’unico deossinucleotidi. Il risultante eteroduplici poly(A)-poly(dT) quindi sono digeriti con RNAsi H e i rimanenti frammenti di RNA sono isolati, legati agli adattatori e sequenziati. Un metodo più semplice ed elegante, 2P-seq, che utilizza un primer di sequenziamento personalizzato saltando il rimanente tratto di oligo (distacco) nella reazione di sequenziamento è stato segnalato dalla stessa autori 2. In un metodo correlato, 3′ legge 3, un primer insolitamente lungo di 5 noi e 45 Ts, contenente anche una biotina è temprato a RNA frammentato, seguito da lavaggi stringenti per selezionare per molecole di RNA con code di poli (a) di oltre 50 nucleotidi. Anche se 3′ letture drasticamente riduce la frequenza di innesco interno, questa non elimina completamente e 3. Protocolli per l’ordinamento diretto del RNA sono stati proposti, ma le letture risultante sono brevi e hanno un alto tasso di errore e questo approccio non è stato ulteriormente sviluppato 18,19,20. PolyA-Seq e i protocolli di Quant Seq commercializzati combinano oligo (distacco) basata di adescamento con un passo di adescamento casuale per il cDNA secondo strand sintesi 20. L’uso della reazione di trascrizione inversa della interruttore modello con della trascrittasi inversa del Virus di leucemia murina Moloney (MMLV) conduce alla generazione dei cDNAs con linker in un unico passaggio e quindi nessun dimeri adattatore possono apparire nel PAS-Seq e metodi S.A.P.A.S. 21 , 22.
Il metodo A-seq2 presentato qui spicca nel suo utilizzo di un nucleotide spaccabili (dU) all’interno di un primer oligo biotinilati. Questa modifica unisce l’utilità di arricchire oligo ibridato, poliadenilazione obiettivi con la rimozione della maggior parte della sequenza di25 oligo (dT) tra i frammenti isolati prima di librerie sono preparate e la conservazione delle tre “t”, che indicare la presenza precedente della coda di poli (a). Al contrario, i metodi che utilizzano la RNasi H per rimuovere poli (a) dalle molecole di RNA in modo casuale lasciano diversi come. Poiché in A-seq2, sequenziamento è fatto dall’estremità 3′ dei filamenti anti-senso, siti di taglio sono preveduti per essere collocato dopo il motivo NNNNTTT all’inizio della sequenza crudo letture. I tetrameri randomizzati servono non solo per consentire base chiamata ma anche l’eliminazione degli artefatti di amplificazione di PCR. UNMIS più lunghi possono essere sistemati. La possibilità di innesco interno rimane in A-seq2 e si rivolge informaticamente, prima scartando 3′ termina con una sequenza a valle genomicamente codificati, A ricchi e quindi scartando 3′ fine di cluster che potrebbe essere spiegato da innesco interno presso la A-ricco di poli (a) segnale stesso. Una recente analisi dei siti di poli (a) dedotto in modo univoco da un gran numero di protocolli indica che i siti che sono unici per A-seq2 hanno la distribuzione prevista del nucleotide e la posizione all’interno dei geni, simile a altri 3′ fine protocolli di sequenziamento.
Un passaggio fondamentale nella A-seq2 è la selezione di poliadenilazione RNA e la rimozione di RNA ribosomiale (rRNA) e vari piccoli RNA. Ciò avviene più facilmente da un kit di isolamento di mRNA con oligo (dT)25 biglie magnetiche. In linea di principio, RNA totale isolato con fenolo contenenti soluzioni anche dà alta qualità RNA che può essere ulteriormente sottoposto a selezione dal kit di mRNA-isolamento o dell’agarosi oligo (dT). Un passaggio che può essere variato in A-seq2 è il trattamento con idrolisi alcalina che possono essere ridotto o esteso per ottenere frammenti di RNA di diverse dimensioni. Fondamentale è anche che l’aggiunta di dATP 3′ a 3′ estremità dei frammenti di RNA da parte della polimerasi di poli (a) è efficiente. Nel protocollo descritto qui, questo trattamento viene applicato a tutti i frammenti di RNA, per evitare concatemerization durante la reazione di legatura. Si segnala infine che, sebbene ligasi RNA 1 è usata normalmente come una ligasi di RNA, lega anche in modo efficiente singolo DNA incagliato, come abbiamo fatto qui per legare un adattatore all’estremità 5′ delle molecole di cDNA.
Così, A-seq2 è un efficiente e facile da implementare il protocollo per l’identificazione di siti di elaborazione estremità 3′ del pre-mRNA. Gli sviluppi futuri potrebbero includere riducendo ulteriormente la complessità del protocollo e la quantità di materiale necessario. Set di strumenti di analisi computazionale dati ulteriormente associato abilitare l’elaborazione omogenea dell’estremità 3′ letture ottenute con una vasta gamma di protocolli di sequenziamento.
The authors have nothing to disclose.
Gli autori ringraziano la signora Béatrice Dimitriades per aiuto con la coltura delle cellule. Questo lavoro è stato supportato dalla Swiss National Science Foundation sovvenzioni n. 31003A_170216 e 51NF40_141735 (PRN RNA & malattia).
Materials | |||
Agarose, ultra pure | Invitrogen | 16500-500 | |
2100 Bioanalyzer | Agilent | G2940CA | |
Cordycepin triphosphate (3’ dATP) | SIGMA | C9137 | |
DNA low bind vials, 1.5 ml | Eppendorf | 22431021 | |
Dulbecco’s Phosphate Buffered Saline | SIGMA | D8637 | |
Dynabeads mRNA-DIRECT Kit | Ambion | AM61012 | |
GR-Green dye | Excellgen | EG-1071 | use 1:10,000 dillution |
HiSeq 2500 or NextSeq 500 next generation sequencers | Illumina | inquire with supplier | |
KAPA HiFi Hotstart DNA polymerase mix | KAPA/Roche | KK2602 | |
Nuclease free water | Ambion | AM9937 | |
Poly(A) polymerase, yeast | Thermo Fisher Scientific | 74225Z25KU | |
Poly(A) polymerase, E.coli | New England Biolabs | M0276L | |
Polynucleotide kinase | Thermo Fisher Scientific | EK0032 | |
QIAEX II Gel Extraction Kit | Qiagen | 20021 | |
QIAquick PCR Purification Kit | Qiagen | 28104 | |
QIAquick Gel Extraction Kit | Qiagen | 28704 | |
RNA ligase 1, high concentration | New England Biolabs | M0437M | includes PEG-8000 |
RNeasy MinElute RNA Cleanup kit | Qiagen | 74204 | |
RNase H | New England Biolabs | M0279 | |
RNasin Plus, ribonuclease inhibitor | Promega | N2618 | |
Superscript IV reverse transcriptase | Thermo Fisher Scientiific | 18090050 | |
Turbo DNase | Ambion | AM2238 | |
USER enzyme mix | New England Biolabs | M5505 | |
Dyna-Mag-2 magnetic rack | Thermo Fisher Scientific | 12321D | |
Thermomixer C | Eppendorf | 5382000015 | Heated mixer with heated lid |
MicroSpin columns | GE-Healthcare | 27-5325-01 | |
Name | Company | Catalog Number | Comments |
Buffers | |||
Alkaline hydrolysis buffer, 1.5 x | Mix 1 part 0.1 M Na2CO3 and 9 parts 0.1 M NaHCO3. Add EDTA to 1 mM. Adjust pH to 9.2. Store aliquots at -20 °C. | ||
5x poly(A) polymerase buffer | Thermo Fisher Scientiific | 100 mM Tris-HCl, pH 7.0, 3 mM MnCl2, 0.1 mM EDTA, 1 mM DTT, 0.5 mg/ml acetylated BSA, 50% glycerol | |
Biotin binding buffer | 20 mM TrisCl pH 7.5, 2 M NaCl, 0.1% NP40 | ||
TEN buffer | 10 mM TrisCl, pH 7.5, 1 mM EDTA, 0.02% NP40 | ||
Name | Company | Catalog Number | Sequence |
Oligonucleotides according to Illumina TruSeq Small RNA Sample Prep Kits, for GA-IIx and Hiseq2000/2500 sequencers | Microsynth | ||
revRA3 (RNA) | Microsynth | 5’ amino CCUUGGCACCCGAGAAUUCCA 3’ | |
revDA5 | Microsynth | 5’ amino GTTCAGAGTTCTACAGTCCGAC GATCNNNN-3’ | |
Bio-dU-dT25, RT primer | Microsynth | 5' Biotin-TTTTTTTTTTTTTTTTTTTTTTTTTT-dU-TTTVN 3' (V = G, A or C) | |
PCR primer forward, RP1 | Microsynth | 5' AATGATACGGCGACCACCGAGA TCTACACGTTCAGAGTTCTACAGTC CGA 3' | |
PCR primer reverse, RPI1, barcode in bold | Microsynth | 5' CAAGCAGAAGACGGCATACGAGA TCGTGATGTGACTGGAGTTCCTTG GCACCCGAGAATTCCA 3' | |
Name | Company | Catalog Number | Comments |
Oligonucleotides according to Illumina TruSeq HT-Small RNA Sample Prep Kits, for HiSeq2000/2500 and NextSeq500 sequencers | |||
HT-rev3A (DNA/RNA) | Microsynth | 5'-amino-GTGACTGGAGTTCAGACGTGTGCT CTTCCrGrAUrC-3' | |
HT-rev5A | Microsynth | 5' amino-ACACTCTTTCCCTACACGACGCTCT TCCGATCTNNNN 3' | |
Bio-dU-dT25, RT primer | Microsynth | 5' Biotin-TTTTTTTTTTTTTTTTTTTTTTTTTT-dU-TTTVN 3' | |
PCR primers forward (D501-506) | Microsynth or Illumina | 5'-AATGATACGGCGACCACCGAGAT CTACAC[i5]ACACTCTTTCCCTACAC GACGCTCTTCCGATCT -3' | |
PCR primers reverse (D701-D712) | Microsynth or Illumina | 5'-CAAGCAGAAGACGGCATACGAG A[i7]GTGACTGGAGTTCAGACGTG TGCTCTTCCGATC-3' | |
Documentation for Illumina multiplexing: | Illumina | https://support.illumina.com/content/dam/illumina-support/documents/documentation/chemistry_documentation/experiment-design/illumina-adapter-sequences_1000000002694-01.pdf |