Denne protokol beskriver en metode til kortlægning pre-mRNA 3′ enden forarbejdning websteder.
Undersøgelser i det sidste årti har afsløret en kompleks og dynamisk udvalg af pre-mRNA kavalergang og polyadenylation reaktioner. mRNAs med lange 3′ utranslaterede regioner (UTRs) er genereret i differentierede celler boer prolifererende celler fortrinsvis express udskrifter med korte 3′ UTRs. Vi beskriver A-seq-protokollen nu på sin anden version, som blev udviklet for at kortlægge polyadenylation websteder genome-wide og studere regulering af pre-mRNA 3′ enden behandling. Denne aktuelle protokol tager også fordel af polyadenylate (poly(A)) haler, der er tilføjet under Biogenese af mest pattedyr mRNAs at berige for fuldt forarbejdet mRNAs. En DNA-adapter med deoxyuracil på sin fjerde position giver mulighed for præcis forarbejdning af mRNA 3′ enden fragmenter til sekvensering. Ikke herunder cellekultur og de overnight ligations kræver protokollen om 8 h hands-on tid. Sammen med det tilbydes en nem at bruge softwarepakke til analyse af den afledte sequencing data. A-seq2 og den tilknyttede analyse software giver en effektiv og pålidelig løsning til kortlægning af pre-mRNA 3′ ender i en lang række betingelser, fra 106 eller færre celler.
Opsamling og sekventering af mRNA 3′ ender giver mulighed for undersøgelse af mRNA forarbejdning og kvantificering af genekspression. På grund af deres poly(A) haler, kan eukaryote mRNAs blive effektivt renset fra samlede cellelysater med perle-immobiliseret oligo-deoxythymidine (oligo(dT)) molekyler, som kan også prime cDNA syntese. Denne tilgang har dog to ulemper. Første kan strækninger af A, der er internt i udskrifter også prime cDNA syntese, hvilket resulterer i uægte poly(A) websteder. Andet, homogene poly(A) strækninger udgøre særlige udfordringer til sekvensering, bortset fra ikke at være informativ for udskrift identifikation. Forskellige metoder er blevet foreslået at omgå disse begrænsninger, såsom reverse transkription gennem poly(A) haler efterfulgt af RNase H fordøjelsen (3 P-seq 1), brug af en brugerdefineret sekventering primer slutter i 20 Ts (2 P-seq 2), Forhåndsudvælgelse af RNA fragmenter med poly(A) haler af over 50 nukleotider med en CU5T45 primer efterfulgt af RNase H fordøjelsen (læser 3′ 3), og brugen af en oligo-dT primer, der indeholder 3′-adapter i en hårnål (A-seq 4).
Den nyligt udviklede A-seq2 metode 5 har til formål at omgå sekventering gennem poly(A) og samtidig minimere andelen af dimerer, der er genereret af selvstændig ligatur af adaptere, især opstår når den molære koncentration af adaptere opvejer Indsæt koncentration. Dette problem kan undgås, når begge adaptere er forbundet til den samme type af polynucleotide ender som A-seq2, hvor 3′ adapterne er forbundet til 5′-enden af RNA fragmenter og 5′-adaptere til 5′ enderne af cDNAs efter reverse transkription. Metoden er mere praktisk end vores tidligere foreslåede A-seq – hvor sekventering var i 5′-til-3′ retning dermed kræver netop kontrollerede RNA fragmentering-, samtidig opretholde en høj præcision af poly(A) site identifikation. Omkring 80% af den omkostningsstyring læser i typiske prøver kort entydigt til genomet og føre til identifikation af over 20.000 poly(A) site klynger, mere end 70% af hvilke overlappende med kommenteret 3′ UTRs.
Kort sagt, starter A-seq2-protokollen med mRNA fragmentering og ligatur af reverse-supplement 3′ adaptere til 5′-enden af RNA fragmenter. Poly (A)-indeholdende RNA’er er derefter omvendt transskriberet med en 25 nukleotid (nt) lang oligo(dT) primer, der indeholder en anker nukleotid på 3′-enden, en dU ved position 4 og et biotin for 5′ enden, så binding af cDNA til magnetiske streptavidin perler. De fleste af primer, herunder biotin, fjernes fra cDNA ved spaltning på dU ved bruger enzymet blanding, der indeholder Uracil DNA glycosylase (UDG) og DNA glycosylase-lyase Liv1975 VIII. Denne reaktion forlader intakt ender for ligatur af en 5′ adapter, og tre Ts venstre efter kavalergang fortsat for at markere placeringen af poly(A) hale. Fordi både 5′ og 3′ adaptere er fastgjort ved ligatur til modtagerens 5′ ender, genereres der ingen adapter dimerer. Fire nukleotid random-mers indført i begyndelsen af læser tillader klynge opløsning på state-of-the-art sekventering instrumenter og kan også tjene som unikke molekylære id (UMI) for detektering og fjernelse af PCR forstærkning artefakter. Størrelsen på UMI kan øges yderligere, som gjort i andre studier 6. Protokollen genererer læsninger, der er omvendt supplement til mRNA 3′ ender, alle starter med en randomiseret tetramer efterfulgt af 3 Ts. behandling af læser, der har de 3 diagnostiske Ts på deres 5′ ende starter med korrektion af PCR forstærkning artefakter af at udnytte (UMIS) velkommen, fjernelse af 3′ adapter sekvenser, og reverse komplementering. Læser, der kan stamme fra oligo(dT) priming på interne A-rige lokaliteter er også identificeret beregningsmæssigt og kasseres. De falske websteder generelt mangler en af de 18 vel karakteriseret og bevarede poly(A) signaler, som bør være beliggende ~ 21 nukleotider opstrøms af tilsyneladende kavalergang site 7.
Protokollen kræver ca. 8 h hands-on tid, ikke tælle cellekultur og overnatning ligations. De tilknyttede læse analyse software giver mulighed for en meget præcis poly(A) site identifikation. Fra webstedet poly(A) klynger skabt på grundlag af 4 prøver yderligere fremhævet i dette manuskript (to biologiske replikater af kontrol siRNA og si-HNRNPC-behandlede celler) 84% overlap med en kommenteret gen, og af disse, 75% overlap med en 3′ UTR og 86% med enten en 3′ UTR eller en terminal exon. Pearson korrelationskoefficienten af udtryk for 3′ ender i Kontraprøverne, der udtages er 0,92, og værdier over 0,9 er typisk fremstillet med metoden. A-seq2 er således en praktisk metode, der giver meget reproducerbare resultater.
Væld af kerne og hjælpeansatte faktorer, der er involveret i pre-mRNA 3′ enden behandling afspejles i en tilsvarende kompleks polyadenylation landskab. Polyadenylation er desuden også lydhøre over for ændringer i andre processer såsom transskription og splicing. 3′ enden kavalergang websteder i pre-mRNAs identificeres typisk baseret på karakteristiske poly(A) haler, der er føjet til spaltningsprodukter 5′. De fleste metoder bruger oligo(dT) primere af variabel længde, der tillader specifikke omdannelse af poly (A)-indeholdende mRNAs til cDNAs i en omvendt transkription reaktion. Et fælles problem i denne tilgang er interne priming til A-rige sekvenser resulterer i kunstig kavalergang websteder. To metoder, der har til formål at omgå denne genstand på scenen til forberedelse af prøven er blevet foreslået. I 3P-seq metode 1, er adaptere specielt forbundet til enderne af poly(A) haler med hjælp fra en skinne oligo efterfulgt af delvis RNase T1 fordøjelse og omvendt transskription med TTP reaktion som den eneste deoxynucleotide. De resulterende poly(A)-poly(dT) heteroduplexes der derefter fordøjes med RNase H og de resterende RNA fragmenter er isoleret, forbundet til adaptere og sekventeret. En enklere og elegante metode, 2P-FF., der bruger en brugerdefineret sekventering primer springe over de resterende oligo(dT) strækning i sekventering reaktion blev rapporteret af de samme forfattere 2. I en relateret metode, 3′ læser 3, en usædvanlig lang primer 5 os og 45 Ts, som også indeholder et biotin er udglødet til fragmenterede RNA, efterfulgt af strenge vasker vælge for RNA molekyler med poly(A) haler af over 50 nukleotider. Selvom 3′ lyder drastisk reducerer hyppigheden af interne priming, fjerner det helt ikke den 3. Protokoller til direkte RNA sekvensering er også blevet foreslået, men de resulterende læsninger er korte og har en høj erhvervsfrekvens blandt fejl og denne tilgang er ikke blevet yderligere udviklet 18,19,20. PolyA-FF. og protokollerne kommercialiseret Quant Seq kombinere oligo(dT) baseret priming med en tilfældig priming skridt for cDNA anden strand syntese 20. Brug af skabelon switch reverse transkription reaktion med Moloney Murine leukæmi Virus (MMLV) reverse transkriptase fører til generation af cDNAs med linkers i et enkelt trin og dermed ingen adapter dimerer kan vises i PAS-FF. og SAPAS metoder 21 , 22.
A-seq2 metode præsenteres her skiller sig ud i sin udnyttelse af en cleavable nukleotid (dU) inden for en biotinylated oligo(dT) primer. Denne ændring kombinerer nytten af berigende oligo(dT) hybridiseret, polyadenylated mål med fjernelse af de fleste af oligo (dT)25 sekvens fra de isolerede fragmenter før biblioteker er forberedt og bevarelse af tre t’er, som angive den forudgående tilstedeværelse af poly(A) hale. I modsætning hertil er forlader metoder, der udnytter RNase H for at fjerne poly(A) fra RNA molekyler tilfældigt flere som. Siden i A-seq2, er sekventering gøres fra 3′-enden af antisense-strenge, er kavalergang websteder forudsagt til at være placeret efter NNNNTTT motiv i begyndelsen af rå sekvens læser. De randomiserede tetramers tjene ikke kun at tillade base ringer men også eliminering af PCR forstærkning artefakter. Også kan være plads til længere (UMIS) velkommen. Muligheden for interne priming forbliver i A-seq2 og er adresseret beregningsmæssigt, først ved at kassere 3′ ender med en gentisk kodet, A-rige downstream sekvens og derefter ved at kassere 3′ enden klynger, der kan forklares ved intern priming på den A-rige poly(A) signal, selv. En nylig analyse af poly(A) websteder udledes entydigt af et stort antal protokoller angiver, at de websteder, der er unikke for A-seq2 har den forventede nukleotid distribution og placering inden for gener, ligner andre 3′ ende sekventering protokoller.
Et kritisk trin i A-seq2 er udvalg af polyadenylated RNA og fjernelse af ribosomale RNA’er og forskellige små RNA’er. Dette gøres lettest ved en mRNA-isolering kit med oligo (dT)25 magnetiske perler. I princippet giver total RNA isoleret med phenol som indeholder løsninger også høj kvalitet RNA, der kan være yderligere udsat for udvælgelse af mRNA-isolering kit eller oligo (dT) agarosegelelektroforese. Et skridt, der kan varieres i A-seq2 er behandling med alkalisk hydrolyse, som kan afkortes eller forlænges for at få RNA fragmenter af forskellige størrelser. Kritisk er også, at tilsætning af 3′ dATP til 3′ enderne af RNA fragmenter af poly(A)-polymerase er effektiv. Protokollen beskrevet her, gælder denne behandling alle RNA fragmenter, til at undgå concatemerization under ligatur reaktion. Endelig, vi konstatere, at selvom RNA ligase 1 bruges normalt som en RNA ligase, det også ligates effektivt enkelt strandede DNA, som vi har gjort her for at ligate en adapter til 5′-enden af cDNA molekyler.
A-seq2 er således en effektiv og let at gennemføre protokollen til identifikation af pre-mRNA 3′ enden forarbejdning websteder. Fremtidige udvikling kunne omfatte yderligere at reducere kompleksitet i protokollen og mængden af krævede materialer. Det tilknyttede sæt beregningsmæssige data analyseværktøjer yderligere aktiverer den ensartede behandling af 3′ enden sekventering læser fremstillet med en bred vifte af protokoller.
The authors have nothing to disclose.
Forfatterne takke fru Béatrice Dimitriades hjælp til cellekultur. Dette arbejde blev støttet af den schweiziske National Science Foundation støtte #31003A_170216 og 51NF40_141735 (NCCR RNA & sygdom).
Materials | |||
Agarose, ultra pure | Invitrogen | 16500-500 | |
2100 Bioanalyzer | Agilent | G2940CA | |
Cordycepin triphosphate (3’ dATP) | SIGMA | C9137 | |
DNA low bind vials, 1.5 ml | Eppendorf | 22431021 | |
Dulbecco’s Phosphate Buffered Saline | SIGMA | D8637 | |
Dynabeads mRNA-DIRECT Kit | Ambion | AM61012 | |
GR-Green dye | Excellgen | EG-1071 | use 1:10,000 dillution |
HiSeq 2500 or NextSeq 500 next generation sequencers | Illumina | inquire with supplier | |
KAPA HiFi Hotstart DNA polymerase mix | KAPA/Roche | KK2602 | |
Nuclease free water | Ambion | AM9937 | |
Poly(A) polymerase, yeast | Thermo Fisher Scientific | 74225Z25KU | |
Poly(A) polymerase, E.coli | New England Biolabs | M0276L | |
Polynucleotide kinase | Thermo Fisher Scientific | EK0032 | |
QIAEX II Gel Extraction Kit | Qiagen | 20021 | |
QIAquick PCR Purification Kit | Qiagen | 28104 | |
QIAquick Gel Extraction Kit | Qiagen | 28704 | |
RNA ligase 1, high concentration | New England Biolabs | M0437M | includes PEG-8000 |
RNeasy MinElute RNA Cleanup kit | Qiagen | 74204 | |
RNase H | New England Biolabs | M0279 | |
RNasin Plus, ribonuclease inhibitor | Promega | N2618 | |
Superscript IV reverse transcriptase | Thermo Fisher Scientiific | 18090050 | |
Turbo DNase | Ambion | AM2238 | |
USER enzyme mix | New England Biolabs | M5505 | |
Dyna-Mag-2 magnetic rack | Thermo Fisher Scientific | 12321D | |
Thermomixer C | Eppendorf | 5382000015 | Heated mixer with heated lid |
MicroSpin columns | GE-Healthcare | 27-5325-01 | |
Name | Company | Catalog Number | Comments |
Buffers | |||
Alkaline hydrolysis buffer, 1.5 x | Mix 1 part 0.1 M Na2CO3 and 9 parts 0.1 M NaHCO3. Add EDTA to 1 mM. Adjust pH to 9.2. Store aliquots at -20 °C. | ||
5x poly(A) polymerase buffer | Thermo Fisher Scientiific | 100 mM Tris-HCl, pH 7.0, 3 mM MnCl2, 0.1 mM EDTA, 1 mM DTT, 0.5 mg/ml acetylated BSA, 50% glycerol | |
Biotin binding buffer | 20 mM TrisCl pH 7.5, 2 M NaCl, 0.1% NP40 | ||
TEN buffer | 10 mM TrisCl, pH 7.5, 1 mM EDTA, 0.02% NP40 | ||
Name | Company | Catalog Number | Sequence |
Oligonucleotides according to Illumina TruSeq Small RNA Sample Prep Kits, for GA-IIx and Hiseq2000/2500 sequencers | Microsynth | ||
revRA3 (RNA) | Microsynth | 5’ amino CCUUGGCACCCGAGAAUUCCA 3’ | |
revDA5 | Microsynth | 5’ amino GTTCAGAGTTCTACAGTCCGAC GATCNNNN-3’ | |
Bio-dU-dT25, RT primer | Microsynth | 5' Biotin-TTTTTTTTTTTTTTTTTTTTTTTTTT-dU-TTTVN 3' (V = G, A or C) | |
PCR primer forward, RP1 | Microsynth | 5' AATGATACGGCGACCACCGAGA TCTACACGTTCAGAGTTCTACAGTC CGA 3' | |
PCR primer reverse, RPI1, barcode in bold | Microsynth | 5' CAAGCAGAAGACGGCATACGAGA TCGTGATGTGACTGGAGTTCCTTG GCACCCGAGAATTCCA 3' | |
Name | Company | Catalog Number | Comments |
Oligonucleotides according to Illumina TruSeq HT-Small RNA Sample Prep Kits, for HiSeq2000/2500 and NextSeq500 sequencers | |||
HT-rev3A (DNA/RNA) | Microsynth | 5'-amino-GTGACTGGAGTTCAGACGTGTGCT CTTCCrGrAUrC-3' | |
HT-rev5A | Microsynth | 5' amino-ACACTCTTTCCCTACACGACGCTCT TCCGATCTNNNN 3' | |
Bio-dU-dT25, RT primer | Microsynth | 5' Biotin-TTTTTTTTTTTTTTTTTTTTTTTTTT-dU-TTTVN 3' | |
PCR primers forward (D501-506) | Microsynth or Illumina | 5'-AATGATACGGCGACCACCGAGAT CTACAC[i5]ACACTCTTTCCCTACAC GACGCTCTTCCGATCT -3' | |
PCR primers reverse (D701-D712) | Microsynth or Illumina | 5'-CAAGCAGAAGACGGCATACGAG A[i7]GTGACTGGAGTTCAGACGTG TGCTCTTCCGATC-3' | |
Documentation for Illumina multiplexing: | Illumina | https://support.illumina.com/content/dam/illumina-support/documents/documentation/chemistry_documentation/experiment-design/illumina-adapter-sequences_1000000002694-01.pdf |