Cap analys av Gene Expression (CAGE) är en metod för genombred kvantitativ kart läggning av mRNA 5 ‘ ändar för att fånga RNA-polymeras II transkription start platser vid en enda-nukleotid upplösning. Detta arbete beskriver en låg-input (SLIC-CAGE) protokoll för generering av högkvalitativa bibliotek med nanogram-mängder av totalt RNA.
Cap analys av gen uttryck (CAGE) är en metod som används för singel-nukleotid upplösning detektion av RNA-polymeras II transkription start platser (TSSs). Noggrann detektering av TSSs förbättrar identifieringen och upptäckten av centrala initiativtagare. Dessutom kan aktiva förstärkare detekteras genom signaturer för dubbelriktad transkription initiering. Beskrev här är en protokoll för utförande toppen-låg insatsen bärare-bur (skära upp i skivor-bur). Denna SLIC-anpassning av CAGE-protokollet minimerar RNA-förluster genom att artificiellt öka RNA-mängden genom användning av en in vitro-transkriberad RNA-bärar blandning som läggs till i urvalet av intresse, vilket möjliggör biblioteks beredning från nanogram-mängder av totalt RNA (dvs. tusentals celler). Bäraren imiterar den förväntade fördelningen av DNA-biblioteksfragmentlängden och eliminerar därmed fördomar som kan orsakas av överflödet av ett homogent transport företag. I protokollets sista stadier tas bäraren bort genom nedbrytning med homing-slutonukleaser och mål biblioteket förstärks. Mål provet biblioteket är skyddat från nedbrytning, eftersom homing endonuclease erkännande platser är långa (mellan 18 och 27 BP), vilket gör sannolikheten för deras existens i eukaryota genomar mycket låg. resultatet är ett DNA-bibliotek redo för nästa generations sekvensering. Alla steg i protokollet, upp till sekvensering, kan slutföras inom 6 dagar. Transport ören förberedelse kräver en hel arbets dag; den kan dock beredas i stora kvantiteter och hållas fryst vid-80 ° c. En gång sekvenserade, läser kan bearbetas för att få genombred singel-nukleotid upplösning TSSs. TSSs kan användas för Core promotor eller förstärkare upptäckt, ger insikt i gen reglering. När aggregerad till initiativtagare, kan data också användas för 5 ‘-centrerad uttryck profilering.
Cap analys av gen uttryck (CAGE) är en metod som används för Single-nucleotide resolution genom-wide kart läggning av RNA-polymeras II transkription start platser (TSSs)1. Dess kvantitativa karaktär tillåter också 5 ‘-End centrerad uttryck profilering. Regioner som omger Tsss (ca 40 BP uppströms och nedströms) är centrala initiativtagare och representerar den fysiska platsen där RNA-polymeras II och allmänna transkriptionsfaktorer binder (granskat tidigare2,3). Information om exakta platser för TSSs kan användas för att identifiera kärn Promotorn och för att övervaka Promotorns dynamik. Dessutom, som aktiva förstärkare uppvisar signaturer för dubbelriktad transkription, kan CAGE data också användas för förstärkare upptäckt och övervakning av förstärkare dynamik4. CAGE metodik har nyligen ökat i popularitet på grund av dess breda tillämpning och användning i hög profil forsknings projekt som ENCODE5, modencode6, och fantom projekt7. Dessutom har TSS-information också visat sig vara viktig för att särskilja frisk och sjuk vävnad, eftersom sjukdomsspecifika TSSs kan användas för diagnostiska ändamål8.
Även om flera metoder för TSS-mappning finns tillgängliga (CAGE, RAMPAGE, STRT, nanoCAGE, nanoCAGE-XL, oligo-capping), har vi och andra nyligen visat att CAGE är den mest objektiva metoden för att fånga sanna TSSs med det minsta antalet falska positiva identifieringar9 , 10. den nyligen Cage protokoll, NAnT-icage11, är den mest objektiva protokoll för TSS profilering, eftersom det undviker att skära fragment till korta Taggar med restriktionsenzymer och inte använder PCR-förstärkning. En begränsning av nAnT-iCAGE-protokollet är kravet på en stor mängd utgångs material (t. ex. 5 μg totalt RNA för varje prov). För att besvara specifika, biologiskt relevanta frågor är det ofta omöjligt att få så stora mängder utgångs material (t. ex. för FACS-sorterade celler eller tidiga embryonala stadier). Slutligen, om nAnT-iCAGE är framgångs rik, endast 1-2 ng av DNA-bibliotek material finns från varje prov, vilket begränsar uppnåeliga sekvensering djup.
För att möjliggöra TSS profilering med endast nanogram av totalt RNA, har vi nyligen utvecklat Super-low input Carrier-CAGE10 (SLIC-Cage, figur 1). Skära upp i skivor-bur behöver bara 10 ng av räkna samman RNA till få hög invecklad bibliotek. Vårt protokoll förlitar sig på den omsorgsfullt utformade syntetiska RNA bärare läggas till RNA av intresse för att uppnå totalt 5 μg av RNA-material. Den syntetiska bäraren härmar målet DNA-bibliotek i längd distribution för att undvika eventuella fördomar som kan orsakas av homogena molekyler i överskott. Sekvensen av bäraren är baserad på sekvensen av Escherichia coli leucyl-tRNA synt Etas genen (tabell 1) av två skäl. Först, eventuella överblivna av bäraren i det slutliga biblioteket, även om sekvenserade, kommer inte att mappa till en eukaryotisk genomet. För det andra, som E. coli är en mesofil art, dess hushållninggener är optimerade för det temperatur område som lämpar sig för SLIC-Cage. Bärvågen sekvensen är också inbäddad med homing endonuclease erkännande platser för att möjliggöra specifik nedbrytning av DNA som härrör från bärare RNA-molekyler. Målet, exempel-härledda bibliotek förblir intakt, eftersom homing endonuclease erkännande platser är långa (I-CeuI = 27 BP; I-SceI = 18 BP) och statistiskt sett osannolikt att påträffas i eukaryota genom. Efter specifik nedbrytning av bäraren och avlägsnande av fragment av storlek uteslutning, mål biblioteket är PCR förstärks och redo för nästa generations sekvensering. Beroende på utgångs RNA-mängden (1-100 ng) förväntas mellan 13-18 PCR-amplifiering cykler krävas. Den slutliga mängden DNA per varje prov varierar mellan 5-50 ng, vilket ger tillräckligt med material för mycket djup sekvensering. Vid användning av endast 1-2 ng av totalt RNA kan sanna TSSs detekteras; biblioteken förväntas dock vara av lägre komplexitet. Slutligen, som SLIC-CAGE är baserad på nAnT-iCAGE protokoll11, det möjliggör multiplexering av upp till åtta prover före sekvensering.
För framgångs rik skära upp i skivor-bur bibliotek förberedelserna, det er kritisk till använda låg-bindande spets och rören till hindra prov förlust på grund av prov adsorption. I alla steg som involverar hämtning av supernatanten bör du återställa entiresample-volymen. Eftersom protokollet har flera steg, kommer kontinuerlig prov förlust leda till misslyckade bibliotek.
Om bur (nAnT-iCAGE) har inte blitt utfört rutinmässigt, den er bäst till prov skära upp i skivor-bur med olik insatsen beloppen (10 ng, 20 ng, 50 ng, 100 ng, 200 ng) om samma räkna samman RNA prov och jämföra med nAnT-iCAGE bibliotek så pass är beredd Använd ande 5 μg av räkna samman RNA. Om den nAnT-iCAGE bibliotek är misslyckad (mindre en 0.5-1 ng om DNA bibliotek skaffat per prov), skära upp i skivor-bur är osannolikt till verk, och prov förlust nödvändigt vis till vara reducera.
Ett viktigt steg för att säkerställa hög kvalitet bibliotek saknar icke-utjämnade försämrat RNA eller rRNA är Cap-fångst som beskrivs i avsnitt 7. Det är mycket viktigt att streptividin-pärlorna grundligt återsuspenderas i tvättbuffertar och att tvättbuffertarna avlägsnas innan de fortsätter till nästa tvättsteg eller eluering av cDNA.
Om resultaten från qPCR efter den första omgången av bärare nedbrytning visar ingen skillnad mellan användning av adaptor_f1 och carrier_f1 primers, fortsätter protokollet rekommenderas fortfarande. Om det efter den andra omgången av bärare nedbrytning, skillnaden i CT-värden är mindre än fem, en tredje omgång bärare nedbrytning rekommenderas. Vi har aldrig funnit en tredje omgång av nedbrytning behövs, och om det inträffar, det rekommenderas att ersätta homing endonuclease bestånd.
Ytterligare omgångar med PCR-förstärkning kan läggas till protokollet om det slutliga beloppet för det bibliotek som erhålls inte är tillräckligt för sekvensering. PCR-förstärkning kan sedan ställas in med minimalt antal amplifieringscykler som behövs för att ge tillräckligt med material för sekvensering, med beaktande av prov förlust som inte kan undvikas vid storleks val. Rening eller storleks val med hjälp av SPRI magnetiska pärlor bör sedan utföras tills alla små (< 200 BP) fragment avlägsnas (om det behövs, Använd 0,6:1 pärlor till provet ratio), och biblioteket bör kvantifieras med Picogreen.
Bibliotek kan ordnas i enslutsläge eller ihopparad. Med hjälp av Parade-end sekvensering, information om transkription ISO former kan erhållas. Dessutom, som omvänd transkription utförs med hjälp av en slumpmässig primer (tct-n6, N6 är en slumpmässig hexamer), information från sekvenserade 3 ‘-End kan användas som unika molekyl ära identifierare (Umi) för att komprimera PCR dubbletter. Eftersom ett måttligt antal PCR-amplifieringscykler används (upp till 18), har användningen av UMIs tidigare befunnits vara onödig.
Som kärnan i protokollet förlitar sig på nAnT-iCAGE11, SLIC-Cage använder åtta streckkoder. Multiplexering av mer än åtta prover stöds därför för närvarande inte. Dessutom, båda skära upp i skivor-bur och nAnT-iCAGE är inte passande för erövrare RNAs kortare än 200 BP, så protokollen är planerat på flytta Linkers och PCR artefakt igenom storlek-uteslutandet med AMPure XP pärlor.
Skära upp i skivor-bur är den bara opartisk låg-insatsen enkel-nukleotid beslutsamhet metod för kart läggande transkription inledande börja tomten Använd ande nanogram av räkna samman RNA material. Alternativa metoder förlitar sig på mallen växling aktivitet omvänt transkriptase till streckkod utjämnat RNA i stället för Cap-svällning (t. ex. NanoCAGE15 och NanoPARE16). På grund av mall växling, dessa metoder uppvisar sekvens-specifika fördomar i Tsss upptäckt, vilket leder till ökat antal falska positiva Tsss och minskat antal sanna Tsss9,10.
The authors have nothing to disclose.
Detta arbete stöddes av Wellcome Trust Grant (106954) tilldelas B. L. och medicinsk forskning rådet (MRC) kärn finansiering (MC-A652-5QA10). N. C. stöddes av EMBO Long-term Fellowship (EMBO ALTF 1279-2016); E. P. stöddes av medicinska forsknings rådet i Storbritannien; B. L. stöddes av medicinska forsknings rådet i Storbritannien (MC UP 1102/1).
2-propanol, Bioultra, for molecular biology, ≥99.5% | Sigma-Aldrich | 59304-100ML-F | Used in RNAclean XP purification. |
3' linkers | Sequences are described in Murata et al 2014 and Supplementary Table 1 of this manuscript. Annealing of strands to produce 3'linkers is described in the supplementary of this protocol. | ||
5' linkers | Sequences are described in Murata et al 2014 and Supplementary Table 1 of this manuscript. Annealing of strands to produce 5'linkers is described in the supplementary of this protocol. | ||
Agencourt AMPure XP, 60 mL | Beckman Coulter | A63881 | Purification of DNA |
Agencourt RNAClean XP Kit | Beckman Coulter | A63987 | Purification of RNA and RNA:cDNA hybrids in CAGE steps. |
Axygen 0.2 mL Polypropylene PCR Tube Strips and Domed Cap Strips | Axygen (available through Corning) | PCR-0208-CP-C | Or any 8-tube PCR strips (used only for water and mixes). |
Axygen 1 x 8 strip domed PCR caps | Axygen (available through Corning) | PCR-02CP-C | Caps for PCR plates. |
Axygen 1.5 mL Maxymum Recovery Snaplock Microcentrifuge Tube | Axygen (available through Corning) | MCT-150-L-C | Low-binding 1.5 ml tubes, used for enzyme mixes or sample concentration. |
Axygen 96 well no skirt PCR microplate | Axygen (available through Corning) | PCR-96-C | Low-binding PCR plates – have to be used for all steps in the protocol. Note that plates should be cut to contain 2 x 8 wells for easier visibility of the samples |
Bioanalyzer (or Tapestation): RNA nano and HS DNA kits | Agilent | To determine quality of RNA, efficient size selection and final quality of the library (Tapestation can also be used) | |
Biotin (Long Arm) Hydrazide | Vector laboratories | SP-1100 | Biotinylation/tagging |
Cutsmart buffer | NEB | Restriction enzyme buffer | |
Deep Vent (exo-) DNA Polymerase | NEB | M0259S | Second strand synthesis |
DNA Ligation Kit, Mighty Mix | Takara | 6023 | Used for 5' and 3'-linker ligation |
dNTP mix (10 mM each) | ThermoFisher Scientific | 18427013 | dNTP mix for production of carrier templates (or any dNTPs suitable for PCR) |
Dynabeads M-270 Streptavidin | Invitrogen | 65305 | Cap-trapping. Do not use other beads as these are optimised with the buffers used. |
DynaMag-2 Magnet | ThermoFisher Scientific | 12321D | Magnetic stand for 1.5 ml tubes – used to prepare Streptavidin beads. |
DynaMag-96 Side Skirted Magnet | ThermoFisher Scientific | 12027 | Magnetic stand for PCR plates (96 well-plates) – used with cut plates to contain 2 x 8 wells. |
Ethanol, BioUltra, for molecular biology, ≥99.8% | Sigma-Aldrich | 51976-500ML-F | Used in AMPure washes. Any molecular biology suitable ethanol can be used. |
Exonuclease I (E. coli) | NEB | M0293S | Leftover primer degradation |
Gel Loading Dye, Purple (6x), no SDS | NEB | B7025S | agarose gel loading dye |
HiScribe T7 High Yield RNA Synthesis Kit | New England Biolabs | E2040S | Kit for carrier in vitro transcription |
Horizontal electrophoresis apparatus | purification of carrier DNA templates from agarose gels | ||
I-Ceu | NEB | R0699S | Homing endonuclease used for carrier degradation. |
I-SceI | NEB | R0694S | Homing endonuclease used for carrier degradation. |
KAPA HiFi HS ReadyMix (2x) | Kapa Biosystems (Supplied by Roche) | KK2601 | PCR mix for target library amplification |
KAPA SYBR FAST qPCR kit (Universal) 2x | Kapa Biosystems (Supplied by Roche) | KK4600 | qPCR mix to assess degradation efficiency and requiered number of PCR amplification cycles |
Micropipettes and multichannel micropipettes (0.1-10 µl, 1-20 µl, 20-200 µ) | Gilson | Use of Gilson with the low-binding Sorenson tips is recommended. Other micropippetes might not be compatible.. Different brand low-binding tips may not be of equal quality and may increase sample loss. | |
Microplate reader | For Picogreen concentration measurement of the final library. Microplates are used to allow small volume measurement and reduce sample waste. | ||
nuclease free water | ThermoFisher Scientific | AM9937 | Or any nuclease (DNase and RNase) free water |
PCR thermal cycler | incubation steps and PCR amplficication | ||
Phusion High-Fidelity DNA Polymerase | ThermoFisher Scientific | F530S | DNA polymerase for amplification of carrier templates (or any high fidelity polymerase) |
QIAquick Gel Extraction Kit (50) | Qiagen | 28704 | Purification of carrier PCR templates from agarose gels. |
qPCR machine | determining PCR amplification cyle number and degree of carrier degradation | ||
Quant-iT PicoGreen dsDNA Reagent | ThermoFisher Scientific | P11495 | Used to measure final library concentration – recommended as, in our hands, it is more accurate and reproducible than Qubit. |
Quick-Load Purple 100 bp DNA Ladder | NEB | N0551S | DNA ladder |
Quick-Load Purple 1 kb Plus DNA Ladder | NEB | N0550S | DNA ladder |
Ribonuclease H | Takara | 2150A | Digestion of RNA after cap-trapping. |
RNase ONE Ribonuclease | Promega | M4261 | Degradation of single stranded RNA not protected by cDNA. |
RNase-Free DNase Set | Qiagen | 79254 | Removal of carrier DNA templates after in vitro transcription. |
RNeasy Mini Kit | Qiagen | 74104 | For cleanup of carrier RNA from in vitro transcription or capping |
Sodium acetate, 1 M, aq.soln, pH 4.5 RNAse free | VWR | AAJ63669-AK | Or any nuclease (DNase and RNase) free solution |
Sodium acetate, 1 M, aq.soln, pH 6.0 RNAse free | Or any nuclease (DNase and RNase) free solution | ||
Sodium periodate | Sigma-Aldrich | 311448-100G | Oxidation of vicinal diols |
Sorenson low binding aerosol barrier tips, MicroReach Guard, volume range 10 μL, Graduated | Sorenson (available through SIGMA-ALDRICH) | Z719390-960EA | Low-binding tips – recommended use throughout the protocol to minimise sample loss. |
Sorenson low binding aerosol barrier tips, MultiGuard, volume range 1000 μL , Graduated | Sorenson (available through SIGMA-ALDRICH) | Z719463-1000EA | Low-binding tips – recommended use throughout the protocol to minimise sample loss. |
Sorenson low binding aerosol barrier tips, MultiGuard, volume range 20 μL , Graduated | Sorenson (available through SIGMA-ALDRICH) | Z719412-960EA | Low-binding tips – recommended use throughout the protocol to minimise sample loss. |
Sorenson low binding aerosol barrier tips, MultiGuard, volume range 200 μL , Graduated | Sorenson (available through SIGMA-ALDRICH) | Z719447-960EA | Low-binding tips – recommended use throughout the protocol to minimise sample loss. |
SpeedVac Vacuum Concentrator | concentrating samples in various steps to lower volume | ||
SuperScript III Reverse Transcriptase | ThermoFisher Scientific | 18080044 | Used for reverse transcription (1st CAGE step) |
Trehalose/sorbitol solution | Preparation is described in Murata et al 2014. | ||
Tris-HCl, 1M aq.soln, pH 8.5 | 1 M solution, DNase and RNase free | ||
tRNA (20 mg/mL) | tRNA solution. Preparation is described in Murata et al 2014. | ||
UltraPure Low Melting Point Agarose | ThermoFisher Scientific | 16520050 | Or any suitable pure low-melt agarose. |
USB Shrimp Alkaline Phosphatase (SAP) | Applied Biosystems (Provided by ThermoFisher Scientific) | 78390500UN | |
USER Enzyme | NEB | M5505S | Degradation of 3'linker's upper strand, Uracil Specific Excision Reagent/Enzyme |
Vaccinia Capping System | NEB | M2080S | Enzymatic kit for in vitro capping of carrier molecules |
Wash buffer A | Cap trapping washes. Preparation is described in Murata et al 2014. | ||
Wash buffer B | Cap trapping washes. Preparation is described in Murata et al 2014. | ||
Wash buffer C | Cap trapping washes. Preparation is described in Murata et al 2014. |