Vi beskriver en protokol for at identificere RNA-bindende proteiner og kortlægge deres RNA-bindende regioner i levende celler ved hjælp af UV-medieret photocrosslinking og massespektrometri.
Noncoding RNA’er spiller vigtige roller i flere nukleare processer, herunder regulering af genekspression, kromatin struktur og DNA reparation. I de fleste tilfælde, er virkningen af noncoding RNA’er medieret af proteiner hvis funktioner er igen underlagt disse interaktioner med noncoding RNA’er. I overensstemmelse hermed, et stigende antal proteiner involveret i nuklear funktioner er blevet rapporteret til at binde RNA og i et par tilfælde regionerne RNA-bindende af disse proteiner er kortlagt, ofte gennem møjsommelige, kandidat-baserede metoder.
Her rapporterer vi en detaljeret protokol til at udføre en høj overførselshastighed, proteom-wide objektiv identifikation af RNA-bindende proteiner og RNA-bindende regioner. Metoden er baseret på inkorporering af en fotoreaktivt uridine analog i den cellulære RNA, efterfulgt af UV-medieret protein-RNA crosslinking og massespektrometri analyser at afsløre RNA-crosslinked peptider inden for proteomet. Selv om vi beskrive proceduren for musen embryonale stamceller, bør protokollen tilpasses nemt til en række kulturperler celler.
Formålet med metoden RBR-ID er at identificere roman RNA-bindende proteiner (RBPs) og kortlægge deres RNA-bindende regioner (RBRs) med peptid-niveau beslutning at lette udformningen af RNA-bindende mutanter og undersøgelse af biologiske og biokemiske funktioner af protein-RNA interaktioner.
RNA er enestående blandt biomolekyler, da det kan både fungere som en budbringer, der bærer genetisk information og også fold i komplekse tredimensionale strukturer med biokemiske funktioner mere beslægtet med dem af proteiner1,2. En voksende mængde af beviser tyder på, at noncoding RNA’er (klarlægning) spiller vigtige roller i forskellige gen regulerende og epigenetiske veje3,4,5 , og typisk disse regulerende funktioner er medieret i koncert med proteiner, der interagerer med en given RNA. Af særlig relevans, var et sæt af interagerende proteiner for nylig udpeget for det intenst undersøgt lange ncRNA (lncRNA) Xist, at give værdifuld indsigt i, hvordan denne lncRNA medierer x-kromosom Inaktiveringen i kvindelige celler6,7 ,8. Navnlig, flere af disse Xist-interagere proteiner indeholder ikke nogen kanoniske RNA-bindende domæner9, og derfor deres RNA-bindende aktivitet kunne ikke forudset i siliciummangan baseret på deres primære sekvens alene. I betragtning af, at tusindvis af lncRNAs er udtrykt i en given celle10, er det rimeligt at antage, at mange af dem kan handle via interaktioner med endnu at blive opdaget RNA-bindende proteiner (RBPs). En eksperimentel strategi til at identificere disse roman RBPs vil derfor i høj grad lette opgave at dissekere den biologiske funktion af klarlægning.
Tidligere forsøg på at identificere RBPs empirisk har påberåbt sig polyA + RNA udvalg koblet til massespektrometri (MS)11,12,13,14,15. Selv om disse forsøg tilføjes listen over formodede RBPs mange proteiner, ved design kunne de kun registrere proteiner bundet til polyadenylated udskrifter. De fleste små RNA’er og mange lncRNAs er imidlertid ikke polyadenylated. 16 , 17 og deres interagerende proteiner ville sandsynligvis have været savnet i disse eksperimenter. En nylig undersøgelse anvendes maskinen læring på protein-protein interactome databaser at identificere proteiner, der co renset med flere kendte RBPs og viste, at disse tilbagevendende RBP partnere var mere tilbøjelige til at besidde RNA-bindende aktiviteter18. Men denne tilgang afhængig mining eksisterende store interaktion databaser og kan kun identificere proteiner, der kan være co renset i ikke-denatureringen betingelser med kendte RBPs, dermed udelukke fra analyse uopløselige, membran-indlejret og knappe proteiner.
Identifikation af et protein som en Bonafide RBP ofte ikke automatisk giver oplysninger om de biologiske og/eller biokemiske funktion af protein-RNA interaktion. For at løse dette punkt, er det typisk ønskeligt at identificere de protein domæne og aminosyre rester involveret i samspillet, således at specifikke mutanter kan være designet til at teste funktionen af RNA bindende i forbindelse med hver roman RBP19, 20. tidligere indsats af vores gruppe og andre har brugt rekombinante protein fragmenter og sletning mutanter for at identificere RNA bindende regioner (RBRs)19,20,21,22; men sådanne tilgange er arbejdskrævende og uforenelig med høj overførselshastighed analyser. For nylig beskrev en undersøgelse en eksperimentel strategi for at kortlægge RNA-bindende aktiviteter i en høj overførselshastighed mode ved hjælp af massespektrometri23; men denne fremgangsmåde påberåbt sig en dobbelt polyA + RNA udvalg, og således foretaget de samme begrænsninger som RBP identifikation metoder beskrevet ovenfor.
Vi udviklet en teknik, kaldet RNA bindende region identifikation (RBR-ID), som udnytter protein-RNA photocrosslinking og kvantitativ massespektrometri til at identificere proteiner og protein regioner interagere med RNA i levende celler uden at gøre antagelse om RNA polyadenylation status, herunder således RBPs bundet til polyA-RNA’er24. Desuden, denne metode afhængig udelukkende af crosslinking og har ingen krav på protein opløselighed eller tilgængelighed og er således egnet til at knytte RNA-bindende aktiviteter inden for membraner (f.eks. den nukleare kuvert) eller () tungtopløselige rum f.eks. den nukleare matrix). Vi beskriver de eksperimenterende trin for at udføre RBR-ID for kerner af musen embryonale stamceller (mESCs) men med mindre ændringer denne protokol skal være egnet til en lang række celletyper, forudsat at de effektivt kan optage 4SU fra kulturen medium.
Vi beskriver en udførligt beskrevet forsøgsplan for at udføre RBR-ID i mESCs og med passende ændringer i alle celler, der kan integrere 4SU i RNA. Andre celletyper kan kræve optimering af tilgang til at sikre et tilstrækkeligt signal til støjforhold. Derudover, mens protokollen beskrevet heri fokuserer på gennemgangen af nukleare RBPs, bør RBR-ID-teknologi være let tilpasses til forskellige cellulære rum, såsom cytosol eller specifikke organeller, ved brug af forskellige fraktionering strategier. Parametre, d…
The authors have nothing to disclose.
R.B. blev støttet af Searle lærde Program, WW Smith Foundation (C1404) og marts Dimes Foundation (1-FY-15-344). Pose anerkender støtte fra NIH grants R01GM110174 og NIH R01AI118891, samt DOD give BC123187P1. R.W.-T. blev støttet af NIH uddannelse grant T32GM008216.
KnockOut DMEM | Fisher Scientific | 10829018 | |
Fetal bovine serum, qualified, US origin | Fisher Scientific | 26140079 | |
L-Glutamine solution 200 mM | Sigma | G7513 | |
Penicillin-Streptomycin solution | Sigma | P0781 | |
MEM Non-essential Amino Acid Solution (100×) | Sigma | M7145 | |
2-Mercaptoethanol | Sigma | M3148 | |
ESGRO Leukemia Inhibitory Factor (LIF) | EMD Millipore | ESG1106 | |
CHIR99021 | Tocris | 4423 | |
PD0325901 | Sigma | PZ0162 | |
Gelatin solution,2% in water | Sigma | G1393 | |
4-thiouridine | Sigma | T4509 | 50 mM stock in water |
Spectrolinker XL-1500 | Fisher Scientific | 11-992-90 | |
Phenylmethanesulfonyl fluoride | Sigma | 78830 | |
IGEPAL CO-630 | Sigma | 542334 | Commercial form of octyl-phenoxy-polyethoxy-ethanol detergent |
Iodoacetamide | Sigma | I6125 | |
Trypsin, sequencing grade | Promega | V5111 | |
Empore solid phase extraction disk | 3M | 66883 | |
OLIGO R3 Reversed – Phase Resin | Fisher Scientific | 1133903 | |
Benzonase | Sigma | E8263 | High purity nuclease |
Sonic Dismembrator Model 100 | Fisher Scientific | discontinued | updated with FB505110 |
HPLC grade acetonitrile | Fisher Chemical | A955-4 | |
HPLC grade water | Fisher Scientific | W6 4 | |
TFA | Fisher Scientific | A11650 | |
Ammonium Bicarbonate | Sigma | A6141 | |
Acetic Acid | Sigma | 49199 | |
Formic Acid | Sigma | F0507 | |
ReproSil-Pur 18-AQ | Dr. Maisch GmbH HPLC | r13.aq.0003 | Packing material for HPLC column |
Capillary for nano columns (75 µm) | Molex | 1068150017 | |
MaxQuant software | Max Planck Institute for Biochemistry | Can perform chromatographic alignment of multiple MS runs |