Waiting
Login processing...

Trial ends in Request Full Access Tell Your Colleague About Jove
Click here for the English version

Biochemistry

Sondering af RNA-struktur med dimethylsulfatmutationsprofilering med sekventering in vitro og i celler

Published: December 9, 2022 doi: 10.3791/64820

Summary

Protokollen giver instruktion til modificering af RNA med dimethylsulfat til mutationsprofileringseksperimenter. Det omfatter in vitro og in vivo sondering med to alternative biblioteksforberedelsesmetoder.

Abstract

RNA-strukturens rolle i stort set enhver biologisk proces er blevet mere og mere tydelig, især i det sidste årti. Imidlertid har klassiske tilgange til løsning af RNA-struktur, såsom RNA-krystallografi eller cryo-EM, ikke kunnet følge med det hurtigt udviklende felt og behovet for løsninger med høj kapacitet. Mutationsprofilering med sekventering ved hjælp af dimethylsulfat (DMS) MaPseq er en sekventeringsbaseret tilgang til at udlede RNA-strukturen fra en bases reaktivitet med DMS. DMS methylerer N1-nitrogenet i adenosiner og N3 i cytosiner ved deres Watson-Crick-ansigt, når basen er uparret. Omvendt transskribering af det modificerede RNA med den termostabile gruppe II intron reverse transcriptase (TGIRT-III) fører til, at de methylerede baser inkorporeres som mutationer i cDNA. Når man sekventerer det resulterende cDNA og kortlægger det tilbage til et referencetranskription, er de relative mutationshastigheder for hver base vejledende for basens "status" som parret eller uparret. Selvom DMS-reaktiviteter har et højt signal-støj-forhold både in vitro og i celler, er denne metode følsom over for bias i håndteringsprocedurerne. For at reducere denne bias giver dette papir en protokol til RNA-behandling med DMS i celler og med in vitro transskriberet RNA.

Introduction

Siden opdagelsen af, at RNA har både strukturelle1,2 og katalytiske3 egenskaber, er betydningen af RNA og dets regulatoriske funktion i en overflod af biologiske processer gradvist blevet afdækket. Faktisk har effekten af RNA-struktur på genregulering fået stigende opmærksomhed4. Ligesom proteiner har RNA primære, sekundære og tertiære strukturer, der henviser til sekvensen af nukleotider, 2D-kortlægningen af baseparringsinteraktioner og 3D-foldningen af disse baseparrede strukturer. Mens bestemmelse af den tertiære struktur er nøglen til at forstå de nøjagtige mekanismer bag RNA-afhængige processer, er den sekundære struktur også meget informativ med hensyn til RNA-funktion og er grundlaget for yderligere 3D-foldning5.

Imidlertid har bestemmelse af RNA-strukturen været iboende udfordrende med konventionelle tilgange. Mens krystallografi, kernemagnetisk resonans (NMR) og kryogen elektronmikroskopi (cryo-EM) for proteiner har gjort det muligt at bestemme mangfoldigheden af strukturelle motiver, hvilket giver mulighed for strukturforudsigelse fra sekvensen alene6, er disse tilgange ikke bredt anvendelige for RNA'er. Faktisk er RNA'er fleksible molekyler med byggesten (nukleotider), der har meget mere konformations- og rotationsfrihed i forhold til deres aminosyremodstykker. Desuden er interaktionerne gennem baseparring mere dynamiske og alsidige end aminosyrerester. Som følge heraf har klassiske tilgange kun været vellykkede for relativt små RNA'er med veldefinerede, meget kompakte strukturer7.

En anden tilgang til bestemmelse af RNA-strukturen er gennem kemisk sondering kombineret med næste generations sekventering (NGS). Denne strategi genererer information om bindingsstatus for hver base i en RNA-sekvens (dvs. dens sekundære struktur). Kort sagt er baserne i et RNA-molekyle, der ikke deltager i baseparring, differentielt modificeret af små kemiske forbindelser. Omvendt transskribering af disse RNA'er med specialiserede reverse transkriptaser (RT'er) inkorporerer modifikationerne i komplementær deoxyribonukleinsyre (cDNA) som mutationer. Disse cDNA-molekyler amplificeres derefter af polymerasekædereaktionen (PCR) og sekventeres. For at få oplysninger om deres "status" som bundet eller ubundet beregnes mutationsfrekvenserne ved hver base i et RNA af interesse og indgår i strukturforudsigelsessoftware som begrænsninger8. Baseret på nærmeste nabos regler9 og minimum gratis energiberegninger10 genererer denne software strukturmodeller, der bedst passer til de opnåede eksperimentelle data11,12.

DMS-MaPseq bruger DMS, som methylerer N1-nitrogenet i adenosiner og N3-nitrogen i cytosiner ved deres Watson-Crick-ansigt på en meget specifik måde13. Brug af termostabil gruppe II intron reverse transkriptase (TGIRT-III) i omvendt transkription skaber mutationsprofiler med hidtil usete signal-støj-forhold, hvilket endda giver mulighed for dekonvolution af overlappende profiler genereret af to eller flere alternative konformationer14,15. Desuden kan DMS trænge ind i cellemembraner og hele væv, hvilket muliggør sondering inden for fysiologiske sammenhænge. Genereringen af data af god kvalitet er imidlertid udfordrende, da variationer i håndteringsproceduren kan påvirke resultaterne. Derfor leverer vi en detaljeret protokol til både in vitro og in-cell DMS-MaPseq for at reducere bias og guide nybegyndere til metoden gennem de vanskeligheder, de måtte støde på. Især i lyset af den nylige SARS-CoV2-pandemi er data af høj kvalitet om RNA-vira et vigtigt redskab til at studere genekspression og finde mulige terapier.

Protocol

BEMÆRK: Se materialetabellen for detaljer relateret til alle materialer, software, reagenser, instrumenter og celler, der anvendes i denne protokol.

1. Genspecifik in vitro DMS-MaP

  1. RNA in vitro transkription
    1. Få sekvensen af RNA'et af interesse som dobbeltstrenget (ds) DNA (f.eks. Som DNA-fragmenter, plasmider eller PCR fra allerede eksisterende / genomisk DNA). Hvis DNA-sekvensen indeholder en polymerasepromotor, skal du springe til trin 3.
    2. Udfør overlappende PCR for at binde en RNA-polymerasepromotor opstrøms for det ønskede DNA-fragment (fremadgående primer til T7-polymerase: 5 'TAATACGACTCACTATAGG + første baser af målsekvens 3').
    3. In vitro transskribere DNA-fragmentet til RNA. Hold altid RNA'et på is.
    4. Fordøje DNA'et ved hjælp af en DNase.
    5. RNA'et isoleres ved hjælp af en kolonnebaseret tilgang (trin 2.4) eller ved ethanoludfældning (trin 2.5). Elute i et passende volumen og forventer et udbytte på ~ 50 μg.
    6. Sørg for RNA-integriteten ved at køre den på en agarosegel; denaturere RNA'et i 2-3 minutter ved 70 °C, før det køres.
      BEMÆRK: Bufferen og agarosen kan indeholde RNaser, der nedbryder RNA og kan forurene RNA-prøven. Precast agarose geler har tidligere været brugt i dette laboratorium; resultaterne (især med RNA) har til tider været tvetydige. De bedste resultater blev opnået med agarose eller PAGE geler.
    7. Direkte brug af opbevaring af RNA'et ved -80 °C i flere måneder, medmindre nedbrydning er synlig efter optøning.
  2. In vitro DMS-modifikation (ved 105 mM DMS)
    1. Der fremstilles en tilstrækkelig mængde refoldingbuffer (0,4 M natriumcacodylat, pH 7,2, indeholdende 6 mM MgCl2).
      BEMÆRK: For hver reaktion (slutvolumen på 100 μL) tilsættes 89 μL refoldingbuffer.
    2. For hver reaktion overføres 89 μL refoldingbuffer til et udpeget 1,5 ml rør og forvarmes ved 37 °C i en termoshaker placeret under en kemisk hætte.
      BEMÆRK: DMS er meget giftigt og skal altid opbevares under en kemisk hætte, indtil den slukkes af et reduktionsmiddel.
    3. Elute 1-10 pmol af RNA i 10 μL nukleasefrit vand (NFH2O); overførsel til et PCR-rør.
    4. Inkuberes i en termocykler ved 95 °C i 1 minut for at denaturere RNA'et.
    5. Placer straks på en isblok for at undgå at folde forkert.
    6. Tilsæt RNA-prøven til det udpegede rør med refoldingbuffer ved 37 ° C, bland godt og inkuber i 10-20 minutter for at omforme RNA'et.
      BEMÆRK: De fleste RNA'er foldes i størrelsesordenen millisekunder til sekunder, selvom der findes undtagelser16.
    7. Tilsæt 1 μL 100% (10,5 M) DMS til RNA-prøven, og inkuber i 5 minutter, mens du ryster ved 800-1,400 rotationer pr. Minut (omdr./min.).
      BEMÆRK: Omrystning (eller andre måder at blande på) på dette trin er afgørende, da DMS er hydrofob og muligvis ikke opløses helt i refoldingbufferen. Afvigelser i reaktionstider kan påvirke reproducerbarheden af DMS-reaktiviteterne. For at minimere pipetteringsfejl kan DMS opløses i 100% ethanol, inden det tilsættes til prøven, hvis en endelig koncentration på 1% (105 mM) DMS opretholdes. For en ubehandlet kontrol kan DMS erstattes af dimethylsulfoxid (DMSO) eller vand.
    8. Efter 5 minutters reaktionstid slukkes med 60 μL 100% β-mercaptoethanol (BME), blandes godt og placeres straks RNA'et på is.
      BEMÆRK: RNA'et kan fjernes sikkert fra emhætten efter slukning af reaktionen med BME for at rense det op. Direkte eksponering af BME for omgivelserne bør dog stadig undgås på grund af dets stærke lugt og irriterende egenskaber.
    9. Ryd op i RNA'et ved natriumacetat-ethanoludfældning (se trin 2.5) eller en kolonnebaseret tilgang (se trin 2.6), og eluer i 10 μL vand.
    10. Kvantificer RNA'et ved hjælp af et spektrofotometer.
    11. Direkte brug af opbevar det modificerede RNA ved -80 °C.
      BEMÆRK: Langtidsopbevaring bør undgås, da RNA er mindre stabilt efter DMS-behandling.
  3. Genspecifik RT-PCR af modificeret RNA
    BEMÆRK: Se figur 1 for RT-PCR-opsætningen af de DMS-behandlede fragmenter.
    1. Elute 100 ng modificeret RNA i 10 μL nukleasefri (NF)H2O. Overførsel til et PCR-rør.
    2. Til røret tilsættes 4 μL 5x førstestrengsbuffer (FSB), 1 μL dNTP-blanding (10 mM hver), 1 μL 0,1 M dithiothreitol (DTT) (undgå fryse-optøningscyklusser), 1 μL RNasehæmmer, 1 μL 10 μM omvendt primer (enkelt primer eller en pulje af primere) og 1 μL TGIRT III.
      BEMÆRK: For en pulje af primere må du ikke tilføje 1 μL af 10 μM af hver primer direkte til RT; Bland i stedet primerne først, og tilsæt 1 μL fra blandingen (ved 10 μM total primerkoncentration).
    3. Inkuberes ved 57 °C i 30 minutter til 1,5 timer (typisk er 30 min tilstrækkelig til at fremstille et 500 nt produkt) i en termocyklator.
    4. Der tilsættes 1 μL 4 M NaOH, blandes ved pipettering, og der inkuberes ved 95 °C i 3 minutter for at nedbryde RNA'et.
      BEMÆRK: Dette trin er afgørende, da det frigiver TGIRT fra cDNA ved at nedbryde RNA'et. Hvis den springes over, kan downstream PCR blive påvirket.
    5. Ryd op ved hjælp af en kolonnebaseret tilgang (se trin 2.6), der fjerner primerne tilstrækkeligt, og eluer i 10 μL NF H2O.
    6. PCR-amplificer cDNA ved at bruge 1 μL af det omvendte transkriptionsprodukt pr. 25 μL af reaktionen med et PCR-sæt designet til at afbalancere udbytte og troskab.
      BEMÆRK: Prigerne skal have en smeltetemperatur på ~60 °C.
    7. Kør 2 μL af PCR-produktet på en agarosegel eller en præfabrikeret agarosegel for at verificere PCR-succesen.
    8. Ideelt set bør kun et bånd vises efter PCR. Hvis det er tilfældet, skal du rydde op i reaktionen ved hjælp af en kolonnebaseret tilgang. Hvis der er alternative bånd, skal du bruge den resterende PCR-reaktion til at fjerne det korrekte bånd fra gelen. Elute i et tilstrækkeligt lille volumen (f.eks. 10 μL).
    9. Kvantificer de ekstraherede fragmenter ved hjælp af et spektrofotometer.
    10. Indekser dsDNA-fragmenterne til sekventering ved hjælp af en tilgang, der passer til den ønskede sekventeringsplatform.

Figure 1
Figur 1: Eksperimentel opsætning af RT-PCR af store DMS-behandlede fragmenter. Ved udførelse af omvendt transkription på et modificeret RNA registreres modifikationerne på sekvensen, som primergløderne til, ikke. Når fragmenterne overstiger 400-500 bp i længden, skal fragmenter, der overlapper hinanden i primerregionerne, designes, som eksemplificeret her. Længden af fragmenterne afhænger af sekventeringsbehovet. Ved brug af parret 150 cyklussekventering bør fragmenterne ikke overstige 300 bp. Forkortelser: RT-PCR = omvendt transkriptionspolymerasekædereaktion; DMS = dimethylsulfat. Klik her for at se en større version af denne figur.

2. Helgenom DMS-MaP ved hjælp af virusinficerede celler

BEMÆRK: I celler kan DMS-behandling også kombineres med den genspecifikke amplifikationsmetode beskrevet ovenfor. Helgenombiblioteket kræver enorm sekventeringsdybde for at opnå fuld dækning på et enkelt gen. Men hvis virale RNA'er udgør en betydelig del af det ribodepleterede RNA efter ekstraktion, ville helgenomsekventering være passende. Desuden kan andre berigelsesmetoder kombineres med helgenombiblioteksgenereringsmetoden.

  1. DMS-behandling
    1. Dyrk celler inficeret med virussen indtil det ønskede infektionsstadium.
    2. Overfør cellebeholderen til en dedikeret røghætte, der er egnet til håndtering af både vira på det krævede biosikkerhedsniveau og de kemiske dampe, der genereres af midler som DMS.
    3. Tilsæt et 2,5% volumen DMS til kulturmediet, og forsegl beholderen (typisk en 10 cm plade) med parafilm.
      BEMÆRK: Det er let at undermodificere og overmodificere med DMS. Når du tilføjer DMS direkte til celler, er det meget vigtigt at blande godt. Alternativt forvarmer det nye medium i et 50 ml konisk rør ved 37 ° C, og tilsæt DMS direkte ryster kraftigt. Dekanter det brugte medium på cellerne og pipetterer langsomt i det DMS-holdige medium.
    4. Overfør til en 37 °C inkubator i 5 min.
      BEMÆRK: Afhængigt af hvor lang tid det tager at håndtere DMS uden for inkubatoren, er det muligt, at 5 min vil føre til overmodifikation. Hold tiden fra at tilføje DMS til inkubation til ≤1 min. Hvis eksperimentet udføres for første gang, anbefales det at foretage en DMS-titrering og variere inkubationstiden (mellem 3 minutter og 10 minutter) for at finde den optimale modifikationshastighed og sikre, at resultaterne er robuste over et vindue af koncentrationer.
    5. Pipetter forsigtigt det DMS-holdige medium (til passende kemisk affald) og tilsæt forsigtigt 10 ml stopbuffer (PBS med 30% BME [f.eks. 3 ml BME og 7 ml PBS]).
      BEMÆRK: Tilsætningen af DMS og BME kan løfte cellerne fra pladen, hvis cellerne ikke er stærkt klæbende. Hvis cellerne løfter sig, kan de behandles som suspensionsceller - i stedet for at fjerne det DMS-holdige medium, skal du tilføje stopbufferen direkte og skrabe cellerne ud med DMS og BME i et 50 ml konisk rør. Pellets cellerne ved centrifugering i 3 minutter ved 3.000 × g; Sørg for at slippe af med eventuelle resterende DMS, som kan pellets under cellerne i store dråber. Et ekstra vasketrin i 30% BME anbefales, hvis DMS-mediet ikke kan fjernes i første omgang.
    6. Skrab cellerne, og overfør dem til et 15 ml konisk rør.
    7. Pellet ved centrifugering ved 3.000 × g i 3 min.
    8. Fjern supernatanten og vask 2x med 10 ml PBS.
    9. Fjern forsigtigt så meget resterende PBS som muligt.
    10. Pelleten opløses i en passende mængde af RNA-isolationsreagenset (f.eks. 3 ml til en T75-kulturkolbe, 1 ml til en 10 cm plade).
      BEMÆRK: Utilstrækkelige mængder af reagenset kan påvirke RNA-udbyttet.
  2. RNA-ekstraktion og ribosomal RNA (rRNA) udtømning
    1. Til 1 ml homogeniserede celler i RNA-isolationsreagenset tilsættes 200 μL chloroform, hvirvel i 15-20 s indtil lyserød, og inkuberes derefter i op til 3 minutter, indtil faseseparation er synlig.
      BEMÆRK: Den lyserøde lipidfase skal sætte sig i bunden. Hvis dette ikke er tilfældet, var hvirveltiden sandsynligvis utilstrækkelig.
    2. Drej ved maksimal hastighed (~ 20.000 × g) i 15 minutter ved 4 °C.
    3. Overfør den øvre vandige fase til et nyt rør.
    4. Der ryddes op i RNA'et ved natriumacetat-ethanoludfældning (se trin 2.5) eller en søjlebaseret fremgangsmåde (se trin 2.6), og der udvindes i et tilstrækkeligt volumen NFH2O.
    5. Kontroller RNA-integriteten på en agarosegel. Se efter to bånd svarende til de to ribosomale underenheder.
    6. Udtøm rRNA'erne ved hjælp af den foretrukne tilgang, og eluer i et passende volumen (typisk 20-50 μL) af NFH2O.
      BEMÆRK: For downstream-applikationer foreslås ~ 500 ng total RNA i et volumen på 8 μL. Ikke-ribosomale RNA'er udgør typisk kun 5% -10% af det samlede RNA.
    7. Kvantificer ved hjælp af et spektrofotometer.
  3. Generering af bibliotek
    1. Brug genspecifik RT-PCR eller andre tilgange til at generere biblioteker15. Hvis du bruger tilfældige hexamerer til priming, tilsættes et inkubationstrin ved et lavt Tm (37-42 °C) for at muliggøre udglødning af hexamer.
      BEMÆRK: Standard biblioteksgenereringssæt kan også bruges ved at erstatte RT-enzymet med TGIRT og ændre RT-temperaturen til 57 ° C.
  4. Kolonnebaseret RNA-oprydning ved hjælp af RNA Clean & Concentrator-kolonnerne
    BEMÆRK: Alle trin skal udføres ved stuetemperatur.
    1. Der tilsættes NF H2O, til prøverøret for at bringe det op på et volumen på 50 μL.
    2. Der tilsættes 100 μL bindingsbuffer og 150 μL 100 % ethanol til prøven.
    3. Bland og overfør til en spinkolonne.
    4. Spin ved 10.000-16.000 × g i 30 s; Kassér gennemstrømningen.
    5. Tilsæt 400 μL RNA-forberedelsesbuffer.
    6. Spin ved 10.000-16.000 × g i 30 s; Kassér gennemstrømningen.
    7. Tilsæt 700 μL RNA-vaskebuffer.
    8. Spin ved 10.000-16.000 × g i 30 s; Kassér gennemstrømningen.
    9. Tilsæt 400 μL RNA-vaskebuffer.
    10. Spin ved 10.000-16.000 × g i 30 s; Kassér gennemstrømningen.
    11. (Valgfrit) Overfør søjlen til et nyt opsamlingsrør, og drej ved 10.000-16.000 × g i 2 min.
    12. Overfør søjlen til et rent RNAse-frit rør og tilsæt en passende mængde NF H2O.
    13. Spin ved 10.000-16.000 × g i 1 min.
  5. Acid phenol-chloroform RNA ekstraktion.
    1. Tilsæt et lige stort volumen syrephenol:chloroform:isoamylalkohol.
    2. Hvirvel grundigt og centrifuge ved 14.000 × g i 5 min.
    3. Hvis der ikke er nogen faseseparation, tilsættes 20 μL 2 M NaCl, og centrifugeringen gentages.
    4. Overfør den vandige fase til et nyt rør.
    5. Der tilsættes 500 μL isopropanol og 2 μL co-bundfald.
    6. Bland og inkuber ved RT i 3 minutter; inkuberes derefter ved -80 °C natten over.
    7. Pellet RNA'et ved centrifugering ved maksimal hastighed (~ 20.000 × g) i 30 minutter ved 4 °C.
    8. Vask pelleten med 200 μL iskold 70% ethanol.
    9. Drej ved maksimal hastighed (~ 20.000 × g) i 5 min; Kassér gennemstrømningen.
    10. Pelleten suspenderes i den passende mængde NFH2O.
  6. Kolonnebaseret cDNA-oprydning ved hjælp af kolonnerne Oligo Clean og Concentrator
    BEMÆRK: Alle trin skal udføres ved stuetemperatur.
    1. Der tilsættes NF H2O, til prøverøret for at bringe det op på et volumen på 50 μL.
    2. Tilsæt 100 μL bindingsbuffer og 400 μL 100% ethanol.
    3. Bland og overfør til en spinkolonne.
    4. Spin ved 10.000-16.000 × g i 30 s; Kassér gennemstrømningen.
    5. Tilsæt 750 μL DNA-vaskebuffer.
    6. Spin ved 10.000-16.000 × g i 30 s; Kassér gennemstrømningen.
    7. (Valgfrit) Overfør søjlen til et nyt opsamlingsrør og drej ved 10.000-16.000 × g i 2 min.
    8. Overfør søjlen til et rent RNAse-frit rør, og tilsæt en passende mængde NFH2O.
    9. Spin ved 10.000-16.000 × g i 1 min.

3. Analyse af sekventeringsdata

BEMÆRK: For at oprette RNA-sekundære strukturmodeller ud fra DMS-MaP-sekventeringsdataene skal de resulterende .fastq-filer behandles med flere forskellige trin. Disse trin kan udføres automatisk ved hjælp af

  1. Trim adaptersekvenserne med TrimGalore eller Cutadapt.
  2. Kortlæg læsningerne til referencesekvenserne (.fasta-format) ved hjælp af Bowtie2.
  3. Tæl læsningerne med specialiseret RNA-struktursoftware (f.eks. DREEM14, RNA-Framework17 eller lignende), og opret reaktivitetsprofiler.
  4. (Valgfrit) Cluster læsningerne for at finde alternative RNA-konformationer ved hjælp af DREEM14, DRACO 17, DANCE-MaP18 eller lignende.
  5. Forudsig den minimale frie energistruktur baseret på reaktivitetsprofilerne ved hjælp af RNAStructure12, ViennaRNA eller lignende.
  6. Visualiser RNA11-strukturen ved hjælp af VARNA (https://varna.lri.fr/) eller lignende.
    BEMÆRK: Af praktiske årsager inkorporerer software som DREEM (www.rnadreem.org) og RNA-Framework19 i vid udstrækning trin 1--5 i deres pipelines, hvilket strømliner analyseprocessen. Enhver strukturforudsigelse skal dog håndteres med forsigtighed (f.eks. ved at verificere strukturens overensstemmelse med dataene20.

Representative Results

Genspecifik in vitro DMS-MaP
For at studere 5'UTR af SARS2 blev virussens første 300 bp bestilt som en gBlock-sekvens sammen med tre primere. Disse omfattede to primere til at udbrede fragmentet ("FW" & "RV") via PCR samt en til at fastgøre T7-promotoren ("FW-T7"). Disse sekvenser fremgår af tabel 1.

Navn Sekvens (5'->3')
FW ATTAAAGGTTTATACCTTCCCAGGTAAC
RV GCAAACTGAGTTGGACGTGT
FW-T7 TAATACGACTCACTATAGG ATTAAAGGTTTATACCTTCCCAGGTAAC

Tabel 1: Primersekvens for DMS-MaP RT-PCR af SARS-CoV2 5'UTR. Her er FW-T7 og RV nødvendige for at generere en DNA-skabelon til in vitro-transkription, RV bruges i den omvendte transkription, og FW-RV-primerparret bruges i den efterfølgende PCR-forstærkning af cDNA. Primerne anneal til begyndelsen af SARS-CoV2-genomet (FW) og sekvensen lige nedstrøms for interesseområdet. Forkortelser: DMS-MaP = Mutationsprofilering med sekventering ved anvendelse af dimethylsulfat; RT-PCR = omvendt transkriptionspolymerasekædereaktion; SARS-CoV2 = alvorligt akut respiratorisk syndrom-coronavirus 2; UTR = uoversat region; RV = omvendt primer; FW = fremadgående primer.

For at generere RNA fra gBlock-fragmentet blev sekvensen af T7-polymerasepromotoren fastgjort ved anvendelse af overlappende PCR ved anvendelse af PCR-forblandingen i henhold til skemaet set i figur 2A. Fra det aflange fragment blev RNA genereret ved hjælp af T7 Transcription Kit. DNA-skabelonen blev efterfølgende fordøjet ved hjælp af DNase og RNA isoleret ved hjælp af RNA Clean & Concentrator kolonner.

Kvalitetskontrol af in vitro-transkriptionen blev udført ved at køre RNA-produktet på en 1% agarosegel sammen med en ssRNA-stige. Da der kun var et bånd synligt, blev der udført in vitro DMS-sondering og RT-PCR (se figur 2B).

For at verificere succesen med PCR-reaktionen blev prøven kørt på en 2% agarosegel ved hjælp af en dsDNA-stige. Efter indeksering skal båndet køre ~ 150 bp højere på den samme gel, idet der tages højde for størrelsen på indekseringsprimerne.

Figure 2
Figur 2: In vitro transkription af DNA-skabelonen. A) For in vitro at transskribere en DNA-skabelon, der endnu ikke har en iboende RNA-polymerasepromotor, skal skabelonen først fastgøres ved overlappende PCR. Dette gøres ved at anvende en fremadgående primer, som indbefatter sekvensen TAATACGACTCACTATAGG (i tilfælde af T7 RNA-polymerasen) opstrøms for de første baser, der overlapper det ønskede fragment. Den understregede base her symboliserer polymerasens transkriptionsstartsted. Når promotoren har fastgjort til dsDNA-fragmentet, kan det transskriberes af T7-polymerasen. Det er vigtigt, at polymerasen bruger strengen i modsætning til den nævnte promotorsekvens som skabelon (blå), hvilket effektivt skaber RNA identisk med sekvensen umiddelbart nedstrøms for den angivne promotorsekvens (rød). (B) En 1% agarosegel med en ssRNA-stige (bane 1) og in vitro-transskriberet RNA-produkt ved 300 nt (bane 2). (C) En 2% agarosegel med GeneRuler 1 kb plus Ladder (bane 1), PCR-produktet efter RT-PCR, der kører ved 300 bp (bane 2), og det indekserede fragment efter biblioteksforberedelse, der kører ved 470 bp (bane 3). Forkortelser: RT-PCR = omvendt transkriptionspolymerasekædereaktion; DMS = dimethylsulfat; nt = nukleotider; dsDNA = dobbeltstrenget DNA; ssRNA = enkeltstrenget RNA. Klik her for at se en større version af denne figur.

Helgenom in vivo DMS-MaP ved hjælp af virusinficerede celler
Før DMS-behandlingen blev HCT-8-cellerne inficeret med OC43. Når en cytopatisk effekt (CPE) blev observeret 4 dage efter infektion (dpi) (som vist i figur 3A), blev disse celler behandlet, og RNA'et blev ekstraheret og ribodeplet. Når det samlede RNA blev kørt på en agarosegel, var to lyse bånd synlige, der tegner sig for 40S og 60S underenheder af ribosomet, som udgør ca. 95% af den samlede RNA-masse (se figur 3B). Når RNA-ekstraktion ikke lykkedes eller blev nedbrudt (f.eks. ved flere fryse-optøningscyklusser), var RNA-nedbrydningsprodukterne synlige i bunden af gelen (se figur 3C, anden bane). Desuden forsvandt de to lyse bånd efter rRNA-udtømning og efterlod en udtværing i banen (se figur 3C, tredje bane). Endelig, efter biblioteksforberedelse, havde prøverne varierende størrelsesfordelinger og blev vist som en udtværing på den endelige PAGE-gel. Båndet blev udskåret mellem 200 nukleotider (nt) og 500 nt i overensstemmelse med den 150 x 150 parrede sekventeringskørsel, der var planlagt til at analysere disse biblioteker. Vigtigst af alt blev adapterdimerne, der kører ved ~ 150 nt, adskilt (se figur 3D).

Figure 2
Figur 3: Kontrolpunkter for in vivo DMS-MaP med virusinficerede celler. (A) Lysmikroskopibillede af virusinficerede HCT-8-celler, 4 dage dpi. For at opnå det højest mulige udbytte af viralt RNA fra det samlede RNA og samtidig minimere bivirkningerne på grund af celledød, skal DMS tilføjes, når CPE starter eller endda før det, som det ses på billedet. (B) En 1% agarosegel med seks prøver af 1 μg total RNA. I hver bane er to lyse bånd, der tegner sig for 40S- og 60S-underenhederne, synlige, da ribosomalt RNA udgør ~ 95% af det samlede RNA. Bemærk: DMS-behandling i cellen forårsager en vis RNA-fragmentering og udtværing, men de to rRNA-bånd skal stadig være synlige. Mild fragmentering efter modifikation tolereres, fordi informationen indeholdende methyleringsmærket genereres og rapporterer om RNA-strukturen under DMS-inkubationen, mens cellerne stadig er i live. (C) En 1% Agarose gel af GeneRuler 1 kb plus stige DNA-markør (bane 1) total RNA tidligere opbevaret ved -80 ° C i 6 måneder (bane 2) og ribodepleted RNA (bane 3). Ved opbevaring af RNA i lang tid med flere fryse-optøningscyklusser begynder RNA'et at nedbrydes og bør muligvis ikke bruges til sondering af eksperimenter. Desuden, efter ribodepleting af det samlede RNA, begynder de to lyse bånd, der tegner sig for 40S og 60S underenheder af ribosomet, fade og en udtværing af de resterende RNA'er at vise. (D) En PAGE gel af GeneRuler 1 kb plus stige DNA-markør (bane 1) og en biblioteksprøve af helgenomfremstillet RNA. Gelen skal udskæres baseret på sekventeringsbehovet. For en parret sekvenseringskørsel, der spænder over 150 cyklusser fra begge sider, skal gelen udskæres mellem 300 bp og 500 bp. Adapterdimers (kører ved 170 bp) skal adskilles. Forkortelser: DMS-MaP = Mutationsprofilering med sekventering ved anvendelse af dimethylsulfat; dpi = dage efter infektion; CPE = cytopatisk virkning. Klik her for at se en større version af denne figur.

Efter sekventering blev .fastq-filerne analyseret ved at indsende et job til DREEM-webserveren (http://rnadreem.org/) sammen med en .fasta-referencefil. Outputtet genereret af serveren inkluderer kvalitetskontrolfiler genereret af fastqc (https://www.bioinformatics.babraham.ac.uk/projects/fastqc/) og TrimGalore (https://www.bioinformatics.babraham.ac.uk/projects/trim_galore/) samt andre outputfiler, der indeholder befolkningens gennemsnitlige mutationsfrekvenser. Bortset fra diagrammet, der viser mutationsfrekvenserne med et interaktivt .html (se figur 4A) format og en .csv fil med de rå reactivitter pr. base og en struct_constraint.txt fil, læsbar af flere RNA-strukturforudsigelsessoftware, inkluderer dette også en bitvector.txt fil, der rapporterer om by-read-mutationerne. Ud fra disse blev populationsgennemsnitsstrukturerne beregnet ved at indsende .fasta- og struct_constraint.txt-filerne til RNAfold-webserveren (http://rna.tbi.univie.ac.at/cgi-bin/RNAWebSuite/RNAfold.cgi). Dette bruger ViennaRNA-softwaren til at generere strukturforudsigelser baseret på den minimale gratis energi, som kan ses online eller downloades i ct- eller Wien-format. For at generere RNA-strukturmodeller blev disse filer, der kunne downloades, sendt til VARNA (https://varna.lri.fr/, se figur 4B). Endelig kan bitvector.txt filer bruges af den stabile version af DREEM (https://codeocean.com/capsule/6175523/tree/v1) til at søge efter alternative RNA-konformationer. For at opnå gode strukturmodeller ved hjælp af DREEM skal der opnås en dækning på 10.000 læsninger pr. base; Til klyngedannelse kan der kræves op til 100.000 læsninger pr. base. En oversigt over hele arbejdsgangen findes i figur 4C.

Figure 4
Figur 4: Eksemplariske data opnået fra kemiske sonderingseksperimenter af SARS-CoV2 5'UTR. (A) Reaktivitetsprofil for de første 300 baser af SARS-CoV2-genomet farvet efter base (A: rød, C: blå, U: grøn, G: gul). De rå reaktiviteter beregnes som den absolutte mutationsfrekvens divideret med dækningen. Baser med åben konformation har høje reaktivitetsværdier; Baser, der deltager i baseparring, har lave reaktivitetsværdier. U og G ændres ikke af DMS og har lave reaktivitetsværdier, der stammer fra polymeraseutroskab. Forudsigelserne blev foretaget med DREEM-webserveren. (B) Strukturmodel af SARS-CoV2 5'UTR forudsagt ud fra reaktivitetsværdier lavet med VARNA. Baser med høje reaktivitetsværdier er farvet i rødt; Baser med lave reaktivitetsværdier er farvet i hvidt. (C) Arbejdsgang for DMS-MaP-analysen, der starter med .fastq-filerne opnået ved sekventering. Disse kan kvalitetskontrolleres ved hjælp af fastqc; adaptersekvenserne trimmes ved hjælp af TrimGalore og kortlægges derefter tilbage til en referencesekvens ved hjælp af Bowtie2. Ud fra de opnåede .bam-filer tæller DREEM mutationerne i hver læsning og opretter et mutationskort eller .bitvector.txt-fil. Disse rapporterer mutationerne af hver læsning på en positionsafhængig måde, baseret på hvilken populationens gennemsnitlige reaktivitetsprofiler kan oprettes. Alternativt kan bitvektorer grupperes ved hjælp af DREEM for at søge efter alternative RNA-konformationer. Endelig visualiseres de opnåede strukturmodeller ved hjælp af software (f.eks. VARNA). Forkortelser: DMS-MaP = Mutationsprofilering med sekventering ved anvendelse af dimethylsulfat; SARS-CoV2 = alvorligt akut respiratorisk syndrom-coronavirus 2. Klik her for at se en større version af denne figur.

Discussion

Protokollen her beskriver, hvordan man sonderer RNA in vitro og i celler ved hjælp af DMS-mutationsprofileringseksperimenter. Desuden giver den instruktioner om, hvordan man forbereder biblioteker til Illumina-sekventering for at generere genspecifikke data og analysere de opnåede .fastq-filer. Derudover kan genom-dækkende biblioteksmetoder bruges. Genspecifik RT-PCR producerer dog den højeste kvalitet og mest robuste data. Hvis man sammenligner mellem prøver, er det derfor vigtigt at sikre, at de er forberedt med identiske sekventeringsstrategier, da biblioteksgenereringen forårsager en vis bias. Reproducerbarheden bør altid måles ved hjælp af replikater.

Flere forholdsregler
RNA er et ustabilt molekyle, der er følsomt over for nedbrydning både gennem forhøjede temperaturer og af RNaser. Derfor anbefales særlige foranstaltninger - brug af personlige værnemidler (PPE), RNAse-frit materiale og RNAse-hæmmere. Vigtigst er det, at RNA holdes på is, når det er muligt. Dette gælder især methyleret RNA, som er endnu mere følsomt over for høje temperaturer.

Det er vigtigt at bekræfte, at RNA-strukturen af interesse ikke er følsom over for DMS-koncentrations- og bufferbetingelserne. Buffere såsom 100 mM Tris, 100 mM MOP og 100 mM HEPES ved pH 7-7,5 giver et højt signal, men er muligvis ikke tilstrækkeligt til at opretholde pH under reaktionen21. Da DMS hydrolyserer i vand, hvilket reducerer pH, er en stærk buffer afgørende for at opretholde en neutral pH under modifikationsreaktionen. Tilsætningen af bicin har vist sig at hjælpe med at opretholde pH som lidt grundlæggende21 , men resulterer i lav DMS-modifikation på Gs og Us, hvilket kunne være informativt, men bør analyseres separat på grund af produktionen af et meget lavere signal end As og Cs og diskuteres ikke yderligere i denne protokol.

I genspecifik RT-PCR transkriberes det modificerede RNA omvendt til DNA'et og amplificeres i fragmenter af PCR. Mens størrelsen af RNA'et teoretisk kan være ubegrænset, bør disse PCR-fragmenter ikke overstige en længde på 400-500 basepar (bp) for at forhindre bias under den omvendte transkriptionsreaktion. Ideelt set bør fragmenterne være inden for rammerne af sekventeringskørslen (dvs. hvis sekventering udføres ved hjælp af et 150 x 150 cyklusparret sekventeringsprogram, bør et enkelt fragment ikke overstige 300 bp). Når du bruger sekventeringsprogrammer med færre cyklusser, kan PCR-produkterne fragmenteres ved hjælp af en dsDNase. Da sekvenser inden for primersekvenserne ikke indeholder nogen strukturel information, skal fragmenterne desuden overlappe hinanden, når det undersøgte RNA omfatter >1 fragment. RT-reaktioner kan indeholde flere RT-primere til forskellige fragmenter (op til 10 forskellige RT-primere). Afhængigt af sekvenserne kan pooling af RT-primere gøre den omvendte transkription mindre effektiv, men fungerer typisk godt. Hver PCR-reaktion skal udføres separat.

Ved sondering af RNA med DMS spiller de eksperimentelle forhold en yderligere rolle, da mange RNA'er er termodynamisk ustabile og ændrer deres konformation baseret på miljøfaktorer som temperatur. For at undgå uregelmæssigheder bør forsøgsbetingelserne holdes så konstante som muligt, også med hensyn til reaktionstider. Bufferbetingelserne synes at kunne udskiftes til en vis grad 17,20,22,23, når de grundlæggende betingelser opretholdes - bufferkapaciteten og tilstedeværelsen af monovalente (Na) og divalente ioner (Mg) - for at sikre korrekt foldning af RNA 24.

Med hensyn til biblioteksforberedelse af modificerede RNA'er skal flere aspekter tages i betragtning. For det første er modificerede RNA'er som nævnt mindre stabile end deres umodificerede modstykker, hvilket betyder, at de muligvis kræver optimering af fragmenteringstiderne for optimal fragmentstørrelsesfordeling. Desuden bruger visse RNA-biblioteksforberedelsessæt såvel som mange andre RNAseq-tilgange tilfældige primere i det omvendte transkriptionssæt. Dette kan føre til lavere dækning af referencen, især i 3'et gen, og i sidste ende til utilstrækkelig dækningsdybde. Hvis dækningen af en bestemt region er for lav, kan det være nødvendigt at fjerne disse baser fra strukturforudsigelsen. Bortset fra RT-PCR og helgenom RNAseq-sæt kan andre biblioteksforberedelsesmetoder anvendes. Protokoller, der inkluderer ligering af 3' og/eller 5' adaptere til RNA'et, er fordelagtige, når der anvendes små fragmenter af RNA, eller når tab af sonderende information i primerregionerne skal undgås.

Endelig skal analysen af de kemiske sondeforsøg altid fortolkes omhyggeligt. I øjeblikket er der ingen software, der forudsiger RNA-strukturen af noget RNA fra sekvensen alene med høj nøjagtighed. Selvom kemiske sonderingsbegrænsninger i høj grad forbedrer nøjagtigheden, er det stadig udfordrende at generere gode modeller til lange RNA'er (>500 nt). Disse modeller bør testes yderligere ved andre tilgange og/eller mutagenese. RNA-forudsigelsessoftware optimerer til det maksimale antal basepar, hvilket straffer åbne konformationer betydeligt, hvilket muligvis ikke nøjagtigt repræsenterer RNA-foldning5. Således bør den opnåede strukturmodel testes ved at kvantificere forudsigelsesaftalen med de underliggende kemiske sonderingsdata (f.eks. af AUROC) og mellem replikater (f.eks. ved mFMI), som eksemplificeret ved Lan et al.20.

Ideelt set bør flere eksperimenter i forskellige systemer for at udfordre den opnåede strukturmodel bruges til at styrke ens hypotese. Disse kan omfatte brugen af in vitro - og in-cell-tilgange, kompenserende mutationer og forskellige cellelinjer og arter. Desuden er rå reaktiviteter ofte lige så eller endda mere informative end strukturforudsigelser, da de registrerer "ground truth" -øjebliksbilledet af RNA-foldensemblet. Som sådan er rå reaktiviteter meget velegnede og informative til sammenligning af strukturændringer mellem forskellige forhold. Det er vigtigt, at de laveste frie energistrukturer beregnet ved hjælp af kemiske sonderingsbegrænsninger med beregningsforudsigelse kun bør bruges som en starthypotese mod en komplet strukturmodel.

Disclosures

Forfatterne har ingen interessekonflikter at erklære.

Acknowledgments

Ingen

Materials

Name Company Catalog Number Comments
1 Kb Plus DNA Ladder 10787018 Thermo
2-mercaptoethanol M6250-250ML Sigma
Acid-Phenol:Chloroform, pH 4.5 AM9720 Thermo
Advantage PCR 639206 Takara
CloneAmp HiFi PCR Premix 639298 Takara
DMS D186309
 
Sigma
dNTPs 10 mM each U151B Promega
E-Gel EX Agarose Gels, 2% G402022 Thermo precast agarose gels
Ethanol (200 proof) E7023-4X4L Sigma
Falcon tubes, 15 mL, 50 mL
GlycoBlue co-precipitant
HCT-8 cells  ATCC #CCL-244
Invitrogen MgCl2 (1 M) AM9530G fisherscientific
Isopropanol 278475 Sigma
Megascript T7 transcription AM1334 Thermo
NanoDrop spectrophotometer
Novex TBE Gels, 8%, 10 well EC6215BOX Thermo
OC43  ATCC #VR-1558
RiboRuler Low Range RNA Ladder SM1831 Thermo
RNAse H M0297L NEB
Sodium Cacodylate, 0.4 M, pH 7.2 102090-964 VWR
Sodium hydroxide solution S8263-150ML Sigma
SuperScript II Reverse Transcriptase for FSB and DTT 18064014 Thermo
TGIRT-III Enzyme TGIRT50 Ingex
The Oligo Clean & Concentrator D4060 Genesee
The RNA Clean & Concentrator kits are RNA clean up kits R1016 Genesee
TRIzol Reagents 15596018 Thermo RNA isolation reagent
Water, (For RNA Work) (DEPC-Treated, DNASE, RNASE free/Mol. Biol.) BP561-1 fisherscientific
xGen Broad-range RNA Library Prep 16rxn 10009865 IDT
Zymo RNA clean and concentrator columns

DOWNLOAD MATERIALS LIST

References

  1. Kim, S. H., et al. Three-dimensional tertiary structure of yeast phenylalanine transfer RNA. Science. 185 (4149), 435-440 (1974).
  2. Robertus, J. D., et al. Structure of yeast phenylalanine tRNA at 3 Å resolution. Nature. 250 (467), 546-551 (1974).
  3. Zaug, A. J., Cech, T. R. In vitro splicing of the ribosomal RNA precursor in nuclei of Tetrahymena. Cell. 19 (2), 331-338 (1980).
  4. Zhao, Y., et al. NONCODE 2016: An informative and valuable data source of long non-coding RNAs. Nucleic Acids Research. 44, D203-D208 (2016).
  5. Vandivier, L. E., Anderson, S. J., Foley, S. W., Gregory, B. D. The conservation and function of RNA secondary structure in plants. Annual Review of Plant Biology. 67, 463 (2016).
  6. Jumper, J., et al. Highly accurate protein structure prediction with AlphaFold. Nature. 596 (7873), 583-589 (2021).
  7. Das, R. RNA structure: A renaissance begins. Nature Methods. 18 (5), 439-439 (2021).
  8. Smola, M. J., Rice, G. M., Busan, S., Siegfried, N. A., Weeks, K. M. Selective 2′-hydroxyl acylation analyzed by primer extension and mutational profiling (SHAPE-MaP) for direct, versatile and accurate RNA structure analysis. Nature Protocols. 10 (11), 1643-1669 (2015).
  9. Mathews, D. H., et al. Incorporating chemical modification constraints into a dynamic programming algorithm for prediction of RNA secondary structure. Proceedings of the National Academy of Sciences of the United States of America. 101 (19), 7287-7292 (2004).
  10. Zuker, M., Stiegler, P. Optimal computer folding of large RNA sequences using thermodynamics and auxiliary information. Nucleic Acids Research. 9 (1), 133-148 (1981).
  11. Lorenz, R., et al. ViennaRNA Package 2.0. Algorithms for Molecular Biology. 6, (2011).
  12. Reuter, J. S., Mathews, D. H. RNAstructure: Software for RNA secondary structure prediction and analysis. BMC Bioinformatics. 11, (2010).
  13. Wells, S. E., Hughes, J. M. X., Igel, A. H., Ares, M. Use of dimethyl sulfate to probe RNA structure in vivo. Methods in Enzymology. , 479-493 (2000).
  14. Tomezsko, P. J., et al. Determination of RNA structural diversity and its role in HIV-1 RNA splicing. Nature. 582 (7812), (2020).
  15. Zubradt, M., et al. DMS-MaPseq for genome-wide or targeted RNA structure probing in vivo. Nature Methods. 14 (1), (2017).
  16. Woodson, S. A. Compact intermediates in RNA folding. Annual Reviews in Biophysics. 39, (2010).
  17. Morandi, E., et al. Genome-scale deconvolution of RNA structure ensembles. Nature Methods. 18 (3), 249-252 (2021).
  18. Olson, S. W., et al. Discovery of a large-scale, cell-state-responsive allosteric switch in the 7SK RNA using DANCE-MaP. Molecular Cell. 82 (9), 1708-1723 (2022).
  19. Incarnato, D., Morandi, E., Simon, L. M., Oliviero, S. RNA Framework: An all-in-one toolkit for the analysis of RNA structures and post-transcriptional modifications. Nucleic Acids Research. 46 (16), (2018).
  20. Lan, T. C. T., et al. Secondary structural ensembles of the SARS-CoV-2 RNA genome in infected cells. Nature Communications. 13 (1), 1128 (2022).
  21. Homan, P. J., et al. Single-molecule correlated chemical probing of RNA. Proceedings of the National Academy of Sciences of the United States of America. 111 (38), 13858-13863 (2014).
  22. Yang, S. L., et al. Comprehensive mapping of SARS-CoV-2 interactions in vivo reveals functional virus-host interactions. Nature Communications. 12 (1), 5113 (2021).
  23. Manfredonia, I., et al. Genome-wide mapping of SARS-CoV-2 RNA structures identifies therapeutically-relevant elements. Nucleic Acids Research. 48 (22), 12436-12452 (2020).
  24. Fischer, N. M., Polěto, M. D., Steuer, J., vander Spoel, D. Influence of Na+ and Mg2+ ions on RNA structures studied with molecular dynamics simulations. Nucleic Acids Research. 46 (10), 4872-4882 (2018).

Tags

Biokemi udgave 190
Sondering af RNA-struktur med dimethylsulfatmutationsprofilering med sekventering <em>in vitro</em> og i celler
Play Video
PDF DOI DOWNLOAD MATERIALS LIST

Cite this Article

Dülk, S. L., Rouskin, S.More

Dülk, S. L., Rouskin, S. Probing RNA Structure with Dimethyl Sulfate Mutational Profiling with Sequencing In Vitro and in Cells. J. Vis. Exp. (190), e64820, doi:10.3791/64820 (2022).

Less
Copy Citation Download Citation Reprints and Permissions
View Video

Get cutting-edge science videos from JoVE sent straight to your inbox every month.

Waiting X
Simple Hit Counter