Begränsning endonucleases med nytt ordnar specificitet kan framkallas från enzym som känner igen ett delvist degenererat ordnar. Här tillhandahåller vi ett detaljerat protokoll som vi framgångsrikt använde för att ändra sekvenss specificitet nlaIV enzym. Viktiga ingredienser i protokollet är in vitro-uppdelning av transkriptions-/översättningsreaktionen och valet av varianter med nya sekvenssub specificiteter.
Begränsning endonuclease (REase) specificitet teknik är extremt svårt. Här beskriver vi ett flerstegsprotokoll som hjälper till att producera REase-varianter som har strängare specificitet än föräldraenzymet. Protokollet kräver att ett bibliotek med uttrycksvalskassetter (ESCs) skapas för varianter av REase, helst med variationer i positioner som kan påverka DNA-bindning. ESK flankeras på ena sidan av en sekvens för den önskade begränsningsplatsens aktivitet och en biotintagg och på andra sidan av en begränsningsplats för oönskad aktivitet och en grundsatsglödplats. ESCs transkriberas och översätts i en vatten-i-olja emulsion, under förhållanden som gör förekomsten av mer än en DNA-molekyl per droppe osannolikt. Därför utsätts DNA i varje kassettmolekyl endast för aktiviteten hos det översatta, kodade enzymet. REase varianter av önskad specificitet ta bort biotin taggen men inte primer glödgning webbplats. Efter att ha brutit emulsionen utsätts DNA-molekylerna för en biotin pulldown, och endast de i supernatanten behålls. Det här steget säkerställer att endast ESC för varianter som inte har förlorat önskad aktivitet behålls. Dessa DNA-molekyler utsätts sedan för en första PCR-reaktion. Klyvning i den oönskade sekvensen skär av primerbindningsstället för en av grundfärgerna. Därför förstärkare PCR endast ESCs från droppar utan oönskad aktivitet. En andra PCR-reaktion utförs sedan för att återinföra begränsningsplatsen för önskad specificitet och biotintaggen, så att urvalssteget kan upprepas. Valda öppna läsramar kan överuttryckas i bakterieceller som också uttrycker cognate metyltransferas av föräldrarnas REase, eftersom den nyligen utvecklade REase riktar endast en delmängd av metyltransferas målplatser.
Sekvens specificitetsteknik är extremt utmanande för klass II REases. I denna klass av endonucleases, sekvens erkännande och katalys är nära sammanflätade, troligen som en evolutionär skydd mot skapandet av en endonuclease av bredare specificitet än dess konjak metyltransferas, vilket skulle skada värd DNA. Riktad utveckling av nya särdrag i celler kompliceras ytterligare av behovet av att skydda värd-DNA mot den nykonstruerade endonucleaseaktiviteten. Därför finns det bara ett fåtal framgångsrika försök av REase teknik rapporterade och alla av dem utnyttja de unika egenskaperna hos ett visst enzym1,2,3,4,5,6,7.
Här tillhandahåller vi ett detaljerat protokoll för specificitetsteknik som kan användas för att generera endonuclease varianter som har smalare specificitet än ett föräldraenzym som bygger på vår framgångsrika teknik för en NlaIV endonuclease8. För ett sådant enzym med en godtycklig igenkänningssekvens kan extra specificitet införas för baser i flankerna. För föräldraenzymer som känner igen delvis degenererade sekvenser (såsom NlaIV med sitt GGNNCC-mål), kan ytterligare specificitet också införas inom igenkänningssekvensen. Eftersom extra specificitet sannolikt kommer att kräva protein-DNA-kontakter, bör de nyligen erkända baserna ligga inom fotavtryck av föräldrarnas endonuclease på DNA. I princip kan urvalsscheman ställas in för önskad specialisering av igenkänningssekvensen. Men de flesta REases som känner igen palindromic och nästan palindromic målsekvenser är funktionella dimers som känner igen endast en halv-plats av palindrorome. Därför är det osannolikt att valet av nya specificiteter som bryter mot symmetrin hos proteinkärna interaktioner kommer att fungera. För dimeric NlaIV, till exempel, ggnncc-sekvensen kan teoretiskt begränsas till GGATCC men att minska specificiteten ner till GGAACC förväntas bli svårare. Vårt system innebär både positivt och negativt urval.
Processen är effektivare när negativt urval också används för att ta bort de särdrag som kan klyva alla sekvenser än den föredragna smalare specificiteten. Val för GGATCC kan till exempel kombineras med antiselection mot GGBVCC (där B är någon annan bas än A och V är någon annan bas än T). När några av de möjliga målsekvenserna inte täcks beror resultatet av urvalsexperimentet på effektiviteten av ett positivt och negativt urval. I vårt NlaIV-arbete valde vi för GGATCC, och mot GGSSCC (där S är G eller C), och fick en specificitet som, ignorera symmetri bryta mål, kan beskrivas som GGWWCC (där W är A eller T), vilket tyder på att i detta fall, negativt urval var mer viktigt än positivt urval.
Vår strategi börjar med att skapa en uttrycksvalskassett (ESC). ESK är uppbyggd i sektioner. På insidan av kärnan avsnitt finns varianter av den öppna avläsningsramen (ORF) av REase, under T7 promotorn kontroll. Den här kärndelen av ESC kan inte innehålla någon cognate-plats för den konstruerade REase. Kärnan är inklämd mellan två cognate platser för vild typ REase: en klyvning plats för oönskad aktivitet (counter vald sekvens, GGSSCC i detta exempel) och en klyvning plats för önskad aktivitet (vald sekvens, GGATCC i exemplet). Det sista steget i beredningen av ESC i PCR lägger till biotin nära önskad aktivitet vid 5’s och skapar en mängd olika counter valda sekvenser (GGSSCC i exemplet). Urvalsstrategin bygger på användning av noggrant utformade grundfärger vid ESC:s omförstärkningsprotokoll efter ett in vitro-protokoll för transkription/översättning/urval (figur 1A). Esc-biblioteket uttrycks i en in vitro-uppdelad transkriptionsöversättning vatten-i-olja emulsion9,,10,11. Inom varje droppe påverkar det uttryckta enzymets specificitet ESK:s tillstånd (figur 1B, steg I). För det beskrivna arrangemanget tar den önskade klyvningsaktiviteten hos det översatta proteinet bort DNA:s biotintagg men påverkar inte den andra ESC-änden med den valda räknarsekvensen. När emulsionen bryts avlägsnas biotinylerade fragment genom streptavidin affinitets pulldown, så att endast fragment från droppar med önskad aktivitet kvarstår (figur 1B, steg II). Det här steget tar bort inaktiva REase-varianter. Den supernatant fraktionen av pull-down-steget förstärks sedan av PCR. I de första PCR-reaktionsprimrarna används F2 och R1 (figur 1A, B, steg III). Primer F2 binder till ESC-sektionen mellan den valda räknarsekvensen och molekyländen. Därför förstärks inte ESCs som uttrycker varianter som kan klyva den valda räknarsekvensen (och därför separera bindningsställena för grundfärgerna F2 och R1 i två olika DNA-molekyler) och tas därmed bort från biblioteket. Primern R1 binder mellan den valda platsen och kärnan i ESC så att den inte påverkas av klyvningsstatusen för det valda området och återställer klyvningsplatsen för önskad aktivitet (GGATCC). Cykeln stängs av en andra PCR (med grundfärger F1 och R2) som lägger till biotin i 5′-änden nära den valda platsen och återställer den utformade variationen vid den disk valda platsen nära den motsatta änden av ESC(figur 1B, steg IV). Den resulterande DNA-blandningen är klar för en ny urvalsrunda.
Framgången för urvalsprotokollet beror starkt på det korrekta valet av den nya, strängare måligenkänningssekvensen och på noggrann utformning av mutagenesis-strategin och dess effektiva genomförande. Eftersom det är mycket lättare att förbättra på små befintliga preferenser REase än att övervinna dem, rekommenderar vi att börja med en kinetisk studie av eventuella befintliga preferenser. Nödvändigheten av noggrann mutagenesis design resultat från den begränsade storleken på en mutant bibliotek som kan behandlas av det presenterade protokollet (109 kloner i ett enda experiment). Därför kan alla 20 möjliga aminosyrasubstitutioner testas effektivt i endast ett fåtal positioner (se Diskussion). Slumpmässig mutagenesis, såsom felbenägna PCR (EP-PCR) presenteras som en alternativ metod, kommer att leda till djupgående undersampling av befintliga komplexitet. Om någon information om potentiella aminosyra positioner som deltar i kontakter med DNA (eller ens ligger i närheten av degenererade nukleotider i en cognate sekvens) är tillgänglig, det säkert bör användas för att välja några aminosyror för oligonukleotid guidad mättnad mutagenesis (protokoll steg 1.6-3.10).
Urvalsprotokollet som beskrivs här testades för NlaIV8, en dimeric PD-(D/E)XK fold recognition sekvens som känner igen en palindromic målplats med centrala NN baser och katalyserar en trubbig ände skära mellan NN baser. NlaIV plockades eftersom klyvning mellan NN baser tyder på att dessa baser är nära proteinet i komplexet. I princip kan protokollet användas för alla sekvensspecifika begränsningardonuclease, monomeric eller dimeric, av någon vikgrupp, katalyserande dubbla strängbrytningar av någon förskjutning, oavsett om katalytiska och specificitetsdomäner sammanfaller (som i NlaIV-exemplet) eller är separata (t.ex. FokI). Dessutom är protokollet i princip användbart inte bara för generering av nya, mer smala enzym specificitet, men kan också användas för att eliminera stjärnaktiviteter, eller för att skapa high fidelity endonucleases. Allt detta har dock inte testats ännu. I synnerhet kan riktad eliminering av stjärnaktivitet vara komplicerat, eftersom samma aminosyrarester kan vara inblandade i att binda till de önskade och oönskade baserna. De in vitro-steg som beskrivs i detta protokoll är inte begränsade till valet av begränsade specificiteter, men kan också användas för att välja annars ändrade särdrag. Det finns dock då ett problem med variant endonucleases: om spektrumet av substrat innehåller nya mål som inte klyvs av föräldrarnas endonuclease, det finns i allmänhet inget bra sätt att skydda celler från de skadliga effekterna av denna verksamhet. Om endonucleases specificitet endast begränsas är målen däremot en delmängd av målen av vildtyp, och därför bör den redan tillgängliga konjaksmetyltransferas vara helt skyddande.
Vårt protokoll skiljer sig i flera avseenden från många riktade evolutionsprotokoll. Öppen läsram mångfald genereras en gång i början av experimentet, inte i varje iteration. Dessutom är det skapat genom split-and-mix syntes, snarare än av EP-PCR. För NNS substitutioner av kodon, som används i detta arbete, det finns (4 x 4 x 2)6 ~ 1,07 x 109 kombinationer för sex positioner. Därför finns en viss variant i genomsnitt en gång i 1,7 fmoler av ESC. Denna kapacitet kan ökas till sju positioner med hjälp av syntes med en blandning av 20 trinukleotid prekursorer som erbjuds av Glen Research eller genom att minska mutation frekvens i mindre lovande positioner med split-and-mix oligonukleotid syntes. Om möjligt rekommenderas att man begränsar variationens omfattning till sex positioner. Uppenbarligen kräver sådan mutagenesis inriktning viss befintlig kunskap om åtminstone de regioner i REase som deltar i substrat bindande. Split-and-mix-protokollet för att skapa mångfald har tydliga fördelar jämfört med EP-PCR. Med EP-PCR erhöll vi oförändrade varianter och sekvenser med åtta substitutioner för NlaIV ESC i samma EP-PCR (tabell 4). Biblioteket från EP-PCR innehåller en betydande del av kloner som bör undvikas (vilda sekvenser, flera substitutioner, frameshift och nonsens mutationer och mutationer på platser som sannolikt inte påverkar sekvens specificitet).
Vårt protokoll skiljer sig också från många andra riktade evolution protokoll genom förekomsten av två sekventiella urval steg. Positiv markering säkerställer att önskad aktivitet behålls, annars tas inte biotintaggen bort och kodningssekvensen kan tas bort genom dragningskraft. Det är tekniskt möjligt att den slumpartade uppkomsten av en ny, icke-överlappande specificitet (t.ex. GCATGC) kan leda till avskiljande av biotintaggen också, om en lämplig klyvningsplats finns nära den önskade klyvningen, men inte någon annanstans. Detta bör dock vara högst osannolikt. Negativ markering tar bort öppna läsramar som kodar för enzymer som fortfarande har oönskad aktivitet. Det här steget är inte strikt obligatoriskt, eftersom protokollet fortfarande kommer att berika utdatabiblioteket med varianter som kan klyva urvalssekvensen men inte kan klyva någon annanstans i ESC, vilket gör det olämpligt för PCR-förstärkning. Urvalseffektiviteten förväntas dock vara lägre eftersom enzymer med den ursprungliga sekvenss specificiteten inte kommer att tas bort från produktionen och kommer att konkurrera ut lovande varianter med förändrad specificitet men också minskad enzymatiska aktivitet. Observera att på befolkningsnivå kan både önskade och oönskade målsekvenser, men behöver inte vara, urarta. I NlaIV-exemplet urartade antimålet och målet icke-degenererat. Även när det finns degenererad på befolkningsnivå, i en enda droppe endast ett (icke-degenererat) mål eller anti-mål är närvarande. I vårt protokoll återinförs mål- och målsekvenser vid varje upprepning av urvalsstegen. Därför måste en öppen läsram koda ett enzym som kan klyva alla möjliga mål, och inte kan klyva någon av anti-mål, för att överleva flera urval rundor. Observera att behovet av att återinföra antiselection-målet vid varje iteration av protokollet upprätthåller två sekventiella PCRs. Den första PCR använder en primer som glödar utanför anti-målet, så att klyvning av anti-målet förhindrar PCR-reaktionen. Den andra PCR kräver en primer som når bortom anti-målet, och återinför anti-mål, för att se till att under flera omgångar av urval, varje öppen läsram testas mot alla varianter av anti-målet.
För enzymer som genererar klibbiga ändar kan ett relaterat alternativt protokoll baserat på en tidigare beskriven metod för isolering av REase ORF10 användas. Utarmningen av inaktiva varianter genom biotinfångst som används i våra experiment ersätts i det alternativa protokollet genom ligering av den kompatibla adaptern med en sekvens som används som en primerbindningsplats i en selektiv PCR (figur 9). Endast ESC som producerar enzymer med den valda specificiteten genererar ligeringskompatibla ändar och kommer därför att väljas ut. Sekvensen av den klibbiga änden av den valda räknarsekvensen måste utformas på ett sådant sätt att den inte kan delta i ligering med adaptrar. Iteration av urvalsprocessen kan enkelt uppnås genom att växla mellan två olika adaptrar och därmed två olika omvända primers i selektiv PCR.
Även med nya protokoll, uppgiften att ingenjörskonst nya särdrag in vitro är fortfarande mycket utmanande. För typiska typ II REases beror sekvenss specificitet och endonucleolytisk aktivitet på samma proteinregioner. Det är därför svårt att ändra det ena utan att påverka den andra. Framgång görs mer sannolikt genom en strategi som tar hänsyn till fotavtryck av enzymet, respekterar symmetrin i protein-DNA interaktioner, och bygger på befintliga enzymatiska preferenser, som bör fastställas i förväg i biokemiska experiment, som gjordes för NlaIV exempel8.
The authors have nothing to disclose.
Detta arbete stöddes av anslag från ministeriet för vetenskap och högre utbildning (0295/B/PO1/2008/34 till MB och N301 100 31/3043 till KS), från Polska National Science Centre (NCN) (UMO-2011/02/A/NZ1/00052, UMO-2014/13/B/NZ1/03991 och UMO-2014/14/M/NZ5/00558 till MB) och genom kortvarig EMBO-stipendium till KS (ATSF 277.00-05).
1000Å CPG Support (dA, dT, dC, dG) | Biosset | 45-1000-050 | Other vendors can be used as well |
ASM-800 DNA/RNA | Biosset | 800-001-000 | |
GeneJET Gel Extraction Kit | Thermo Scientific | K0691 | Any other kit can be used |
Glen-Pak DNA purification cartridge | Glen Research | 60-5200 | |
HIS-Select Nickel Affinity Gel | Sigma | P6611 | |
pET 28a vector | Any other vector with T7 promoter upstream of plycloning site can be used instead | ||
Phusion High-Fidelity DNA Polymerase | Thermo Scientific | F530S | Any other high fidelity and highly processive thermophilic polymearse can be used instead |
Porous steel foil | Biosset | 40-063 | |
Rapid Translation System RTS 100, E.coli HY Kit |
Roche | 3 186 148 | |
Restriction endonucleases | Thermo Scientific | Obviously other vendors, enzymes can be used | |
Streptavidin Magnetic Beads | New England Biolabs | S1420S | Other vendors can be used as well. We have positively tested beds form Sigma |
Synthesis chemicals including phosphoramidities | Carl Roth | Other vendors can be used as well | |
Synthesis columns (different sizes) | Biosset | ||
T4 DNA ligase | Thermo Scientific | EL0011 | Any other ligase can be used |