Journal
/
/
Strukturbaserad simulering och provtagning av transkriptionsfaktorproteinrörelser längs DNA från atomskala som går till grovkornig diffusion
JoVE Journal
Biology
A subscription to JoVE is required to view this content.  Sign in or start your free trial.
JoVE Journal Biology
Structure-Based Simulation and Sampling of Transcription Factor Protein Movements along DNA from Atomic-Scale Stepping to Coarse-Grained Diffusion

Strukturbaserad simulering och provtagning av transkriptionsfaktorproteinrörelser längs DNA från atomskala som går till grovkornig diffusion

2,942 Views

09:17 min

March 01, 2022

DOI:

09:17 min
March 01, 2022

7 Views
, , , ,

Transcript

Automatically generated

Målet med detta protokoll är att avslöja strukturell dynamik av endimensionell diffusion av protein längs DNA, med hjälp av en växttranskriptionsfaktor WRKY-domänprotein som ett exemplifierande system. Atomsimuleringarna under Markovs tillståndsmodellkonstruktion avslöjar 1-bp stegrörelser av protein längs DNA vid atomdetaljer. Medan de grovkorniga simuleringarna fokuserar på provtagning av proteinprocessiva diffusioner över 10 bps längs DNA.

Börja med att använda en 10 mikrosekond MD-bana för alla atomer för att extrahera 10 000 ramar jämnt framåt, en basparstegsväg. Förbered övergångsvägen med 10 000 bildrutor i VMD genom att klicka på Arkiv och Spara koordinater. Skriv sedan protein eller nuklein i rutan Valda atomer.

Välj Ramar i rutan Ramar och klicka på Spara för att få de ramar som behövs. Rikta in referensens långa axel från DNA:s kristallstruktur till x-axeln och ställ in det initiala masscentrumet för hela 34 basparets DNA vid koordinatutrymmets ursprung genom att klicka på Extensions och sedan välja TkConsole i VMD. Skriv sedan kommandot i kommandofönstret TkConsole.

Beräkna sedan roten betyder kvadratavstånd för proteinryggraden genom att klicka på VMD, gå sedan till Tillägg, klicka på Analys och välj RMSD Trajectory Tool. I atomvalsrutan skriver du nukleinsyra och rest 14 till 23 och 46 till 55. Klicka på JUSTERA och sedan på RMSD-rutan.

För att beräkna rotationsgraden av protein runt DNA theta T, med den initiala vinkelpositioneringen definierad som theta 0, på XY-planet i MATLAB, utför kommandot. Ange instruktionerna i MATLAB för att använda K-medelsmetoder och klassificera de 10 000 strukturerna i 25 kluster. När du är klar samlar du strukturerna i de 25 klustercentren för ytterligare MD-simulering.

För att genomföra den första omgången MD-simulering, bygg ett atomistiskt system för de 25 strukturerna med hjälp av GROMACS och byggsystemet sh-fil. Genomför 60 nanoseconds MD-simuleringar för de 25 systemen under NPT-ensemble med ett tidssteg på två femtosekund genom att bearbeta kommandot i skal. För att klustra de första MD-banorna, ta bort de första 10 nanoseconderna av varje simuleringsbana och samla in bekräftelser från 25 gånger 50 nanosecond-banorna.

För den tidsoberoende komponentanalysen anger du skriptet i GROMACS, följt av att välja avståndspar mellan protein och DNA som indataparametrar projektion. Från indexet. ndx-fil, till ett nytt textfilindex.dat.

Om du vill hämta parinformationen mellan dessa atomer använder du Python-skriptet. Beräkna de 415 avståndsparen från varje bana i MSMBuilder-kommandofönstret. Utför sedan en tidsoberoende komponentanalys för att minska dimensionen av data på de två första gången oberoende komponenterna eller vektorerna genom att utföra kommandot.

Med bearbetningen av instruktionen i MSMBuilder grupperar du de projicerade datauppsättningarna i 100 kluster med hjälp av case center-metoden och väljer mittstrukturen för varje kluster. För att genomföra andra omgången MD-simulering, genomföra 60 nanosecond MD-simuleringar med början från de 100 initiala strukturerna. Efter att ha infört slumpmässiga initiala hastigheter på alla atomer, lägg till de slumpmässiga initiala hastigheterna genom att slå på Velocity-generationen i MDP-filen.

Ta bort de första 10 nanosekundarna i varje simulering enligt beskrivningen tidigare. Och samla in 2 500 000 ögonblicksbilder från de 100 gånger 50 nanosekundbanorna, jämnt, för att konstruera MSM. Om du vill klustra ANDRA OMGÅNGENS MD-banor utför du den tidsoberoende komponentanalysen för den andra omgångens banor i MSMBuilder enligt bilden.

Och beräkna den implicita tidsskalan för att validera parametrar genom att köra Python-skriptet. Variera sedan fördröjningstiden tau och mikrotillståndsnumret genom att ändra parametrarna. Klassificera bekräftelserna i 500 kluster genom att köra kommandot.

För MSM-konstruktion, klumpa ihop de 500 mikrotillstånden i tre till sex makrotillstånd. För att ta reda på antalet makrotillstånd som passar bäst, enligt PCCAplus-algoritmen i MSMBuilder med hjälp av Python-skriptet. Kartlägg de högdimensionella bekräftelserna till X och rotationsvinkeln för proteinet längs DNA för varje mikrotillstånd.

För att beräkna de genomsnittliga första passagetiderna, utför fem Monte Carlo-banor på 10 millisekunder, baserat på övergångssannolikhetsmatrisen för 500 mikrotillstånds-MSM med fördröjningstiden på 10 nanosekunder inställd som monte carlo-tidssteget. Beräkna genomsnittliga första passagetider mellan varje par makrotillstånd i Python-skriptet och genomsnittet av standardfel för de genomsnittliga första passagetiderna med Bash-filen. I CafeMol 3.0-programvaran kör du den kurskorniga simuleringen genom att utföra kommandot på terminalen.

När du har angett blocken i indatafilen ställer du in filnamnsblocket och job_cntl blocket med de enskilda kommandona. Ställ sedan in unit_and_state-blocket, följt av att ställa in energy_function-blocket och md_information-blocket. Alla proteinbekräftelser på DNA kartlades till proteinets longitudinella rörelse X och rotationsvinkel längs DNA, som ytterligare kan grupperas i tre makrotillstånd.

S1-tillståndet är mindre gynnsamt eftersom vätebindningarna liknar den modellerade strukturen, medan S3 hänvisar till ett metastabilt tillstånd där alla vätebindningar skiftade efter ett basparsteg och verkade stabila med den högsta populationen på 63%Mellantillståndet S2 förbinder S1 och S3 med en medelhög befolkning på 30%Övergången av S2 till S3 möjliggör kollektiv brytning och reformering av vätebindningarna i cirka sju mikroseconds, medan S1 till S2-övergången kan ske på cirka 0,06 mikrosekoner. Kontaktnumren mellan protein och DNA beräknades och fyra tillstånd identifierades. I tillstånd 1 och 3 binder zinkfingerregionen mot Y-riktningen.

Medan i tillstånd 2 och 3 binder zinkfingerregionen mot Y-riktningen. Stegstorleken för varje konserverad rest på olika DNA-sekvenser mättes, vilket avslöjade att stegstorlekarna för dessa rester är mer synkroniserade på polyA-DNA än på polyAT eller slumpmässiga DNA-sekvenser. De viktiga stegen i Markovs tillståndsmodellkonstruktion är att välja avståndspar mellan protein- och DNA-datareparationer i 1-bp-stegrörelserna och valet av ett lämpligt antal mikrotillstånd och makrotillstånd.

Summary

Automatically generated

Målet med detta protokoll är att avslöja strukturell dynamik av endimensionell diffusion av protein längs DNA, med hjälp av en växttranskriptionsfaktor WRKY-domänprotein som ett exemplifierande system. För att göra detta har både atomistiska och grovkorniga molekylära dynamiksimuleringar tillsammans med omfattande beräkningsprovtagningar implementerats.

Read Article