March 1st, 2022
Het doel van dit protocol is om de structurele dynamiek van eendimensionale diffusie van eiwit langs DNA te onthullen, met behulp van een plantaardig transcriptiefactor WRKY-domeineiwit als een voorbeeldig systeem. Om dit te doen, zijn zowel atomistische als grofkorrelige moleculaire dynamicasimulaties samen met uitgebreide computationele bemonsteringen geïmplementeerd.
Het doel van dit protocol is om de structurele dynamiek van eendimensionale diffusie van eiwit langs DNA te onthullen, met behulp van een plantaardig transcriptiefactor WRKY-domeineiwit als een voorbeeldig systeem. De atoomsimulaties onder de Markov-toestandsmodelconstructie onthullen 1-bp stapbewegingen van eiwit langs DNA bij atomaire details. Terwijl de grofkorrelige simulaties zich richten op het bemonsteren van eiwitprocesve diffusies over 10 bps langs DNA.
Gebruik om te beginnen een MD-traject van 10 microseconden voor alle atomen om 10.000 frames gelijkmatig naar voren te extraheren, waarbij één basispaar een pad stapt. Bereid het overgangspad voor met 10.000 frames in VMD door op Bestand en Coördinaten opslaan te klikken. Typ vervolgens eiwit of nucleïne in het vak Geselecteerde atomen.
Kies Frames in het vak Frames en klik op Opslaan om de benodigde frames op te halen. Lijn de lange as van de referentie van de kristalstructuur van DNA uit op de x-as en stel het initiële massamiddelpunt van de volledige 34 basenparen DNA in aan de oorsprong van de coördinatenruimte door op Extensies te klikken en vervolgens TkConsole in VMD te selecteren. Typ daarna de opdracht in het opdrachtvenster van TkConsole.
Bereken vervolgens de vierkantsafstand van de eiwitbackbone door op VMD te klikken, ga vervolgens naar Extensies, klik op Analyse en selecteer het RMSD-trajectgereedschap. Typ in het atoomselectievak nucleïne en residu 14 tot 23 en 46 tot 55. Klik op UITLIJNEN en vervolgens op RMSD vak.
Om de rotatiegraad van eiwit rond DNA theta T te berekenen, met de initiële hoekpositie gedefinieerd als theta 0, voert u op het XY-vlak in MATLAB het commando uit. Voer de instructies in MATLAB in om K-means-methoden te gebruiken en classificeer de 10.000 structuren in 25 clusters. Als u klaar bent, verzamelt u de structuren van de 25 clustercentra voor verdere MD-simulatie.
Om de eerste ronde MD-simulatie uit te voeren, bouwt u een atomistisch systeem voor de 25 structuren met behulp van GROMACS en het build system sh-bestand. Voer MD-simulaties van 60 nanoseconden uit voor de 25 systemen onder NPT-ensemble met een tijdstap van twee femtoseconden door het commando in de schaal te verwerken. Om de md-trajecten van de eerste ronde te clusteren, verwijdert u de eerste 10 nanoseconden van elk simulatietraject en verzamelt u bevestigingen van de trajecten van 25 keer 50 nanoseconden.
Voer voor de tijdonafhankelijke componentanalyse het script in GROMACS in, gevolgd door het kiezen van afstandsparen tussen eiwit en DNA als projectie van invoerparameters. Uit de index. ndx-bestand, naar een nieuwe tekstbestandindex.dat.
Als u de paarinformatie tussen deze atomen wilt ophalen, gebruikt u het Python-script. Bereken de 415 afstandsparen van elk traject in het MSMBuilder-opdrachtvenster. Voer vervolgens een tijdonafhankelijke componentanalyse uit om de dimensie van gegevens te verminderen tot de eerste twee keer onafhankelijke componenten of vectoren door de opdracht uit te voeren.
Met de verwerking van de instructie in MSMBuilder clustert u de geprojecteerde datasets in 100 clusters met behulp van de case center-methode en selecteert u de centrumstructuur van elk cluster. Om md-simulaties in de tweede ronde uit te voeren, voert u MD-simulaties van 60 nanoseconden uit vanaf de 100 initiële structuren. Nadat u willekeurige beginsnelheden op alle atomen hebt opgelegd, voegt u de willekeurige beginsnelheden toe door de velocity-generatie in het MDP-bestand in te schakelen.
Verwijder de eerste 10 nanoseconden van elke simulatie zoals eerder beschreven. En verzamel 2, 500, 000 snapshots van de 100 keer 50 nanoseconde trajecten, gelijkmatig, om de MSM te construeren. Om md-trajecten van de tweede ronde te clusteren, voert u de tijdonafhankelijke componentanalyse uit voor de tweede rondetrajecten in de MSMBuilder zoals weergegeven.
En bereken de impliciete tijdschaal om parameters te valideren door het Python-script uit te voeren. Varieer vervolgens de vertragingstijd tau en het aantal microtoestanden door de parameters te wijzigen. Classificeer de bevestigingen in 500 clusters door de opdracht uit te voeren.
Voor MSM-constructie, gooi de 500 micro-toestanden in drie tot zes macrotoestanden. Om erachter te komen hoeveel macrotoestanden het beste passen, volgens het PCCAplus-algoritme in MSMBuilder met behulp van het Python-script. Breng de hoogdimensionale bevestigingen aan de X en rotatiehoek van het eiwit langs het DNA voor elke microtoestand in kaart.
Om de gemiddelde eerste passagetijden te berekenen, voert u vijf Monte Carlo-trajecten van 10 milliseconden uit, gebaseerd op de overgangskansmatrix van de 500 microtoestand MSM met de vertragingstijd van 10 nanoseconden ingesteld als de tijdstap van Monte Carlo. Bereken de gemiddelde eerste passagetijden tussen elk paar macrotoestanden in het Python-script en het gemiddelde van de standaardfout van de gemiddelde eerste passagetijden met behulp van het Bash-bestand. Voer in de CafeMol 3.0-software de cursussimulatie uit door de opdracht op de terminal uit te voeren.
Nadat u de blokken in het invoerbestand hebt opgegeven, stelt u het bestandsnamenblok en het job_cntl blok in met de afzonderlijke opdrachten. Stel vervolgens het unit_and_state blok in, gevolgd door het energy_function blok en het md_information blok. Alle eiwitbevestigingen op het DNA werden toegewezen aan de longitudinale beweging X en rotatiehoek van het eiwit langs DNA, die verder kan worden geclusterd in drie macrotoestanden.
De S1-toestand is minder gunstig omdat de waterstofbruggen vergelijkbaar zijn met de gemodelleerde structuur, terwijl S3 verwijst naar een metastabiele toestand waarbij alle waterstofbruggen na één basenpaarstap verschoven en stabiel leken met de hoogste populatie van 63%De tussentoestand S2 verbindt S1 en S3 met een middelhoge populatie van 30% De overgang van S2 naar S3 maakt het collectief breken en hervormen van de waterstofbruggen in ongeveer zeven mogelijk microseconden, terwijl de overgang van S1 naar S2 kan plaatsvinden in ongeveer 0,06 microseconden. De contactnummers tussen eiwit en DNA werden berekend en vier toestanden werden geïdentificeerd. In toestanden 1 en 3 bindt het zinkvingergebied in de richting van de Y.
Terwijl in de toestanden 2 en 3 het zinkvingergebied zich bindt in de richting van de Y. De stapgrootte voor elk geconserveerd residu op verschillende DNA-sequenties werd gemeten, waaruit bleek dat de stapgroottes van deze residuen meer gesynchroniseerd zijn op polyA DNA dan op polyAT of willekeurige DNA-sequenties. De belangrijke stappen in de constructie van het Markov-toestandsmodel zijn het kiezen van afstandsparen tussen eiwit- en DNA-gegevensreparaties in de 1-bp stapbewegingen en de selectie van een geschikt aantal microtoestanden en macrotoestanden.
View the full transcript and gain access to thousands of scientific videos
Dit onderzoek heeft tot doel de structurele dynamica van eiwitdiffusie langs DNA te verduidelijken, waarbij het WRKY-domeineiwit van de plant als voorbeeld wordt gebruikt. Er zijn zowel atomistische als grove moleculaire dynamica-simulaties uitgevoerd om het eendimensionale diffusieproces en de onderliggende mechanismen te begrijpen.