March 1st, 2022
Celem tego protokołu jest ujawnienie strukturalnej dynamiki jednowymiarowej dyfuzji białka wzdłuż DNA, przy użyciu białka domeny roślinnego czynnika transkrypcyjnego WRKY jako przykładowego systemu. W tym celu wdrożono zarówno atomistyczne, jak i gruboziarniste symulacje dynamiki molekularnej, a także obszerne próbkowanie obliczeniowe.
Celem tego protokołu jest ujawnienie strukturalnej dynamiki jednowymiarowej dyfuzji białka wzdłuż DNA, przy użyciu białka domeny roślinnego czynnika transkrypcyjnego WRKY jako przykładowego systemu. Symulacje atomowe w konstrukcji modelu stanu Markowa ujawniają ruchy krokowe białka o długości 1 pz wzdłuż DNA w szczegółach atomowych. Podczas gdy symulacje gruboziarniste koncentrują się na próbkowaniu procesowych dyfuzji białek powyżej 10 punktów bazowych wzdłuż DNA.
Aby rozpocząć, użyj 10-mikrosekundowej trajektorii MD składającej się ze wszystkich atomów, aby równomiernie wyodrębnić 10 000 ramek do przodu, jedną ścieżkę krokową pary zasad. Przygotuj ścieżkę przejścia z 10 000 klatek w VMD, klikając Plik i Zapisz współrzędne. Następnie wpisz białko lub nukleinowy w polu Wybrane atomy.
Wybierz opcję Klatki w polu ramek i kliknij przycisk Zapisz, aby pobrać potrzebne ramki. Wyrównaj długą oś odniesienia od struktury krystalicznej DNA do osi x i ustaw początkowy środek masy pełnego DNA 34 par zasad w początku przestrzeni współrzędnych, klikając Rozszerzenia, a następnie wybierając TkConsole w VMD. Następnie wpisz polecenie w oknie poleceń TkConsole.
Następnie oblicz średnią kwadratową odległości rdzenia szkieletu białka, klikając VMD, a następnie przejdź do Rozszerzenia, kliknij Analiza i wybierz narzędzie trajektorii RMSD. W polu wyboru atomów wpisz nukleiny i reszty od 14 do 23 i od 46 do 55. Kliknij WYRÓWNAJ, a następnie pole RMSD.
Aby obliczyć stopień rotacji białka wokół DNA theta T, z początkowym położeniem kątowym zdefiniowanym jako theta 0, na płaszczyźnie XY w MATLAB, wykonaj polecenie. Wprowadź instrukcje w programie MATLAB, aby użyć metod K-średnich i sklasyfikuj 10 000 struktur w 25 klastrach. Po zakończeniu zbierz struktury 25 centrów klastrowych w celu dalszej symulacji MD.
Aby przeprowadzić pierwszą rundę symulacji MD, zbuduj system atomistyczny dla 25 struktur przy użyciu GROMACS i pliku sh systemu budowania. Przeprowadź 60-nanosekundowe symulacje MD dla 25 systemów w ramach zespołu NPT z krokiem czasowym wynoszącym dwie femtosekundy, przetwarzając polecenie w powłoce. Aby zgrupować trajektorie MD w pierwszej rundzie, usuń pierwsze 10 nanosekund każdej trajektorii symulacji i zbierz potwierdzenia z trajektorii 25 razy 50 nanosekund.
W przypadku analizy składowych niezależnej od czasu wprowadź skrypt w GROMACS, a następnie wybierz pary odległości między białkiem a DNA jako projekcję parametrów wejściowych. Z indeksu. ndx, do nowego pliku tekstowego index.dat.
Aby uzyskać informacje o parze między tymi atomami, użyj skryptu języka Python. Oblicz 415 par odległości dla każdej trajektorii w oknie poleceń MSMBuilder. Następnie przeprowadź analizę składowych niezależną od czasu, aby zmniejszyć wymiar danych na pierwsze dwa niezależne od czasu komponenty lub wektory, wykonując polecenie.
Po przetworzeniu instrukcji w programie MSMBuilder pogrupuj rzutowane zestawy danych w 100 klastrów przy użyciu metody centrum obserwacji i wybierz strukturę środkową każdego klastra. Aby przeprowadzić drugą rundę symulacji MD, przeprowadź 60 nanosekundowych symulacji MD, zaczynając od 100 początkowych struktur. Po nałożeniu losowych prędkości początkowych na wszystkie atomy, dodaj losowe prędkości początkowe, włączając generowanie prędkości w pliku MDP.
Usuń pierwsze 10 nanosekund każdej symulacji, jak opisano wcześniej. I zbierz 2 500 000 migawek z trajektorii 100 razy 50 nanosekund, równomiernie, aby skonstruować MSM. Aby zgrupować trajektorie MD drugiej rundy, przeprowadź niezależną od czasu analizę komponentów dla trajektorii drugiej rundy w MSMBuilder, jak pokazano.
I oblicz implikowaną skalę czasu, aby zweryfikować parametry, wykonując skrypt Pythona. Następnie zmieniaj czas opóźnienia, tau i liczbę mikrostanów, zmieniając parametry. Sklasyfikuj potwierdzenia w 500 klastrach, wykonując polecenie.
W przypadku budowy MSM wrzuć 500 mikrostanów do jednego worka w trzy do sześciu makrostanów. Aby dowiedzieć się, ile makrostanów najlepiej pasuje, zgodnie z algorytmem PCCAplus w MSMBuilder za pomocą skryptu Python. Mapuj wysokowymiarowe potwierdzenia na X i kąt obrotu białka wzdłuż DNA dla każdego mikrostanu.
Aby obliczyć średni czas pierwszego przejścia, należy przeprowadzić pięć 10-milisekundowych trajektorii Monte Carlo, w oparciu o macierz prawdopodobieństwa przejścia 500 mikrostanów MSM z czasem opóźnienia wynoszącym 10 nanosekund ustawionym jako krok czasowy Monte Carlo. Oblicz średnie czasy pierwszego przejścia między każdą parą makrostanów w skrypcie Pythona i średnią błędu standardowego średnich czasów pierwszego przejścia za pomocą pliku Bash. W oprogramowaniu CafeMol 3.0 uruchom symulację o dużej ziarnistości, wykonując polecenie na terminalu.
Po określeniu bloków w pliku wejściowym ustaw blok nazw plików i blok job_cntl za pomocą poszczególnych poleceń. Następnie ustaw blok unit_and_state, a następnie ustaw blok energy_function i blok md_information. Wszystkie potwierdzenia białek w DNA zostały zmapowane do ruchu podłużnego X i kąta obrotu białka wzdłuż DNA, które można dalej grupować w trzy makrostany.
Stan S1 jest mniej korzystny, ponieważ wiązania wodorowe są podobne do modelowanej struktury, podczas gdy S3 odnosi się do stanu metastabilnego, w którym wszystkie wiązania wodorowe przesunęły się po kroku jednej pary zasad i wydawały się stabilne z najwyższą populacją 63%Stan pośredni S2 łączy S1 i S3 ze średnio wysoką populacją 30%Przejście S2 do S3 umożliwia zbiorowe zerwanie i reformację wiązań wodorowych w około siedmiu mikrosekund, podczas gdy przejście S1 do S2 może nastąpić w ciągu około 0,06 mikrosekundy. Obliczono liczby kontaktowe między białkiem a DNA i zidentyfikowano cztery stany. W stanach 1 i 3 obszar palca cynkowego wiąże się w kierunku Y.
Natomiast w stanach 2 i 3 obszar palca cynkowego wiąże się w kierunku Y. Zmierzono rozmiar krokowy dla każdej konserwatywnej reszty w różnych sekwencjach DNA, co ujawniło, że rozmiary krokowe tych reszt są bardziej zsynchronizowane na poliA DNA niż na poliAT lub losowych sekwencjach DNA. Ważnymi etapami w budowie modelu stanu Markowa są wybór par odległości między naprawami danych białkowych i DNA w ruchach krokowych 1-pz oraz wybór odpowiedniej liczby mikrostanów i makrostanów.
View the full transcript and gain access to thousands of scientific videos
Celem niniejszego badania jest wyjaśnienie dynamiki strukturalnej dyfuzji białek wzdłuż DNA, wykorzystując białko domeny WRKY czynnika transkrypcyjnego roślin jako przykład. Przeprowadzono zarówno atomistyczne, jak i szorstkie symulacje dynamiki molekularnej, aby zrozumieć proces dyfuzji jednowymiarowej i jego podstawowe mechanizmy.