Biology

구조 기반 시뮬레이션 및 원자 스케일 스테핑에서 거친 입자 확산에 이르기까지 DNA를 따른 전사 인자 단백질 움직임의 샘플링

Published: March 1, 2022 doi: 10.3791/63406

Chao E*¹, Liqiang Dai*^1,2, Jiaqi Tian^3,4, Lin-Tai Da⁴, Jin Yu^5,6,7

¹Beijing Computational Science Research Center, ²Shenzhen JL Computational Science and Applied Research Institute, ³School of Medical Informatics and Engineering, Xuzhou Medical University, ⁴Key Laboratory of Systems Biomedicine (Ministry of Education), Shanghai Center for Systems Biomedicine, Shanghai Jiao Tong University, ⁵Department of Physics and Astronomy, University of California, Irvine, ⁶Department of Chemistry, University of California, Irvine, ⁷NSF-Simons Center for Multiscale Cell Fate Research, University of California, Irvine

* These authors contributed equally

Summary

이 프로토콜의 목표는 식물 전사 인자 WRKY 도메인 단백질을 모범적 인 시스템으로 사용하여 DNA를 따라 단백질의 일차원 확산의 구조적 역학을 밝히는 것입니다. 이를 위해 원자 론적 및 거친 입자 역학 시뮬레이션과 광범위한 계산 샘플링이 구현되었습니다.

Abstract

DNA를 따라 전사 인자 (TF) 단백질의 1차원 (1-D) 슬라이딩은 유전자 조절을 위한 표적 DNA 부위를 찾기 위한 TF의 확산을 용이하게 하는데 필수적이다. DNA를 슬라이딩하거나 밟는 TF의 염기쌍(bp) 분해능을 검출하는 것은 여전히 실험적으로 어려운 과제이다. 우리는 최근에 DNA를 따라 작은 WRKY 도메인 TF 단백질의 자발적인 1-bp 스테핑을 포착하는 모든 원자 분자 역학 (MD) 시뮬레이션을 수행했습니다. 이러한 시뮬레이션으로부터 수득된 10μs WRKY 스테핑 경로에 기초하여, 여기의 프로토콜은 MSM 구축을 위해 시험된 다양한 수의 마이크로- 및 매크로-상태와 함께 1-bp 단백질 스테핑을 위한 마르코프 상태 모델(MSM)을 구성함으로써, TF-DNA 시스템의 보다 광범위한 입체 형태 샘플링을 수행하는 방법을 보여준다. DNA와 함께 TF 단백질의 처리적인 1-D 확산 탐색을 구조적 기초와 함께 검사하기 위해, 프로토콜은 시스템의 장시간 스케일 다이내믹을 샘플링하기 위해 거친 그레인 (CG) MD 시뮬레이션을 수행하는 방법을 추가로 보여줍니다. 이러한 CG 모델링 및 시뮬레이션은 모든 원자 시뮬레이션으로부터 밝혀진 서브마이크로초 내지 마이크로초 단백질 스테핑 모션과 비교하여 수십 마이크로초 이상의 TF 단백질의 처리적 확산 운동에 대한 단백질-DNA 정전기적 영향을 밝히는데 특히 유용하다.

Introduction

전사 인자 (TF)는 유전자 전사 및 관련 활성에 결합하고 조절하기 위해 표적 DNA를 검색한다¹. 3차원 (3D) 확산 이외에도, TF의 촉진된 확산은 표적 DNA 탐색에 필수적인 것으로 제안되었으며, 여기서 단백질은 또한 1차원 (1D) DNA를 따라 미끄러 지거나 홉 또는 DNA 2,3,4,5,6,7 상의 분절 간 전달로 점프할 수 있다.

최근 연구에서, 우리는 DNA⁸ 상의 WRKY 도메인 단백질인 식물 TF에 대해 수십 마이크로초(μs) 모든 원자 평형 분자 역학(MD) 시뮬레이션을 수행하였다. 마이크로초 내에 폴리-A DNA에 대한 WRKY의 완전한 1-bp 스테핑이 포착되었다. DNA 홈과 수소 결합 (HBs)을 따라 단백질의 움직임이 파괴 - 개질 역학이 관찰되었습니다. 이러한 궤적은 하나의 샘플링 된 경로를 나타내는 반면, 전체 단백질 스테핑 환경은 여전히 부족합니다. 여기에서, 우리는 실질적인 형태 변화 및 시간 척도 분리를 포함하는 다양한 생체 분자 시스템을 시뮬레이션하기 위해 널리 구현 된 건설 된 Markov 상태 모델 (MSM)을 사용하여 초기 포획 된 단백질 스테핑 경로 주위에서 계산 샘플링을 확장하는 방법을 보여줍니다 9,10,11,12,13,14,15,16^, ^17,18,19. 목적은 하나의 순환 단계를 위해 DNA를 따라 확산된 TF 단백질의 형태적 앙상블 및 메타-안정 상태를 밝히는 것이다.

위의 MD 시뮬레이션은 DNA 상에서 1bp에 대한 단백질 이동의 원자 분해능을 나타내지만, 동일한 고해상도에서 DNA를 따라 TF의 오랜 시간 공정 확산의 구조적 역학은 거의 접근 할 수 없다. 그러나 잔류 물 수준에서 거친 그레인 (CG) MD 시뮬레이션을 수행하는 것은 기술적으로 접근 할 수 있습니다. CG 시뮬레이션 시간 척도는 원자 시뮬레이션 20,21,22,23,24,25,26,27,28,29보다 수십 배 또는 수백 배 더 길게 효과적으로 확장될 수 있다. 여기서는 타카다 랩³⁰에서 개발한 CafeMol 소프트웨어를 구현하여 수행한 CG 시뮬레이션을 보여줍니다.

현재 프로토콜에서는 폴리-A DNA와 MSM 구축을 따라 WRKY 도메인 단백질의 원자 시뮬레이션을 먼저 제시하며, 이는 DNA를 따라 단지 1 bp에 대한 단백질 스테핑 모션을 샘플링하는 데 중점을 둡니다. 그런 다음 동일한 단백질-DNA 시스템의 CG 모델링 및 시뮬레이션을 제시하여 전산 샘플링을 DNA를 따라 수십 bps에 걸쳐 단백질 처리 확산으로 확장합니다.

여기서, 우리는 GROMACS 31,32,33 소프트웨어를 사용하여 MD 시뮬레이션을 수행하고 MSMbuilder 34를 사용하여 샘플링 된 형태 스냅 샷을위한 MSM을 구성하고 VMD ^35를 사용하여 생체 분자를 시각화합니다. 이 프로토콜은 사용자가 위의 소프트웨어를 설치하고 구현할 수 있어야합니다. CafeMol³⁰ 소프트웨어의 설치 및 구현은 CG MD 시뮬레이션을 수행하는 데 필요합니다. 궤적 및 시각화에 대한 추가 분석도 VMD에서 수행됩니다.

Subscription Required. Please recommend JoVE to your librarian.

Protocol

1. 원자 MD 시뮬레이션에서 마르코프 상태 모델 (MSM)의 구축

자발적인 단백질 스테핑 경로 및 초기 구조 수집
1. 이전에 수득된 10-μs 전원자 MD 궤적⁸ 을 사용하여 "순방향" 1-bp 스테핑 경로(즉, 각 나노초마다 하나의 프레임)로부터 10000개의 프레임을 고르게 추출한다. 프레임의 총 수는 모든 대표적인 형태를 포함하기에 충분히 커야 한다.
2. 파일 > 좌표 저장을 클릭하여 VMD에서 10000 프레임으로 전환 경로를 준비하고, 선택한 원자에 단백질 또는 핵산을 입력하고 프레임 상자에서 프레임을 선택하고 저장을 클릭하여 필요한 프레임을 가져옵니다.
  참고: 34-bp 동종 폴리-A DNA⁸ 상에서 WRKY 스테핑을 위한 이전에 획득된 10μs 모든 원자 MD 시뮬레이션 궤적(여기서는 "순방향 스테핑 궤적"이라고 함)을 추가 입체 샘플링을 개시하기 위한 초기 경로로 사용하였다. 그러나 대부분의 사례에서는 조향 또는 표적 MD 시뮬레이션을 수행하거나 일반적인 경로 생성 방법 등을 구현하여 초기 경로를 구성합니다.^36,37,38,39.
3. 기준 DNA의 장축(결정 구조로부터)을 x축에 정렬하고, 추가 데이터 분석의 편의를 위해 좌표 공간의 원점에 전체 34bp DNA의 질량 중심(COM)을 설정한다. 이렇게 하려면 VMD에서 Tk 콘솔 > 확장을 클릭하고 Tk 콘솔 명령 창에 다음을 입력합니다.
  소스 회전.tcl
  tcl 스크립트는 보충 파일 3에서 찾을 수 있습니다.
4. 그런 다음 결정 구조⁴⁰으로부터 중앙 10 bp DNA (A14 내지 23 및 T14' 내지 23')를 정렬함으로써 단백질 백본의 평균 제곱 거리 (RMSD)를 계산하고, RMSD는 시스템의 기하학적 척도를 나타낸다 ( 도 1A 참조). 이렇게 하려면 VMD > 확장 > 분석 > RMSD 궤적 도구를 클릭하고 원자 선택 상자에 핵산 및 잔기 14~23 및 46~55를 입력하고 정렬 을 클릭한 다음 RMSD 상자를 클릭하여 RMSD 값을 계산합니다.
5. 명령을 입력하여 MATLAB의 y-z 평면에서 DNA Θ(t) 주위의 단백질의 회전 정도를 계산합니다.
  rad2deg(아탄(z/y))
  이전에 8에서 수행된 것처럼 Θ(0)=0으로 정의된 초기 각도 위치 지정을^{사용합니다}.
6. MATLAB⁴¹에 다음 명령을 입력하여 K-means 메서드 ^42,43,44를 사용하고 입력하여 10000개의 구조를 25개의 클러스터로 분류합니다.
  [idx, C]=kmeans(X, 25)
  여기서 X 는 RMSD의 2D 행렬이며 DNA에 대한 WRKY의 회전 각도입니다. 추가 MD 시뮬레이션을 위해 이 25개 클러스터 센터의 구조를 수집합니다.
  참고 : DNA에 대해 샘플링 된 단백질 RMSD는 약 25 Å의 범위를 다루기 때문에 옹스트롬 당 하나의 클러스터를 갖기 위해 25 개의 클러스터를 선택합니다.
MD 시뮬레이션 1^차 및 시뮬레이션 설정 수행
1. parmbsc1 force 필드(⁴⁵) 하에 GROMACS 5.1.2 소프트웨어⁽³²)를 사용하고 쉘의 보충 파일 2로부터의 buildsystem.sh 파일을 사용하여 25개의 구조물에 대한 원자론적 시스템을 구축한다.
2. 셸에 다음 명령을 입력하여 2fs의 시간 단계로 NPT 앙상블 아래에서 이러한 25개 시스템에 대해 60ns MD 시뮬레이션을 수행합니다.
  gmx_mpi grompp -f md.mdp -c npt.gro -p topol.top -o md.tpr
  gmx_mpi mdrun -deffnm md
클러스터링 1^세인트 둥근 MD 궤적
1. 셸에 입력하여 각 시뮬레이션 궤적의 처음 10ns를 제거합니다.
  gmx_mpi trjcat -f md.xtc -b 10000 -e 600000 -o newtraj.xtc
  클러스터링을 위한 25 × 50ns 궤적으로부터 형상을 수집하여 후속 보다 광범위한 샘플링(2^차 라운드 MD 시뮬레이션)을 위한 입력 구조를 준비합니다.
  참고: 초기 경로의 영향을 줄이고 로컬 평형을 허용하기 위해 초기 시뮬레이션 기간의 10ns를 제거했습니다.
2. 단백질과 DNA 사이의 거리 쌍을 시간 독립적 성분 분석(tICA) ^46,47,48 프로젝션을 위한 입력 파라미터로 선택합니다. GROMACS에서 make_ndx 명령을 사용하여 다음을 수행하십시오.
  gmx_mpi make_ndx -f 입력.pdb -o index.ndx
  참고: 여기서, 단백질 CA 원자 및 잔기 Y119, K122, K125, R131, Y133, Q146, K144, R135, W116, R117, Y134, K118, Q121의 잔기 Y119, K122, K121의 잔기 Y119, K122, N121의 잔기 Y119, K122, N136의 잔기 Y119, T19-23). 선택된 아미노산은 DNA와 안정한 HB 또는 염 다리를 형성 할 수 있습니다.
3. 위에서 선택한 원자 인덱스를 index.ndx 파일에서 새 텍스트 파일(인덱스.dat)로 복사합니다. 보충 파일 1 generate_atom_indices.py에서 파이썬 스크립트로 이러한 원자 사이의 쌍 정보를 얻고 입력하십시오 :
  python2.6 generate_atom_indices.py 인덱스 .dat > AtomIndices .txt
  이것은 단백질과 DNA 사이의 415 거리 쌍을 생성합니다.
4. MSMbuilder 명령 창에 다음 명령을 입력하여 모든 궤적에서 415개의 거리 쌍을 계산합니다.
  msmb AtomPairsFeaturizer -out pair_features --pair_indices AtomIndices.txt --top references.pdb --trjs "trajectories/*.xtc" --transformed pair_features --stride 5
5. tICA를 수행하여 다음을 입력하여 처음 2개의 시간 독립적 구성 요소(tIC) 또는 벡터로 데이터 차원을 줄입니다.
  msmb tICA -i .. /tica_rc_a/tmp/ -o tica_results --n_components 2 --lag_time 10 --감마 0.05 -t tica_results.h5
  참고: tICA는 방정식에 의해 시뮬레이션 시스템의 가장 느린 자유도를 결정하기 위해 시간 지연 상관 행렬 의 고유값을 계산하는 치수 감소 방법입니다.
  
  여기서 Xi(t)는 시간 t에서의 i번째 반응 좌표의 값이고, _Xj(t+Δt)는 시간 t+Δt에서의 j번째 반응 좌표의 값이다. 는 Xi(t) 및 _Xj(t+Δt) 전체 시뮬레이션 궤적의 곱의 기대값이다. 가장 느린 이완 자유도를 따른 방향은 위의 시간 지연 상관 행렬의 가장 큰 고유값에 해당합니다. 여기서 2 개의 tIC는 MSM 구성시 세 개의 매크로 상태를 구별하기위한 최소 집합 인 것 같습니다 (나중에 해결). 하나는 또한 일반화된 매트릭스 레일리 지수(GMRQ) 스코어(⁴⁹)를 계산하여, 예를 들어, 사용될 최적의 컴포넌트 세트를 탐색할 수 있다.
6. MSMbuilder의 명령을 사용하여 K-center^43,44 방법으로 프로젝션된 데이터 세트를 100개의 클러스터로 클러스터링합니다(그림 1B 참조).
  msmb KCenters -i ./tica_results.h5 -o -o kcenters_output -t kcenters_output --n_clusters 100.
  각 클러스터의 중심 구조를 2^차 MD 시뮬레이션의 초기 구조로 선택합니다. 속도를 제외한 위치, 온도, 압력 등을 포함하여 시뮬레이션된 100개 구조물의 시뮬레이션 정보를 유지합니다.
  참고: 25번의 시뮬레이션의 첫 번째 라운드 후에 초기 경로의 메모리가 감소되었으므로 두 번째 라운드에서 더 많은 클러스터(예: 100개의 클러스터)를 생성하여 형태 샘플링을 크게 확장합니다.
2^차 라운드 광범위한 MD 시뮬레이션 수행
1. 모든 원자에 임의의 초기 속도를 부과 한 후이 100 개의 초기 구조에서 시작하여 60-ns MD 시뮬레이션을 수행하십시오. mdp 파일에서 속도 생성을 켜는 것, 즉 md.mdp 파일을 = no로 변경하여 임의의 초기 속도를 gen_vel = gen_vel = yes로 추가합니다.
2. 단계 1.3.1에 설명된 대로 각 시뮬레이션의 처음 10ns를 제거하고 100×50ns 궤적에서 2,500,000개의 스냅샷을 균등하게 수집하여 MSM을 구성합니다.
  참고 : 이후의 거시 상태 구성에서는 특히 낮은 인구 (X-Θ 평면의 하단에 ~ 0.2 %)를 가진 소수의 오프 경로 상태가 발견되었습니다. 이러한 오프 경로 상태는 총 매크로 상태 수가 3~6으로 설정된 경우 하나의 매크로 상태로 분류됩니다(그림 2B). 이러한 낮은 모집단 매크로 상태에는 결국 제거 된 3 개의 궤적 만 포함되기 때문에이 프로토콜에 표시된 결과는 실제로 97 × 50 ns 궤적에서 얻었으며 총 2,425,000 프레임 또는 스냅 샷이 있습니다.
2^차 MD 궤적을 클러스터링
1. 이전에 수행 한 것처럼 2^라운드 궤적에 대해 tICA를 수행하십시오. MSMbuilder에 입력:
  msmb tICA -i .. /tica_rc_a/tmp/ -o tica_results --n_components 2 --lag_time 10 --감마 0.05 -t tica_results.h5
2. 암시적 시간 척도를 계산하여 상관 지연 시간 Δt 및 미세 상태 수에 대한 파라미터를 검증합니다( 그림 1C 참조).
  
  여기서 τ는 전이 확률 매트릭스(TPM)를 구축하는데 사용되는 지연 시간을 나타내고; μ_k(τ)는 τ의 지연 시간 하에서 TPM의 k번째 고유값을 나타낸다. 이 파이썬 BuildMSMsAsVaryLagTime.py -d 에 대해 보충 파일 1 의 파이썬 스크립트를 사용하십시오. / -f .. /trajlist_num -i 50 -m 1000 -t 10 -n 20 -s 500.
3. 지연 시간 τ 및 미세 상태 수를 변경하여 위에 사용 된 매개 변수를 변경하여 변경하십시오.
  파이썬 BuildMSMsAsVaryLagTime.py -d .. / -f .. /trajlist_num -i 50 -m 1000 -t 5 10 20 30 40 -n 20 -s 20 200 400 500 800 2000
  주: 이 시스템은 암시적 시간 척도 곡선이 시간 척도 분리로 수평 해제되기 시작할 때 마르코비안으로 간주됩니다. 그런 다음 상관 지연 시간으로 Dt를 선택하고 암시적 시간 척도가 레벨오프되기 시작하는 지연 시간 τ를 선택하여 MSM을 빌드합니다.
4. 따라서, 비교적 큰(그러나 너무 크지는 않은) 상태의 수, N = 500, 및 비교적 짧은 상관 지연 시간 Δt = 10 ns를 선택한다. 지연 시간은 MSM을 구축하기 위해 τ = 10ns인 것으로 밝혀졌다.
5. 다음 명령을 사용하여 구조를 500개의 클러스터로 분류합니다( 그림 1D 참조).
  msmb KCenters -i ./tica_results.h5 -o -o kcenters_output -t kcenters_output --n_clusters 500
MSM 건설
1. 보충 파일 1 파이썬 msm_lumping_usingPCCAplus.py의 파이썬 스크립트를 사용하여 MSMbuilder의 PCCA+ 알고리즘 50에 따라 가장 적합한 매크로 상태의 수를 찾기 위해⁵⁰⁰ 개의 마이크로 상태를 3-6 매크로 상태로 묶으십시오. 생체분자의 가장 필수적인 형태적 변화에 대한 모델의 감소된 운동 네트워크를 확인하고, 소수의 거대 상태, 즉 아래에 설명된 바와 같이 수백 개의 미세상태를 동역학적으로 덩어리화할 때,^{즉 17,51}을 구성한다.
2. 단계 1.1.3 및 1.1.4에 기술된 바와 같이 각 거대 상태에 대한 DNA를 따른 X(DNA 장축을 따른 단백질 이동) 및 단백질의 회전 각도에 고차원 입체 형태를 매핑한다(예를 들어, 1%< 너무 낮은 집단을 갖는 상태가 없다; 도 2C 참조). 그런 다음 시스템을 가장 잘 나타내는 3개의 매크로 상태를 찾습니다(그림 1E). DNA를 따른 단백질의 움직임과 DNA 주위의 단백질 회전 각도에 대한 스냅샷은 도 2D 를 참조하십시오.
  참고: 10μs 자발적 단백질 순방향 스테핑 경로를 생성하는 이전 작업에서는 샘플링을 적당히 확장하기 위해 5 x 4μs 평형 MD 시뮬레이션을 추가로 수행했습니다. 우리는 원래의 순방향 경로 (그림 2A 왼쪽 참조)의 매핑과 이전에 수행 된 순방향 경로에서 4-μs 샘플링 궤적을 추가로 보여주었습니다 (그림 2A 오른쪽 참조)⁸. 이 작업에 사용된 원래 100ns × 50ns(왼쪽 그림 2B 참조)⁸ 및 97× 50ns 궤적의 매핑이 표시됩니다(오른쪽 그림 2B 참조).
평균 첫 번째 통과 시간(MFPT)의 계산
1. MC의 시간 단계로 설정된 10ns의 지연 시간을 사용하여 500 마이크로 스테이트 MSM의 TPM을 기반으로 5개의 10ms 몬테카를로(MC) 궤적을 수행합니다. 보충 파일 1 파이썬 파이썬 mfpt_msm3.py의 파이썬 스크립트에 의해 각 매크로 상태 쌍 사이의 MFPT⁵²를 계산합니다(그림 3).
2. 보충 파일 2의 bash 파일을 사용하여 MFPT의 평균 및 표준 오류를 계산하고 다음을 입력하십시오.
  sh mfpt_analysis.bash

2. 오랜 시간 역학을 샘플링하기 위해 거친 그레인 (CG) 시뮬레이션 수행

CafeMol 3.0 소프트웨어(³⁰)를 이용하여 CG 시뮬레이션을 실시한다. 입력 구조, 시뮬레이션 매개 변수, 출력 파일 등을 포함하여 확장자가 .inp인 입력 구성 파일에 지정된 CG 시뮬레이션 설정을 참조하십시오. 터미널에서 다음 명령을 입력하여 CG 시뮬레이션을 실행합니다.
카페몰 XXX.inp
입력 파일에서 다음 블록을 지정하고, 각 블록은 레이블 < and ending with >>>>로 시작합니다.
1. 파일 이름 블록(필수)을 설정하여 작업 디렉토리와 입/출력 파일 저장소 경로를 지정합니다. 이러한 시뮬레이션의 파일 이름 블록에 대해 다음을 입력합니다.
  파일 이름 <<<<
  경로 = XXXXX (작업 경로)
  파일 이름 = wrky (출력 파일 이름)
  출력 psf pdb 영화 dcd rst
  path_pdb = XXXXX(입력 기본 구조 경로)
  path_ini = XXXXX(입력 초기 구조 경로)
  path_natinfo = XXXXX(기본 정보 파일 경로)
  path_para = XXXXX(매개변수 파일 경로)
  >>>>
  참고: Go-model(⁵³ )이 CG 모델링에서 활용되기 때문에, 즉, 단백질은 천연 형태에 편향될 것이므로, 모델링된 구조를 네이티브 형태로서 설정해야 한다. 여기서, 입력 결정 구조는 기본 입체 구조로 설정되었다.
2. 작업 제어 블록(필수)을 설정하여 시뮬레이션의 실행 모드를 정의합니다. 다음 명령을 입력합니다.
  <<<< job_cntl
  i_run_mode = 2 (= 2 항온 시뮬레이션)
  i_simulate_type = 1 (=1 랑게빈 역학)
  i_initial_state = 2(=2는 초기 구성이 기본 구성임을 의미함)
  >>>>
  항온 Langevin 역학 시뮬레이션을 선택합니다.
3. 단위 및 상태 블록(필수)을 설정하여 입력 구조에 대한 정보를 정의합니다. 다음 명령을 입력합니다.
  <<<< unit_and_state
  i_seq_read_style = 1(=1은 PDB 파일에서 읽은 시퀀스를 의미함)
  i_go_native_read_style = 1 (=1은 네이티브 구조가 PDB 파일에서 가져온 것임을 의미)
  1 단백질 단백질.pdb (unit&state molecular_type native_structure)
  2-3 dna DNA.pdb (unit&state molecular_type native_structure)
  >>>>
  참고: 초기 입력 구조 파일(단백질.pdb 및 DNA.pdb은 여기)이 필요합니다. 구조는 pdb 형식으로 작성됩니다. 하나는 WRKY(단위 1)의 중원자 좌표를 포함하는 단백질 구조 파일이고, 다른 하나는 200bp 이중 가닥(ds) DNA의 좌표입니다(단위 2-3). 단백질은 처음에 DNA로부터 15 Å 떨어진 곳에 배치됩니다.
4. energy_function 블록에 정의된 에너지 기능 블록(필수)을 설정합니다. 다음 명령을 입력합니다.
  <<<< energy_function
  현지(1) L_GO
  현지(2-3) L_DNA2
  NLOCAL(1/1) GO EXV ELE
  NLOCAL(2-3/2-3) ELE DNA
  NLOCAL(1/2-3) EXV ELE
  i_use_atom_protein = 0
  i_use_atom_dna = 0
  i_para_from_ninfo = 1
  i_triple_angle_term = 2
  >>>>
  참고: CG 시뮬레이션에서, 단백질은 Go-model⁵³ 에 의해 굵은 입자화되고, 각각의 아미노산은 CG 입자로 대표되며 Cα 위치에 배치된다. 단백질 입체 형태는 이동 전위 하에서 천연 구조 또는 결정 구조를 향해 편향될 것이다(왼쪽 그림 4A ). DNA는 3SPN.2 모델⁵⁴에 의해 설명되며, 여기서 각각의 뉴클레오티드는 각각 당, 인산염 및 질소 염기에 상응하는 3개의 CG 입자 S, P, N으로 표시된다(도 4A 우측). 정전기 및 vdW 상호 작용은 서로 다른 체인 간에 고려됩니다. CG 시뮬레이션에서 단백질과 DNA 사이의 정전기적 상호작용은 Debye-Hückel 전위⁽⁵⁵)에 의해 근사된다. vdW 반발 에너지는 Go 모델과 동일한 형태를 취합니다.
5. md_information 블록(필수)을 설정하여 시뮬레이션 정보를 정의합니다. 다음 명령을 입력합니다.
  <<<< md_information
  n_step_sim = 1
  n_tstep(1) = 500000000
  tstep_size = 0.1
  n_step_save = 1000
  n_step_neighbor = 100
  i_com_zeroing = 0
  i_no_trans_rot = 0
  tempk = 300.0
  n_seed = -1
  >>>>
  n_tstep은 시뮬레이션 단계입니다. tstep_size를 각 MD 단계의 시간 길이로 설정하고, 각 CG 카페몰 시간 단계는 약 200 fs³⁰이므로 여기서의 각 MD 단계는 원칙적으로 200 × 0.1 fs입니다. 100MD 단계마다 인접 목록을 업데이트합니다(n_step_neighbor = 100). 시뮬레이션 온도를 300K로 설정합니다. Berendsen 서모스탯⁽⁵⁶)을 사용하여 단백질 구조를 업데이트하기 위한 속도형 Verlet 알고리즘을 사용하여 온도를 제어합니다.
  참고: n_step_sim은 Go 모델 기반 전위의 분지 수 또는 에너지 곡선의 로컬 최소 수입니다. 다중 분지 전위는 단백질 입체 형태가 상이한 형태에 편향되도록 허용하여 단백질 입체 형태가 하나의 국부적 최소치에서 다른 국부적으로 변할 수 있도록 한다. 여기서는 단일 분지 Go 모델만 사용되며, 이는 시뮬레이션에서 단백질에 대해 하나의 편향된 입체 형태(결정 구조)만을 의미합니다. 한편, CG 컨텍스트에서 모델링된 단백질-DNA 수소 결합 상호작용 등이 없기 때문에, 분자 운동은 원자 시뮬레이션에서보다 훨씬 빠르게, 즉 > 10배 더 빠르게 샘플링될 수 있다.
6. 정전기 블록 (정전기 상호 작용이 사용될 때만 필요함)을 서로 다른 체인간에 정전기 상호 작용이 고려되므로 이 블록을 사용하여 다음을 입력하여 정전기 상호 작용에 대한 매개 변수를 정의하십시오.
  <<<< 정전기
  cutoff_ele = 10.0
  ionic_strength = 0.15
  >>>>
  정전기 상호작용에서 Debye 길이를 용액 조건에 해당하는 10 Å로 설정하십시오. 생리적 조건에서와 같이 이온 강도를 0.15 M로 설정하십시오.

Subscription Required. Please recommend JoVE to your librarian.

Representative Results

MSM 구조에서 WRKY의 회전 결합 슬라이딩 또는 1bp 스테핑
DNA 상의 모든 단백질 입체형태는 DNA를 따라 단백질 COM의 종방향 이동 X 및 회전 각도에 매핑된다( 도 3A 참조). 이 두 도의 선형 결합은 DNA 상의 WRKY 도메인 단백질의 회전 결합 스테핑을 나타낸다. 상기 형태들은 MSM에서 3개의 매크로스테이트들(S1, S2, 및 S3)로 더 클러스터링될 수 있다. WRKY의 전진 단계는 매크로 상태 전환 S1->S2->S3을 따릅니다. S1은 ~6%의 집단을 갖는 모델링된 구조(WRKY-DNA 복합체(⁴⁰)의 결정 구조를 기초로)에 의해 개시되는 준안정 상태를 의미한다. 현재의 모델링에서, 초기 단백질 입체 형태는 단백질이 특정 W-box DNA 서열(⁴⁰)과 결합하는 결정 구조로부터 채택되었다. 이러한 모델링된 단백질-폴리 A-DNA 복합체는 따라서 단차적 또는 최종적으로 이완된 구조(S3)보다 덜 유리한 초기 구조(S1)를 유도한다. 그럼에도 불구하고, 단백질-DNA 계면에서의 수소 결합(HBs)이 S1의 중심 근처에서 S3의 중심 근처에서 회복된다는 것을 알 수 있다( 도 3B 참조). S1 상태의 HB는 잘 유지됩니다: A15가 있는 K125, A15, R131, Q146 및 Y133이 있는 A16, A17이 있는 K144 및 Y119, A18이 있는 R135(왼쪽 위 그림 3B ). S3는 1-bp 단백질 스테핑 후의 준안정 상태를 나타내며, 거의 모든 HBs가 1-bp 거리 동안 시프트되고(도 3B 하단), 구조가 가장 높은 집단(63%)으로 안정하게 나타난다. 중간 상태 S2는 S1과 S3을 중간 높은 인구 (~ 30 %)와 연결합니다. 우리는 R135와 K144가이 중간 상태에서 매우 유연하며 일반적으로 현재 뉴클레오티드로 HB를 깨고 다음 뉴클레오티드로 개혁 할 수 있음을 발견했습니다 (오른쪽 상단 3B ). 전반적으로, WRKY 단백질 COM은 ~2.9 Å로 이동했고 ~55°를 회전시켜 여기에서 1bp를 밟았다. WRKY 스테핑의 속도 제한 단계는 S2->S3이며, 이는 본질적으로 HB의 집단 파괴 및 개질을 허용하며 평균 ~ 7 μs를 필요로합니다. 대조적으로, S1 내지 S2는 ~0.06 μs 또는 60-ns의 시간에 매우 빠르게 이동할 수 있으며(도 3B), 주로 단백질 COM 변동을 수반한다(예를 들어, DNA 상의 단백질 배향 변화로 인한).

CG 모델에서 프로세시브 확산 동안 WRKY의 단일 가닥 바이어스
우리의 최근 연구에서, 우리는 WRKY 도메인 단백질이 1-bp 스테핑 또는 정적 결합 동안 상관없이 dsDNA의 한 가닥에 우선적으로 결합한다는 것을 발견했습니다. 단일-가닥 편향은 특히 특정 DNA 서열 결합⁸시에 매우 두드러진다. 한편, DNA를 따라 단백질의 진행적 확산 동안 그러한 추세가 남아 있는지 여부는 분명하지 않다. 여기서 우리는 CG 시뮬레이션을 통해 잠재적 인 가닥 편향을 조사하려고했습니다. 흥미롭게도, 상당한 단일 가닥 DNA 결합 구성이 공정 확산 동안 WRKY의 CG 시뮬레이션에서 확인되었다. 이를 확인하기 위해, 단백질과 DNA 사이의 접촉 수를 각각의 DNA 가닥에 대해 계산하였다( 도 4B 참조). 접촉은 단백질 CG 입자와 DNA CG P (포스페이트 그룹) 입자 사이의 거리가 7 Å보다 작을 때 고려된다. 단백질은 실제로 하나의 DNA 가닥에 대한 편향을 보여주며(예를 들어, 한 가닥에 ~4개의 접촉, 다른 가닥에 ~1개의 접촉), 즉 단백질-DNA 계면에서의 HBs와 같은 상세한 상호작용이 모델링되지 않은 경우에도.

그러나, 바람직한 DNA 가닥은 DNA 상의 단백질의 결합 배향 또는 구성에 따라 DNA의 두 가닥 사이에서 때때로 전환될 수 있다. 특히, 단백질과 DNA의 각각의 가닥 사이에 형성된 접촉 수에 따라, 여기에는 주로 4개의 상태가 있다( 도 4B, C에서 1, 2, 3 및 4로 표지됨). 상태 1 및 3에서, 아연-핑거 영역은 -Y 방향을 향해 결합하고, 바람직한 가닥은 청색 가닥이다. 상태 2 및 3에서, 아연-핑거 영역은 +Y 방향을 향해 결합하고, 바람직한 가닥은 적색 가닥이 된다. 또한 아연-피그너 영역이 DNA와 우세하게 상호작용한다는 것도 발견 된다(도 4D 참조). 따라서, 아연-핑거 영역과 밀접하게 결합된 DNA 가닥이 실제로 선호되는 것이다. 상기 샘플링에 따르면, 따라서 가닥 바이어스는 지속되지만 처리성 단백질 확산의 CG 모델에서 두 DNA 가닥 사이에서 전환되는 것으로 나타난다.

CG 시뮬레이션에서 단백질 개별 잔류 스테핑
이전에 CG 시뮬레이션에서 WRKY의 스테핑 크기가 다른 DNA 서열⁸에서 다를 수 있음을 알게되었습니다. 단백질 COM은 균질한 폴리-A DNA 상에서 단계 1 bp로 하는 경향이 있다. 2 bp 주기성을 갖는 폴리-AT DNA 상에서, 2-bp 스테핑의 비율은 증가하는 것으로 보인다.

추가적으로, 여기서는 개별 단백질 잔기가 단백질-DNA 계면에서 동기적으로 이동하는지 여부를 조사하였다. 매 1000개의 타임스텝마다 WRKY 모티프(WRKYGQK) 내의 각각의 고도로 보존된 잔기의 스테핑 크기를 계산하였다(도 5A). 따라서 보존된 각 잔기의 잔류 스테핑 크기는 CG 시뮬레이션으로부터 측정될 수 있다. 결과는 실제로 이러한 개별 잔기의 스테핑 크기가 폴리 AT 또는 랜덤 DNA 서열보다 폴리 A DNA에서 더 동기화된다는 것을 보여줍니다 (그림 5B).

그림 1: 형태 생성 및 미세상태/거시상태 구성 . (A) 단백질-DNA RMSD 및 DNA 주위의 단백질 회전 각도에 매핑된 초기 순방향 스테핑 경로. 처음 선택한 25 개의 구조물은 빨간색 원으로 표시되어 있습니다. (B) 1^차 라운드 25 x 50ns MD 시뮬레이션 궤적에서 두 개의 가장 높은 고유값 tIC 방향에 매핑된 100개의 입체 형태 클러스터 센터. (c) 선택된 거리 쌍을 입력으로 사용하는 tICA를 통한 MSM 구축을 위한 지연 시간의 함수로서 암시적 시간 척도를 플롯한다. 각 세트에 대해 MSM은 형상을 상위 2개의 tIC에 투영한 다음 K 중심 클러스터링하여 5 ~ 40ns(위쪽에서 아래쪽 행)에서 선택한 tICA에 대한 상관 지연 시간과 함께 20~2000개의 미세 상태(왼쪽에서 오른쪽 열까지)를 생성하도록 구성되었습니다. (D) 500개의 마이크로스테이트가 건설되고 (E) 추가로 구성된 3개의 매크로스테이트들, 대응하는 마이크로스테이트 센터들이 가장 높은 두 개의 tIC 방향을 따라 매핑된다. 이 그림의 더 큰 버전을 보려면 여기를 클릭하십시오.

그림 2: 거대 상태의 구축 . (A) 초기 순방향 스테핑 경로 궤적(왼쪽)과 단백질 질량 중심(COM)의 소수 추가 마이크로초 궤적 샘플링(오른쪽)을 사용하여 DNA 장축(X)과 DNA 주위의 회전 각도(이전에⁸번 획득)를 따라 이동한 매핑. (b) 현재 MSM 구성에 사용되는 원래 100 × 50 ns 궤적과 97 × 50 ns 궤적의 매핑. (C) 건설 된 MSM에서 3-6 개의 거시 국가 및 그 개체군의 건설은 광범위한 샘플링지도에 표시되어 있습니다. (d) DNA 주위의 단백질 이동 X 및 회전 각도가 각각 도시되어 있다. 샘플링 된 형태는 마침내 3 개의 매크로 상태로 묶여 있으며 매크로 상태 1, 2 및 3에 각각 해당하는 빨간색, 파란색 및 회색이 있습니다. 이 그림의 더 큰 버전을 보려면 여기를 클릭하십시오.

도 3: 폴리-A DNA를 밟는 WRKY 도메인 단백질의 MSM이다 . (A) 단백질 COM 이동 X 및 DNA에 대한 회전 각도의 좌표 상으로의 MD 입체 형태적 스냅샷의 투사. 3개의 매크로 상태 S1, S2 및 S3는 각각 빨간색, 파란색 및 회색으로 채색됩니다. (B) 구성된 3개의 거시상태의 대표적인 형태 및 전이 평균-최초-통과시간(MFPT). 단백질과 DNA 사이의 주요 수소 결합이 표시됩니다. 이 그림의 더 큰 버전을 보려면 여기를 클릭하십시오.

도 4: CG 모델에서 단백질과 DNA 가닥 사이에 형성된 굵은 그레인(CG) 모델과 접촉. (A) 단백질(왼쪽)과 DNA(오른쪽)의 거친 그레인팅. (b) 시뮬레이션을 따른 WRKY와 각 DNA 가닥 사이의 접촉 번호. (C) 4 접촉 모드의 분자 견해. 아연 손가락 근처의 단백질 영역은 회색으로 채색되고 다른 영역은 녹색으로 채색됩니다. (d) 각 단백질 아미노산과 DNA의 접촉 확률. 아미노산의 CG 입자와 임의의 DNA CG 입자 사이의 거리가 7 Å보다 작을 때, 아미노산은 DNA와 접촉하는 것으로 간주된다. 이 그림의 더 큰 버전을 보려면 여기를 클릭하십시오.

도 5: DNA를 따라 이동하는 WRKY로서 WRKY 모티프에서 개별 단백질 아미노산의 확산 단계 크기. (A) 원자 구조에서 고도로 보존된 잔기(WRKYGQK)(왼쪽)와 거친 그레인 후(오른쪽). (B) DNA의 상이한 서열 상의 보존된 각 잔기에 대한 스테핑 크기(poly-A; poly-AT; 랜덤 서열) 는 이 그림의 더 큰 버전을 보려면 여기를 클릭하십시오.

보충 파일 1: 이 프로토콜에 사용 된 파이썬 코드와 소프트웨어. MSM은 주로 MSMbuilder를 사용하여 빌드되며 필요한 파이썬 코드가 첨부됩니다. 이 파일을 다운로드하려면 여기를 클릭하십시오.

보충 파일 2: 원자 분자 역학 시뮬레이션은 GROMACS에 의해 수행되며, 모든 원자 시뮬레이션을 구축하는 데 필요한 명령 및 파일도 첨부됩니다. 거친 시뮬레이션은 CafeMol 소프트웨어에 의해 수행됩니다. 시뮬레이션 결과는 VMD 및 MATLAB에 의해 분석됩니다. 이 파일을 다운로드하려면 여기를 클릭하십시오.

보충 파일 3 : VMD에서 단백질을 회전시키고 이동하는 tcl 스크립트. 이 파일을 다운로드하려면 여기를 클릭하십시오.

Subscription Required. Please recommend JoVE to your librarian.

Discussion

이 작업은 구조 기반 계산 시뮬레이션 및 샘플링을 수행하여 DNA를 따라 이동하는 전사 인자 또는 TF 단백질을 스테핑의 원자 세부 사항뿐만 아니라 DNA 표적 검색에서 TF의 촉진 확산에 필수적인 프로세스 확산에서도 밝히는 방법을 다룹니다. 이를 위해, 균질한 폴리-A DNA를 따라 1-bp를 밟는 작은 TF 도메인 단백질 WRKY 스테핑의 마르코프 상태 모델 또는 MSM이 먼저 구축되어, 단백질-DNA 계면에서의 집단적 수소 결합 또는 HB 역학과 함께 DNA 상의 단백질 입체형태의 앙상블이 드러날 수 있다. MSM을 얻기 위해, 우리는 자발적인 단백질 스테핑 경로 (이전의 10-μs 시뮬레이션에서 얻은 것)를 따라 광범위한 모든 원자 MD 시뮬레이션의 두 라운드를 수행했으며, 현재 샘플링은 7.5 μs (125 x 60 ns)의 응집으로 이루어졌습니다. 이러한 광범위한 샘플링은 수백 개의 미세 상태로 구성 클러스터링을위한 스냅 샷을 제공하여 단백질-DNA 계면 쌍 거리를 클러스터링을위한 기하학적 척도로 활용합니다. MSM 구성의 Markovian 속성은 개별 MD 시뮬레이션의 다양한 길이 또는 지연 시간에 대해 계산 된 암시 적 시간 척도로부터의 시간 척도 분리를 감지하여 부분적으로 검증됩니다. 그런 다음 20-2000 개의 미세 상태를 테스트하고 시간 척도 분리 특성을 비교했으며 MSM 구축을 위해 500 개의 마이크로 스테이트를 선택했습니다. 또한, 500 개의 미세 상태는 운동 학적으로 소수의 매크로 상태로 묶여 있었고, 우리는 다양한 수의 상태를 테스트하고 현재 시스템에 충분한 세 개의 매크로 상태를 발견했습니다. 3 상태 모델은 단순히 상태 S1이 DNA에 대한 단백질 질량 중심 (COM) 변동에 의해 지배되는 S2로 비교적 빠르게 (수십 ns 이내) 이동한다는 것을 보여 주며, 상태 S2는 천천히 S3로 이동하며 속도 제한 (평균 ~ 7 μs)이며 스테핑을위한 집단 HB 역학에 의해 지배됩니다. 미세 상태를 소수의 운동 학적으로 별개의 거시 상태로 동역학적으로 덩어리로 묶는 것은 여전히 방법론 적 발전의 대상이되며, 개선을위한 다양한 알고리즘 테스트 및 기계 학습 기술 57,58,59,60,61,62,63 . MSM을 구축하기 위한 중요한 단계에는 tICA에 사용되는 거리 쌍을 선택하고 미세 상태를 구성하는 데 사용되는 매개 변수를 결정하는 것이 포함됩니다. 거리 쌍의 선택은 지식 기반이며, 가장 필수적인 상호 작용 쌍을 선택하는 것이 중요합니다. 상관 지연 시간, 지연 시간, 미세 상태의 뮤버와 같은 미세 상태를 구성하기위한 매개 변수는 시스템이 Markovian이되도록 적절하게 설정되어야합니다.

이러한 노력으로, 원자 세부 사항을 갖는 서브마이크로-마이크로-초 단백질 구조 역학은 DNA를 따라 1-bp 단백질을 밟는 것에 대해 체계적으로 밝혀질 수 있다. 원칙적으로, MSM 구성으로부터 얻어진 전이 확률 매트릭스와 함께, 시스템은 마이크로초를 넘어 긴 시간 스케일로 진화될 수 있거나, 말하자면, 밀리초 이상 ^13,17,64에 접근할 수 있다. 그러나 특정 초기 경로를 중심으로 서브마이크로초 개별 시뮬레이션에 의존하는 MSM 샘플링 및 구성의 본질적인 한계가 있으며, 마르코비안 특성은 ^65,66을 잘 보장하지 못할 수 있습니다. 대부분의 경우, 초기 경로는 강제 또는 가속 하에 구축되었지만, 현재 시스템에서는 10-ms 평형 시뮬레이션(⁸)으로부터 얻은 자발적인 단백질 스테핑 경로(강제 또는 가속 없이)를 이용한다. 집합체의 형태 샘플링은 원자 시뮬레이션의 높은 계산 비용으로 인해 수십 마이크로 초로 여전히 제한됩니다. 단백질 스테핑의 이러한 마이크로초 샘플링은 장시간 스케일 가공성 TF 확산 상에 나타나기에 충분한 입체형태를 제공하지 않을 것이다. 메모리 문제는 특정 시간 척도를 넘어 현재 획득 된 전이 확률 매트릭스를 구현하고 Markovian 속성이 현재 MSM ^14,52,66의 적절한 사용을 보장하지 않는다고 보장하면 중요합니다. 따라서, DNA를 따라 TF의 장시간 스케일 가공적 확산을 샘플링하기 위해, 잔류물 레벨이 조대-그레인 또는 CG 모델링 및 시뮬레이션이 대신 구현되어, 구조적 기초를 유지하고 계산 비용을 낮추는 것 사이의 균형을 이룬다.

CG 모델링 및 시뮬레이션에서, 단백질 잔기 및 DNA 뉴클레오티드는 비드 (즉, 하나의 아미노산에 대해 하나의 비드, 하나의 뉴클레오티드에 대해 세 개의 비드)로 표현되며, 단백질 입체 형태는 천연 또는 사전 평형화 된 구성^30,53을 향해 Go 모델을 통해 유지된다. HB 상호 작용의 원자 수준은 CG 모델에서 결여되지만, 단백질-DNA 정전기적 상호작용은 잘 유지되며, 이는 DNA^67,68,69,70을 따라 단백질의 진행적 확산에서 지배적 인 역학 특징을 포착 할 수있는 것으로 보인다. WRKY-DNA 시스템을 모델링하고 시뮬레이션하기 위한 자세한 구현 프로토콜이 여기에 제시되어 있습니다. 대표적인 결과는 흥미롭게도 WRKY-DNA 시스템의 이전 원자 시뮬레이션에서 제시된 단일 가닥 DNA 바이어스가 CG 모델에서 지속되는 반면, 프로세스 확산 중에 샘플링 된 다양한 단백질 방향 / 구성은 때때로 두 가닥 사이의 바이어스의 전환으로 이어진다는 것을 보여줍니다. 따라서, 이러한 DNA 가닥 편향은 반드시 HB 연관성과 연결되지는 않지만, 주로 단백질-DNA 정전기적 상호작용에 의존하는 것으로 보이며, 이는 DNA 상의 다양한 단백질 구성 또는 배향에 따라 다양하다. 다음으로, 고도로 보존된 WRKQGQK 모티프와 같은 단백질-DNA 계면에서의 또는 그 근처의 개별 아미노산은 상이한 DNA 서열에 대해 상이한 스테핑 크기 또는 동기화 패턴을 나타낸다. 우리의 이전 연구에서, 스테핑 크기 변이는 단백질이 다른 DNA 서열을 따라 확산되도록 모델링 되었기 때문에 단백질의 COM에 대해서만 나타났습니다. DNA의 현재 CG 모델은 원자 세부 사항이 누락되었지만 다른 매개 변수화 ^54,71,72의 DNA 서열 변이를 지원합니다. 단백질-DNA 시스템의 구조-기반 모델링에서 적절한 DNA 서열-의존적 파라미터화는, 따라서 다수의 시간 및 길이 스케일에 걸쳐 단백질-DNA 검색 및 인식 메카니즘을 드러내는 데 매우 중요하다.

Subscription Required. Please recommend JoVE to your librarian.

Disclosures

저자는 이해 상충이 없습니다.

Acknowledgments

이 작업은 NSFC Grant #11775016 및 #11635002에서 지원되었습니다. JY는 NSF DMS 1763272와 UCI의 Simons Foundation 보조금 #594598 및 창업 기금을 통해 UCI의 CMCF의 지원을 받았습니다. LTD는 상하이 #20ZR1425400 및 #21JC1403100의 자연 과학 재단의 지원을 받고 있습니다. 우리는 또한 베이징 전산 과학 연구 센터 (CSRC)의 전산 지원을 인정합니다.

Materials

Name	Company	Catalog Number	Comments
CafeMol	Kyoto University		coarse-grained (CG) simulations
GROMACS	University of Groningen Royal Institute of Technology Uppsala University		molecular dynamics simulations software
Matlab	MathWorks		Numerical calculation software
MSMbuilder	Stanford University		build MSM
VMD	UNIVERSITY OF ILLINOIS AT URBANA-CHAMPAIGN		molecular visualization program

DOWNLOAD MATERIALS LIST

References

Latchman, D. S. Transcription factors: an overview. The International Journal of Biochemistry & Cell Biology. 29 (12), 1305-1312 (1997).
Berg, O. G., von Hippel, P. H. Selection of DNA binding sites by regulatory proteins. Statistical-mechanical theory and application to operators and promoters. Journal of Molecular Biology. 193 (4), 723-750 (1987).
von Hippel, P. H., Berg, O. G. Facilitated target location in biological systems. The Journal of Biological Chemistry. 264 (2), 675-678 (1989).
Halford, S. E., Marko, J. F. How do site-specific DNA-binding proteins find their targets. Nucleic Acids Research. 32 (10), 3040-3052 (2004).
Slusky, M., Mirny, L. A. Kinetics of protein-DNA interaction: facilitated target location in sequence-dependent potential. Biophysical Journal. 87 (6), 4021-4035 (2004).
Bauer, M., Metzler, R. Generalized facilitated diffusion model for DNA-binding proteins with search and recognition states. Biophysical Journal. 102 (10), 2321-2330 (2012).
Shvets, A. A., Kochugaeva, M. P., Kolomeisky, A. B. Mechanisms of Protein Search for Targets on DNA: Theoretical Insights. Molecules. 23 (9), Basel, Switzerland. 2106 (2018).
Dai, L., Xu, Y., Du, Z., Su, X. D., Yu, J. Revealing atomic-scale molecular diffusion of a plant-transcription factor WRKY domain protein along DNA. Proceedings of the National Academy of Sciences of the United States of America. 118 (23), 2102621118 (2021).
Chodera, J. D., Singhal, N., Pande, V. S., Dill, K. A., Swope, W. C. Automatic discovery of metastable states for the construction of Markov models of macromolecular conformational dynamics. The Journal of Chemical Physics. 126 (15), 155101 (2007).
Pan, A. C., Roux, B. Building Markov state models along pathways to determine free energies and rates of transitions. The Journal of Chemical Physics. 129 (6), 064107 (2008).
Bowman, G. R., Huang, X., Pande, V. S. Using generalized ensemble simulations and Markov state models to identify conformational states. Methods. 49 (2), San Diego, California. 197-201 (2009).
Prinz, J. H., et al. Markov models of molecular kinetics: Generation and validation. The Journal of chemical physics. 134 (17), 174105 (2011).
Chodera, J. D., Noé, F. Markov state models of biomolecular conformational dynamics. Current Opinion in Structural Biology. 25, 135-144 (2014).
Malmstrom, R. D., Lee, C. T., Van Wart, A. T., Amaro, R. E. On the Application of Molecular-Dynamics Based Markov State Models to Functional Proteins. Journal of Chemical Theory and Computation. 10 (7), 2648-2657 (2014).
Husic, B. E., Pande, V. S. Markov State Models: From an Art to a Science. Journal of the American Chemical Society. 140 (7), 2386-2396 (2018).
Sittel, F., Stock, G. Perspective: Identification of collective variables and metastable states of protein dynamics. The Journal of chemical physics. 149 (15), 150901 (2018).
Wang, W., Cao, S., Zhu, L., Huang, X. Constructing Markov State Models to elucidate the functional conformational changes of complex biomolecules. WIREs Computational Molecular Science. 8, 1343 (2018).
Peng, S., et al. Target search and recognition mechanisms of glycosylase AlkD revealed by scanning FRET-FCS and Markov state models. Proceedings of the National Academy of Sciences of the United States of America. 117 (36), 21889-21895 (2020).
Tian, J., Wang, L., Da, L. T. Atomic resolution of short-range sliding dynamics of thymine DNA glycosylase along DNA minor-groove for lesion recognition. Nucleic Acids Research. 49 (3), 1278-1293 (2021).
Chu, J. -W., Izveko, S., Voth, G. The multiscale challenge for biomolecular systems: coarse-grained modeling. Molecular Simulation. 32 (3-4), 211-218 (2006).
Marrink, S. J., Risselada, H. J., Yefimov, S., Tieleman, D. P., De Vries, A. H. The MARTINI force field: coarse grained model for biomolecular simulations. The Journal of Physical Chemistry B. 111 (27), 7812-7824 (2007).
Givaty, O., Levy, Y. Protein sliding along DNA: dynamics and structural characterization. Journal of Molecular Biology. 385 (4), 1087-1097 (2009).
Khazanov, N., Levy, Y. Sliding of p53 along DNA can be modulated by its oligomeric state and by cross-talks between its constituent domains. Journal of Molecular Biology. 408 (2), 335-355 (2011).
Riniker, S., Allison, J. R., van Gunsteren, W. F. On developing coarse-grained models for biomolecular simulation: a review. Physical Chemistry Chemical Physics : PCCP. 14 (36), 12423-12430 (2012).
Kmiecik, S., et al. Coarse-Grained Protein Models and Their Applications. Chemical Reviews. 116 (14), 7898-7936 (2006).
Bhattacherjee, A., Krepel, D., Levy, Y. Coarse-grained models for studying protein diffusion along DNA. WIREs Computational Molecular Science. 6, 515-531 (2016).
Wang, J., et al. Machine Learning of Coarse-Grained Molecular Dynamics Force Fields. ACS Central Science. 5 (5), 755-767 (2019).
Joshi, S. Y., Deshmukh, S. A. A review of advancements in coarse-grained molecular dynamics simulations. Molecular Simulation. 47 (10-11), 786-803 (2021).
Bigman, L. S., Greenblatt, H. M., Levy, Y. What Are the Molecular Requirements for Protein Sliding along DNA. The Journal of Physical Chemistry B. 125 (12), 3119-3131 (2021).
Kenzaki, H., et al. CafeMol: A Coarse-Grained Biomolecular Simulator for Simulating Proteins at Work. Journal of Chemical Theory and Computation. 7 (6), 1979-1989 (2011).
Berendsen, H. J. C., vander Spoel, D., van Drunen, R. GROMACS: a message-passing parallel molecular dynamics implementation. Computer Physics Communications. 91 (1-3), 43-56 (1995).
vander Spoel, D., et al. GROMACS: fast, flexible, and free. Journal of Computational Chemistry. 26 (16), 1701-1718 (2005).
Abraham, M. J., et al. GROMACS: High performance molecular simulations through multi-level parallelism from laptops to supercomputers. SoftwareX. 1-2, 19-25 (2015).
Harrigan, M. P., et al. MSMBuilder: Statistical Models for Biomolecular Dynamics. Biophysical journal. 112 (1), 10-15 (2017).
Humphrey, W., Dalke, A., Schulten, K. VMD: visual molecular dynamics. Journal of Molecular Graphics. 14 (1), 33-38 (1996).
Izrailev, S., et al. Steered Molecular Dynamics. Computational Molecular Dynamics: Challenges, Methods, Ideas. 4, Springer. Berlin, Heidelberg. 39-65 (1999).
Schlitter, J., Engels, M., Krüger, P. Targeted molecular dynamics: a new approach for searching pathways of conformational transitions. Journal of Molecular Graphics. 12 (2), 84-89 (1994).
Maragliano, L., Fischer, A., Vanden-Eijnden, E., Ciccotti, G. String method in collective variables: minimum free energy paths and isocommittor surfaces. The Journal of Chemical Physics. 125 (2), 24106 (2006).
Weiss, D. R., Levitt, M. Can morphing methods predict intermediate structures. Journal of Molecular Biology. 385 (2), 665-674 (2009).
Xu, Y. P., Xu, H., Wang, B., Su, X. D. Crystal structures of N-terminal WRKY transcription factors and DNA complexes. Protein. 11 (3), 208-213 (2020).
Higham, D. J., Higham, N. J. MATLAB guide. Society for Industrial and Applied Mathematics. , (2016).
Hartigan, J. A., Wong, M. A. Algorithm AS 136: A K-Means Clustering Algorithm. Journal of the Royal Statistical Society. Series C (Applied Statistics). 28 (1), 100-108 (1979).
Gonzalez, T. F. Clustering to minimize the maximum intercluster distance. Theoretical Computer Science. 38, 293-306 (1985).
Zhao, Y., Sheong, F. K., Sun, J., Sander, P., Huang, X. A fast parallel clustering algorithm for molecular simulation trajectories. Journal of Computational Chemistry. 34 (2), 95-104 (2013).
Ivani, I., et al. Parmbsc1: a refined force field for DNA simulations. Nature Methods. 13 (1), 55-58 (2016).
Naritomi, Y., Fuchigami, S. Slow dynamics of a protein backbone in molecular dynamics simulation revealed by time-structure based independent component analysis. The Journal of Chemical Physics. 139 (21), 215102 (2013).
Naritomi, Y., Fuchigami, S. Slow dynamics in protein fluctuations revealed by time-structure based independent component analysis: the case of domain motions. The Journal of Chemical Physics. 134 (6), 065101 (2011).
Pérez-Hernández, G., Paul, F., Giorgino, T., De Fabritiis, G., Noé, F. Identification of slow molecular order parameters for Markov model construction. The Journal of Chemical Physics. 139 (1), 015102 (2013).
McGibbon, R. T., Pande, V. S. Variational cross-validation of slow dynamical modes in molecular kinetics. The Journal of Chemical Physics. 142 (12), 124105 (2015).
Deuflhard, P., Weber, M. Robust Perron cluster analysis in conformation dynamics. Linear Algebra and its Applications. 398, 161-184 (2005).
Silva, D. A., et al. Millisecond dynamics of RNA polymerase II translocation at atomic resolution. Proceedings of the National Academy of Sciences of the United States of America. 111 (21), 7665-7670 (2014).
Swope, W. C., Pitera, J. W., Suits, F. Describing Protein Folding Kinetics by Molecular Dynamics Simulations. 1. Theory. The Journal of Physical Chemistry B. 108 (21), 6571-6581 (2004).
Clementi, C., Nymeyer, H., Onuchic, J. N. Topological and energetic factors: what determines the structural details of the transition state ensemble and "en-route" intermediates for protein folding? An investigation for small globular proteins. Journal of molecular biology. 298 (5), 937-953 (2000).
Hinckley, D. M., Freeman, G. S., Whitmer, J. K., De Pablo, J. J. An experimentally-informed coarse-grained 3-Site-Per-Nucleotide model of DNA: structure, thermodynamics, and dynamics of hybridization. The Journal of chemical physics. 139 (14), 144903 (2013).
Debye, P., Huckel, E. The theory of the electrolyte II-The border law for electrical conductivity. Physikalische Zeitschrift. 24, 305-325 (1923).
Berendsen, H. J., Postma, J. V., van Gunsteren, W. F., DiNola, A., Haak, J. R. Molecular dynamics with coupling to an external bath. The Journal of Chemical Physics. 81, 3684-3690 (1984).
Bowman, G. R. Improved coarse-graining of Markov state models via explicit consideration of statistical uncertainty. The Journal of Chemical Physics. 137 (13), 134111 (2012).
Jain, A., Stock, G. Identifying metastable states of folding proteins. Journal of Chemical Theory and Computation. 8 (10), 3810-3819 (2012).
Röblitz, S., Weber, M. Fuzzy spectral clustering by PCCA+: application to Markov state models and data classification. Advances in Data Analysis and Classification. 7, 147-179 (2013).
Mardt, A., Pasquali, L., Wu, H., Noé, F. VAMPnets for deep learning of molecular kinetics. Nature Communications. 9 (1), 5 (2018).
Wang, W., Liang, T., Sheong, F. K., Fan, X., Huang, X. An efficient Bayesian kinetic lumping algorithm to identify metastable conformational states via Gibbs sampling. The Journal of Chemical Physics. 149 (7), 072337 (2018).
Chen, W., Sidky, H., Ferguson, A. L. Nonlinear discovery of slow molecular modes using state-free reversible VAMPnets. The Journal of Chemical Physics. 150 (21), 214114 (2019).
Gu, H., et al. RPnet: a reverse-projection-based neural network for coarse-graining metastable conformational states for protein dynamics. Physical Chemistry Chemical Physics :PCCP. 24 (3), 1462-1474 (2022).
Lane, T. J., Bowman, G. R., Beauchamp, K., Voelz, V. A., Pande, V. S. Markov state model reveals folding and functional dynamics in ultra-long MD trajectories. Journal of the American Chemical Society. 133 (45), 18413-18419 (2011).
Konovalov, K. A., Unarta, I. C., Cao, S., Goonetilleke, E. C., Huang, X. Markov State Models to Study the Functional Dynamics of Proteins in the Wake of Machine Learning. JACS Au. 1 (9), 1330-1341 (2021).
Cao, S., Montoya-Castillo, A., Wang, W., Markland, T. E., Huang, X. On the advantages of exploiting memory in Markov state models for biomolecular dynamics. The Journal of Chemical Physics. 153 (1), 014105 (2020).
Brandani, G. B., Takada, S. Chromatin remodelers couple inchworm motion with twist-defect formation to slide nucleosomal DNA. PLoS Computational Biology. 14 (11), 1006512 (2018).
Tan, C., Terakawa, T., Takada, S. Dynamic Coupling among Protein Binding, Sliding, and DNA Bending Revealed by Molecular Dynamics. Journal of the American Chemical Society. 138 (27), 8512-8522 (2016).
Terakawa, T., Takada, S. p53 dynamics upon response element recognition explored by molecular simulations. Scientific reports. 5, 17107 (2015).
Brandani, G. B., Niina, T., Tan, C., Takada, S. DNA sliding in nucleosomes via twist defect propagation revealed by molecular simulations. Nucleic Acids Research. 46 (6), 2788-2801 (2018).
Knotts, T. A., Rathore, N., Schwartz, D. C., de Pablo, J. J. A coarse grain model for DNA. The Journal of Chemical Physics. 126 (8), 084901 (2007).
Freeman, G. S., Hinckley, D. M., Lequieu, J. P., Whitmer, J. K., de Pablo, J. J. Coarse-grained modeling of DNA curvature. The Journal of Chemical Physics. 141 (16), 165103 (2014).

Biology

구조 기반 시뮬레이션 및 원자 스케일 스테핑에서 거친 입자 확산에 이르기까지 DNA를 따른 전사 인자 단백질 움직임의 샘플링

Summary

Abstract

Introduction

Protocol

Representative Results

Discussion

Disclosures

Acknowledgments

Materials

References

Tags

Cite this Article

Summary

Abstract

Introduction

Protocol

Representative Results

Discussion

Disclosures

Acknowledgments

Materials

References

Tags

Cite this Article

Get cutting-edge science videos from JoVE sent straight to your inbox every month.