Waiting
Login processing...

Trial ends in Request Full Access Tell Your Colleague About Jove
Click here for the English version

Biology

संरचना-आधारित सिमुलेशन और ट्रांसक्रिप्शन फैक्टर प्रोटीन आंदोलनों का नमूना परमाणु-स्केल से मोटे-दाने वाले प्रसार के लिए कदम उठाने से डीएनए के साथ

Published: March 1, 2022 doi: 10.3791/63406
* These authors contributed equally

Summary

इस प्रोटोकॉल का लक्ष्य डीएनए के साथ प्रोटीन के एक आयामी प्रसार की संरचनात्मक गतिशीलता को प्रकट करना है, एक अनुकरणीय प्रणाली के रूप में एक संयंत्र प्रतिलेखन कारक WRKY डोमेन प्रोटीन का उपयोग करना। ऐसा करने के लिए, दोनों परमाणुवादी और मोटे दानेदार आणविक गतिशीलता सिमुलेशन के साथ-साथ व्यापक कम्प्यूटेशनल नमूने लागू किए गए हैं।

Abstract

डीएनए के साथ प्रतिलेखन कारक (टीएफ) प्रोटीन का एक आयामी (1-डी) स्लाइडिंग आनुवंशिक विनियमन के लिए लक्ष्य डीएनए साइट का पता लगाने के लिए टीएफ के प्रसार को सुविधाजनक बनाने के लिए आवश्यक है। टीएफ स्लाइडिंग या डीएनए पर कदम रखने के बेस-पेयर (बीपी) रिज़ॉल्यूशन का पता लगाना अभी भी प्रयोगात्मक रूप से चुनौतीपूर्ण है। हमने हाल ही में डीएनए के साथ एक छोटे से WRKY डोमेन TF प्रोटीन के सहज 1-bp कदम पर कब्जा करने वाले ऑल-एटम आणविक गतिशीलता (एमडी) सिमुलेशन का प्रदर्शन किया है। इस तरह के सिमुलेशन से प्राप्त 10 μs WRKY कदम पथ के आधार पर, यहां प्रोटोकॉल से पता चलता है कि 1-बीपी प्रोटीन स्टेपिंग के लिए मार्कोव स्टेट मॉडल (एमएसएम) का निर्माण करके, टीएफ-डीएनए सिस्टम के अधिक व्यापक संरचनात्मक नमूनों का संचालन कैसे किया जाए, जिसमें एमएसएम निर्माण के लिए सूक्ष्म और मैक्रो-राज्यों की विभिन्न संख्याओं का परीक्षण किया गया है। संरचनात्मक आधार के साथ डीएनए के साथ टीएफ प्रोटीन की प्रक्रियात्मक 1-डी प्रसारात्मक खोज की जांच करने के लिए, प्रोटोकॉल आगे दिखाता है कि सिस्टम के लंबे समय तक पैमाने की गतिशीलता का नमूना लेने के लिए मोटे-दाने (सीजी) एमडी सिमुलेशन का संचालन कैसे किया जाए। इस तरह के सीजी मॉडलिंग और सिमुलेशन विशेष रूप से दसियों माइक्रोसेकंड के ऊपर टीएफ प्रोटीन के प्रोसेसिव प्रसार गतियों पर प्रोटीन-डीएनए इलेक्ट्रोस्टैटिक प्रभावों को प्रकट करने के लिए उपयोगी हैं, उप-माइक्रोसेकंड की तुलना में माइक्रोसेकंड प्रोटीन स्टेपिंग गतियों की तुलना में सभी-परमाणु सिमुलेशन से पता चला है।

Introduction

प्रतिलेखन कारक (टीएफ) जीन प्रतिलेखन और संबंधित गतिविधियों को बांधने और विनियमित करने के लिए लक्ष्य डीएनए की खोजकरते हैं। तीन आयामी (3 डी) प्रसार के अलावा, टीएफ के सुविधाजनक प्रसार को लक्ष्य डीएनए खोज के लिए आवश्यक होने का सुझाव दिया गया है, जिसमें प्रोटीन एक-आयामी (1 डी) डीएनए के साथ स्लाइड या हॉप भी कर सकते हैं, या डीएनए 2,3,4,5,6,7 पर अंतर-खंडीय हस्तांतरण के साथ कूद सकते हैं

हाल के एक अध्ययन में, हमने एक संयंत्र टीएफ पर दसियों माइक्रोसेकंड (μs) ऑल-एटम संतुलन आणविक गतिशीलता (एमडी) सिमुलेशन का आयोजन किया है - डीएनए8 पर WRKY डोमेन प्रोटीन। माइक्रोसेकंड के भीतर पॉली-ए डीएनए पर WRKY का एक पूरा 1-bp कदम कैप्चर किया गया है। डीएनए नाली और हाइड्रोजन बांड (एचबी) ब्रेकिंग-रिफॉर्मिंग गतिशीलता के साथ प्रोटीन के आंदोलनों को देखा गया है। जबकि इस तरह के प्रक्षेपवक्र एक नमूना पथ का प्रतिनिधित्व करता है, एक समग्र प्रोटीन कदम परिदृश्य अभी भी कमी है। यहां, हम दिखाते हैं कि निर्मित मार्कोव राज्य मॉडल (एमएसएम) के साथ शुरू में कैप्चर किए गए प्रोटीन स्टेपिंग पथ के आसपास कम्प्यूटेशनल नमूनों का विस्तार कैसे किया जाए, जिसे विभिन्न प्रकार के बायोमोलेक्यूलर सिस्टम का अनुकरण करने के लिए व्यापक रूप से लागू किया गया है, जिसमें पर्याप्त संरचनात्मक परिवर्तन और समय-पैमाने पर पृथक्करणशामिल हैं 9,10,11,12,13,14,15,16, 17,18,19. उद्देश्य एक चक्रीय चरण के लिए डीएनए के साथ टीएफ प्रोटीन प्रसार के संरचनात्मक पहनावा और मेटा-स्थिर राज्यों को प्रकट करना है।

जबकि उपरोक्त एमडी सिमुलेशन डीएनए पर 1 बीपी के लिए प्रोटीन आंदोलनों के परमाणु संकल्प का खुलासा करता है, एक ही उच्च-रिज़ॉल्यूशन पर डीएनए के साथ टीएफ के लंबे समय तक संसाधित प्रसार की संरचनात्मक गतिशीलता शायद ही सुलभ है। अवशेष स्तर पर मोटे दाने (सीजी) एमडी सिमुलेशन का संचालन हालांकि तकनीकी रूप से पहुंच योग्य है। सीजी सिमुलेशन समय पैमाने को प्रभावी ढंग से परमाणु सिमुलेशन 20,21,22,23,24,25,26,27,28,29 की तुलना में दसियों या सैकड़ों गुना अधिक समय तक बढ़ाया जा सकता है यहां, हम ताकाडा लैब30 द्वारा विकसित कैफेमोल सॉफ़्टवेयर को लागू करके किए गए सीजी सिमुलेशन दिखाते हैं।

वर्तमान प्रोटोकॉल में, हम पॉली-ए डीएनए और एमएसएम निर्माण के साथ WRKY डोमेन प्रोटीन के परमाणु सिमुलेशन को पहले प्रस्तुत करते हैं, जो डीएनए के साथ केवल 1 बीपी के लिए प्रोटीन स्टेपिंग गतियों का नमूना लेने पर ध्यान केंद्रित करते हैं। फिर हम एक ही प्रोटीन-डीएनए प्रणाली के सीजी मॉडलिंग और सिमुलेशन प्रस्तुत करते हैं, जो डीएनए के साथ दसियों बीपीएस पर प्रोटीन प्रोसेसिव प्रसार के लिए कम्प्यूटेशनल नमूने का विस्तार करते हैं।

यहां, हम GROMACS 31,32,33 सॉफ़्टवेयर का उपयोग एमडी सिमुलेशन और MSMbuilder34 का संचालन करने के लिए नमूना संरचनात्मक स्नैपशॉट के लिए MSM का निर्माण करने के लिए करते हैं, साथ ही साथ बायोमोलेक्यूल्स की कल्पना करने के लिए VMD35 का उपयोग करते हैं। प्रोटोकॉल की आवश्यकता है कि उपयोगकर्ता ऊपर दिए गए सॉफ़्टवेयर को स्थापित करने और कार्यान्वित करने में सक्षम हो। कैफेमोल30 सॉफ़्टवेयर की स्थापना और कार्यान्वयन तब सीजी एमडी सिमुलेशन के संचालन के लिए आवश्यक है। प्रक्षेपवक्र और विज़ुअलाइज़ेशन के आगे के विश्लेषण भी VMD में आयोजित किए जाते हैं।

Subscription Required. Please recommend JoVE to your librarian.

Protocol

1. परमाणु एमडी सिमुलेशन से मार्कोव राज्य मॉडल (MSM) का निर्माण

  1. सहज प्रोटीन कदम मार्ग और प्रारंभिक संरचनाओं संग्रह
    1. पहले से प्राप्त 10-μs ऑल-एटम एमडी प्रक्षेपवक्र8 का उपयोग करें ताकि 10000 फ्रेम को "फॉरवर्ड" 1-बीपी स्टेपिंग पथ (यानी, प्रत्येक नैनोसेकंड के लिए एक फ्रेम) से समान रूप से निकाला जा सके। फ्रेम की कुल संख्या को सभी प्रतिनिधि संरचनाओं को शामिल करने के लिए पर्याप्त रूप से बड़ा होना चाहिए।
    2. फ़ाइल > सहेजें निर्देशांक, प्रकार प्रोटीन या चयनित परमाणुओं में न्यूक्लिक करें बॉक्स में फ़्रेम चुनें और फ़्रेम्स बॉक्स में फ़्रेम चुनें, क्लिक करके VMD में 10000 फ़्रेम के साथ संक्रमण पथ तैयार करें, आवश्यक फ़्रेम प्राप्त करने के लिए सहेजें क्लिक करें।
      नोट: एक पहले से प्राप्त 10 μs सभी परमाणु एमडी सिमुलेशन प्रक्षेपवक्र (कहा जाता है "आगे कदम प्रक्षेपवक्र" यहाँ) WRKY एक 34-bp सजातीय पॉली-ए डीएनए8 पर 1-bp दूरी कदम के लिए प्रारंभिक पथ के रूप में इस्तेमाल किया गया था आगे संरचनात्मक नमूने शुरू करने के लिए. ध्यान दें कि अधिकांश प्रथाओं में, हालांकि, एक प्रारंभिक पथ का निर्माण किया जाता है, जो संचालित या लक्षित एमडी सिमुलेशन का प्रदर्शन करके, या सामान्य पथ-पीढ़ी के तरीकों को लागू करके, आदि 36,37,38,39 है।
    3. संदर्भ डीएनए (क्रिस्टल संरचना से) के लंबे अक्ष को एक्स-अक्ष पर संरेखित करें, और आगे के डेटा विश्लेषण की सुविधा के लिए समन्वय स्थान के मूल में पूर्ण 34-बीपी डीएनए के द्रव्यमान (COM) के प्रारंभिक केंद्र को सेट करें। ऐसा करने के लिए, VMD में Tk कंसोल > एक्सटेंशन क्लिक करें, और Tk कंसोल आदेश विंडो में लिखें:
      स्रोत rotate.tcl
      TCL स्क्रिप्ट अनुपूरक फ़ाइल 3 में पाया जा सकता है।
    4. फिर केंद्रीय 10 बीपी डीएनए (ए 14 से 23 और टी 14 'से 23') को क्रिस्टल संरचना40 से संरेखित करके प्रोटीन बैकबोन की रूट-माध्य-वर्ग-दूरी (आरएमएसडी) की गणना करें, और आरएमएसडी सिस्टम के ज्यामितीय उपायों का प्रतिनिधित्व करता है ( चित्रा 1 ए देखें)। VMD > एक्सटेंशन > विश्लेषण > RMSD प्रक्षेपवक्र उपकरण और प्रकार न्यूक्लिक और अवशेष 14 से 23 और 46 से 55 परमाणु चयन बॉक्स में क्लिक करके ऐसा करें, संरेखित करें क्लिक करें और उसके बाद RMSD मानों की गणना करने के लिए RMSD बॉक्स।
    5. कमांड टाइप करके MATLAB में y-z विमान पर DNA Π(t) के चारों ओर प्रोटीन की घूर्णी डिग्री की गणना करें
      rad2deg (atan(z/y))
      प्रारंभिक कोणीय स्थिति के साथ Π(0) = 0 के रूप में परिभाषित किया गया है, जैसा कि पहले8 आयोजित किया गया था।
    6. K-meansविधियों 42,43,44 का उपयोग करने के लिए MATLAB41 में निम्न आदेश टाइप करें और 10000 संरचनाओं को टाइप करके 25 क्लस्टर्स में वर्गीकृत करें:
      [idx, C]=kmeans(X, 25)
      यहाँ X RMSD का एक 2D मैट्रिक्स और डीएनए पर WRKY का घूर्णी कोण है। आगे एमडी सिमुलेशन के लिए इन 25 क्लस्टर केंद्रों की संरचनाओं को इकट्ठा करें।
      नोट: चूंकि डीएनए के सापेक्ष प्रोटीन आरएमएसडी का नमूना लगभग 25 Å की एक सीमा को कवर करता है, इसलिए हम 25 क्लस्टर प्रति एंगस्ट्रॉम में एक क्लस्टर रखने के लिए चुनते हैं।
  2. एमडी सिमुलेशन और सिमुलेशन सेटिंग्स के 1वें दौर का आयोजन
    1. GROMACS 5.1.2 सॉफ़्टवेयर32 parmbsc1 बल फ़ील्ड45 के तहत और शेल में अनुपूरक फ़ाइल 2 से buildsystem.sh फ़ाइल का उपयोग करके 25 संरचनाओं के लिए परमाणुवादी सिस्टम बनाएँ।
    2. एनपीटी पहनावा के तहत इन 25 प्रणालियों के लिए 60-एनएस एमडी सिमुलेशन का संचालन करें, जिसमें शेल में निम्नलिखित कमांड टाइप करके 2 एफएस का समय चरण होता है:
      gmx_mpi grompp -f md.mdp -c npt.gro -p topol.top -o md.tpr
      gmx_mpi mdrun -deffnm md
  3. क्लस्टरिंग 1सेंट गोल प्रबंध निदेशक प्रक्षेपवक्र
    1. खोल में टाइप करके प्रत्येक सिमुलेशन प्रक्षेपवक्र के पहले 10 एनएस को निकालें:
      gmx_mpi trjcat -f md.xtc -b 10000 -e 600000 -o newtraj.xtc
      और क्लस्टरिंग के लिए 25 × 50 एनएस trajectories से conformations इकट्ठा करने के लिए बाद में और अधिक व्यापक नमूने (2दौर एमडी सिमुलेशन) के लिए इनपुट संरचनाओं को तैयार करने के लिए।
      नोट:: प्रारंभिक पथ से प्रभाव को कम करने के लिए और स्थानीय संतुलन की अनुमति देने के लिए, सिमुलेशन की प्रारंभिक अवधि के 10-ns निकाल दिए गए थे।
    2. समय-स्वतंत्र घटक विश्लेषण (टीआईसीए) 46,47,48 प्रक्षेपण के लिए इनपुट पैरामीटर के रूप में प्रोटीन और डीएनए के बीच दूरी जोड़े चुनें। ऐसा करने के लिए GROMACS में make_ndx आदेश का उपयोग करें:
      gmx_mpi make_ndx -f इनपुट.pdb -o index.ndx
      नोट: यहाँ, प्रोटीन CA परमाणुओं और भारी परमाणुओं (NH1, NH2, OH, NZ, NE2, ND2) अवशेषों के अवशेष Y119, K122, K125, R131, Y133, Q146, K144, R135, W116, R117, Y134, K118, Q121 जो डीएनए न्यूक्लियोटाइड के साथ हाइड्रोजन बांड (HBs) बना सकते हैं, जो डीएनए न्यूक्लियोटाइड के साथ हाइड्रोजन बांड (HBs) बना सकते हैं, जो O11P के साथ हाइड्रोजन बांड (HBs) का चयन किया गया था। T19-23)। चयनित अमीनो एसिड या तो डीएनए के साथ स्थिर एचबी या नमक पुल बना सकते हैं।
    3. अनुक्रमणिका.ndx फ़ाइल से किसी नई पाठ फ़ाइल (अनुक्रमणिका.dat) में उपरोक्त चयनित परमाणु अनुक्रमणिका की प्रतिलिपि बनाएँ. पूरक फ़ाइल 1 generate_atom_indices.py से पायथन स्क्रिप्ट द्वारा इन परमाणुओं के बीच जोड़ी जानकारी प्राप्त करें और प्रकार:
      python2.6 generate_atom_indices.py सूचकांक.dat > AtomIndices.txt
      यह प्रोटीन और डीएनए के बीच 415 दूरी जोड़े उत्पन्न करता है।
    4. MSMbuilder आदेश विंडो में निम्न आदेश टाइप करके प्रत्येक प्रक्षेपवक्र से 415 दूरी जोड़े की गणना करें:
      msmb AtomPairsFeaturizer --pair_features बाहर --pair_indices AtomIndices.txt --शीर्ष संदर्भ.pdb --trjs "trajectories pair_features/
    5. टाइप करके पहले 2 समय-स्वतंत्र घटकों (tICs) या वैक्टर पर डेटा के आयाम को कम करने के लिए tICA का संचालन करें:
      msmb tICA -i .. /tica_rc_a/tmp/ -o tica_results --n_components 2 --lag_time 10 --गामा 0.05 -t tica_results.h5
      नोट: tICA एक आयाम-कमी विधि है जो समीकरण द्वारा सिमुलेशन सिस्टम की स्वतंत्रता की सबसे धीमी आराम डिग्री निर्धारित करने के लिए समय-lagged सहसंबंध मैट्रिक्स Equation 1 के eigenue की गणना करता है:
      Equation 2
      जहां Xi(t) समय t पर i-th अभिक्रिया निर्देशांक का मान है, और Xj(tt) समय tt पर j-th अभिक्रिया निर्देशांक का मान है। Equation 3 Xi(t) और X j(t + Π t) के उत्पाद का अपेक्षा मान है। स्वतंत्रता की सबसे धीमी आराम की डिग्री के साथ दिशाएं उपरोक्त समय-लैग्ड सहसंबंध मैट्रिक्स के सबसे बड़े eigens के अनुरूप हैंEquation 1। यहां, 2 टीएमसी हमारे एमएसएम निर्माण (बाद में संबोधित) पर तीन मैक्रोस्टेट्स को अलग करने के लिए एक न्यूनतम सेट प्रतीत होते हैं। कोई भी सामान्यीकृत मैट्रिक्स रेले भागफल (GMRQ) स्कोर49 की गणना कर सकता है, उदाहरण के लिए, उपयोग किए जाने वाले घटकों के इष्टतम सेट का पता लगाने के लिए।
    6. K-center43,44 विधि द्वारा 100 क्लस्टर्स में प्रक्षेपित डेटासेट क्लस्टर करने के लिए MSMbuilder में आदेश का उपयोग करें (चित्र 1B देखें):
      msmb KCenters -i ./tica_results.h5 -o kcenters_output -t kcenters_output --n_clusters 100.
      एमडी सिमुलेशन के 2nd दौर के लिए प्रारंभिक संरचना के रूप में प्रत्येक क्लस्टर की केंद्र संरचना का चयन करें। सिम्युलेटेड 100 संरचनाओं की सिमुलेशन जानकारी को बनाए रखें, जिसमें पदों, तापमान, दबाव, आदि शामिल हैं, वेगों को छोड़कर।
      नोट: 25 सिमुलेशन के पहले दौर के बाद, प्रारंभिक पथ की स्मृति को कम कर दिया गया है, इसलिए हम अधिक क्लस्टर उत्पन्न करते हैं, उदाहरण के लिए, 100 क्लस्टर, दूसरे दौर में, काफी हद तक संरचनात्मक नमूने का विस्तार करने के लिए।
  4. 2दौर व्यापक एमडी सिमुलेशन का संचालन
    1. सभी परमाणुओं पर यादृच्छिक प्रारंभिक वेग लागू करने के बाद इन 100 प्रारंभिक संरचनाओं से शुरू होने वाले 60-एनएस एमडी सिमुलेशन का संचालन करें। एमडीपी फ़ाइल में वेग पीढ़ी को चालू करके यादृच्छिक प्रारंभिक वेग जोड़ें, यानी, md.mdp फ़ाइल को बदलना gen_vel = नहीं gen_vel = हाँ करने के लिए।
    2. चरण 1.3.1 में वर्णित के रूप में प्रत्येक सिमुलेशन के पहले 10 एनएस निकालें, MSM का निर्माण करने के लिए समान रूप से 100 × 50 एनएस प्रक्षेपवक्र से 2,500,000 स्नैपशॉट एकत्र करें।
      नोट: ध्यान दें कि बाद के macrostates निर्माण में, एक विशेष रूप से कम आबादी (~ 0.2%, X-Π विमान के तल पर) के साथ ऑफ-पाथ राज्यों की एक छोटी संख्या पाई गई थी। इन ऑफ-पाथ राज्यों को एक मैक्रोस्टेट के रूप में वर्गीकृत किया जाता है जब मैक्रोस्टेट्स की कुल संख्या 3 से 6 (चित्रा 2 बी) के रूप में सेट की जाती है। चूंकि इतनी कम आबादी वाले मैक्रोस्टेट में केवल 3 प्रक्षेपवक्र शामिल हैं, जिन्हें अंत में हटा दिया गया था, इसलिए इस प्रोटोकॉल में दिखाए गए परिणाम वास्तव में 97 × 50 एनएस प्रक्षेपवक्रों से प्राप्त किए गए थे, जिसमें कुल 2,425,000 फ्रेम या स्नैपशॉट थे।
  5. क्लस्टरिंग 2दौर एमडी trajectories
    1. 2 दौर trajectories के लिए tICA आचरण के रूप में पहले किया. MSMbuilder में टाइप करें:
      msmb tICA -i .. /tica_rc_a/tmp/ -o tica_results --n_components 2 --lag_time 10 --गामा 0.05 -t tica_results.h5
    2. सहसंबंध विलंब समय के लिए पैरामीटर को मान्य करने के लिए निहित टाइमस्केल की गणना करें और microstates संख्याओं ( चित्रा 1C देखें),
      Equation 4
      जहां π संक्रमण प्रायिकता मैट्रिक्स (TPM) के निर्माण के लिए उपयोग किए जाने वाले अंतराल-समय का प्रतिनिधित्व करता है; μk(π) TPM के kth eigenue को π के अंतराल समय के तहत दर्शाता है। इस पायथन BuildMSMsAsVaryLagTime.py -d के लिए अनुपूरक फ़ाइल 1 से पायथन स्क्रिप्ट का उपयोग करें .. / -f .. /trajlist_num -i 50 -m 1000 -t 10 -n 20 -s 500.
    3. ऊपर उपयोग किए गए पैरामीटर को बदलकर अंतराल-समय π और microstates संख्या को बदलें:
      अजगर BuildMSMsAsVaryLagTime.py -d .. / -f .. /trajlist_num -i 50 -m 1000 -t 5 10 20 30 40 -n 20 -s 20 200 400 500 800 2000
      नोट:: सिस्टम मार्कोवियन के रूप में माना जाता है जब निहित टाइमस्केल वक्र समय-पैमाने पर पृथक्करण के साथ स्तर बंद करने के लिए शुरू होता है। उसके बाद, सहसंबंध देरी समय के रूप में Dt का चयन करें, और अंतराल समय जहां निहित टाइमस्केल MSM बनाने के लिए बंद स्तर के लिए शुरू होता है।
    4. तदनुसार, राज्यों की एक तुलनात्मक रूप से बड़ी (लेकिन बहुत बड़ी नहीं) संख्या का चयन करें, एन = 500, और एक तुलनात्मक रूप से कम सहसंबंध देरी समय Πt = 10 एनएस। अंतराल समय MSM बनाने के लिए π = 10 ns पाया गया था।
    5. आदेश का उपयोग करके 500 क्लस्टर्स में conformations वर्गीकृत करें ( चित्र1D देखें):
      msmb KCenters -i ./tica_results.h5 -o kcenters_output -t kcenters_output --n_clusters 500
  6. MSM निर्माण
    1. 500 microstates को 3-6 macrostates में गांठ ें ताकि macrostates की संख्या का पता लगाया जा सके जो MSMbuilder में PCCA + एल्गोरिथ्म50 के अनुसार सबसे अच्छा सूट करते हैं, पूरक फ़ाइल 1 पायथन msm_lumping_usingPCCAplus.py में पायथन स्क्रिप्ट का उपयोग करके। biomolecules के सबसे आवश्यक संरचनात्मक परिवर्तनों के लिए मॉडल के एक कम गतिज नेटवर्क की पहचान करें, macrostates की एक छोटी संख्या का निर्माण करके, यानी, गतिज रूप से17,51 के नीचे वर्णित के रूप में सैकड़ों microstates lumping पर।
    2. एक्स (डीएनए लंबी धुरी के साथ प्रोटीन आंदोलन) और प्रत्येक मैक्रोस्टेट के लिए डीएनए के साथ प्रोटीन के घूर्णी कोण के लिए उच्च आयामी संरचनाओं को मैप करें जैसा कि चरण 1.1.3 और 1.1.4 में वर्णित है (उदाहरण के लिए, बहुत कम आबादी वाला कोई राज्य 1% <; चित्रा 2 सी देखें)। फिर उन 3 मैक्रोस्टेट्स को ढूंढें जो सिस्टम (चित्रा 1E) का सबसे अच्छा प्रतिनिधित्व करते हैं। डीएनए के साथ प्रोटीन के आंदोलन और डीएनए के चारों ओर प्रोटीन रोटेशन कोण के स्नैपशॉट के लिए चित्रा 2 डी देखें।
      नोट: पिछले काम में 10 μs सहज प्रोटीन आगे कदम पथ उत्पन्न, हम अतिरिक्त रूप से 5 x 4 μs संतुलन एमडी सिमुलेशन आयोजित करने के लिए मामूली नमूने का विस्तार. हमने मूल आगे के पथ का मानचित्रण दिखाया ( चित्रा 2A बाएं देखें) और आगे के पथ पर आगे 4-μs नमूना प्रक्षेपवक्र पहले से आयोजित किए गए ( चित्रा 2A दाएँ देखें)8। मूल 100 × 50 एनएस का मानचित्रण ( चित्रा 2 बी बाएं देखें)8 और इस काम में उपयोग किए जाने वाले 97 × 50 एनएस प्रक्षेपवक्र दिखाए गए हैं ( चित्र 2 बी दाएं देखें)।
  7. माध्य प्रथम मार्ग समय की गणना (MFPT)
    1. MC के समय चरण के रूप में निर्धारित 10 ns के अंतराल समय के साथ 500 माइक्रोस्टेट MSM के TPM पर आधारित पांच 10-ms मोंटे कार्लो (MC) प्रक्षेपवक्रों का संचालन करें। पूरक फ़ाइल 1 पायथन पायथन mfpt_msm3.py में पायथन स्क्रिप्ट द्वारा मैक्रोस्टेट्स (चित्र3) की प्रत्येक जोड़ी के बीच MFPT52 की गणना करें।
    2. MFPT के औसत और मानक त्रुटि की गणना अनुपूरक फ़ाइल 2 में बैश फ़ाइल का उपयोग कर, प्रकार:
      sh mfpt_analysis.bash

2. लंबे समय तक गतिशीलता का नमूना करने के लिए मोटे दाने (सीजी) सिमुलेशन का संचालन

  1. CafeMol 3.0 सॉफ़्टवेयर30 का उपयोग करके एक CG सिमुलेशन का संचालन करें। इनपुट संरचनाओं, सिमुलेशन पैरामीटर, आउटपुट फ़ाइलों, आदि सहित एक एक्सटेंशन .inp के साथ इनपुट कॉन्फ़िगरेशन फ़ाइल में निर्दिष्ट CG सिमुलेशन सेटिंग्स देखें. CG सिमुलेशन को चलाने के लिए टर्मिनल पर निम्न आदेश टाइप करें:
    कैफेमोल XXX.inp
  2. इनपुट फ़ाइल में निम्न ब्लॉक निर्दिष्ट करें, जिसमें प्रत्येक ब्लॉक लेबल < and ending with >>>> से प्रारंभ होता है.
    1. कार्य निर्देशिकाओं और इनपुट/आउटपुट फ़ाइल संग्रह पथ को निर्दिष्ट करने के लिए फ़ाइल नाम ब्लॉक (आवश्यक) सेट करें. इन सिमुलेशन के लिए filenames ब्लॉक के लिए निम्न लिखें:
      <<<< फ़ाइल नाम
      पथ = XXXXX (कार्य पथ)
      फ़ाइल नाम = wrky (आउटपुट फ़ाइल नाम)
      आउटपुट psf pdb फिल्म dcd rst
      path_pdb = XXXXX (इनपुट मूल संरचना पथ)
      path_ini = XXXXX (इनपुट प्रारंभिक संरचना पथ)
      path_natinfo = XXXXX (मूल जानकारी फ़ाइल पथ)
      path_para = XXXXX (पैरामीटर फ़ाइलें पथ)
      >>>>
      नोट: जैसा कि गो-मॉडल53 का उपयोग सीजी मॉडलिंग में किया जाता है, यानी, प्रोटीन देशी संरचना के लिए पक्षपाती होगा, इसलिए किसी को मॉडलिंग संरचना को मूल संरचना के रूप में सेट करने की आवश्यकता है। यहां, इनपुट क्रिस्टल संरचना को देशी संरचना के रूप में सेट किया गया था।
    2. सिमुलेशन के चल रहे मोड को परिभाषित करने के लिए कार्य नियंत्रण ब्लॉक (आवश्यक) सेट करें। निम्न आदेश टाइप करें:
      <<<< job_cntl
      i_run_mode = 2 (= 2 स्थिर तापमान सिमुलेशन)
      i_simulate_type = 1 (= 1 लैंगविन गतिशीलता)
      i_initial_state = 2 (= 2 का अर्थ है कि प्रारंभिक कॉन्फ़िगरेशन मूल कॉन्फ़िगरेशन है)
      >>>>
      निरंतर तापमान Langevin गतिशीलता सिमुलेशन का चयन करें।
    3. इनपुट संरचनाओं के लिए जानकारी निर्धारित करने के लिए इकाई और राज्य ब्लॉक (आवश्यक) सेट करें। निम्न आदेश टाइप करें:
      <<<< unit_and_state
      i_seq_read_style = 1 (= 1 का अर्थ है पीडीबी फ़ाइल से अनुक्रमों को पढ़ना)
      i_go_native_read_style = 1 (= 1 का अर्थ है कि मूल संरचना पीडीबी फ़ाइल से है)
      1 प्रोटीन प्रोटीन.pdb (इकाई और राज्य molecular_type native_structure)
      2-3 डीएनए डीएनए.pdb (इकाई और राज्य molecular_type native_structure)
      >>>>
      नोट: प्रारंभिक इनपुट संरचना फ़ाइलें (प्रोटीन.pdb और डीएनए.pdb यहां) की आवश्यकता है। संरचनाओं को पीडीबी प्रारूप में लिखा गया है। यहां दो पीडीबी फाइलों की आवश्यकता है: एक प्रोटीन संरचना फ़ाइल है जिसमें WRKY (इकाई 1) के भारी परमाणु निर्देशांक होते हैं, और दूसरा 200-bp डबल-फंसे (ds) डीएनए (यूनिट 2-3) के निर्देशांक हैं। प्रोटीन को शुरू में डीएनए से 15 Å दूर रखा जाता है।
    4. energy_function ब्लॉक में परिभाषित ऊर्जा फ़ंक्शन ब्लॉक (आवश्यक) सेट करें। निम्न आदेश टाइप करें:
      <<<< energy_function
      स्थानीय (1) L_GO
      स्थानीय (2-3) L_DNA2
      NLOCAL(1/1) जाओ EXV ELE
      NLOCAL(2-3/2-3) ELE DNA
      NLOCAL(1/2-3) EXV ELE
      i_use_atom_protein = 0
      i_use_atom_dna = 0
      i_para_from_ninfo = 1
      i_triple_angle_term = 2
      >>>>
      नोट: सीजी सिमुलेशन में, प्रोटीन को गो-मॉडल53 द्वारा मोटे-दानेदार किया जाता है, जिसमें प्रत्येक अमीनो एसिड को सीजी कण द्वारा दर्शाया जाता है जो इसकी Cα स्थिति में रखा जाता है। प्रोटीन संरचना तब देशी संरचना, या क्रिस्टल संरचना की ओर पक्षपाती होगी, यहां गो पोटेंशियल (चित्रा 4 ए बाएं) के तहत। डीएनए को 3SPN.2 मॉडल54 द्वारा वर्णित किया गया है, जिसमें प्रत्येक न्यूक्लियोटाइड को 3 सीजी कण एस, पी, एन द्वारा दर्शाया गया है, जो क्रमशः चीनी, फॉस्फेट और नाइट्रोजनस बेस के अनुरूप है (चित्रा 4 ए दाएं)। इलेक्ट्रोस्टैटिक और वीडीडब्ल्यू इंटरैक्शन को विभिन्न श्रृंखलाओं के बीच माना जाता है। सीजी सिमुलेशन में प्रोटीन और डीएनए के बीच इलेक्ट्रोस्टैटिक इंटरैक्शन डेबाई-ह्यूकेल संभावित55 द्वारा अनुमानित हैं। VdW प्रतिकारक ऊर्जा गो मॉडल के रूप में एक ही रूप लेता है।
    5. सिमुलेशन जानकारी को परिभाषित करने के लिए md_information ब्लॉक (आवश्यक) सेट करें। निम्न आदेश टाइप करें:
      <<<< md_information
      n_step_sim = 1
      n_tstep(1) = 5000000000
      tstep_size = 0.1
      n_step_save = 1000
      n_step_neighbor = 100
      i_com_zeroing = 0
      i_no_trans_rot = 0
      tempk = 300.0
      n_seed = -1
      >>>>
      n_tstep सिमुलेशन चरण है। प्रत्येक एमडी चरण की समय लंबाई के रूप में tstep_size सेट करें, प्रत्येक सीजी कैफेमोल समय चरण लगभग 200 एफएस30 है, इसलिए यहां प्रत्येक एमडी चरण सिद्धांत रूप में 200 × 0.1 एफएस है। प्रत्येक 100 एमडी चरणों (n_step_neighbor = 100) पड़ोसी सूची अद्यतन करें। सिमुलेशन तापमान को 300 K पर सेट करें Berendsen thermostat56 के साथ प्रोटीन संरचना को अद्यतन करने के लिए वेग-प्रकार वर्लेट एल्गोरिथ्म को नियोजित करके तापमान को नियंत्रित करें।
      नोट:: n_step_sim जाओ मॉडल आधारित क्षमता, या ऊर्जा वक्र की स्थानीय न्यूनतम संख्या की बेसिन संख्या है। एक बहु-बेसिन क्षमता प्रोटीन संरचना को विभिन्न संरचनाओं के लिए पक्षपाती करने की अनुमति देती है ताकि प्रोटीन संरचना एक स्थानीय न्यूनतम से दूसरे में बदल सके। यहां केवल एकल बेसिन गो मॉडल का उपयोग किया जाता है, जिसका अर्थ है कि सिमुलेशन में प्रोटीन के लिए केवल एक पक्षपाती संरचना (क्रिस्टल संरचना) है। इस बीच, चूंकि सीजी संदर्भ में मॉडलिंग की गई कोई प्रोटीन-डीएनए हाइड्रोजन बॉन्डिंग इंटरैक्शन, आदि नहीं है, आणविक गतियों को और भी तेजी से नमूना लिया जा सकता है, यानी, परमाणु सिमुलेशन की तुलना में > 10 गुना।
    6. इलेक्ट्रोस्टैटिक ब्लॉक सेट करें (केवल तब आवश्यक होता है जब इलेक्ट्रोस्टैटिक इंटरैक्शन का उपयोग किया जाता है) क्योंकि इलेक्ट्रोस्टैटिक इंटरैक्शन को विभिन्न श्रृंखलाओं के बीच माना जाता है, इसलिए टाइप करके इलेक्ट्रोस्टैटिक इंटरैक्शन के लिए पैरामीटर को परिभाषित करने के लिए इस ब्लॉक का उपयोग करें:
      <<<< इलेक्ट्रोस्टैटिक
      cutoff_ele = 10.0
      ionic_strength = 0.15
      >>>>
      इलेक्ट्रोस्टैटिक इंटरैक्शन में Debye लंबाई को 10 Å पर सेट करें, समाधान की स्थिति के अनुरूप। आयनिक शक्ति को 0.15 मीटर पर सेट करें, जैसा कि शारीरिक स्थिति में होता है।

Subscription Required. Please recommend JoVE to your librarian.

Representative Results

रोटेशन-युग्मित स्लाइडिंग या MSM निर्माण से WRKY के 1 bp कदम
डीएनए पर सभी प्रोटीन संरचनाओं को अनुदैर्ध्य आंदोलन एक्स और डीएनए के साथ प्रोटीन कॉम के रोटेशन कोण के लिए मैप किया जाता है ( चित्रा 3 ए देखें)। इन दो डिग्री का रैखिक युग्मन डीएनए पर WRKY डोमेन प्रोटीन के रोटेशन-युग्मित कदम को इंगित करता है। conformations आगे MSM में 3 macrostates (S1, S2, और S3) में संकुल किया जा सकता है। WRKY के आगे कदम तो macrostate संक्रमण S1->S2->S3 का अनुसरण करता है। S1 मॉडलिंग संरचना द्वारा शुरू की गई एक मेटास्टेबल स्थिति को संदर्भित करता है (WRKY-DNA कॉम्प्लेक्स40 की क्रिस्टल संरचना के आधार पर), ~ 6% की आबादी के साथ। ध्यान दें कि वर्तमान मॉडलिंग में, प्रारंभिक प्रोटीन संरचना को क्रिस्टल संरचना से अपनाया गया था जिसमें प्रोटीन विशिष्ट डब्ल्यू-बॉक्स डीएनए अनुक्रम40 के साथ बांधता है। इस तरह के एक मॉडलिंग प्रोटीन-पॉली ए-डीएनए कॉम्प्लेक्स इस प्रकार कदम या अंत में आराम से संरचनाओं (एस 3) की तुलना में कम अनुकूल प्रारंभिक संरचनाओं (एस 1) की ओर जाता है। फिर भी, कोई भी पा सकता है कि प्रोटीन-डीएनए इंटरफ़ेस पर हाइड्रोजन बांड (एचबी) एस 3 के केंद्र के पास ठीक हो जाते हैं क्योंकि एस 1 में केंद्र के पास ( चित्रा 3 बी देखें)। S1 राज्य में HBs को अच्छी तरह से बनाए रखा जाता है: A15 के साथ K125, R131, Q146 और Y133 A16 के साथ, K144 और A17 के साथ Y119, A18 के साथ R135 (चित्रा 3B शीर्ष बाईं ओर)। एस 3 1-बीपी प्रोटीन कदम के बाद एक मेटास्टेबल स्थिति को संदर्भित करता है, जिसमें लगभग सभी एचबी 1-बीपी दूरी (चित्रा 3 बी नीचे) के लिए स्थानांतरित हो जाते हैं, और संरचनाएं उच्चतम आबादी (63%) के साथ स्थिर दिखाई देती हैं। मध्यवर्ती राज्य S2 S1 और S3 को एक मध्यम-उच्च आबादी (~ 30%) के साथ जोड़ता है। हमने पाया कि R135 और K144 इस मध्यवर्ती अवस्था में काफी लचीले हैं और आमतौर पर वर्तमान न्यूक्लियोटाइड के साथ एचबी को तोड़ सकते हैं और अगले न्यूक्लियोटाइड (चित्रा 3 बी शीर्ष दाईं ओर) के साथ सुधार कर सकते हैं। कुल मिलाकर, WRKY प्रोटीन COM ~ 2.9 Å स्थानांतरित कर दिया और यहाँ 1 बीपी कदम रखने के लिए ~ 55 ° घुमाया। WRKY कदम के लिए दर-सीमित कदम S2->S3 है, जो अनिवार्य रूप से सामूहिक तोड़ने और HBs के सुधार की अनुमति देता है और औसतन ~ 7 μs की आवश्यकता होती है। इसके विपरीत, S1 से S2 ~ 0.06 μs या 60-ns (चित्रा 3B) के समय में बहुत तेजी से पारगमन कर सकता है, जिसमें मुख्य रूप से प्रोटीन COM उतार-चढ़ाव शामिल होते हैं (उदाहरण के लिए, डीएनए पर प्रोटीन ओरिएंटेशनल परिवर्तनों के कारण)।

सीजी मॉडल में प्रक्रियात्मक प्रसार के दौरान WRKY के एकल-स्ट्रैंड पूर्वाग्रह
हमारे हाल के अध्ययन में, हमने पाया कि WRKY डोमेन प्रोटीन dsDNA के एक स्ट्रैंड को प्राथमिकता से बांधता है, इससे कोई फर्क नहीं पड़ता कि 1-बीपी स्टेपिंग या स्थैतिक बाइंडिंग के दौरान; और एकल-स्ट्रैंड पूर्वाग्रह विशेष रूप से विशिष्ट डीएनए अनुक्रम बाध्यकारी 8 पर अत्यधिक प्रमुख हो जाताहै। इस बीच, यह स्पष्ट नहीं है कि डीएनए के साथ प्रोटीन के प्रक्रियात्मक प्रसार के दौरान ऐसी प्रवृत्ति बनी रहती है या नहीं। यहां हमने सीजी सिमुलेशन के माध्यम से संभावित स्ट्रैंड पूर्वाग्रह की जांच करने की कोशिश की। दिलचस्प बात यह है कि एक महत्वपूर्ण एकल-स्ट्रैंड डीएनए बाध्यकारी कॉन्फ़िगरेशन को संसाधित प्रसार के दौरान WRKY के सीजी सिमुलेशन में पहचाना गया है। यह देखने के लिए, प्रोटीन और डीएनए के बीच संपर्क संख्याओं की गणना संबंधित डीएनए स्ट्रैंड्स पर की गई थी ( चित्रा 4 बी देखें)। एक संपर्क पर विचार किया जाता है जब प्रोटीन सीजी कण और डीएनए सीजी पी (फॉस्फेट समूह) कण के बीच की दूरी 7 Å से छोटी होती है। प्रोटीन वास्तव में डीएनए स्ट्रैंड्स में से एक के लिए पूर्वाग्रह दिखाता है (उदाहरण के लिए, एक स्ट्रैंड के लिए ~ 4 संपर्क और दूसरे के लिए ~ 1 संपर्क), यानी, तब भी जब प्रोटीन-डीएनए इंटरफ़ेस पर एचबी जैसे विस्तृत इंटरैक्शन मॉडलिंग नहीं किए जाते हैं।

पसंदीदा डीएनए स्ट्रैंड, हालांकि, डीएनए के दो स्ट्रैंड्स के बीच समय-समय पर स्विच कर सकता है, जो डीएनए पर प्रोटीन के बाध्यकारी अभिविन्यास या कॉन्फ़िगरेशन पर निर्भर करता है। विशेष रूप से, प्रोटीन और डीएनए के संबंधित किस्में के बीच गठित संपर्क संख्या के अनुसार, यहां मुख्य रूप से 4 राज्य हैं (जैसा कि चित्र 4 बी, सी में 1, 2, 3 और 4 लेबल किया गया है)। राज्य 1 और 3 में, एक जस्ता-उंगली क्षेत्र -Y दिशा की ओर बांधता है, और पसंदीदा स्ट्रैंड नीला है। राज्य 2 और 3 में, जस्ता-उंगली क्षेत्र +Y दिशा की ओर बांधता है, और पसंदीदा स्ट्रैंड लाल हो जाता है। यह भी पाया गया है कि जस्ता-फिगर क्षेत्र डीएनए के साथ प्रमुख रूप से बातचीत करता है ( चित्रा 4 डी देखें)। इसलिए, जस्ता-उंगली क्षेत्र के साथ निकटता से बंधे डीएनए स्ट्रैंड वास्तव में पसंदीदा है। उपर्युक्त नमूने के अनुसार, इस प्रकार ऐसा प्रतीत होता है कि स्ट्रैंड पूर्वाग्रह बना रहता है लेकिन संसाधित प्रोटीन प्रसार के सीजी मॉडल में दो डीएनए स्ट्रैंड के बीच स्विच करता है।

सीजी सिमुलेशन में प्रोटीन व्यक्तिगत अवशिष्ट कदम
यह पहले हमारे सीजी सिमुलेशन से देखा गया था कि WRKY का कदम आकार विभिन्न डीएनए अनुक्रमों 8 पर भिन्न हो सकताहै। प्रोटीन COM सजातीय पॉली-ए डीएनए पर चरण 1 बीपी के लिए जाता है। जबकि 2 बीपी आवधिकता के साथ पॉली-एटी डीएनए पर, 2-बीपी स्टेपिंग का अनुपात बढ़ता है।

इसके अतिरिक्त, यहां हमने जांच की कि क्या व्यक्तिगत प्रोटीन अवशेष प्रोटीन-डीएनए इंटरफ़ेस पर तुल्यकालिक रूप से चलते हैं। हमने प्रत्येक 1000 टाइमस्टेप्स (चित्रा 5 ए) के लिए WRKY आकृति (WRKYGQK) में प्रत्येक अत्यधिक संरक्षित अवशेषों के चरण आकार की गणना की। प्रत्येक संरक्षित अवशेषों के अवशिष्ट कदम आकार इस प्रकार सीजी सिमुलेशन से मापा जा सकता है। परिणाम वास्तव में दिखाते हैं कि इन व्यक्तिगत अवशेषों के कदम के आकार पॉली-एटी या यादृच्छिक डीएनए अनुक्रमों (चित्रा 5 बी) की तुलना में पॉली-ए डीएनए पर अधिक सिंक्रनाइज़ होते हैं।

Figure 1
चित्र 1: संरचनाएं उत्पादन और माइक्रोस्टेट्स / मैक्रोस्टेट्स निर्माण। () डीएनए के चारों ओर प्रोटीन-डीएनए आरएमएसडी और प्रोटीन घूर्णी कोण पर मैप किया गया प्रारंभिक आगे का कदम पथ। प्रारंभिक चुने गए 25 संरचनाओं को लाल हलकों द्वारा लेबल किया गया है। (बी) 1st दौर से 100 संरचना क्लस्टर केंद्रों 25 x 50 एनएस एमडी सिमुलेशन trajectories दो उच्चतम eigenue tIC दिशा पर मैप किया. (सी) इनपुट के रूप में चयनित दूरी जोड़े का उपयोग करके टीआईसीए के माध्यम से एमएसएम निर्माण के लिए अंतराल-समय के एक समारोह के रूप में निहित टाइमस्केल के भूखंड। प्रत्येक सेट के लिए, MSM का निर्माण शीर्ष 2 tICs पर conformations प्रोजेक्ट करके किया गया था, जिसके बाद K-centers clustering के बाद 20 से 2000 microstates (बाएं से दाएं कॉलम तक) का उत्पादन करने के लिए 5 से 40 ns (ऊपर से नीचे की पंक्ति तक) से चुने गए TICA के लिए सहसंबंध देरी समय के साथ। () 500 माइक्रोस्टेट्स का निर्माण किया गया और () आगे निर्मित 3 मैक्रोस्टेट्स, जिनमें तदनुरूपी माइक्रोस्टेट केंद्रों को उच्चतम दो टीआईसी दिशा के साथ मैप किया गया है। कृपया इस आंकड़े का एक बड़ा संस्करण देखने के लिए यहाँ क्लिक करें.

Figure 2
चित्र 2: मैक्रोस्टेट्स का निर्माण। (A) प्रारंभिक आगे कदम पथ प्रक्षेपवक्र (बाएं) का मानचित्रण और डीएनए लंबी धुरी (X) के साथ द्रव्यमान (COM) आंदोलन के प्रोटीन केंद्र पर अतिरिक्त माइक्रो-सेकंड प्रक्षेपवक्र नमूने (दाएं) की एक छोटी संख्या के साथ और डीएनए के चारों ओर घूर्णी कोण (पहलेप्राप्त 8)। (बी) वर्तमान एमएसएम निर्माण में उपयोग किए जाने वाले मूल 100 × 50 एनएस प्रक्षेपवक्रों और 97 × 50 एनएस प्रक्षेपवक्रों का मानचित्रण। () निमत एमएसएम से 3-6 मैक्रोस्टेट्स और उनकी आबादी के निर्माण को व्यापक नमूना मानचित्रों पर लेबल किया गया है। (d) डीएनए के चारों ओर प्रोटीन आंदोलन एक्स और रोटेशन कोण क्रमशः दिखाए गए हैं। नमूना conformations अंतमें 3 macrostates में lumped हैं, लाल, नीले, और भूरे रंग के साथ क्रमशः macrostate 1, 2, और 3 के अनुरूप. कृपया इस आंकड़े का एक बड़ा संस्करण देखने के लिए यहाँ क्लिक करें.

Figure 3
चित्र 3: WRKY डोमेन प्रोटीन का MSM पॉली-ए डीएनए पर कदम रखता है। (A) डीएनए के संबंध में प्रोटीन COM आंदोलन X और घूर्णन कोण के निर्देशांक पर MD संरचनात्मक स्नैपशॉट का प्रक्षेपण। 3 मैक्रोस्टेट्स S1, S2, और S3 क्रमशः लाल, नीले और भूरे रंग में रंगे हुए हैं। (बी) निर्मित 3 मैक्रोस्टेट्स के प्रतिनिधि संरचनाएं और संक्रमण माध्य-प्रथम-पारित होने का समय (एमएफपीटी)। प्रोटीन और डीएनए के बीच प्रमुख हाइड्रोजन बांड दिखाए गए हैं। कृपया इस आंकड़े का एक बड़ा संस्करण देखने के लिए यहाँ क्लिक करें.

Figure 4
चित्र 4: मोटे अनाज (CG) मॉडल और CG मॉडल में प्रोटीन और DNA स्ट्रैंड के बीच गठित संपर्क। (A) प्रोटीन (बाएं) और DNA (दाएं) का मोटा-दाने। (बी) सिमुलेशन के साथ WRKY और प्रत्येक डीएनए स्ट्रैंड के बीच संपर्क संख्या। (सी) 4 संपर्क मोड के आणविक विचार। जस्ता-उंगली के पास प्रोटीन क्षेत्र भूरे रंग में रंगा हुआ है, और दूसरे क्षेत्र को हरे रंग में रंग दिया गया है। (d) डीएनए के साथ प्रत्येक प्रोटीन अमीनो एसिड की संपर्क संभावना। जब अमीनो एसिड के सीजी कण और किसी भी डीएनए सीजी कणों के बीच की दूरी 7 Å से छोटी होती है, तो अमीनो एसिड को डीएनए के संपर्क में माना जाता है। कृपया इस आंकड़े का एक बड़ा संस्करण देखने के लिए यहाँ क्लिक करें.

Figure 5
चित्र 5: WRKY आकृति में व्यक्तिगत प्रोटीन अमीनो एसिड के प्रसार चरण के आकार WRKY के रूप में डीएनए के साथ आगे बढ़ रहे हैं। (A) परमाणु संरचना (बाएं) में अत्यधिक संरक्षित अवशेष (WRKYGQK) और मोटे दाने (दाएं) के बाद। (बी) डीएनए के विभिन्न अनुक्रमों (पॉली-ए; पॉली-एटी; यादृच्छिक अनुक्रमों) पर प्रत्येक संरक्षित अवशेषों के लिए कदम का आकार इस आंकड़े के एक बड़े संस्करण को देखने के लिए कृपया यहां क्लिक करें।

अनुपूरक फ़ाइल 1: इस प्रोटोकॉल में उपयोग किए जाने वाले पायथन कोड और सॉफ़्टवेयर। MSM मुख्य रूप से MSMbuilder का उपयोग करके बनाया गया है, आवश्यक पायथन कोड संलग्न हैं। कृपया इस फ़ाइल को डाउनलोड करने के लिए यहाँ क्लिक करें।

अनुपूरक फ़ाइल 2: परमाणुवादी आणविक गतिशीलता सिमुलेशन GROMACS द्वारा आयोजित किए जाते हैं, सभी परमाणु सिमुलेशन बनाने के लिए कमांड और आवश्यक फ़ाइलें भी जुड़ी होती हैं। मोटे दानेदार सिमुलेशन कैफेमोल सॉफ्टवेयर द्वारा आयोजित किए जाते हैं। सिमुलेशन परिणामों का विश्लेषण VMD और MATLAB द्वारा किया जाता है। कृपया इस फ़ाइल को डाउनलोड करने के लिए यहाँ क्लिक करें।

अनुपूरक फ़ाइल 3: VMD में प्रोटीन को घुमाने और स्थानांतरित करने के लिए tcl स्क्रिप्ट. कृपया इस फ़ाइल को डाउनलोड करने के लिए यहाँ क्लिक करें।

Subscription Required. Please recommend JoVE to your librarian.

Discussion

यह काम यह पता लगाता है कि संरचना-आधारित कम्प्यूटेशनल सिमुलेशन और नमूने को डीएनए के साथ चलने वाले प्रतिलेखन कारक या टीएफ प्रोटीन को प्रकट करने के लिए कैसे किया जाए, न केवल कदम के परमाणु विस्तार पर, बल्कि प्रक्रियात्मक प्रसार में भी, जो डीएनए लक्ष्य खोज में टीएफ के सुविधाजनक प्रसार के लिए आवश्यक है। ऐसा करने के लिए, मार्कोव राज्य मॉडल या सजातीय पॉली-ए डीएनए के साथ 1-बीपी के लिए एक छोटे से टीएफ डोमेन प्रोटीन डब्ल्यूआरकेवाई के एमएसएम का निर्माण पहली बार किया गया था, ताकि प्रोटीन-डीएनए इंटरफ़ेस पर सामूहिक हाइड्रोजन बॉन्डिंग या एचबी गतिशीलता के साथ डीएनए पर प्रोटीन संरचनाओं का एक पहनावा प्रकट किया जा सके। MSM प्राप्त करने के लिए, हमने एक सहज प्रोटीन स्टेपिंग पथ (पिछले 10-μs सिमुलेशन से प्राप्त) के साथ व्यापक ऑल-एटम एमडी सिमुलेशन के दो दौर आयोजित किए, जिसमें 7.5 μs (125 x 60 ns) के एकत्रीकरण में वर्तमान नमूने थे। इस तरह के व्यापक नमूने हमें सैकड़ों माइक्रोस्टेट्स में संरचना क्लस्टरिंग के लिए स्नैपशॉट प्रदान करते हैं, क्लस्टरिंग के लिए ज्यामितीय उपायों के रूप में प्रोटीन-डीएनए इंटरफेसियल जोड़ी दूरी का उपयोग करते हैं। MSM निर्माण की मार्कोवियन संपत्ति आंशिक रूप से अलग-अलग एमडी सिमुलेशन की विभिन्न लंबाई या अंतराल-समय के लिए गणना की गई निहित समय तराजू से समय-पैमाने पर अलगाव का पता लगाने के माध्यम से मान्य है। 20-2000 microstates का परीक्षण किया गया और समय-पैमाने पर पृथक्करण गुणों के लिए तुलना की गई, जिसमें MSM निर्माण के लिए 500 microstates का चयन किया गया। इसके अलावा, 500 माइक्रोस्टेट्स को गतिज रूप से मैक्रोस्टेट्स की एक छोटी संख्या में जोड़ा गया था, जिसके लिए हमने विभिन्न राज्यों का परीक्षण किया और पाया कि वर्तमान प्रणाली के लिए तीन मैक्रोस्टेट पर्याप्त हैं। तीन-राज्य मॉडल से पता चलता है कि राज्य एस 1 एस 2 को तुलनात्मक रूप से तेजी से (एनएस के दसियों के भीतर) में पारगमन करता है, जो डीएनए पर द्रव्यमान (कॉम) के उतार-चढ़ाव के प्रोटीन केंद्र का प्रभुत्व रखता है, जबकि राज्य एस 2 धीरे-धीरे एस 3 में पारगमन करता है और दर-सीमित (औसतन 7 μs) है, जो कदम उठाने के लिए सामूहिक एचबी गतिशीलता का प्रभुत्व है। ध्यान दें कि गतिज रूप से अलग मैक्रोस्टेट्स की एक छोटी संख्या में माइक्रोस्टेट्स की गतिज गांठ अभी भी पद्धतिगत विकास के अधीन है, जिसमें विभिन्न एल्गोरिदम का परीक्षण किया गया है और सुधार के लिए मशीन लर्निंग तकनीकों का परीक्षण किया गयाहै 57,58,59,60,61,62,63 . MSM बनाने के लिए महत्वपूर्ण चरणों में टीआईसीए में उपयोग किए जाने वाले दूरी जोड़े का चयन करना और माइक्रोस्टेट्स के निर्माण के लिए उपयोग किए जाने वाले पैरामीटर का निर्धारण करना शामिल है। दूरी जोड़े की पसंद ज्ञान आधारित है, और सबसे आवश्यक इंटरैक्शन जोड़े चुनना महत्वपूर्ण है। माइक्रोस्टेट्स के निर्माण के लिए पैरामीटर, जैसे कि सहसंबंध देरी समय, अंतराल समय, माइक्रोस्टेट्स के मुबर, को सिस्टम को मार्कोवियन सुनिश्चित करने के लिए ठीक से सेट करने की आवश्यकता है।

इस तरह के प्रयासों के साथ, परमाणु विवरण के साथ माइक्रो-सेकंड प्रोटीन संरचनात्मक गतिशीलता को डीएनए के साथ प्रोटीन स्टेपिंग 1-बीपी के लिए व्यवस्थित रूप से प्रकट किया जा सकता है। सिद्धांत रूप में, MSM निर्माण से प्राप्त संक्रमण प्रायिकता मैट्रिक्स के साथ, सिस्टम को माइक्रोसेकंड से परे एक लंबे समय के पैमाने पर विकसित किया जा सकता है, या कहें, मिलीसेकंड और13,17,64 से ऊपर तक पहुंचने के लिए। हालांकि, MSM नमूनाकरण और निर्माण की आंतरिक सीमाएं हैं, जो एक निश्चित प्रारंभिक पथ के आसपास उप-माइक्रोसेकंड व्यक्तिगत सिमुलेशन पर भरोसा करती हैं, और मार्कोवियन संपत्ति को अच्छी तरह से 65,66 की गारंटी नहीं दी जा सकती है। अधिकांश प्रथाओं में, प्रारंभिक पथ का निर्माण मजबूर या त्वरण के तहत किया गया था, हालांकि वर्तमान प्रणाली में हम 10-एमएस संतुलन सिमुलेशन 8 से प्राप्त एक सहज प्रोटीन स्टेपिंग पथ (मजबूर या त्वरण के बिना) का लाभ उठातेहैं। कुल मिलाकर संरचनात्मक नमूने अभी भी परमाणु सिमुलेशन की उच्च कम्प्यूटेशनल लागत के कारण दसियों माइक्रोसेकंड तक सीमित हैं। प्रोटीन कदम के इस तरह के microseconds नमूने लंबे समय के पैमाने पर संसाधित TF प्रसार पर प्रकट करने के लिए पर्याप्त conformations प्रदान करने की संभावना नहीं है। स्मृति समस्या महत्वपूर्ण हो जाएगी यदि कोई वर्तमान में प्राप्त संक्रमण संभावना मैट्रिक्स को एक निश्चित समय पैमाने से परे लागू करता है, और मार्कोवियन संपत्ति को वर्तमान MSM 14,52,66 के उचित उपयोग को सुनिश्चित करने की गारंटी नहीं दी जाती है। इसलिए, डीएनए के साथ टीएफ के लंबे समय तक स्केल प्रोसेसिव प्रसार का नमूना लेने के लिए, अवशेष स्तर मोटे-दाने वाले या सीजी मॉडलिंग और सिमुलेशन को इसके बजाय लागू किया जाता है, ताकि संरचनात्मक आधार को बनाए रखने और कम्प्यूटेशनल लागत को कम करने के बीच संतुलन बनाया जा सके।

सीजी मॉडलिंग और सिमुलेशन में, प्रोटीन अवशेषों और डीएनए न्यूक्लियोटाइड्स को मोतियों द्वारा दर्शाया जाता है (यानी, एक अमीनो एसिड के लिए एक मनका, और एक न्यूक्लियोटाइड के लिए तीन मोती), प्रोटीन संरचना के साथ गो मॉडल के माध्यम से एक देशी या पूर्व-संतुलित कॉन्फ़िगरेशन30,53 की ओर बनाए रखा जाता है। हालांकि एचबी इंटरैक्शन का परमाणु स्तर सीजी मॉडल में अनुपस्थित हो जाता है, प्रोटीन-डीएनए इलेक्ट्रोस्टैटिक इंटरैक्शन को अच्छी तरह से बनाए रखा जाता है, जो डीएनए 67,68,69,70 के साथ प्रोटीन के प्रक्रियात्मक प्रसार में प्रमुख गतिशीलता विशेषताओं को पकड़ने में सक्षम प्रतीत होता है। विस्तृत कार्यान्वयन प्रोटोकॉल मॉडलिंग और WRKY-डीएनए प्रणाली का अनुकरण करने के लिए प्रस्तुत किए गए हैं। प्रतिनिधि परिणाम दिलचस्प रूप से दिखाते हैं कि सबसे पहले, WRKY-DNA प्रणाली के पिछले परमाणु सिमुलेशन में प्रस्तुत एकल-स्ट्रैंड डीएनए पूर्वाग्रह सीजी मॉडल में बना रहता है, जबकि प्रक्रियात्मक प्रसार के दौरान नमूना किए गए विभिन्न प्रकार के प्रोटीन अभिविन्यास / विन्यास समय-समय पर दो किस्में के बीच पूर्वाग्रह के स्विच का कारण बनते हैं। इसलिए, इस तरह के डीएनए स्ट्रैंड पूर्वाग्रह जरूरी नहीं कि एचबी एसोसिएशन से लिंक हो, लेकिन मुख्य रूप से प्रोटीन-डीएनए इलेक्ट्रोस्टैटिक इंटरैक्शन पर भरोसा करते हैं, जो डीएनए पर विभिन्न प्रोटीन कॉन्फ़िगरेशन या झुकाव के लिए भिन्न होते हैं। इसके बाद, प्रोटीन-डीएनए इंटरफ़ेस पर या उसके पास व्यक्तिगत अमीनो एसिड, जैसे कि अत्यधिक संरक्षित WRKQGQK रूपांकनों, विभिन्न डीएनए अनुक्रमों के लिए विभिन्न कदम आकार या सिंक्रनाइज़ेशन पैटर्न दिखाते हैं। हमारे पिछले अध्ययन में, कदम के आकार की विविधताओं को केवल प्रोटीन के सीओएम के लिए दिखाया गया था, क्योंकि प्रोटीन को विभिन्न डीएनए अनुक्रमों के साथ फैलाने के लिए मॉडलिंग की गई थी। ध्यान दें कि डीएनए का वर्तमान सीजी मॉडल विभिन्न पैरामीटराइजेशन 54,71,72 के साथ डीएनए अनुक्रम विविधताओं का समर्थन करता है, हालांकि परमाणु विस्तार गायब है। प्रोटीन-डीएनए प्रणाली की संरचना-आधारित मॉडलिंग में उचित डीएनए अनुक्रम-निर्भर पैरामीटराइजेशन, इस प्रकार कई समय और लंबाई के तराजू में प्रोटीन-डीएनए खोज और मान्यता तंत्र को प्रकट करने के लिए महत्वपूर्ण है।

Subscription Required. Please recommend JoVE to your librarian.

Disclosures

लेखकों के हितों का कोई संघर्ष नहीं है।

Acknowledgments

इस कार्य को NSFC अनुदान #11775016 और #11635002 द्वारा समर्थित किया गया है. जेवाई को एनएसएफ डीएमएस 1763272 के माध्यम से यूसीआई के सीएमसीएफ द्वारा समर्थित किया गया है और सिमंस फाउंडेशन अनुदान # 594598 और यूसीआई से स्टार्ट-अप फंड है। LTD को शंघाई #20ZR1425400 और #21JC1403100 के प्राकृतिक विज्ञान फाउंडेशन द्वारा समर्थित किया गया है। हम बीजिंग कम्प्यूटेशनल साइंस रिसर्च सेंटर (CSRC) से कम्प्यूटेशनल समर्थन को भी स्वीकार करते हैं।

Materials

Name Company Catalog Number Comments
CafeMol Kyoto University coarse-grained (CG) simulations
GROMACS University of Groningen Royal Institute of Technology Uppsala University molecular dynamics simulations software
Matlab MathWorks Numerical calculation software
MSMbuilder Stanford University build MSM
VMD UNIVERSITY OF ILLINOIS AT URBANA-CHAMPAIGN molecular visualization program

DOWNLOAD MATERIALS LIST

References

  1. Latchman, D. S. Transcription factors: an overview. The International Journal of Biochemistry & Cell Biology. 29 (12), 1305-1312 (1997).
  2. Berg, O. G., von Hippel, P. H. Selection of DNA binding sites by regulatory proteins. Statistical-mechanical theory and application to operators and promoters. Journal of Molecular Biology. 193 (4), 723-750 (1987).
  3. von Hippel, P. H., Berg, O. G. Facilitated target location in biological systems. The Journal of Biological Chemistry. 264 (2), 675-678 (1989).
  4. Halford, S. E., Marko, J. F. How do site-specific DNA-binding proteins find their targets. Nucleic Acids Research. 32 (10), 3040-3052 (2004).
  5. Slusky, M., Mirny, L. A. Kinetics of protein-DNA interaction: facilitated target location in sequence-dependent potential. Biophysical Journal. 87 (6), 4021-4035 (2004).
  6. Bauer, M., Metzler, R. Generalized facilitated diffusion model for DNA-binding proteins with search and recognition states. Biophysical Journal. 102 (10), 2321-2330 (2012).
  7. Shvets, A. A., Kochugaeva, M. P., Kolomeisky, A. B. Mechanisms of Protein Search for Targets on DNA: Theoretical Insights. Molecules. 23 (9), Basel, Switzerland. 2106 (2018).
  8. Dai, L., Xu, Y., Du, Z., Su, X. D., Yu, J. Revealing atomic-scale molecular diffusion of a plant-transcription factor WRKY domain protein along DNA. Proceedings of the National Academy of Sciences of the United States of America. 118 (23), 2102621118 (2021).
  9. Chodera, J. D., Singhal, N., Pande, V. S., Dill, K. A., Swope, W. C. Automatic discovery of metastable states for the construction of Markov models of macromolecular conformational dynamics. The Journal of Chemical Physics. 126 (15), 155101 (2007).
  10. Pan, A. C., Roux, B. Building Markov state models along pathways to determine free energies and rates of transitions. The Journal of Chemical Physics. 129 (6), 064107 (2008).
  11. Bowman, G. R., Huang, X., Pande, V. S. Using generalized ensemble simulations and Markov state models to identify conformational states. Methods. 49 (2), San Diego, California. 197-201 (2009).
  12. Prinz, J. H., et al. Markov models of molecular kinetics: Generation and validation. The Journal of chemical physics. 134 (17), 174105 (2011).
  13. Chodera, J. D., Noé, F. Markov state models of biomolecular conformational dynamics. Current Opinion in Structural Biology. 25, 135-144 (2014).
  14. Malmstrom, R. D., Lee, C. T., Van Wart, A. T., Amaro, R. E. On the Application of Molecular-Dynamics Based Markov State Models to Functional Proteins. Journal of Chemical Theory and Computation. 10 (7), 2648-2657 (2014).
  15. Husic, B. E., Pande, V. S. Markov State Models: From an Art to a Science. Journal of the American Chemical Society. 140 (7), 2386-2396 (2018).
  16. Sittel, F., Stock, G. Perspective: Identification of collective variables and metastable states of protein dynamics. The Journal of chemical physics. 149 (15), 150901 (2018).
  17. Wang, W., Cao, S., Zhu, L., Huang, X. Constructing Markov State Models to elucidate the functional conformational changes of complex biomolecules. WIREs Computational Molecular Science. 8, 1343 (2018).
  18. Peng, S., et al. Target search and recognition mechanisms of glycosylase AlkD revealed by scanning FRET-FCS and Markov state models. Proceedings of the National Academy of Sciences of the United States of America. 117 (36), 21889-21895 (2020).
  19. Tian, J., Wang, L., Da, L. T. Atomic resolution of short-range sliding dynamics of thymine DNA glycosylase along DNA minor-groove for lesion recognition. Nucleic Acids Research. 49 (3), 1278-1293 (2021).
  20. Chu, J. -W., Izveko, S., Voth, G. The multiscale challenge for biomolecular systems: coarse-grained modeling. Molecular Simulation. 32 (3-4), 211-218 (2006).
  21. Marrink, S. J., Risselada, H. J., Yefimov, S., Tieleman, D. P., De Vries, A. H. The MARTINI force field: coarse grained model for biomolecular simulations. The Journal of Physical Chemistry B. 111 (27), 7812-7824 (2007).
  22. Givaty, O., Levy, Y. Protein sliding along DNA: dynamics and structural characterization. Journal of Molecular Biology. 385 (4), 1087-1097 (2009).
  23. Khazanov, N., Levy, Y. Sliding of p53 along DNA can be modulated by its oligomeric state and by cross-talks between its constituent domains. Journal of Molecular Biology. 408 (2), 335-355 (2011).
  24. Riniker, S., Allison, J. R., van Gunsteren, W. F. On developing coarse-grained models for biomolecular simulation: a review. Physical Chemistry Chemical Physics : PCCP. 14 (36), 12423-12430 (2012).
  25. Kmiecik, S., et al. Coarse-Grained Protein Models and Their Applications. Chemical Reviews. 116 (14), 7898-7936 (2006).
  26. Bhattacherjee, A., Krepel, D., Levy, Y. Coarse-grained models for studying protein diffusion along DNA. WIREs Computational Molecular Science. 6, 515-531 (2016).
  27. Wang, J., et al. Machine Learning of Coarse-Grained Molecular Dynamics Force Fields. ACS Central Science. 5 (5), 755-767 (2019).
  28. Joshi, S. Y., Deshmukh, S. A. A review of advancements in coarse-grained molecular dynamics simulations. Molecular Simulation. 47 (10-11), 786-803 (2021).
  29. Bigman, L. S., Greenblatt, H. M., Levy, Y. What Are the Molecular Requirements for Protein Sliding along DNA. The Journal of Physical Chemistry B. 125 (12), 3119-3131 (2021).
  30. Kenzaki, H., et al. CafeMol: A Coarse-Grained Biomolecular Simulator for Simulating Proteins at Work. Journal of Chemical Theory and Computation. 7 (6), 1979-1989 (2011).
  31. Berendsen, H. J. C., vander Spoel, D., van Drunen, R. GROMACS: a message-passing parallel molecular dynamics implementation. Computer Physics Communications. 91 (1-3), 43-56 (1995).
  32. vander Spoel, D., et al. GROMACS: fast, flexible, and free. Journal of Computational Chemistry. 26 (16), 1701-1718 (2005).
  33. Abraham, M. J., et al. GROMACS: High performance molecular simulations through multi-level parallelism from laptops to supercomputers. SoftwareX. 1-2, 19-25 (2015).
  34. Harrigan, M. P., et al. MSMBuilder: Statistical Models for Biomolecular Dynamics. Biophysical journal. 112 (1), 10-15 (2017).
  35. Humphrey, W., Dalke, A., Schulten, K. VMD: visual molecular dynamics. Journal of Molecular Graphics. 14 (1), 33-38 (1996).
  36. Izrailev, S., et al. Steered Molecular Dynamics. Computational Molecular Dynamics: Challenges, Methods, Ideas. 4, Springer. Berlin, Heidelberg. 39-65 (1999).
  37. Schlitter, J., Engels, M., Krüger, P. Targeted molecular dynamics: a new approach for searching pathways of conformational transitions. Journal of Molecular Graphics. 12 (2), 84-89 (1994).
  38. Maragliano, L., Fischer, A., Vanden-Eijnden, E., Ciccotti, G. String method in collective variables: minimum free energy paths and isocommittor surfaces. The Journal of Chemical Physics. 125 (2), 24106 (2006).
  39. Weiss, D. R., Levitt, M. Can morphing methods predict intermediate structures. Journal of Molecular Biology. 385 (2), 665-674 (2009).
  40. Xu, Y. P., Xu, H., Wang, B., Su, X. D. Crystal structures of N-terminal WRKY transcription factors and DNA complexes. Protein. 11 (3), 208-213 (2020).
  41. Higham, D. J., Higham, N. J. MATLAB guide. Society for Industrial and Applied Mathematics. , (2016).
  42. Hartigan, J. A., Wong, M. A. Algorithm AS 136: A K-Means Clustering Algorithm. Journal of the Royal Statistical Society. Series C (Applied Statistics). 28 (1), 100-108 (1979).
  43. Gonzalez, T. F. Clustering to minimize the maximum intercluster distance. Theoretical Computer Science. 38, 293-306 (1985).
  44. Zhao, Y., Sheong, F. K., Sun, J., Sander, P., Huang, X. A fast parallel clustering algorithm for molecular simulation trajectories. Journal of Computational Chemistry. 34 (2), 95-104 (2013).
  45. Ivani, I., et al. Parmbsc1: a refined force field for DNA simulations. Nature Methods. 13 (1), 55-58 (2016).
  46. Naritomi, Y., Fuchigami, S. Slow dynamics of a protein backbone in molecular dynamics simulation revealed by time-structure based independent component analysis. The Journal of Chemical Physics. 139 (21), 215102 (2013).
  47. Naritomi, Y., Fuchigami, S. Slow dynamics in protein fluctuations revealed by time-structure based independent component analysis: the case of domain motions. The Journal of Chemical Physics. 134 (6), 065101 (2011).
  48. Pérez-Hernández, G., Paul, F., Giorgino, T., De Fabritiis, G., Noé, F. Identification of slow molecular order parameters for Markov model construction. The Journal of Chemical Physics. 139 (1), 015102 (2013).
  49. McGibbon, R. T., Pande, V. S. Variational cross-validation of slow dynamical modes in molecular kinetics. The Journal of Chemical Physics. 142 (12), 124105 (2015).
  50. Deuflhard, P., Weber, M. Robust Perron cluster analysis in conformation dynamics. Linear Algebra and its Applications. 398, 161-184 (2005).
  51. Silva, D. A., et al. Millisecond dynamics of RNA polymerase II translocation at atomic resolution. Proceedings of the National Academy of Sciences of the United States of America. 111 (21), 7665-7670 (2014).
  52. Swope, W. C., Pitera, J. W., Suits, F. Describing Protein Folding Kinetics by Molecular Dynamics Simulations. 1. Theory. The Journal of Physical Chemistry B. 108 (21), 6571-6581 (2004).
  53. Clementi, C., Nymeyer, H., Onuchic, J. N. Topological and energetic factors: what determines the structural details of the transition state ensemble and "en-route" intermediates for protein folding? An investigation for small globular proteins. Journal of molecular biology. 298 (5), 937-953 (2000).
  54. Hinckley, D. M., Freeman, G. S., Whitmer, J. K., De Pablo, J. J. An experimentally-informed coarse-grained 3-Site-Per-Nucleotide model of DNA: structure, thermodynamics, and dynamics of hybridization. The Journal of chemical physics. 139 (14), 144903 (2013).
  55. Debye, P., Huckel, E. The theory of the electrolyte II-The border law for electrical conductivity. Physikalische Zeitschrift. 24, 305-325 (1923).
  56. Berendsen, H. J., Postma, J. V., van Gunsteren, W. F., DiNola, A., Haak, J. R. Molecular dynamics with coupling to an external bath. The Journal of Chemical Physics. 81, 3684-3690 (1984).
  57. Bowman, G. R. Improved coarse-graining of Markov state models via explicit consideration of statistical uncertainty. The Journal of Chemical Physics. 137 (13), 134111 (2012).
  58. Jain, A., Stock, G. Identifying metastable states of folding proteins. Journal of Chemical Theory and Computation. 8 (10), 3810-3819 (2012).
  59. Röblitz, S., Weber, M. Fuzzy spectral clustering by PCCA+: application to Markov state models and data classification. Advances in Data Analysis and Classification. 7, 147-179 (2013).
  60. Mardt, A., Pasquali, L., Wu, H., Noé, F. VAMPnets for deep learning of molecular kinetics. Nature Communications. 9 (1), 5 (2018).
  61. Wang, W., Liang, T., Sheong, F. K., Fan, X., Huang, X. An efficient Bayesian kinetic lumping algorithm to identify metastable conformational states via Gibbs sampling. The Journal of Chemical Physics. 149 (7), 072337 (2018).
  62. Chen, W., Sidky, H., Ferguson, A. L. Nonlinear discovery of slow molecular modes using state-free reversible VAMPnets. The Journal of Chemical Physics. 150 (21), 214114 (2019).
  63. Gu, H., et al. RPnet: a reverse-projection-based neural network for coarse-graining metastable conformational states for protein dynamics. Physical Chemistry Chemical Physics :PCCP. 24 (3), 1462-1474 (2022).
  64. Lane, T. J., Bowman, G. R., Beauchamp, K., Voelz, V. A., Pande, V. S. Markov state model reveals folding and functional dynamics in ultra-long MD trajectories. Journal of the American Chemical Society. 133 (45), 18413-18419 (2011).
  65. Konovalov, K. A., Unarta, I. C., Cao, S., Goonetilleke, E. C., Huang, X. Markov State Models to Study the Functional Dynamics of Proteins in the Wake of Machine Learning. JACS Au. 1 (9), 1330-1341 (2021).
  66. Cao, S., Montoya-Castillo, A., Wang, W., Markland, T. E., Huang, X. On the advantages of exploiting memory in Markov state models for biomolecular dynamics. The Journal of Chemical Physics. 153 (1), 014105 (2020).
  67. Brandani, G. B., Takada, S. Chromatin remodelers couple inchworm motion with twist-defect formation to slide nucleosomal DNA. PLoS Computational Biology. 14 (11), 1006512 (2018).
  68. Tan, C., Terakawa, T., Takada, S. Dynamic Coupling among Protein Binding, Sliding, and DNA Bending Revealed by Molecular Dynamics. Journal of the American Chemical Society. 138 (27), 8512-8522 (2016).
  69. Terakawa, T., Takada, S. p53 dynamics upon response element recognition explored by molecular simulations. Scientific reports. 5, 17107 (2015).
  70. Brandani, G. B., Niina, T., Tan, C., Takada, S. DNA sliding in nucleosomes via twist defect propagation revealed by molecular simulations. Nucleic Acids Research. 46 (6), 2788-2801 (2018).
  71. Knotts, T. A., Rathore, N., Schwartz, D. C., de Pablo, J. J. A coarse grain model for DNA. The Journal of Chemical Physics. 126 (8), 084901 (2007).
  72. Freeman, G. S., Hinckley, D. M., Lequieu, J. P., Whitmer, J. K., de Pablo, J. J. Coarse-grained modeling of DNA curvature. The Journal of Chemical Physics. 141 (16), 165103 (2014).

Tags

जीव विज्ञान अंक 181
संरचना-आधारित सिमुलेशन और ट्रांसक्रिप्शन फैक्टर प्रोटीन आंदोलनों का नमूना परमाणु-स्केल से मोटे-दाने वाले प्रसार के लिए कदम उठाने से डीएनए के साथ
Play Video
PDF DOI DOWNLOAD MATERIALS LIST

Cite this Article

E, C., Dai, L., Tian, J., Da, L. T., More

E, C., Dai, L., Tian, J., Da, L. T., Yu, J. Structure-Based Simulation and Sampling of Transcription Factor Protein Movements along DNA from Atomic-Scale Stepping to Coarse-Grained Diffusion. J. Vis. Exp. (181), e63406, doi:10.3791/63406 (2022).

Less
Copy Citation Download Citation Reprints and Permissions
View Video

Get cutting-edge science videos from JoVE sent straight to your inbox every month.

Waiting X
Simple Hit Counter