Waiting
Login processing...

Trial ends in Request Full Access Tell Your Colleague About Jove
Click here for the English version

Biology

Nonexperts के लिए Phylogenetics के लिए एक व्यावहारिक गाइड

Published: February 5, 2014 doi: 10.3791/50975

Summary

यहाँ हम न्यूक्लियोटाइड या अमीनो एसिड अनुक्रम डेटासेट से विश्वसनीय phylogenies पैदा करने के लिए एक कदम दर कदम पाइपलाइन का वर्णन. इस गाइड शोधकर्ताओं या वंशावली विश्लेषण करने के लिए नए छात्रों की सेवा करना है.

Abstract

कई शोधकर्ताओं, अविश्वसनीय रूप से विविध foci भर में, उनके अनुसंधान प्रश्न (ओं) को Phylogenetics आवेदन कर रहे हैं. हालांकि, कई शोधकर्ताओं ने इस विषय के लिए नए हैं और इसलिए यह अंतर्निहित समस्याओं को प्रस्तुत. यहाँ हम nonexperts के लिए Phylogenetics के लिए एक व्यावहारिक परिचय संकलन. हम एक कदम दर कदम तरीके, जीन अनुक्रम डेटासेट से विश्वसनीय phylogenies पैदा करने के लिए एक पाइप लाइन में रूपरेखा. हम ऑनलाइन इंटरफेस के साथ ही स्थानीय निष्पादनयोग्य के माध्यम से समानता खोजी उपकरण के लिए एक उपयोगकर्ता के गाइड के साथ शुरू करते हैं. अगला, हम विकास की सबसे फिट मॉडल निर्धारित करने के लिए सॉफ्टवेयर का उपयोग करने के लिए प्रोटोकॉल द्वारा पीछा एकाधिक अनुक्रम संरेखण पैदा करने के लिए कार्यक्रमों का पता लगाने. हम तो अधिकतम संभावना और Bayesian मापदंड के द्वारा वंशावली रिश्तों के पुनर्निर्माण के लिए प्रोटोकॉल रूपरेखा और अंत में वंशावली पेड़ दृश्यमान करने के लिए उपकरणों का वर्णन. किसी भी वंशावली दृष्टिकोण की एक विस्तृत विवरण का मतलब द्वारा यह नहीं है, यह व्यावहारिक शुरू कर informat के साथ पाठक प्रदान करता हैसामान्यतः phylogeneticists द्वारा उपयोग प्रमुख सॉफ्टवेयर अनुप्रयोगों पर आयन. इस लेख के लिए दृष्टि यह वंशावली पढ़ाई पर तैयार कर रहे शोधकर्ताओं के लिए एक व्यावहारिक प्रशिक्षण उपकरण के रूप में सेवा करते हैं और यह भी एक कक्षा या शिक्षण प्रयोगशाला में शामिल किया जा सकता है कि एक शैक्षिक संसाधन के रूप में सेवा कर सकता है कि होगा.

Introduction

दो (या अधिक) प्रजाति विकसित कैसे को समझने के लिए, यह प्रत्येक नमूने से अनुक्रम या रूपात्मक डेटा प्राप्त करने के लिए पहली आवश्यक है, इन आंकड़ों हम विकासवादी अंतरिक्ष के माध्यम से अपने रिश्ते को मापने के लिए उपयोग कर सकते हैं कि मात्रा का प्रतिनिधित्व करते हैं. (उदाहरण के लिए मील, इंच, माइक्रोन) उपलब्ध अधिक डेटा एक अधिक सटीक माप के लिए समानता मिलेगी, रेखीय दूरी मापने जब ​​बस की तरह. फलस्वरूप, एक शोधकर्ता विकासवादी दूरी अनुमान कर सकते हैं सटीकता के साथ जो भारी रिश्तों को मापने के लिए उपलब्ध जानकारीपूर्ण डेटा की मात्रा से प्रभावित है. विभिन्न नमूनों अलग दरों पर और अलग तंत्र द्वारा विकसित क्योंकि इसके अलावा, हम दो taxa के बीच संबंधों को मापने के लिए उपयोग किए जाने वाले विधि भी सीधे विकासवादी माप की शुद्धता को प्रभावित करती है. इसलिए, विकास के संबंधों पर सीधे नहीं मनाया जाता है लेकिन बजाय अनुक्रम या रूपात्मक डेटा, विकासवादी inferring की समस्या से extrapolated रहे हैं क्योंकिरिश्तों आंकड़ों में से एक हो जाता है. Phylogenetics बेहतर taxa के बीच विकास के इतिहास को फिर से संगठित करने के क्रम में विकास के पैटर्न के लिए सांख्यिकीय मॉडल को लागू करने के साथ संबंध जीव विज्ञान की शाखा है. Taxa के बीच यह पुनर्निर्माण taxa की फाइलोजेनी के रूप में जाना जाता है.

हम यहाँ दृश्यों का एक सेट से phylogenies inferring के लिए कदम पाइप लाइन के द्वारा एक कदम का वर्णन आणविक जीव और विकासवादी जीव के बीच विशेषज्ञता में खाई पाटने में मदद करने के लिए. सबसे पहले, हम विस्तार से वेब आधारित इंटरफेस के माध्यम से और भी स्थानीय निष्पादनयोग्य का उपयोग करके बेसिक स्थानीय संरेखण खोज उपकरण (ब्लास्ट 1) कलन विधि का उपयोग डेटाबेस पूछताछ में शामिल कदम है, यह अक्सर एक अज्ञात के लिए इसी तरह के दृश्यों की एक सूची प्राप्त करने में पहला कदम है क्वेरी, कुछ शोधकर्ताओं ने यह भी Phylota (http://www.phylota.net/) के रूप में वेब इंटरफेस के माध्यम से एक ही समूह के लिए डेटा इकट्ठा करने में रुचि हो सकती है. ब्लास्ट ग के लिए एक एल्गोरिथ्म हैक्वेरी अनुक्रम सदृश कि 'हिट' के लिए खोज करने के लिए दृश्यों का एक डाटाबेस के खिलाफ प्राथमिक अमीनो एसिड या nucleotide अनुक्रम डेटा omparing. ब्लास्ट कार्यक्रम स्टीफन Altschul एट अल द्वारा डिजाइन किया गया था. राष्ट्रीय स्वास्थ्य संस्थान (एनआईएच) में 1. ब्लास्ट सर्वर विभिन्न कार्यक्रमों के एक नंबर के होते हैं, और यहाँ सबसे आम ब्लास्ट कार्यक्रमों में से कुछ की एक सूची है:

मैं) nucleotide-न्यूक्लियोटाइड ब्लास्ट (blastn): इस कार्यक्रम के एक डीएनए अनुक्रम इनपुट की आवश्यकता है और डीएनए डेटाबेस से ज्यादा समान डीएनए दृश्यों देता है कि उपयोगकर्ता निर्दिष्ट करता है कि एक विशिष्ट जीव के लिए (उदाहरण के लिए).

द्वितीय) प्रोटीन प्रोटीन ब्लास्ट (blastp): यहाँ उपयोगकर्ता एक प्रोटीन अनुक्रम जानकारी और प्रोग्राम उपयोगकर्ता निर्दिष्ट करता है कि प्रोटीन डेटाबेस से ज्यादा समान प्रोटीन दृश्यों देता है.

III) स्थिति विशिष्ट चलने का विस्फोट (साई ब्लास्ट) (blastpgp): उपयोगकर्ता इनपुट एक prote हैनिकट से संबंधित प्रोटीन का एक सेट देता है जो अनुक्रम में, और इस डाटासेट से एक संरक्षित प्रोफाइल उत्पन्न होता है. अगला एक नई क्वेरी एक प्रोटीन डेटाबेस से पूछताछ करने के लिए प्रयोग किया जाता है जो केवल इन संरक्षित "रूपांकनों" का उपयोग कर उत्पन्न होता है और इस संरक्षित "रूपांकनों" का एक नया सेट निकाला और फिर एक प्रोटीन डेटाबेस तक पूछताछ करने के लिए उपयोग किया जाता है, जिसमें से प्रोटीन का एक बड़ा समूह रिटर्न प्रोटीन का एक भी बड़ा सेट लौटा रहे हैं और एक अन्य प्रोफाइल उत्पन्न होता है और इस प्रक्रिया को दोहराया. प्रत्येक चरण में क्वेरी में संबंधित प्रोटीन शामिल करके इस कार्यक्रम उपयोगकर्ता अधिक मुक़्तलिफ़ हैं कि दृश्यों की पहचान करने के लिए अनुमति देता है.

चतुर्थ) Nucleotide 6 फ्रेम अनुवाद प्रोटीन (blastx): यहाँ उपयोगकर्ता छह फ्रेम वैचारिक अनुवाद उत्पादों (यानी में बदल जाता है, जो एक nucleotide अनुक्रम इनपुट प्रदान करता है दोनों किस्में) एक प्रोटीन अनुक्रम डेटाबेस के खिलाफ..

V) 6 फ्रेम अनुवाद-न्यूक्लियोटाइड न्यूक्लियोटाइड6 फ्रेम अनुवाद (tblastx): इस कार्यक्रम के एक डीएनए nucleotide अनुक्रम इनपुट लेता है और यह एक nucleotide अनुक्रम डेटाबेस के छह फ्रेम में अनुवाद के खिलाफ तुलना जो सभी छह फ्रेम वैचारिक अनुवाद उत्पादों में निवेश के लिए अनुवाद.

vi) प्रोटीन न्यूक्लियोटाइड 6 फ्रेम अनुवाद (tblastn): इस कार्यक्रम के एक nucleotide अनुक्रम डेटाबेस के सभी छह पढ़ने फ्रेम के खिलाफ तुलना करने के लिए एक प्रोटीन अनुक्रम इनपुट का उपयोग करता है.

अगला, हम एक दृश्य डाटासेट से एक एकाधिक अनुक्रम संरेखण (एमएसए) पैदा करने के लिए आमतौर पर इस्तेमाल किया कार्यक्रमों का वर्णन है, और यह एक दृश्य डाटासेट के लिए विकास की सबसे फिट मॉडल है कि निर्धारित कार्यक्रमों के लिए एक उपयोगकर्ता के गाइड द्वारा पीछा किया जाता है. जातिवृत्तिक पुनर्निर्माण एक सांख्यिकीय समस्या है, और इस वजह से, वंशावली तरीकों एक सांख्यिकीय ढांचे को शामिल करने की जरूरत है. इस सांख्यिकीय ढांचे डाटासेट भीतर अनुक्रम परिवर्तन को शामिल किया गया है कि एक विकासवादी मॉडल बन जाता है. इस विकासवादी मोडेल न्यूक्लियोटाइड या एमिनो एसिड प्रतिस्थापन की प्रक्रिया के बारे में मान्यताओं का एक सेट शामिल है, और एक विशेष डाटासेट के लिए सबसे फिट मॉडल सांख्यिकीय परीक्षण के माध्यम से चुना जा सकता है. विभिन्न मॉडलों के डेटा के लिए फिट संभव वालों में से एक सेट के भीतर सबसे फिट मॉडल का चयन करने के लिए संभावना अनुपात परीक्षण (LRTs) या जानकारी मापदंड के माध्यम से तुलना की जा सकती. दो आम जानकारी मापदंड Akaike जानकारी कसौटी (एआईसी) 2 और Bayesian जानकारी कसौटी (बीआईसी) 3 रहे हैं. एक इष्टतम संरेखण उत्पन्न हो जाने के बाद गठबंधन डेटा से एक फाइलोजेनी बनाने के लिए कई अलग अलग तरीके हैं. विकासवादी रिश्तों inferring के कई तरीके हैं, मोटे तौर पर, वे दो श्रेणियों में बांटा जा सकता है: दूरी आधारित विधियों और अनुक्रम आधारित विधियों. दूरी आधारित विधियों दृश्यों से जोड़ो दूरी की गणना, और फिर पेड़ प्राप्त करने के लिए इन दूरियों का उपयोग करें. अनुक्रम आधारित विधियों सीधे अनुक्रम संरेखण का उपयोग, और आमतौर पर टी खोजएक optimality कसौटी का उपयोग REE अंतरिक्ष. हम वंशावली रिश्तों के पुनर्निर्माण के लिए दो अनुक्रम आधारित विधियों की रूपरेखा तैयार: इन अधिकतम संभावना ढांचे को लागू करता है जो PhyML 4 हैं, और Bayesian मार्कोव चेन मोंटे कार्लो निष्कर्ष का उपयोग करता है जो MrBayes 5. संभावना और Bayesian तरीकों वंशावली पुनर्निर्माण के लिए एक सांख्यिकीय ढांचा प्रदान करते हैं. आमतौर पर इस्तेमाल किया पेड़ निर्माण उपकरणों पर उपयोगकर्ता जानकारी प्रदान करके, हम वंशावली रिश्तों अनुमान करने के लिए आवश्यक आवश्यक डेटा के लिए पाठक परिचय.

Subscription Required. Please recommend JoVE to your librarian.

Protocol

1. बेसिक स्थानीय संरेखण खोज उपकरण (ब्लास्ट): ऑनलाइन इंटरफ़ेस

  1. जैव प्रौद्योगिकी सूचना के लिए राष्ट्रीय केन्द्र (एन सी बी आई) में हुए विस्फोट 1 वेब सर्वर यात्रा करने के लिए इस लिंक पर क्लिक करें. - http://blast.ncbi.nlm.nih.gov/Blast.cgi (चित्रा 1).
  2. क्वेरी बॉक्स में इनपुट एक FASTA स्वरूपित पाठ अनुक्रम (उदाहरण के लिए चित्र 2 देखें).
  3. खोज में इस्तेमाल करते हैं और फिर "विस्फोट" क्लिक करने के लिए उपयुक्त ब्लास्ट कार्यक्रम और प्रासंगिक डेटाबेस या ब्याज के व्यक्तिगत प्रजातियों क्लिक करें.
    नोट: FASTA स्वरूपित अनुक्रम एक ">" साइन ने संकेत दिया एक विवरण पंक्ति के साथ शुरू होता है. विवरण ">" पर हस्ताक्षर, अनुक्रम (यानी. न्यूक्लियोटाइड या अमीनो एसिड) अगली पंक्ति पर विवरण का पालन करने के तुरंत बाद का पालन करना होगा. ब्लास्ट खोज से उत्पादन HTML, सादा पाठ, एक्सएमएल, या मारा टीए के रूप में देखा जाता हैbles एचटीएमएल गए निर्धारित (चित्रा 3) के साथ (पाठ या सीएसवी).

2. बेसिक स्थानीय संरेखण खोज उपकरण (ब्लास्ट): स्थानीय निष्पादनयोग्य

  1. इस लिंक से नवीनतम ब्लास्ट कमांड लाइन ब्लास्ट निष्पादनयोग्य डाउनलोड करें:
    ftp://ftp.ncbi.nlm.nih.gov/blast/executables/blast+/LATEST/ -
  2. पीसी उपयोगकर्ताओं के लिए उन्हें>: नवीनतम विस्फोट win32.exe फाइल को डबल क्लिक करें और लाइसेंस समझौते को स्वीकार करने और स्थापित करें.
    नोट: NCBI विस्फोट-2.2.27 +: डिफ़ॉल्ट स्थापना निर्देशिका सी है.
  3. इस प्रकार के रूप पीसी वातावरण चर विन्यस्त करें:
    1. "शुरू" बटन, और फिर ठीक है "कंप्यूटर" पर क्लिक करें पीसी क्लिक करें,
    2. "गुण" पर क्लिक करें और पॉप अप में "उन्नत" टैब पर क्लिक करें
    3. "चर" बटन क्लिक करें और नई पॉप अप में वें के तहत 'नई' बटन पर क्लिक करेंखंड ए "उपयोगकर्ता के लिए उपयोगकर्ता चर"
    4. NCBI विस्फोट-2.2.27 + बिन: पॉप अप में चर नाम "पथ" और चर मान "सी जोड़ें.
      नोट: बिन निर्देशिका निष्पादन योग्य (.. यानी blastp, आदि) शामिल हैं.
  4. मैक उपयोगकर्ताओं के लिए उन्हें>: टर्मिनल आवेदन खोलें (यह सिर्फ खुले "खोजक" ऐसा करने के लिए और "टर्मिनल" खोज और इस "टर्मिनल" चिह्न प्रदर्शित करेगा). टर्मिनल विंडो प्रकार में:
    > एफ़टीपी ftp.ncbi.nih.gov
    नोट: यह भी पीसी के लिए उदाहरण में ऊपर प्रयोग यूआरएल टाइप कर सकते हैं
  5. एन सी बी आई FTP साइट प्रकार नाम और पासवर्ड के लिए "गुमनाम", और फिर टाइप पहुंचने के लिए:
    > सीडी विस्फोट / निष्पादनयोग्य / नवीनतम
  6. टाइपिंग द्वारा निष्पादनयोग्य सूची:
    > रास
  7. निम्नलिखित (या जो नवीनतम संस्करण वर्तमान में है) लिखकर नवीनतम संस्करण प्राप्त करें:
    2; NCBI विस्फोट-2.2.7-macosx.tar.gz मिल
  8. "बाहर निकलें" टाइप करके NCBI FTP सर्वर साइट से बाहर निकलें.
  9. टाइप करके डाउनलोड की फ़ाइलें दबाव हटाना:
    > राल xzf NCBI विस्फोट-2.2.7-macosx.tar.gz
  10. टाइप करके आदेशों की तलाश में जब खोल इस निर्देशिका के माध्यम से खोज कर सकते हैं अपने पथ को विस्फोट निष्पादन योग्य के लिए बायनेरिज़ की स्थानः
    > पथ = $ पथ: new_folder_location
  11. इस टाइप करके अपने पथ को स्थान गयी है की जाँच करें:
    > $ गूंज पथ
  12. यहां क्लिक करके (प्रतिदिन अपडेट किया जाता है) एक पूर्वस्वरूपित ब्लास्ट डेटाबेस बनाएँ:
    ftp://ftp.ncbi.nlm.nih.gov/blast/db/
  13. "DB" फ़ोल्डर में डेटाबेस रखें.
  14. एक पीसी पर उन्हें>: और टाइप करके NCBI विस्फोट फ़ोल्डर में निर्देशिका बदलने (इस पर क्लिक करें "शुरू" और खोज पट्टी में "cmd" टाइप करने के लिए) एक एमएस डॉस प्रॉम्प्ट खोलें:
    C: उपयोगकर्ता> सीडी .. [चालेंएक फ़ोल्डर ऊपर]
    C: > सीडी NCBI विस्फोट-2.2.27 +
    यह करने के लिए निर्देशिका बदल जाएगा:
    C: NCBI विस्फोट-2.2.27 +>
  15. निम्नलिखित "makedb" आदेश का उपयोग कर डेटाबेस बनाएँ:
    > Makedb में DB / briggsae.fasta-dbtype prot बाहर DB / briggsae
    नोट: उदाहरण के नीचे (चित्रा 4) में डेटाबेस "briggsae" का नाम है और जीव Caenorhabditis briggsae से एक कड़ी समूह शामिल है.
  16. "DB" फ़ोल्डर में एक FASTA स्वरूपित प्रोटीन पाठ अनुक्रम डालने से "परीक्षण" नामक एक क्वेरी प्रोटीन अनुक्रम बनाएँ.
  17. निम्न आदेश टाइप करके एक blastp खोज के माध्यम से डेटाबेस से पूछताछ:
    > Blastp क्वेरी DB / test.txt-DB DB / briggsae बाहर text.txt
  18. एक मैक पर उन्हें>: (2.4 कदम) और ऊपर दिए गए निर्देशों के अनुसार NCBI एफ़टीपी वेबसाइट तक पहुँचने के द्वारा स्थानीय ब्लास्ट खोजों के लिए एक डाटाबेस डाउनलोडएन प्रकार:
    > एलसीडी .. / डेटाबेस /
  19. टाइप करके ब्याज के जीनोम या अनुक्रम डाउनलोड करें:
    > मिल NC_ [परिग्रहण #]. फना
    नोट: ". फना" FASTA स्वरूपित nucleotide अनुक्रम को संदर्भित करता है और "एफएए." FASTA स्वरूपित एमिनो एसिड दृश्यों को दर्शाता है.
  20. FTP साइट से बाहर निकलने के लिए "बंद" लिखें.
  21. टाइप करके डेटाबेस बनाना:
    > DB / mouse.faa बाहर माउस dbtype prot makeblastdb में
  22. "बिन" फ़ोल्डर में एक तेजी से स्वरूपित क्वेरी अनुक्रम डालें और निम्न कमांड के साथ डेटाबेस से पूछताछ:
    > Blastp क्वेरी "आपके query.fasta" DB "अपने डेटाबेस" बाहर results.txt

3. एकाधिक अनुक्रम संरेखण सृजन

  1. आमतौर पर इस्तेमाल एकाधिक अनुक्रम संरेखण (एमएसए) कार्यक्रमों का उपयोग करने के लिए इन लिंक पर क्लिक करें:
    ClustalW 6 http://www.clustal.org/
    कालीजीएन 7 http://msa.sbc.su.se/cgi-bin/msa.cgi
    MAFFT 8,9 http://mafft.cbrc.jp/alignment/software/
    मांसपेशी 10 http://www.drive5.com/muscle/
    टी कॉफी 11 http://www.tcoffee.org/Projects/tcoffee/
    PROBCONS 12 http://toolkit.tuebingen.mpg.de/probcons
  2. - इस लिंक पर क्लिक करें http://tcoffee.crg.cat/apps/tcoffee/do:regular क्वेरी बॉक्स में और इनपुट FASTA स्वरूपित अनुक्रम डेटा -
    नोट: टी कॉफी से एक नमूना उत्पादन चित्रा 5 में देखा जा सकता है, इसी तरह के अवशेषों कोडित रंग के होते हैं.
  3. एक कमांड लाइन संस्करण (ClustalW) या एक चित्रमय वी के रूप में Clustal एमएसए डाउनलोड करेंइस लिंक पर क्लिक करके ersion (ClustalX): http://www.clustal.org/clustal2/ - तब उचित निष्पादन योग्य पर क्लिक करें (यानी जीत, लिनक्स, मैक ओएस एक्स).
  4. FASTA स्वरूपित अनुक्रम पाठ के रूप में डेटा अपलोड करें और चित्रा (6) संरेखित.

4. विकास की सबसे फिट मॉडल निर्धारण

  1. ProtTest 13 प्रोग्राम डाउनलोड करने के लिए यहां क्लिक करें:
    http://darwin.uvigo.es/our-software/
  2. ProtTest डाउनलोड की है एक बार, ProtTest.jar फाइल पर डबल क्लिक करें
  3. ProtTest शुरू की है एक बार, "फाइल चुनें" पर क्लिक करें और चित्रा (7) अनुक्रम डेटा लोड.
  4. तो फिर क्लिक करें "शुरू" और कार्यक्रम (चित्रा 8) शुरू हो जाएगा.
    नोट: रन (8 चित्रा) के पूरा होने के बाद, कार्यक्रम मापदंड पर आधारित सर्वश्रेष्ठ अभिनेत्री का संकेत होगा जैसे "एआईसी के अनुसार सर्वश्रेष्ठ अभिनेत्री: ठठोलिया + मैं + जी"

5. अधिकतम संभावना या Bayesian अनुमान से अनुक्रम आधार Phylogenies inferring

  1. यहाँ PhyML 4 डाउनलोड:
    https://code.google.com/p/phyml/
  2. डबल उपयुक्त आवेदन (यानी phyml विंडोज, phyml लिनक्स, आदि.) और इंटरफ़ेस खिड़की (9 चित्रा) पॉप जाएगा क्लिक करके निष्पादन योग्य लॉन्च.
  3. टाइप करके एक PHYLIP स्वरूपित दृश्य के रूप में इनपुट अनुक्रम लोड:
    > "फ़ाइल नाम". बनावट
    नोट:, अनुक्रम प्रारूपों के बीच परिवर्तित में उपलब्ध "Readseq" वेब प्रोग्राम का उपयोग करने के लिए - http://iubio.bio.indiana.edu/cgi-bin/readseq.cgi .
  4. "वाई" टाइप करके कार्यक्रम का शुभारंभ.
  5. यहाँ MrBayes 5 डाउनलोड:
    rceforge.net / download.php "> http://mrbayes.sourceforge.net/download.php
  6. निष्पादन योग्य फ़ाइल पर कार्यक्रम प्रारंभ क्लिक करें और टाइप करके कार्यक्रम में सांठगांठ स्वरूपित अनुक्रम डेटा को पढ़ने के लिए:
    > "फ़ाइल नाम" निष्पादित. नेक्स
  7. विकासवादी मॉडल सेट करें.
  8. टाइपिंग से चलाने के लिए पीढ़ियों की संख्या का चयन करें:
    > Mcmcp NGEN = 1000000 [इस 1000000 पीढ़ियों की संख्या सेट]
    > नाबदान Burnin = 10000 [इस 10000 से Burnin सेट]
  9. टाइप करके परिणाम फ़ाइल में शाखा लंबाई बचाओ:
    > Mcmcp savebrlens = हाँ
  10. टाइपिंग द्वारा विश्लेषण चलाने:
    > MCMC
  11. "Sumt" आदेश का उपयोग पेड़ संक्षेप.

6. Phylogenies Visualizing

  1. यहां पेड़ दर्शक कार्यक्रमों की सूची देखें:
    http://www.treedyn.org/overview/editors.html
  2. TreeView 14 कार्यक्रम डाउनलोड करेंयहाँ हूँ:
    http://taxonomy.zoology.gla.ac.uk/rod/treeview.html

Subscription Required. Please recommend JoVE to your librarian.

Representative Results

एक प्रश्न के समानता ढूँढना शोधकर्ताओं नए दृश्यों के लिए एक संभावित पहचान मानो और भी दृश्यों के बीच संबंधों का अनुमान लगाने के लिए अनुमति देता है. ब्लास्ट 1 के लिए फ़ाइल इनपुट प्रकार FASTA स्वरूपित पाठ अनुक्रम या परिग्रहण संख्या है. FASTA स्वरूपित अनुक्रम एक ">" चिह्न (चित्रा 2) ने संकेत दिया एक विवरण पंक्ति के साथ शुरू होता है. विवरण ">" पर हस्ताक्षर, अनुक्रम (यानी. न्यूक्लियोटाइड या अमीनो एसिड) अगली पंक्ति पर विवरण का पालन करने के तुरंत बाद का पालन करना होगा. बचत और संपादन अनुक्रम फाइलें, जब वह इस तरह के पीसी या TextWrangler (पर "नोटपैड" के रूप में एक पाठ संपादक का उपयोग करने के लिए सबसे अच्छा है http://www.barebones.com/products/textwrangler/ मैक के लिए). ब्लास्ट एल्गोरिथ्म अनुक्रम समानता की कमी हिस्सों के लिए खोज करता है जो "स्थानीय" संरेखण, प्रदर्शन करती है. एल्गोरिथ्म सभी संभव "stretche ऊपर देखा है, के बादक्वेरी अनुक्रम और ज़्यादा से ज़्यादा बढ़ाया से है "इन दृश्यों, यह तो यह है कि इन मैचों में कितने अच्छे से समझने के लिए तो महत्वपूर्ण है. प्रत्येक क्वेरी अनुक्रम जोड़ी के लिए संरेखण assembles, और इसलिए ब्लास्ट (ई) एक उम्मीद मूल्य शामिल जो प्रत्येक हिट करने के लिए आंकड़े लागू होता है और एक सा स्कोर. ई मूल्य एक मैच के लिए सांख्यिकीय महत्व का संकेत देता है. ई मूल्य कम, अधिक महत्वपूर्ण मारा, उदाहरण के लिए 0.05 की एक ई मूल्य के साथ एक अनुक्रम संरेखण का मतलब है कि इस की संभावना अकेले संयोग से होने वाली मैच 100 में 5 है. सा स्कोर कैसे अच्छा संरेखण है. उच्च बिट स्कोर, बेहतर संरेखण. विस्फोट के ऑनलाइन संस्करण के लिए इसी प्रकार, वहाँ का एक संकेत प्रदान करने के लिए एक विशिष्ट स्कोरिंग मैट्रिक्स का उपयोग करता है स्थानीय ब्लास्ट निष्पादन योग्य का उपयोग कर आदेशों के माध्यम से स्थापित किया जा सकता है कि मानकों के एक नंबर भी इन आदेशों का वर्णन एक व्यापक संसाधन यहां पाया जा सकता है -. http://www.ncbi.nlm.nih.gov/books/ NBK1762 /. स्थानीय खोज का उत्पादन सिर्फ ऑनलाइन ब्लास्ट इंटरफ़ेस से निर्गम (चित्रा 4) की तरह एक पाठ फ़ाइल है.

एक बहु अनुक्रम संरेखण (एमएसए) अमीनो एसिड, डीएनए, या शाही सेना से बना तीन या अधिक प्राथमिक दृश्यों के एक दृश्य के संरेखण है. ClustalW 6 1994 में जारी की है, जीव के लिए सबसे लोकप्रिय एमएसए उपकरणों में से एक है. - कई लोकप्रिय एमएसए उपकरण के लिए एक बंद पहुँच प्रदान करता है कि एक उपयोगकर्ता के अनुकूल ऑनलाइन इंटरफ़ेस यहाँ EMBL-EBI सर्वर पर पाया जा सकता है http://www.ebi.ac.uk/Tools/msa . कई अलग अलग प्रारूपों भी स्वीकार कर रहे हैं, हालांकि प्रत्येक कार्यक्रम के लिए इनपुट FASTA (देखें चित्र 2) अनुक्रम डेटा प्रारूपित किया जा सकता है, और प्रत्येक के लिए कई दर्पण साइटों ऑनलाइन पाया जा सकता है. खाई दंड और उत्पादन प्रारूपों की तरह कई मापदंडों को आसानी से चुना जा सकता है. एमएसए टी कॉफी से एक नमूना उत्पादन समान अवशेषों सह रहे हैं, जहां 5 चित्रा, में देखा जा सकता हैLor कोडित. कुछ मामलों में, एमएसए उपकरण भी डाउनलोड किया है और स्थानीय स्तर पर निष्पादित किया जा सकता है. - Clustal इस वेबसाइट से एक कमांड लाइन संस्करण (ClustalW) या एक चित्रमय संस्करण (ClustalX) के रूप में डाउनलोड किया जा सकता http://www.clustal.org/clustal2/ . डाउनलोड करने के लिए अभी उपयुक्त निष्पादन योग्य पर क्लिक करें (यानी. जीत, लिनक्स, मैक ओएस एक्स). विंडोज के लिए प्रोग्राम निष्पादन डाउनलोड करेंगे और एक पॉप अप मेनू "भागो" क्लिक करें, और उसके बाद स्थापना शुरू हो जाएगा उपयोगकर्ता की आवश्यकता होगी. कार्यक्रम बहुत सहज है, दृश्यों NBRF / पीर, FASTA, EMBL / स्विस Prot, Clustal, जीसीसी / एमएसएफ, GCG9 आरएसएफ, और GDE के रूप में प्रारूपित दृश्यों से युक्त एक पाठ फ़ाइल से लोड किया जा सकता है. दृश्यों "संरेखण" मेनू से "है पूरी स्थिति" पर क्लिक करके जुड़ रहे हैं. ClustalX का उपयोग गठबंधन छह प्रोटीन दृश्यों का एक नमूना संरेखण चित्रा 6 में देखा जा सकता है. जैसे फ़ॉन्ट आकार और रंग के रूप में विभिन्न मापदंडों आसानी से संशोधित, और editi किया जा सकता हैदृश्यों की एनजी "संपादन" मेनू पर क्लिक करके किया जाता है. मैन्युअल परिष्कृत संरेखण अक्सर पूरी तरह से तरीकों से स्वचालित करने के लिए बेहतर होते हैं और इस वजह से, एमएसए उपकरण डेवलपमेंट रिसर्च की एक बहुत सक्रिय क्षेत्र है. कुछ सामान्य संरेखण संपादकों निम्नलिखित लिंक पर पाया जा सकता है: - एसई अल http://tree.bio.ed.ac.uk/software/seal/ ; BSEdit - http://www.bsedit.org/ ; JalView - http://www.jalview.org/ ; Seaview - http://pbil.univ-lyon1.fr/software/seaview.html .

एमिनो एसिड संरेखण के लिए कार्यक्रम ProtTest 13 डेटा भीतर अमीनो एसिड प्रतिस्थापन की सबसे फिट मॉडल का चयन निर्धारित करने के लिए प्रयोग किया जाता है. ProtTest सबसे छोटी Akaike सूचना मानदंड (एआईसी), Bayesian सूचना के साथ उम्मीदवार मॉडल की सूची से मॉडल खोजने के द्वारा यह चयन बनाता हैtion के मानदंड (बीआईसी) स्कोर, या निर्णय थ्योरी मानदंड (डीटी). ProtTest (संस्करण 3.2) के नवीनतम संस्करण 120 विभिन्न मॉडलों में परिणाम है कि 15 अलग दर matrices शामिल हैं. उपयोगकर्ता ProtTest चलाने के लिए अपने सिस्टम पर जावा रनटाइम होना आवश्यक है. जावा रनटाइम यहाँ आसानी से उपलब्ध है - http://www.java.com/en/download/chrome.jsp . दृश्यों PHYLIP या सांठगांठ प्रारूप के रूप में inputted हैं. , अनुक्रम प्रारूपों के बीच परिवर्तित में उपलब्ध "Readseq" वेब प्रोग्राम का उपयोग करने के लिए - http://iubio.bio.indiana.edu/cgi-bin/readseq.cgi . "फाइल चुनें" पर क्लिक करें और अनुक्रम डेटा लोड. तो फिर क्लिक करें "शुरू" और कार्यक्रम शुरू हो जाएगा. चयनित मॉडलों की संख्या को संशोधित करने के लिए, आप "मॉडल" बटन पर क्लिक कर सकते हैं. कार्यक्रम शुरू होता है एक बार जब यह नीचे स्थित एक प्रगति पट्टी प्रदर्शित करेगा और वे विश्लेषण किया जा रहा है के रूप में मॉडलों सूची (8 चित्रा https://code.google.com/p/prottest3/wiki/Background . अभी यह केवल दृश्यों की एक सीमित संख्या संभाल कर सकते हैं, सिवाय इसके कि डाउनलोड संस्करण की तरह कार्य करता है जो ProtTest के लिए एक ऑनलाइन वेब इंटरफेस भी है. - यह वेब इंटरफेस यहाँ पर क्लिक करके पहुँचा जा सकता है http://darwin.uvigo.es/software/prottest2_server.html . न्यूक्लियोटाइड डेटासेट के लिए कार्यक्रम jModelTest 15 एआईसी, बीआईसी, और श्रेणीबद्ध और dynamical संभावना राशन परीक्षण से ऊपर है और यह भी उल्लिखित डीटी मानदंडों को लागू करने से न्यूक्लियोटाइड प्रतिस्थापन की सबसे फिट मॉडल के सांख्यिकीय चयन की जांच करने के लिए प्रयोग किया जाता हैएस (hLRT और dLRT). jModelTest इनपुट के लिए मैक ओएस एक्स के लिए अनुकूलित है, कई प्रारूपों की अनुमति है. एक स्पष्ट कदम दर कदम गाइड यहाँ डेवलपर्स द्वारा उपलब्ध है - http://computing.bio.cam.ac.uk/local/doc/jmodeltest.pdf

PhyML न्यूक्लियोटाइड या एमिनो एसिड दृश्यों के संरेखण से अधिकतम संभावना phylogenies का अनुमान है कि एक कार्यक्रम है. PhyML पेड़ टोपोलॉजी अंतरिक्ष (10 चित्रा) खोज करने के लिए विभिन्न विकल्पों के लिए युग्मित प्रतिस्थापन मॉडल की एक बड़ी संख्या को शामिल करेंगे. कार्यक्रम दो पाठ फ़ाइलों में परिणाम की बचत होगी. पहले फाइल को आसानी से एक पेड़ दर्शक (प्रोटोकॉल 6 देखें) का उपयोग करते हुए देखा जा सकता है जो Newick प्रारूप में एमएल पेड़ शामिल होंगे, और अन्य फ़ाइल के आँकड़े शामिल होंगे (फ़ाइल नाम, मॉडल, लॉग संभावना स्कोर, आदि.) विश्लेषण की . सभी मापदंडों बहुत आसानी से मेनू आइटम के बाद से स्थापित कर रहे हैं. प्रत्येक मेनू सेशन का अधिक विस्तृत विवरण- tion PhyML डाउनलोड पृष्ठ पर उपलब्ध PhyML पुस्तिका में समझाया जाता है https://code.google.com/p/phyml/downloads/list . MrBayes 5 वंशावली रिश्तों को फिर से संगठित करने के लिए विकास के मॉडल की एक संख्या भर में Bayesian MCMC अनुमान है कि इस्तेमाल एक कार्यक्रम है. कार्यक्रम में सभी प्लेटफार्मों पर एक ही व्यवहार करती है और एक बार इंस्टॉलर निष्पादन योग्य स्थापित हो जाएगा डाउनलोड किया. कार्यक्रम शुरू करने के लिए, बस निष्पादन योग्य पर क्लिक करें. - सेट किया जा सकता है और प्रत्येक मॉडल और उनके आदेशों की जानकारी यहां पाया जा सकता है कि कई मॉडल हैं http://mrbayes.sourceforge.net/wiki/index.php/Tutorial . दूसरे की मदद विकल्प "मदद lset" टाइप करने के लिए है - इस मॉडल की स्थापना पर विवरण प्रदान करेगा. उदाहरण के लिए "Prset aamodelpr = मिश्रित" वाशिंगटन के लिए अमीनो एसिड मॉडल स्थापित करेगा "prset aamodelpr = फिक्स्ड (हिलाना)" मिश्रित मॉडलिंग या होगा परमिट जी मॉडल. एक outgroup आसानी टैक्सोन संख्या "outgroup 30" निर्दिष्ट द्वारा सेट किया जा सकता है, प्रोग्राम स्वचालित रूप से संख्या से दृश्यों / Taxa सूचीबद्ध करता है. एक outgroup तय नहीं है तो पेड़ unrooted हो जाएगा. कार्यक्रम (11 चित्रा) शुरू होने के बाद प्रगति "printfreq = एक्स" आदेश का उपयोग कर सेट किया जा सकता है जो विशिष्ट अंतराल में देखा जा सकता है. उपयोगकर्ता के मैनुअल में पाया जा सकता है विश्लेषण (कितने के लिए चलाने के लिए पीढ़ियों यानी.) को रोकने के लिए जब पर अधिक जानकारी. एक cladogram पर क्लेड मूल्यों आसानी से एक पेड़ दर्शक (प्रोटोकॉल 6 देखें) का उपयोग करते हुए देखा जा सकता है कि यह भी Newick प्रारूप में प्रदान की जाती है, जो एक phylogram के साथ परिणामों में प्रदान की जाती हैं.

एक वंशावली पेड़ उत्पन्न होता है एक बार, टोपोलॉजी देखे जा करने की जरूरत है. कई ऑनलाइन उपकरण और पेड़ टोपोलॉजी कल्पना करने के लिए प्रयोग किया जाता से डाउनलोड किए आवेदन कर रहे हैं. लोकप्रिय कार्यक्रमों में से एक आंशिक सूची यहाँ देखा जा सकता है -ylogenetic_tree_visualization_software">http://en.wikipedia.org/wiki/List_of_phylogenetic_tree_visualization_software , और एक अधिक व्यापक सूची यहां पाया जा सकता है - http://www.treedyn.org/overview/editors.html . TreeView 14 और TreeDyn 16 दो लोकप्रिय विकल्प हैं. दोनों विभिन्न विकल्पों के साथ परिचित बनने के लिए बहुत उपयोगकर्ता के अनुकूल और आसान कर रहे हैं. TreeView लगभग समान इंटरफेस का उपयोग करते हुए, मैक और Windows पर चलाता है. इनपुट गठजोड़, PHYLIP, Hennig86, मेगा, और ClustalW / एक्स सहित कई स्वरूपों में से एक हो सकता है TreeView (चित्रा 12) भी उपयोगकर्ता, शाखाओं को स्थानांतरित reroot पेड़, और पेड़ की उपस्थिति को पुनर्व्यवस्थित करने की अनुमति देता है कि एक पेड़ संपादक भी शामिल है.

चित्रा 1
चित्रा 1. > NCBI ब्लास्ट वेब पेज. ब्लास्ट वेब सर्वर ब्लास्ट कार्यक्रमों के एक कमरे में शामिल है और जैव प्रौद्योगिकी सूचना के लिए राष्ट्रीय केन्द्र (एन सी बी आई) द्वारा आयोजित है. बड़ी छवि को देखने के लिए यहां क्लिक करें.

चित्रा 2
चित्रा 2. FASTA स्वरूपित अनुक्रम. FASTA स्वरूप एक ">" ने संकेत दिया एक विवरण पंक्ति के साथ शुरू होता है. विवरण ">" पर हस्ताक्षर, अनुक्रम (यानी. न्यूक्लियोटाइड या अमीनो एसिड) अगली पंक्ति पर विवरण का पालन करने के तुरंत बाद का पालन करना होगा. बड़ी छवि को देखने के लिए यहां क्लिक करें.

NT "के लिए: रखने together.within पृष्ठ =" हमेशा "> चित्रा 3
एक बम विस्फोट खोज से चित्रा 3. HTML आउटपुट. ब्लास्ट खोज से उत्पादन क्वेरी अनुक्रम के भीतर पहचान के क्षेत्रों को दिखाता है, और भी बिट के स्कोर प्रदान करता है, मूल्यों और प्रत्येक मैच के साथ जोड़ो संरेखण की उम्मीद है. बड़ी छवि को देखने के लिए यहां क्लिक करें.

चित्रा 4
चित्रा 4. एक स्थानीय ब्लास्ट निष्पादन योग्य खोज से एक नमूना उत्पादन. इस खोज के उत्पादन, सिर्फ ऑनलाइन ब्लास्ट इंटरफ़ेस से उत्पादन की तरह एक पाठ फ़ाइल है कि उम्मीद मूल्य और सा स्कोर, साथ ही मैच विवरण शामिल हैं. बड़ी छवि को देखने के लिए यहां क्लिक करें.

चित्रा 5
टी कॉफी का उपयोग कर एक एमएसए के चित्रा 5. आउटपुट. उत्पादन समान साइटों और वजन रंग से मैच पर प्रकाश डाला गया. अंतराल के रूप में सम्मिलित कर रहे हैं "-" चिन्ह और छाछ या न्यूक्लियोटाइड स्थिति प्रत्येक टैक्सोन के लिए संरक्षित है. बड़ी छवि को देखने के लिए यहां क्लिक करें.

ig6.jpg "/>
चित्रा 6. ClustalX का उपयोग कर एक नमूना संरेखण. इसी तरह के मैचों रंग कोडित रहे हैं और अंतराल एक के रूप में सम्मिलित कर रहे हैं "-" पर हस्ताक्षर. मेनू बार शीर्ष बाएँ में देखा जाता है. बड़ी छवि को देखने के लिए यहां क्लिक करें.

चित्रा 7
चित्रा 7. ProtTest प्रोग्राम इंटरफ़ेस. बड़ी छवि को देखने के लिए यहां क्लिक करें.

8 चित्रा
फाईgure 8. ProtTest सांत्वना. ProtTest सांत्वना एक विश्लेषण के चलते हुए. प्रगति बार पूरा हो चुका है कि कितने मॉडल इंगित करता है, और मुख्य खिड़की प्रत्येक मॉडल के लिए लॉग संभावना स्कोर को प्रदर्शित करता है. बड़ी छवि को देखने के लिए यहां क्लिक करें.

9 चित्रा
चित्रा 9. PhyML इंटरफ़ेस. बड़ी छवि को देखने के लिए यहां क्लिक करें.

चित्रा 10
चित्रा 10. PhyML इंटरफ़ेस मेनू. दृश्यों PhyML में लोड कर रहे हैं एक बार पहले मेनू प्रकट होता है, वर्ग कोष्ठक में पत्र या प्रतीक लिखकर navigated किया जा सकता है. Submenus "+" चिह्न को टाइप करके पहुंचा जा सकता है. बड़ी छवि को देखने के लिए यहां क्लिक करें.

11 चित्रा
चित्रा 11. MrBayes इंटरफ़ेस. MrBayes प्रगति का शुभारंभ किया गया है, जब विशिष्ट अंतराल में देखा जा सकता है "printfreq = एक्स" आदेश का उपयोग निर्धारित किया है. कार्यक्रम एक रन के दौरान रोका नहीं जा सकता हालांकि पीढ़ियों की निर्धारित संख्या गणना कर रहे हैं के बाद से वे और अधिक पीढ़ियों को चलाना चाहते हैं, तो उपयोगकर्ता के लिए कहा जाएगा.www.jove.com/files/ftp_upload/50975/50975fig11highres.jpg "लक्ष्य =" _blank "> बड़ी छवि को देखने के लिए यहां क्लिक करें.

चित्रा 12
चित्रा 12. TreeView इंटरफ़ेस. इस आंकड़े में TreeView खिड़की Flybase से (http://flybase.org/) प्रोटीन का एक नमूना पेड़ को प्रदर्शित करता है. फ़ाइलें "खुले" विकल्प क्लिक करके, और एक उचित फ़ाइल प्रकार (उदाहरण के लिए. Newick प्रारूप) का चयन करके आयात कर रहे हैं. बड़ी छवि को देखने के लिए यहां क्लिक करें.

Subscription Required. Please recommend JoVE to your librarian.

Discussion

इस लेख के लिए हमारी आशा है कि यह Phylogenetics के लिए नए हैं कि शोधकर्ताओं या छात्रों के मार्गदर्शन के लिए एक प्रारंभिक बिंदु के रूप में सेवा करेंगे. जीनोम अनुक्रमण परियोजनाओं पिछले कुछ वर्षों में कम महंगे हो गए हैं और एक परिणाम के रूप में इस प्रौद्योगिकी के लिए उपयोगकर्ता की मांग बढ़ रही है, और अब बड़े अनुक्रम डेटासेट का उत्पादन छोटे प्रयोगशालाओं में आम है. ये डेटासेट अक्सर उनके कार्य को समझने के लिए शुरू करने के लिए एक वंशावली ढांचे की आवश्यकता है कि जीन के सेट के साथ शोधकर्ताओं प्रदान करते हैं. Phylogenetics अनुसंधान प्रयोगशालाओं की बढ़ती संख्या में एक घर के लग रहा है, क्योंकि इसके अलावा, हम भी जैविक अनुसंधान में मोटे तौर पर दिलचस्पी छात्रों के लिए एक शैक्षिक उपकरण के रूप में सेवा करने के लिए इस लेख के लिए चाहते हैं. "क्यों", "कैसे", और आमतौर पर इस्तेमाल किया पेड़ निर्माण उपकरणों के लिए, हम इन अनुप्रयोगों के साथ खुद को परिचित करने के लिए शुरू करने के लिए पाठक के लिए एक रूपरेखा प्रदान "जहां" और कैसे वे काम पर उपयोगकर्ता जानकारी प्रदान करके. एचowever, हम विभिन्न मापदंडों उनके अनुक्रम डेटा को प्रभावित कर सकते हैं समझ के प्रयास में एक उपकरण के भीतर सभी सेटिंग्स के साथ चारों ओर खेलने के लिए, और प्रत्येक मामले में मंच और सॉफ्टवेयर के बीच संगतता सुनिश्चित करने के लिए पाठक को सलाह. ऊपर उल्लिखित विश्लेषण इंटेल कोर i7 प्रोसेसर के साथ एक Dell Optiplex 990 और एक इंटेल कोर 2 डुओ प्रोसेसर के साथ एक मैकबुक लैपटॉप का उपयोग अभिकलन किया गया था, हालांकि, विश्लेषण की गति और भी विशिष्ट बायनेरिज़ (जैसे. 32 बिट या 64 बिट) निर्भर करेगा उपयोगकर्ता के मंच पर.

Phylogenetics के लिए यह एक तरह एक उपयोगकर्ता पुस्तिका संकलन जब एक चुनौती है, Phylogenetics के क्षेत्र, और एक पूरे के रूप में जैव सूचना विज्ञान, बेहतर संरेखण, समानता भविष्यवाणियों, या वंशावली पेड़ों को उपलब्ध कराने के उद्देश्य से लगातार नए सॉफ्टवेयर विज्ञप्ति कि अनुसंधान का तेजी से विस्तार क्षेत्र है कि है . इस समस्या को कम करने के लिए, हम साल के एक नंबर के लिए चारों ओर गया और ओ खाते पर अभी भी लोकप्रिय हैं कि कार्यक्रमों पर ध्यान केंद्रित करने की कोशिश कीएफ कितनी अच्छी तरह वे काम करते हैं. यही कारण है कि हम इस लेख में उल्लिखित है, और इसलिए इस शोषण और उनके विश्लेषण में कई अनुप्रयोगों को शामिल करने के लिए पाठक को प्रोत्साहित किया है समस्याओं से निपटने के लिए उपलब्ध कई अन्य उपकरण हैं कि बाहर बात करना चाहते हैं, ने कहा.

Subscription Required. Please recommend JoVE to your librarian.

Disclosures

हम खुलासा करने के लिए कुछ भी नहीं है.

Acknowledgments

हम पांडुलिपि पर टिप्पणियों के लिए O'Halloran प्रयोगशाला के सदस्यों को धन्यवाद. हम डी. O'Halloran के लिए वित्त पोषण के लिए जीव विज्ञान के जॉर्ज वाशिंगटन विश्वविद्यालय के विभाग और कला और विज्ञान के कोलंबियन कॉलेज धन्यवाद.

Materials

Name Company Catalog Number Comments
BLAST webpage  http://blast.ncbi.nlm.nih.gov/Blast.cgi
BLAST executables  ftp://ftp.ncbi.nlm.nih.gov/blast/executables/blast+/LATEST/
Preformatted BLAST databases ftp://ftp.ncbi.nlm.nih.gov/blast/db/
Clustal http://www.clustal.org/
Kalign http://msa.sbc.su.se/cgi-bin/msa.cgi
MAFFT http://mafft.cbrc.jp/alignment/software/
MUSCLE http://www.drive5.com/muscle/
T-Coffee http://www.tcoffee.org/Projects/tcoffee/
PROBCONS http://toolkit.tuebingen.mpg.de/probcons 
Se-Al  http://tree.bio.ed.ac.uk/software/seal/
BSEdit  http://www.bsedit.org/
JalView http://www.jalview.org/
SeaView http://pbil.univ-lyon1.fr/software/seaview.html
ProtTest  https://code.google.com/p/prottest3/
Java Runtime  http://www.java.com/en/download/chrome.jsp
Readseq http://iubio.bio.indiana.edu/cgi-bin/readseq.cgi
jModelTest https://code.google.com/p/jmodeltest2/
PhyML https://code.google.com/p/phyml/
MrBayes http://mrbayes.sourceforge.net/download.php
TreeView http://taxonomy.zoology.gla.ac.uk/rod/treeview.html
TreeDyn http://www.treedyn.org/

DOWNLOAD MATERIALS LIST

References

  1. Altschul, S. F., Carroll, R. J., Lipman, D. J. Weights for data related by a tree. J. Mol. Biol. 207 (4), 647-653 (1989).
  2. Akaike, H. A new look at the statistical model identification. IEEE Trans. Automat. Contr. 19 (6), 706-723 (1974).
  3. Schwarz, G. Estimating the dimension of a model. Ann. Stat. 6 (2), 461-464 (1978).
  4. Guindon, S., Gascuel, O. A simple, fast, and accurate algorithm to estimate large phylogenies by maximum likelihood. Syst. Biol. 52 (5), 696-704 (2003).
  5. Huelsenbeck, J. P., Ronquist, F. MRBAYES: Bayesian inference of phylogenetic trees. Bioinformatics. 17 (8), 754-755 (2001).
  6. Thompson, J. D., Higgins, D. G., Gibson, T. J. CLUSTAL W: Improving the sensitivity of progressive multiple sequence alignment through sequence weighting, position-specific gap penalties and weight matrix choice. Nucleic Acids Res. 22 (22), 4673-4680 (1994).
  7. Lassmann, T., Sonnhammer, E. L. Kalign--an accurate and fast multiple sequence alignment algorithm. BMC Bioinformatics. 6, 298 (2005).
  8. Katoh, K., Kuma, K., Toh, H., Miyata, T. MAFFT version 5: Improvement in accuracy of multiple sequence alignment. Nucleic Acids Res. 33 (2), 511-518 (2005).
  9. Katoh, K., Misawa, K., Kuma, K., Miyata, T. MAFFT: A novel method for rapid multiple sequence alignment based on fast fourier transform. Nucleic Acids Res. 30 (14), 3059-3066 (2002).
  10. Edgar, R. C. MUSCLE: Multiple sequence alignment with high accuracy and high throughput. Nucleic Acids Res. 32 (5), 1792-1797 (2004).
  11. Notredame, C., Higgins, D. G., Heringa, J. T-coffee: A novel method for fast and accurate multiple sequence alignment. J. Mol. Biol. 302 (1), 205-217 (2000).
  12. Do, C. B., Mahabhashyam, M. S., Brudno, M., Batzoglou, S. ProbCons: Probabilistic consistency-based multiple sequence alignment. Genome Res. 15 (2), 330-340 (2005).
  13. Darriba, D., Taboada, G. L., Doallo, R., Posada, D. ProtTest 3: Fast selection of best-fit models of protein evolution. Bioinformatics. 27 (8), 1164-1165 (2011).
  14. Page, R. D. TreeView: An application to display phylogenetic trees on personal computers. Comput. Appl. Biosci. 12 (4), 357-358 (1996).
  15. Darriba, D., Taboada, G. L., Doallo, R., Posada, D. jModelTest 2: More models, new heuristics and parallel computing. Nat. Methods. 9 (8), 772 (2012).
  16. Chevenet, F., Brun, C., Banuls, A. L., Jacq, B., Christen, R. TreeDyn: Towards dynamic graphics and annotations for analyses of trees. BMC Bioinformatics. 7, 439 (2006).

Tags

बुनियादी प्रोटोकॉल अंक 84 Phylogenetics एकाधिक अनुक्रम संरेखण वंशावली पेड़ ब्लास्ट निष्पादनयोग्य बुनियादी स्थानीय संरेखण खोज उपकरण Bayesian मॉडल
Nonexperts के लिए Phylogenetics के लिए एक व्यावहारिक गाइड
Play Video
PDF DOI DOWNLOAD MATERIALS LIST

Cite this Article

O'Halloran, D. A Practical Guide toMore

O'Halloran, D. A Practical Guide to Phylogenetics for Nonexperts. J. Vis. Exp. (84), e50975, doi:10.3791/50975 (2014).

Less
Copy Citation Download Citation Reprints and Permissions
View Video

Get cutting-edge science videos from JoVE sent straight to your inbox every month.

Waiting X
Simple Hit Counter