Waiting
Login processing...

Trial ends in Request Full Access Tell Your Colleague About Jove
Click here for the English version

Immunology and Infection

באמצעות ניתוח פילוגנטי לחקור האיקריוטים מקור גנטי

Published: August 14, 2018 doi: 10.3791/56684
* These authors contributed equally

Summary

מתוארת שיטה של בניית עץ פילוגנטי בהתבסס על הומולוגיה רצף של ממתקים פרוקריוטים, SemiSWEETs של אאוקריוטים. ניתוח פילוגנטי הוא כלי שימושי עבור המסביר את relatedness האבולוציוני בין חלבונים הומולוגיים או גנים מקבוצות אורגניזם שונים.

Abstract

ניתוח פילוגנטי משתמש נוקלאוטיד או רצפי חומצות אמינו או פרמטרים אחרים, כגון תחום רצפים ומבנה תלת מימדי, לבנות עץ כדי להראות את הקשר האבולוציוני בין taxa שונים (סיווג יחידות) מולקולרית רמה. ניתוח פילוגנטי יכול לשמש גם כדי לחקור תחום היחסים טקסון בודדים, במיוחד עבור אורגניזמים שעברו משמעותי לשנות מורפולוגיה ופיזיולוגיה, אך עבור חוקרים אשר חוסר ראייה פוסיליים בשל של אורגניזמים היסטוריה אבולוציונית זמן או מחסור של התאבנות.

בטקסט הזה, מתואר פרוטוקול מפורט עבור שימוש בשיטת פילוגנטי, כולל עימוד רצפים חומצת אמינו באמצעות אומגה Clustal ובניית עץ פילוגנטי עוקבות באמצעות שני המרבי הסבירות (ML) של גנטיקה מולקולרית אבולוציונית ניתוח (מגה), מסקנה בייסיאניות ויה MrBayes. כדי לחקור את המקור של גנים סוכרים יהיה בסופו של דבר להיות מובילי מיוצאים (מתוק) האיקריוטים, נותחו 228 סוויטס כולל 35 מתוק מהחלבונים פרוקריוטים חד־תאיות וחלבונים SemiSWEET 57 מ אאוקריוטים. מעניין, SemiSWEETs נמצאו אאוקריוטים, אך מתוקים נמצאו פרוקריוטים. שני העצים פילוגנטי נבנו תוך שימוש בשיטות שונות באופן תיאורטי הראו באופן עקבי כי הגן הראשון מתוק האיקריוטים שאולי נובעים הפיוז'ן של הגן SemiSWEET חיידקי וג'ין SemiSWEET archaeal. ראוי לציין שאת זה. צריך להיות זהיר כדי לצייר מסקנה בהתבסס רק על ניתוח פילוגנטי, למרות זה שימושי להסביר את הקשר הבסיסי בין taxa שונים, אשר קשה או אפילו בלתי אפשרי להבחין באמצעים ניסיוני .

Introduction

רצפי ה-DNA או RNA נושא מידע גנטי של פנוטיפים הבסיסי שניתן מנותח באמצעות שיטות פיזיולוגית ביוכימית או שנמדדו באמצעות ראייה פוסיליים מורפולוגיים. במובן מסוים, מידע גנטי אמינה יותר מאשר הערכת פנוטיפים חיצוני משום שהראשון הוא הבסיס האחרון. במחקר התפתחותי, המאובנים היא מאוד ישירה ומשכנע. אולם, אורגניזמים רבים, כגון מיקרואורגניזמים, יש סיכוי קטן כדי ליצור מאובן במהלך הדורות זמן גיאולוגית. לכן, מידע מולקולרי כגון רצפי חומצת אמינו רצפים של אורגניזמים הקיימים קשורים הם בעלי ערך עבור חקר יחסים אבולוציונית1. במחקר הנוכחי, הקדמה פשוטה של בסיסי ידע פילוגנטי, פרוטוקול קל-כדי-ללמוד סופקה עבור עולים חדשים אשר צריך לבנות עץ פילוגנטי בכוחות עצמם.

דנ א (נוקלאוטיד) והן רצפי חלבונים (חומצות אמינו) ניתן להסיק פילוגנטי קשרי הגומלין בין הגנים הומולוגיים, organelles או אפילו אורגניזמים2. רצפי DNA נוטים יותר להיות מושפע משינויים במהלך האבולוציה. לעומת זאת, רצפים של חומצות אמיניות הם הרבה יותר יציבה, בהתחשב בכך נרדף מוטציות ברצפים נוקלאוטיד אינם גורמים מוטציות ברצפים חומצת אמינו. כתוצאה מכך, רצפי DNA שימושיים השוואה של הגנים הומולוגי אורגניזמים הקשורים קשר הדוק, ואילו חומצת אמינו רצפים מתאימים עבור גנים הומולוגי אורגניזמים רחוקים קשורות3.

ניתוח פילוגנטי מתחיל עם היישור של חומצת אמינו או רצפי נוקלאוטיד4 שאוחזר מהגנום מוערת רצף מסד הנתונים5 המפורטים FASTA תבנית, קרי, חלבון בשם או ביטוי רצפים, רצפי RNA , או רצפי DNA. ראוי לציין כי זה קריטי כדי לאסוף רצפים באיכות גבוהה לניתוח, רצפים הומולוגיים רק יכול לשמש כדי לנתח קשרי גומלין פילוגנטי. פלטפורמות שונות רבות כגון Clustal W, Clustal X, שריר, T-קפה, MAFFT, יכול לשמש עבור עימוד רצפים. בשימוש נרחב ביותר הוא Clustal אומגה6,7 (http://www.ebi.ac.uk/Tools/msa/clustalo/), אשר יכול לשמש באינטרנט או ניתן להוריד ללא תשלום תשלום. הכלי יישור כולל פרמטרים רבים, המשתמש יכול לשנות לפני שמתחילים את היישור, אך הפרמטרים של ברירת המחדל פועלות היטב ברוב המקרים. לאחר השלמת התהליך, יש לשמור את רצפי מסודרים בתבנית הנכונה עבור השלב הבא. הם יש ואז לערוך או חיתוך באמצעות תוכנת עריכת, כגון BioEdit, כי עץ פילוגנטי בנייה על ידי מגה דורש את רצפי להיות באורך שווה (כולל קיצורים חומצת אמינו והן מקפים. ברצף מיושר, בכל תנוחה ללא חומצת אמינו או נוקלאוטיד מיוצג על ידי מקף "-"). באופן כללי, כל חומצות אמינו בולטות או נוקלאוטידים בשני צידי היישור יש להסיר. בנוסף, ניתן למחוק עמודות המכילות רצפי לקוי מיושר היישור כי הם מעבירים מידע בעל ערך קטן, לפעמים יכול לתת מידע מבלבל או שקר3. ניתן למחוק את העמודות המכילות מקפים אחד או יותר בשלב זה או עץ בנייה בשלב מאוחר יותר. לחלופין, הם יכולים לשמש לחישוביות פילוגנטי. עימוד רצפים של זמירה תסתיים, יש לשמור את רצפי מיושר FASTA בתבנית, או את התבנית הרצויה, לשימוש מאוחר יותר.

פלטפורמות תוכנה רבות המספקות פונקציות בניה עץ באמצעות שיטות שונות או אלגוריתמים. באופן כללי, ניתן לסווג את השיטות שיטות מטריצה מרחק או שיטות נתונים בדיד. שיטות מטריצה מרחק הן פשוטה ומהירה כדי לחשב, ואילו שיטות נתונים בדיד מורכב ולגזול. עבור taxa הקשורים קשר הדוק מאוד עם רמה גבוהה של שיתוף של חומצת אמינו או נוקלאוטיד רצף הזהות, שיטה מטריקס מרחק (שכן הצטרפות: NJ; Unweighted שיטת קבוצה זוג עם ממוצע אריתמטי: UPGMA) הוא המתאים; עבור קרובים רחוקים taxa, שיטה נתונים בדיד (נראות מקסימלית: ML; בהססנות מרבי: MP; מסקנה בייסיאניות) היא אופטימלית3,8. במחקר זה, השיטות ML מגה (6.0.6), מסקנה בייסיאני (MrBayes 3.2) הוחלו לבנות עצים פילוגנטי9. באופן אידיאלי, כאשר המודל הנכון לבין פרמטרים משמשים, התוצאות נגזר שיטות שונות עלולות להיות עקבי, והם לכן אמין ומשכנע יותר.

עבור עץ פילוגנטי ML נבנה באמצעות מגה10, יש אפשרות לטעון את הקובץ רצף מסודרים בתבנית FASTA לתוכנית. הצעד הראשון ואז היא לבחור דגם החלפת אופטימלית עבור הנתונים שהועלה. כל הדגמים זמינים החלפת מושווים בהתבסס על הרצף שהועלה, הציונים הסופי שלהם יוצג בטבלה התוצאות. בחר את הדגם עם הציון בקריטריון מידע בייסיאני (המזרחי) הקטן ביותר (מופיע תחילה בטבלה), לקבוע פרמטרים ML לפי הדגם המומלץ, ולהתחיל חישוב. חישוב הזמן משתנה בין מספר דקות עד מספר ימים, בהתאם למורכבות של הנתונים טעון (אורך של רצפים, מספר taxa) ואת הביצועים של המחשב שבו מופעלות התוכניות. חישוב תסתיים, עץ פילוגנטי יוצג בחלון חדש. שמור את הקובץ בשם "FileName.mat". לאחר הגדרת פרמטרים כדי לציין את המראה של העץ, לשמור פעם נוספת. באמצעות שיטה זו, מגה ניתן להפיק הפרסום כיתה עץ פילוגנטי דמויות.

לבנייה בעץ עם MrBayes11, הצעד הראשון הוא לשנות את רצף מיושר, אשר בדרך כלל מופיע בתבנית FASTA, לפורמט נקסוס (.nex כסוג קובץ). הפיכת FASTA קבצים לפורמט nexus ניתן יהיה לעבד מגה. לאחר מכן, ניתן להעלות את רצף מסודרים בתבנית נקסוס לתוך MrBayes. כאשר הקובץ מועלה בהצלחה, ציין פרמטרים מפורטים עבור חישוב עץ. פרמטרים אלה יש לכלול פרטים כגון דגם החלפת חומצת אמינו, וריאציה המחירים, שרשרת מספר עבור שרשרת מרקוב מונטה קרלו mcmc (ב) מצמד, מספר ngen, הממוצע סטיית התקן של פיצול התדרים, וכן הלאה. לאחר פרמטרים אלה צוינו, מתחילים חישוב. בסופו של דבר, שתי דמויות עץ קוד ASC II, מראה קלייד אמינות, אחרים מראה סניף המרחק, יוצג על המסך.

התוצאה עץ יישמרו באופן אוטומטי כמו "FileName.nex.con". קובץ זה עץ ניתן לפתוח ולערוך מאת FigTree, ניתן לשנות את הדמות המוצגת FigTree נוספת כדי להפוך אותו מתאים יותר לפרסום.

במחקר זה, 228 חלבונים מתוק, כולל 35 מ פרוקריוטים חד־תאיות וממתקים SemiSWEETs 57 מ אאוקריוטים, נותחו כדוגמה. ממתקים והן SemiSWEETs מאופיינים גלוקוז, פרוקטוז או סוכרוז מובילי מעבר ממברנות12,13. ניתוח פילוגנטי עולה כי שני התחומים MtN3/רוק המכיל ממתקים עשוי להיגזר פיוז ' ן אבולוציונית של חיידקי SemiSWEET ועורות של archaeon14.

Subscription Required. Please recommend JoVE to your librarian.

Protocol

1. עימוד רצפים

  1. לאסוף את רצפי החומצות של מתוקים האיקריוטים SemiSWEET prokaryotic במסמכים נפרדים ולפרט אותם בתבנית FASTA. להוריד רצפים של המרכז הארצי ביוטכנולוגיה מידע (NCBI), המעבדה לביולוגיה מולקולרית האירופית (EMBL) של הבנק נתונים הדנ א של מסדי נתונים של יפן (DDBJ) על ידי דמיון חיפוש בעזרת הכלי הבסיסי המקומי יישור חיפוש כלי (הפיצוץ).
    1. בתיבה הקבצים לדוגמה, לאסוף 228 רצפי חלבונים מתוק בשם בעל שני תחומים MtN3/רוק (7 transmembrane helices) בין רצפי חלבונים SemiSWEET 57 אחזקת מחשבים MtN3/רוק (3 transmembrane helices) בודדת של אאוקריוטים פרוקריוטים 13.
    2. כדי לפשט את התהליך, בחר המועמד 35 חלבונים מתוק של אורגניזמים האיקריוטים חד־תאיות בין הממתקים בשם 228 לבנייה עץ פילוגנטי. רצפים אלה מחוברים כך הקורא יכול להתאמן על ערכת נתונים אמיתיים.
  2. יישר את רצפי מתוק 35 דילי אותם לתוך אומגה Clustal (http://www.ebi.ac.uk/Tools/msa/clustalo/).
    1. העתק והדבק את רצפי חלבונים בתבנית FASTA לתוך תיבת קלט או להעלות קובץ רצף בתבנית FASTA. לציין כי הם רצף חומצות אמיניות על-ידי לחיצה על הסמל תחת התפריט הנפתח בסעיף "שלב 1".
    2. ציין תבנית פלט ופרמטרים אחרים במקטע 'שלב 2', במידת הצורך. במחקר זה, להגדיר תבנית פלט "clustal ללא מספר", ולהשאיר את שאר הפרמטרים של הגדרות ברירת המחדל. ברוב המקרים, הפרמטרים של ברירת המחדל לעבוד בלי כל מפרט.
  3. שלח ולהפעיל את היישור במקטע 'שלב 3'. יכולה לקחת מספר שניות עד דקות לסיום היישור. בחלונית ' 'סיכום התוצאות' ', לחצו לחיצה ימנית על הקישור תחת "היישור בתבנית CLUSTAL" ושמור את רצפי מיושר "35.clustal" (איור 1).
  4. פתח את הקובץ תוצאה יישור ב- BioEdit.
    1. על הלוח הראשי של BioEdit, לחץ "רצף" בחר "רוח לערוך" בתפריט הנפתח הראשון, ולאחר מכן לחץ על "ערוך משקעים" בתפריט המשנה (איור 2).
    2. בחר את רצפי בולטות בצד שמאל של היישור עם הסמן (הרצף שנבחר יוצג בשחור) ולחץ על הסמל "מחק" תחת תפריט "עריכה" כדי להסיר את רצפי שנבחר (איור 3).
    3. בחר, למחוק את רצפי בולטות בצד ימין של התחום MtN3/רוק הראשונה ולאחר שמירת הרצף החתוך MtN3/רוק הראשונה תחום 35-I.fas (איור 4). באופן דומה, למחוק את שמאל ואת צד ימין בולטות רצפים של התחום השני MtN3/רוק, שמור אותו כקובץ 35-II.fas. הראשון, הרצף השני של תחום MtN3/רוק ניתן לחזות עם קצב (http://proteinformatics.charite.de/rhythm/inndex.php?site=helix) או TMHMM (http://www.cbs.dtu.dk/services/TMHMM/) מראש.
  5. פתח את הקובץ 35-I.fas עם מגה ולאחר לחץ על "ישר" כאשר תתבקש לעשות זאת. תחת תפריט "עריכה", לחץ על "בחר הכל" ולאחר מכן לחץ על "בחר Sequence(s)"; השמות ואת רצף taxa ייבחרו בשחור (איור 5).
    1. בחר "עותק" מתפריט "עריכה" כדי להעתיק את רצפי ללוח ולאחר מכן הדבק את רצפי המועתק לקובץ doc.
    2. בקובץ doc, להחליף כל "#" ">", ולאחר מכן מחק את כל התווים שאינם קשורים כדי להמירם לתבנית FASTA. להוסיף "-אני" בסוף כל טקסון שם כדי לסמן אותם רצפים התחום הראשון של MtN3/רוק. תהליך הרצף השני של תחום MtN3/רוק בעקבות באותה השיטה ולהוסיף "-II" לאחר כל שם טקסון.
  6. שלב הרצף התחום הראשון והשני של MtN3/רוק, בתבנית FASTA בקובץ doc.
    1. לטעון את רצפי משולב לתוך אומגה Clustal שוב ויישר את רצפי כפי שתואר לעיל. לשמור את התוצאה "35 realigned.clustal".
    2. פתח את הקובץ "35 realigned.clustal" ב BioEdit, למחוק את שאריות חומצה אמינית (בולט) לא אחידה בשני צידי הרצף מיושר, ולאחר מכן לשמור את רצפי כמו "35 realigned.fas". לחץ על "כן" כאשר הזהיר כי לא ניתן לשמור חלק מהתווים שאינם סטנדרטיים.

2. חישוב של עץ פילוגנטי

  1. לפתוח את "35 realigned.fas" מגה.
    1. לחץ על תפריט "נתונים", לבחור "יישור ייצוא" ושמור את היישור בתבנית PAUP (nexus) כמו "35.nex" לשימוש מאוחר יותר ב- MrBayes (איור 6).
    2. בינתיים, לחץ על הסמל "מודלים" על הלוח הראשי של מגה, לבחור "למצוא את הטוב ביותר DNA/חלבון מודלים (ML)" ולאחר לחץ על "אישור" בחלון מוקפץ. לחץ על "חשב" כדי להתחיל את מודל חיפוש תהליך (איור 7). פאנל התקדמות חדש ייפתח; תהליך זה נמשך מספר דקות מספר ימים, בהתאם למורכבות הרצפים טעון והביצועים של המחשב.
      הערה: טבלה המציגה שהתוצאות ייפתח לאחר סיום תהליך חיפוש מודל ( איור 8). התוצאה המזרחי הקטן יפורטו תחילה, ואחריו סדרה של מודלים שונים עם המזרחי הציונים הולך וגדל בהדרגה. המודל הראשון "LG + G + F" עם התוצאה המזרחי הקטן ביותר הוא הדגם המומלץ עבור עץ ML המבוסס על קובץ "35 realigned.fas".
  2. לחץ על הסמל "טקסונומי" על הלוח הראשי של מגה, לחץ על "לבנות/בדיקות מקסימלית הסבירות לעץ" ולאחר מכן לחץ על "כן" על לוח מוקפץ. חלון חדש ייפתח מראה שונה פרמטרים צריכים להיות שצוין (איור 9).
    1. תחילה, הגדר את ערך האתחול במבחן של התיבה האמיניות; 500 או 1000 מספיקה ברוב המקרים. תחת המודל החלפת, בחר "חומצת אמינו" כסוג החלפה. המטרה של בחירת דגם החלפת היא להעריך את ההבדל האמיתי בין רצפים מבוסס על הברית הנוכחי שלהם3.
    2. בחר "LG עם Freqs. דגם (+F) "(LG + F) בתיבה מודל/שיטה. המחירים ואת התיבה תבנית, בחר "גאמא מבוזר" (G) לתאר את קצב וריאציות על-פני אתרים, כלומר., לתת יותר משקל שינויים לאט מתפתח אתרי3. בתיבה ערכת משנה נתונים, בחר "להשלים את המחיקה" כדי להסיר את כל העמודות המכילות מקפים.
    3. לשמור על פרמטרים אחרים במדינות ברירת המחדל שלהם (איור 9). לאחר מפרט של פרמטרים אלה, לחץ על הסמל "מחשוב" כדי להתחיל את החישוב.

3. מצגת של עץ פילוגנטי

הערה: עץ פילוגנטי ML, יוצגו חישוב באמצעות מגה תסתיים (איור 10).

  1. תחת התפריט הנפתח של סמל "קובץ" על לוח עץ, לבחור "שמור ההפעלה הנוכחית" כדי לשמור את התוצאה (.mas הוא סוג הקובץ המהווה ברירת מחדל). במחקר הנוכחי, התוצאה נשמרה כמו "35.mas". על לוח עץ, פרמטרים רבים, כולל אורך של קלייד, בסגנון עץ, עץ טופולוגיה, גופן של טקסון שם, גודל, צבע, מוצגים, ניתן להגדיר אפשרויות שונות.
  2. שמור את הקובץ הסופי עץ על-ידי לחיצה על סמל התמונה, ולשמור את הדמות בתבניות שונות או להעתיק את התמונה כמקור עבור עריכת תמונות.

4. ניתוח של מערכת היחסים של ממתקים, SemiSWEETs באמצעות עימוד רצפים

הערה: שלב זה לא ייתכן שיהיה צורך בניתוח רצף רגיל.

  1. יישר את הממתקים האיקריוטים 228 ו 57 SemiSWEETs prokaryotic Clustal באומגה כמתואר לעיל. ניתן להציג את התוצאות יישור ב- Jalview, שהוא משתלב אומגה Clustal, להעתיק לשמירת עורך צילום (איור 11).
    הערה: דוגמה ביישור, כמה SemiSWEETs של α-פרוטאובקטריה מיושרים עם קבוצת המחשבים MtN3/רוק הראשונה של הרצף מתוק, ואילו SemiSWEETs מ- Methanobacteria (ארכאונים) מיושרים עם התחום MtN3/רוק השני של הרצף מתוק.

5. מבנה עץ פילוגנטי עם MrBayes

  1. על מסקנות בייסיאניות עם MrBayes, פתח את קובץ ההפעלה של MrBayes, ממשק דוס יצוץ בחלון חדש. הצעד הראשון הוא לקרוא את file הנתונים נקסוס. קלט "בצע 35.nex" לאחר שורת (זכור לשמור את הקובץ nex 35. באותה ספריה של קובץ ההפעלה MrBayes, או לציין את הנתיב של הקובץ לפני שאתה מעלה אותו). הודעה "מטריקס קריאה מוצלחת" יוצגו בעקבות האחרון taxa הרשומים (איור 12). הקובץ nex 35. יש כבר היה מוכן והציל מגה (ראה 2.1 לעיל).
  2. הגדרת המודל האבולוציוני.
    1. לאחר שורת, הקלד "prset aamodelpr = fixed(lg); המחירים lset = g ". "Lg" ו- "g" יתאימו למודל "LG" ו- "G" אשר שוכן מגה. לאחר הגדרת בהצלחה את המודל, הקלד "mcmc ב nchains = 4 ngen = 5,000,000" לאחר הבקשה. לנצל "nchains = 4" ערך מסמל את המספר הכולל של שרשרת קר אחד, שלושה חם שרשראות של צימוד מטרופוליס. "ngen = 5,000,000" פירושו לרוץ 5,000,000 דורות של מטרופוליס צימוד ההתכנסות של הרשתות קרים וחמים. במחקר זה, נחשב הממוצע סטיית התקן של פיצול התדרים מתחת 0.01 התכנסות של הרשתות חמים וקרים.
    2. הערה המספר ngen לא ניתן לחזות במדויק בתחילת התהליך, והוא בדרך כלל צריך להיות מותאם בהתבסס על השינוי הממוצע סטיית התקן של פיצול התדרים. בנוסף, המספר ngen להתקרבות עשוי להיות שונה בכל פעם בעת הפעלת התוכנית המבוססת על אותם נתונים.
  3. להפעיל את הניתוח: שלב זה נמשך כמה דקות ועד מספר ימים, בהתאם למורכבות של נתוני הקלט ואת הביצועים של המחשב. לאחר השלמת חישוב מראש, הנחיה ישאל "להמשיך עם ניתוח (כן/לא)?" אם "לא" זה מוקלד לאחר הבקשה, מחשוב יפסיק (איור 13), אחרת הוא ימשיך לחשב לאחר מספר דורות נוספים המוזנים. לאחר חישוב יושלם (עם סטיית תקן ממוצעת של פיצול התדרים < 0.01 או 0.05), להפסיק את חישוב על-ידי הקלדת "לא" לאחר שורת חקירה.
    הערה: 0.01 הוא קריטריון קפדנית, 0.05 היא מתונה בדרך כלל נאותה.
  4. לסכם את הדוגמאות: הקלד "בור קיבול" אחרי שורת לסיכום דגימות של מודל פרמטרים (איור 14). לאחר מכן הקלד "sumt relburnin = burninfrac כן = 0.25" לאחר שורת לסיכום דגימות העץ. מידע מפורט אודות בניית עץ פילוגנטי תוצג כמו באיור 15, ואחריו שתי דמויות עץ שיופיע בקוד השני עולה על המסך, אמינות קלייד מראה את אורך סניף אחרים של הצגה. במקביל, קובץ עץ עם השם של "35.nex.con" יישמרו באופן אוטומטי.
  5. עבור הצגה טובה יותר של עץ פילוגנטי, פתח את הקובץ עץ "35.nex.con" בעזרת הכלי FigTree (http://tree.bio.ed.ac.uk/software/figtree/), בחר סגנון או גודל כדי להציג את התוצאה (באיור 16) או אפילו לערוך אותו בעורך צילום כדי להפוך אותו הקורא ידידותי יותר.

Subscription Required. Please recommend JoVE to your librarian.

Representative Results

עצים פילוגנטי להראות כי כל קבוצות MtN3/רוק הראשונה של הרצף מתוק 35 מקובצים באשכולות וגם קלייד אחד התחומים MtN3/רוק השני של הרצף מתוק מקובצים באשכולות כמו קלייד אחר. בנוסף, תוצאות היישור של ממתקים, SemiSWEETs להציג כמה SemiSWEETs של α-פרוטאובקטריה מיושר עם קבוצת המחשבים MtN3/רוק הראשונה של הרצף מתוק, ואילו SemiSWEETs מ- Methanobacteria (ארכאונים) מיושר עם הרוק/MtN3 השני התחום של הרצף מתוק. תוצאות אלו יחד מראים כי שני התחומים MtN3/רוק המכיל ממתקים עשוי להיגזר פיוז ' ן אבולוציונית של חיידקי SemiSWEET ועורות של archaeon14.

Figure 1
איור 1 : לשמור את רצפי המיושרת של 35 ממתקים האיקריוטים בשם "35.clustal" דרך Clustal אומגה. אנא לחץ כאן כדי להציג גירסה גדולה יותר של הדמות הזאת.

Figure 2
איור 2 : בחר נתיב ב- BioEdit כדי לקצץ רצפי מיושר "35.clustal", אשר הוכן באומגה Clustal. אנא לחץ כאן כדי להציג גירסה גדולה יותר של הדמות הזאת.

Figure 3
איור 3 : בחר ומחק את רצפי לא אחיד בצד שמאל של הרצף הראשון של תחום MtN3/רוק של ממתקים האיקריוטים בשם 35 ב- BioEdit. אנא לחץ כאן כדי להציג גירסה גדולה יותר של הדמות הזאת.

Figure 4
איור 4 : רצפי החתוך של התחום MtN3/רוק הראשונה של ממתקים האיקריוטים בשם 35 ב- BioEdit. אנא לחץ כאן כדי להציג גירסה גדולה יותר של הדמות הזאת.

Figure 5
איור 5 : לבחור ולהעתיק את רצפי התחום הראשון MtN3/רוק של ממתקים האיקריוטים בשם 35 במגה- רצפי שהועתק יודבק בקובץ doc העריכה. אנא לחץ כאן כדי להציג גירסה גדולה יותר של הדמות הזאת.

Figure 6
איור 6 : להמיר "35 realigned.fas" "35.nex" (בפורמט PAUP) עבור בייסיאניות היסק בשלב מאוחר יותר. אנא לחץ כאן כדי להציג גירסה גדולה יותר של הדמות הזאת.

Figure 7
איור 7 : חיפוש עבור דגם החלפת מיטבית על ידי מגה לבנייה עץ פילוגנטי הסבירות המרבית (ML) המבוסס על קובץ "35 realigned.fas". אנא לחץ כאן כדי להציג גירסה גדולה יותר של הדמות הזאת.

Figure 8
איור 8 : טבלה של המודל החלפת מיטבית שחושב עבור עץ ML המבוסס על קובץ "35 realigned.fas". אנא לחץ כאן כדי להציג גירסה גדולה יותר של הדמות הזאת.

Figure 9
איור 9 : לציין את הפרמטרים לחישוביות עץ ML, המבוססת על מודל החלפת מיטבית עבור "realigned.fas 35" במגה- אנא לחץ כאן כדי להציג גירסה גדולה יותר של הדמות הזאת.

Figure 10
איור 10 : עץ ML המקורי נבנה על ידי מגה המבוסס על "35 realigned.fas". בשלב זה, אפשרויות רבות עבור איור סגנון, גודל, צבע, וכו '., זמינות. אנא לחץ כאן כדי להציג גירסה גדולה יותר של הדמות הזאת.

Figure 11
איור 11 : היישור של ממתקים האיקריוטים 228, 57 SemiSWEETs prokaryotic על ידי אומגה Clustal. התוצאות הוצגו ב- Jalview, משולבים אומגה Clustal. ביישור, כמה SemiSWEETs של α-פרוטאובקטריה היו מיושר עם קבוצת המחשבים MtN3/רוק הראשונה של הרצף מתוק, ואילו SemiSWEETs מ- Methanobacteria (ארכאונים) היו מיושר עם התחום MtN3/רוק השני של הרצף מתוק. אנא לחץ כאן כדי להציג גירסה גדולה יותר של הדמות הזאת.

Figure 12
איור 12 : לטעון את הקובץ "35.nex" לתוך MrBayes בחלון DOS. על מנת להציג תוצאות הכוללת, תוכן דומה נמחק כדי להפחית את אורך איור. אנא לחץ כאן כדי להציג גירסה גדולה יותר של הדמות הזאת.

Figure 13
איור 13 : המידע המוצג על המסך לאחר חישוב של קובץ ה-"35.nex" באמצעות MrBayes. כדי להציג את תוצאות הכוללת, תוכן דומה נמחק כדי להפחית את אורך איור. אנא לחץ כאן כדי להציג גירסה גדולה יותר של הדמות הזאת.

Figure 14
איור 14 : סיכם דגימות של מודל פרמטרים עבור קובץ ה-"35.nex". אנא לחץ כאן כדי להציג גירסה גדולה יותר של הדמות הזאת. אנא לחץ כאן כדי להציג גירסה גדולה יותר של הדמות הזאת.

Figure 15
איור 15 : סיכם עץ דגימות של קובץ ה-"35.nex". כדי להציג את תוצאות הכוללת, תוכן דומה נמחק כדי להפחית את אורך איור. אנא לחץ כאן כדי להציג גירסה גדולה יותר של הדמות הזאת.

Figure 16
איור 16 : עץ פילוגנטי "35.nex.con" המוצג על-ידי FigTree. אנא לחץ כאן כדי להציג גירסה גדולה יותר של הדמות הזאת.

Subscription Required. Please recommend JoVE to your librarian.

Discussion

זה הופך יותר ויותר פופולרי במחקר ביולוגי כדי להפוך עץ פילוגנטי בהתבסס על נוקלאוטיד או רצפי חומצות אמינו8. באופן כללי, ישנם שלושה שלבים קריטיים על המרפאה כולל עימוד רצפים, הערכה של הרצף מיושר עם השיטה הנכונה או אלגוריתם, והדמיה של תוצאה חישובית כמו עץ פילוגנטי. במסגרת המחקר הציג, נערכו שלושה סבבי עימוד רצפים: ראשית, רצפי חלבונים מתוק, כולל התחום MtN3/רוק הראשונה והשניה, היו מיושרים; שנית, כל אחד הרצפים בודדים של תחום MtN3/רוק של הממתקים כמו טקסון עצמאית היו אסף, מיושר יחד; לבסוף, רצפים SemiSWEET ורצפים מתוק היו במשותף מיושר. סיבוב אחד בלבד של עימוד רצפים נדרש בדרך כלל לבניית עץ phylogenic.

בשלב ראשוני, ניתן להוריד רצפים הומולוגיים NCBI או מסדי נתונים אחרים. רצפי שהורדו אלה ייתכן שתצטרך להיות מוקרן אם הם הם לא טוב להן ביאורים. בשלב הראשון והשני, יישור וחישוביות לא ניתן להתחיל אם תבנית רצף שגוי. לדוגמה, אומגה Clustal תדחה סטייה כלשהי מתבנית FASTA בקובץ ה-רצף. בשלב חישובית, שימו לב כי המרחק רצף כולל הן חומצות אמינו או נוקלאוטידים ומקפים נדרשים להיות שווה לפני חישובו על ידי מגה.

למרות העושר של שיטות ומודלים לבנייה בעץ הזמינות, אף אחד מהם הוא חסין בפני תקלות. תוצאות חזקות ומשכנע הם עקביים עם אחד את השני כאשר אלגוריתמים שונים או דוגמניות משמשים כדי להעריך את הנתונים באותו15. ב שיטת ML, האמינות של טופולוגיית עץ תלויה, במידה רבה ערך האתחול של קלייד כל; ערך האתחול של 70 ומעלה נחשב בדרך כלל אמינים. בהווה לומדים, כל הרצפים התחום הראשון MtN3/רוק מקובצים באשכולות כמו קלייד גדול עם ערך האתחול של 83. הערך של קלייד אחרים המכילים כל את השני MtN3/רוק תחום רצפים, לעומת זאת, היה רק 6 (איור 10). כדי לוודא את הארכיטקטורה עץ, MrBayes, אשר מעסיקה בשיטה שונה לחלוטין16 מ מ ל, שימש כדי לנתח את קשרי הגומלין בין taxa. הסתברויות האחורי16 clades התחום הראשון והשני המתקבל MrBayes היו 100 ו- 68, בהתאמה (באיור 16).

מגבלה נוספת של ML, חישוב MrBayes הוא כי הן זמן רב כדי להפעיל. באמצעות מחשב עם מעבדים מרובי ליבות יחידות העיבוד הגרפי (GPU) שימושי לשפר את הביצועים חישובית ומהירות17,18. עבור הפעולה של MrBayes, מחשב עם כרטיס גרפי נפרד, את מנהלי ההתקנים המתאימים CUDA יכול להאיץ באופן משמעותי את החישובים הסבירות11.

בחירת הדגם המתאים לחישוביות עץ פילוגנטי קשה עבור אלה עם ניסיון מועט. במובן זה, מגה מספק דרך קלה כדי למצוא את הדגם הטוב ביותר על ידי השוואת התוצאות המזרחי של המועמד מודלים. בנוסף, 6.0 מגה לאחרונה שדרוג משלב מספר רצף יישור כלים כגון שרירים ו- Clustal W10, אשר נוח מאוד לשימוש. הוא מספק גם עריכת רצף והן פונקציה בניה עץ פילוגנטי. תכונות אלה להסביר חלקית מדוע תוכנה זו הוא כל כך פופולרי בתחום אבולוציה מולקולרית חישובית. באשר MrBayes, יתרון משמעותי של כלי זה היא כי זה יכול לעבד נתונים מסוג מעורב ביחד (למשל., נתונים מורפולוגיים מולקולרי)11, ולכן התוצאות הן מקיפות יותר.

לסיכום, המחקר הנוכחי מספק שיטה לנתח את מקור מולקולרית של גנים קידוד חלבונים שעברו וריאציה מורכבים כגון פיוז'ן לאחר שכפול או העברה גנטית אופקית (HGT) במהלך האבולוציה. בתקווה, ממצאים יותר יתגלה עם יישום נרחב של ניתוח פילוגנטי בשדה המחקר האבולוציוני.

Subscription Required. Please recommend JoVE to your librarian.

Disclosures

המחברים אין לחשוף.

Acknowledgments

עבודה זו נתמכה על ידי נבחרת מדעי הטבע קרן של סין (31371596), המרכז לחקר ביו-טכנולוגיה, סין שלושת הערוצים האוניברסיטה (2016KBC04), יסודות מדעי הטבע במחוז ג'יאנגסו, סין (BK20151424).

Materials

Name Company Catalog Number Comments
Adobe Illustration a graphical tool developed by Adobe Systems Software Ireland Ltd. Copyright © 2017
BioEdit a biological sequence alignment editor written for Windows 95/98/NT/2000/XP/7. Copyright © Tom Hall
Clustal Omega a package for making multiple sequence alignments of amino acid or nucleotide sequences.  http://www.clustal.org/
CorelDRAW a graphic design software. Copyright © 2017 Corel Corporation
FigTree a graphical viewer of phylogenetic trees designed by the University of Edinburgh
MEGA MolecularEvolutionary Genetics Analysis version6.0 http://www.megasoftware.net/home
MrBayes an Bayesian phylogenetic inference tool
NVIDIA a company designs graphics processing units (GPUs) for the gaming and professional markets. Corporation Copyright © 2017
PAUP Phylogenetic Analysis Using Parsimony. David Swofford's program implements the maximum likelihood method under a number of nucleotide models.
Photoshop a raster graphics editor developed and published by Adobe Systems Software Ireland Ltd. Copyright © 2017
RHYTHM a knowledge based prediction of hekix contacts. Charité Berlin – Protein Formatics Group - Copyright 2007-2009
TMHMM a tool for prediction of transmembrane helices in proteins. http://www.cbs.dtu.dk/services/TMHMM/
Compter 4 GB memory, Core 2 or above CPU. Windows 7, Windows 10

DOWNLOAD MATERIALS LIST

References

  1. Nei, M., Kumar, S. Molecular Evolution and Phylogenetics. , Oxford University Press. Oxford. (2000).
  2. Foth, B. J. Phylogenetic analysis to uncover organellar origins of nuclear-encoded genes. Methods Mol Biol. 390, 467-488 (2007).
  3. Baldauf, S. L. Phylogeny for the faint of heart: a tutorial. Trends Genet. 19, 345-351 (2003).
  4. Feng, D. F., Doolittle, R. F. Progressive sequence alignment as a prerequisite to correct phylogenetic trees. J Mol Evol. 25, 351-360 (1987).
  5. Persson, B. Bioinformatics in protein analysis. EXS. 88, 215-231 (2000).
  6. Sievers, F., et al. Fast, scalable generation of high-quality protein multiple sequence alignments using Clustal Omega. Mol Syst Biol. 7, 539 (2011).
  7. Sievers, F., Higgins, D. G. Clustal omega. Curr Protoc Bioinformatics. 48, 1-16 (2014).
  8. Yang, Z., Rannala, B. Molecular phylogenetics: principles and practice. Nat Rev Genet. 13, 303-314 (2012).
  9. Hall, B. G. Comparison of the accuracies of several phylogenetic methods using protein and DNA sequences. Mol Biol Evol. 22, 792-802 (2005).
  10. Tamura, K., Stecher, G., Peterson, D., Filipski, A., Kumar, S. MEGA6: Molecular Evolutionary Genetics Analysis version 6.0. Mol Biol Evol. 30, 2725-2729 (2013).
  11. Ronquist, F., et al. MrBayes 3.2: efficient Bayesian phylogenetic inference and model choice across a large model space. Syst Biol. 61, 539-542 (2012).
  12. Chen, L. Q., et al. Sugar transporters for intercellular exchange and nutrition of pathogens. Nature. 468, 527-532 (2010).
  13. Xuan, Y., et al. Functional role of oligomerization for bacterial and plant SWEET sugar transporter family. Proc Natl Acad Sci USA. 110, 3685-3694 (2013).
  14. Hu, Y., et al. Phylogenetic evidence for a fusion of archaeal and bacterial SemiSWEETs to form eukaryotic SWEETs and identification of SWEET hexose transporters in the amphibian chytrid pathogen Batrachochytrium dendrobatidis. FASEB J. 30, 3644-3654 (2016).
  15. Holder, M. T., Zwickl, D. J., Dessimoz, C. Evaluating the robustness of phylogenetic methods to among-site variability in substitution processes. Philos Trans R Soc Lond B Biol Sci. 363, 4013-4021 (2008).
  16. Alfaro, M. E., Holder, M. T. The Posterior and the Prior in Bayesian Phylogenetics. Annu Rev Ecol Evol Syst. 37, 19-42 (2006).
  17. Suchard, M., Rambaut, A. Many-core algorithms for statistical phylogenetics. Bioinformatics. 25, 1370-1376 (2009).
  18. Zierke, S., Bakos, J. FPGA acceleration of the phylogenetic likelihood function for Bayesian MCMC inference methods. BMC Bioinformatics. 11, 184 (2010).

Tags

אימונולוגיה זיהום גיליון 138 יישור אומגה Clustal מגה MrBayes עץ פילוגנטי חלבון רצף
באמצעות ניתוח פילוגנטי לחקור האיקריוטים מקור גנטי
Play Video
PDF DOI DOWNLOAD MATERIALS LIST

Cite this Article

Zhang, D., Kan, X., Huss, S. E.,More

Zhang, D., Kan, X., Huss, S. E., Jiang, L., Chen, L. Q., Hu, Y. Using Phylogenetic Analysis to Investigate Eukaryotic Gene Origin. J. Vis. Exp. (138), e56684, doi:10.3791/56684 (2018).

Less
Copy Citation Download Citation Reprints and Permissions
View Video

Get cutting-edge science videos from JoVE sent straight to your inbox every month.

Waiting X
Simple Hit Counter