Metagenomic ניתוח של תחמיץ

1Biosciences, University of Exeter
Published 1/13/2017
0 Comments
  CITE THIS  SHARE 
Genetics
 

Summary

Cite this Article

Copy Citation

Tennant, R. K., Sambles, C. M., Diffey, G. E., Moore, K. A., Love, J. Metagenomic Analysis of Silage. J. Vis. Exp. (119), e54936, doi:10.3791/54936 (2017).

Please note that all translations are automatically generated.

Click here for the english version. For other languages click here.

Abstract

Introduction

Metagenomics הוא הניתוח הישיר של DNA מטוהר מן הקהילות ביולוגיות נמצאות בתוך דגימות סביבתיות 1 ו שמש במקור כדי לזהות חיידקי unculturable נמצאים במשקעים 2. Metagenomics כבר בשימוש נרחב במשך מספר יישומים, כגון זיהוי Microbiome האדם 3, לסיווג אוכלוסיות חיידקים בתוך האוקיינוס 4 ואפילו לניתוח של קהילות חיידקים המתפתחים על מכונות קפה 5. המבוא של טכנולוגיות רצף הדור הבא הביא תפוקת רצף גדולה ופלט. כתוצאה מכך, רצפי DNA הפכו יותר חסכוניים 6 ואת העומק של רצף שניתן לבצע גדלה מאוד, מה שמאפשר metagenomics להפוך כלי רב עצמה, אנליטי.

"Front-end" שיפורים בהיבט המעשי, המולקולרי של רצף metagenomic הניעו את הצמיחה של בכלי ביואינפורמטיקה סיליקון זמין עבור הסיווג הטקסונומי 7-9, ביאור תפקודי 10,11 וייצוג חזותי 12,13 של נתוני רצף DNA. מספר הגדל וההולך של זמין, רצף פרוקריוטים ו האיקריוטים 14 הגנום מאפשר דיוק נוסף בסיווג קהילות חיידקים, אשר מבוצעות תמיד מול מסד נתוני התייחסות "עורפי" של הגנום רצף 15. שתי גישות עיקריות ניתן לאמץ לניתוח metagenomic.

השיטה המקובלת יותר היא ניתוח של הגן 16S rRNA קידוד באזור של הגנום של חיידקים. 16S rRNA הוא שמור ביותר בין המינים פרוקריוטים אבל מפגין תשעה אזורים היפר-משתנה (V1 - V9) אשר ניתן לנצל לצורך זיהוי מינים 16. המבוא של רצף ארוך יותר (≤ 300 נ"ב סוף לזווג) מותר לניתוח רצפי DNA פורש שני אזורים-משתנה יתר, בפרטV3 - באזור V4 17. התקדמות בטכנולוגיות רצף אחרות, כגון אוקספורד nanopore 18 PacBIO 19, מתירה את גן 16S rRNA כולו להיות רצף בסמיכות.

בעוד 16S ספריות מבוססות rDNA לספק גישה ממוקדת, לשם זיהוי מינים ולאפשר זיהוי של דנ"א מספר נמוך עותק המתרחש באופן טבעי בתוך דגימות מטוהרות, ספריות רצף רובה לאפשר זיהוי של מינים שעלולים להכיל אזורי DNA כי הם או לא amplifiable ידי 16S רצפי פריימר סמן rRNA בשימוש, או בגלל ההבדלים בין רצף התבנית ואת רצף הגברה פריימר גדולים מדי 20,21. יתר על כן, למרות polymerases DNA יש איכות גבוהה של שכפול ה- DNA, שגיאות בסיס בכל זאת יכולה להתרחש במהלך הגברת PCR ושגיאות המשולבות אלה עלולות לגרום סיווג שגוי של שמקורם מינים 22. הטיות הגברת PCR של seq התבניתמשפיעה יכולה להתרחש גם; רצפים של DNA עם תוכן GC גבוה יכולים להיות בתת-ייצוג בברכת amplicon הסופי 23 ובדומה שינויי בסיס טבעיים, כגון גליקול תימין, יכול לעצור polymerases DNA גורם כשלי ההגברה של DNA רצפי 24. לעומת זאת, ספריית DNA רצף אקדח היא ספריית DNA כי הוכנה באמצעות כל ה- DNA מטוהר כי כבר שחולץ ממדגם ובהמשך מקוטע לתוך אורכי שרשרת דנ"א קצר לפני הכנה על רצף. סיווג טקסונומי של רצפי DNA שנוצר על ידי רצף הרובה הוא יותר כמדויק בהשוואה רצף amplicon 16S rRNA 25, למרות העלות הכספית הנדרשת כדי להגיע לעומק רצף אמין הוא גדול יותר מזה של רצף amplicon 26. היתרון העיקרי של metagenomics רצף אקדח הוא שאזורי רצף של הגנום השונה במדגם זמינים וסיקור גן פעם הם היוסווג 27 טקסונומית.

נתוני רצף metagenomic מנותחים על ידי מגוון גדל והולך של כלי bioinformatic. כלים אלה מסוגלים לבצע מגוון רחב של יישומים, למשל, ניתוח בקרת איכות של הנתונים רצף גלם 28, חופפים של סוף לזווג קורא 29, דה נובו הרכבה של רצף מקריא contigs ופיגומים 30,31, הסיווג הטקסונומי וויזואליזציה של רצף הקורא התאסף רצפי 7,12,32,33 ואת הביאור התפקודי של רצפים התאספו 34,35.

תחמיץ, המיוצר על ידי חקלאים בכל רחבי העולם מדגנים מותססים כמו תירס (Zea Mays), משמש ברובה כמו לבהמות. תחמיץ מטופל עם sp לקטובצילוס חיידק. כדי לסייע תסיסה 36 אך עד כה, יש ידע מוגבל של אוכלוסיות חיידקים אחרים שנמצאו תחמיץ. fermentatioתהליך n יכול להוביל מיקרו אורגניזמים בלתי-רצויים ומזיקים פוטנציאל להיות נפוץ בתוך תחמיץ 37. בנוסף שמרים ועובש, חיידקים הם סתגלניים במיוחד לסביבת אנאירובי תוסס תחמיץ ומזוהים בתדירות גבוהה יותר עם מחלות בעלי חיים ולא השפלה של התחמיץ 38. חיידקים חומצה בוטירית ניתן להוסיף בטעות מאדמת נשאר בעת מילוי בממגורות תחמיץ והם מסוגלים להמיר את חומצת חלב, תוצר של עיכול אנאירובי, חומצה בוטירית, ובכך להגדיל את רמת החומציות של תחמיץ 39. העלייה זו pH יכולה להוביל להתגברות חיידקים מקולקלים לא יוכל בדרך כלל כדי לקיים את צמיחה בתנאי תסיסת תחמיץ אופטימלי 38. Spp Clostridium. , Spp ליסטריה. ו spp Bacillus. הם מדאיג במיוחד, במיוחד תחמיץ עבור להאכיל בקר לחלב, כפי נבגי החיידקים ששרדו את gastrבדרכי ointestinal 40 יכולות להיכנס-שרשרת מזון, להוביל קלקול מזון, במקרים נדירים, כדי חי למותם של בני אדם 37,39,41-44. יתר על כן, בעוד שקשה להעריך את ההשפעה הכלכלית המדויקת של טיפול וטרינרים ואובדן בעלי חיים הנגרם על ידי קלקול תחמיץ, היא עשויה להיות מזיק חווה אם התפרצות הייתה להתרחש.

ההשערה היא כי באמצעות גישת metagenomic אנחנו יכולים לסווג אוכלוסיות החיידקים שנמצאות בדגימות תחמיץ ויתר על כן לזהות קהילות חיידקים הקשורים קלקול תחמיץ כי היו, בתורו, יש פוטנציאל השפעה מזיקה על בעלי החיים, המאפשר פעולה מתקנת כדי להיות נלקח לפני התחמיץ הוא לשמש כמקור מזון.

Protocol

1. אתר מיקום

  1. אסוף מדגם התחמיץ מאתר מתאים כגון בחווה. הנה, החווה ממוקמת Ballydulea, קורק ושות 'אירלנד (51 ° 51'58.4 "N 8 ° 16'48.7" W).

2. DNA הפקה

הערה: מיצוי DNA בוצע באמצעות ערכה מסחרית בהתאם להוראות היצרן. כביקורת שלילית, שהכילה לא מדגם, שפעלה לכל אורכו של שיטת הכנת הספרייה.

  1. הוספת 100 - 400 מ"ג של מדגם חיץ פוספט נתרן 978 μL 122 μL חיץ אדמה תמוגה בתוך הצינורות תמוגה מסופק.
  2. Homogenize דגימות ידי הנחת צינורות תמוגה לתוך homogenizer עבור 40 שניות במהירות של 6.0 m / s.
  3. lysates צנטריפוגה ב 14,000 XG במשך 15 דקות ולהעביר את supernatant לצינור מיקרו צנטריפוגות נקי המכיל 250 μL של פתרון המשקע חלבון (PPS). מערבבים את הפתרון על ידי היפוך 10 פעמים צנטריפוגות14,000 XG במשך 5 דקות.
  4. מוסיפים את supernatant ל -1 מטריצה ​​מחייב מ"ל DNA בתוך שפופרת 15 מ"ל צנטריפוגות נקי. מערבבים את הפתרון על ידי צינור היפוך הזמן במשך 3 דקות. אפשר התערובת להסתפק 3 דקות, ואז להשליך 500 μL של supernatant. מערבבים את supernatant הנותרים.
  5. העבר 600 μL של ההשעיה מסנן ספין צנטריפוגות ב 14,000 XG דקות 1. מחק את התסנין וחזור על התהליך עם ההשעיה הנותרת.
  6. הוספת 500 μL של חיץ לשטוף את המטריצה ​​DNA מחייבת בתוך מסנן ספין, ומערבבים על ידי pipetting, אז צנטריפוגות ב 14,000 XG דקות 1.
  7. מחק את תסנין ו צנטריפוגות מסנן ספין שוב ב 14,000 XG במשך 2 דקות על מנת להבטיח את כל חיץ לשטוף יוסר. לייבש את מסנן ספין על 23 צלזיוס למשך 5 דקות.
  8. טרום חמים (70 C) המים ללא DNase (DES) מחדש להשעות המטריצה ​​DNA מחייבת ב 100 μL של DES בתוך מסנן ספין. מעבירים את מסנן ספין על 1.5 מ"ל מיקרו צנטריפוגות נקי tuצנטריפוגות להיות 14,000 XG במשך 1 דקות כדי elute DNA. אחסן את ה- DNA מטוהרים ב -20 C עד לניתוח נוסף מבוצע.

3. טיהור DNA DNA באמצעות חרוזי טיהור

הערה: לפני הכנת ספריית metagenomic את חילוץ DNA היה מטוהר באמצעות חרוזי טיהור כדי להבטיח דגימת DNA טהורה הושגה.

  1. דגירת החרוזים ב 23 צלזיוס למשך 30 דקות לפני השימוש. מוסיפים 2 כרכים של חרוזים על דגימת DNA דגירה הפתרון על 23 צלזיוס למשך 5 דקות.
  2. מניח את הדגימות על מגנט הפרדה במשך 5 דקות ולאחר מכן לבטל את supernatant. שטפו את החרוזים פעמיים עם 200 μL אתנול 80% טרי (EtOH). האוויר יבש חרוז במשך 10 דקות.
  3. הסר את דגימות מן מגנט ההפרדה ולהוסיף 50 μL של חיץ elution (EB), ומערבבים על ידי pipetting
  4. לדגור על השעיית ב 23 צלזיוס למשך 5 דקות, ולאחר מכן למקם את הדגימות בחזרה אל מגנט ההפרדה במשך 3 דקות.
  5. Transfer supernatant, אשר מכיל את ה- DNA, אל צינור נקי. מחק את החרוזים.
  6. לכמת את ה- DNA מטוהר כהוראת סעיף ארבעה.

4. כימות DNA המטוהר

הערה: מטוהרים DNA היה לכמת באמצעות fluorometer ו פעמיים תקועים (dsDNA) רגישות גבוהה (HS) ערכת assay בעקבות הוראות היצרן.

  1. כן פתרון עבודה באמצעות 199: 1 יחס של חיץ מגיב.
  2. הוסף 10 μL של תקן זה DNA 190 μL של פתרון עובד.
  3. הוסף 10 μL של DNA מטוהרים 190 μL של פתרון עובד. ההיקף הסופי צריך להיות 200 μL. דגירה דגימות תקן ו- DNA ב 23 צלזיוס למשך 2 דקות.
  4. לנתח הסטנדרטים לפני דגימות DNA על fluorometer לפי ההוראות המופיעות על המסך.

5. הכנת ספריית רצף רובה

הערה: ספריית רצף רובה הוכנה באמצעותערכת כנת הספרייה מסחרית באמצעות הוראות היצרן.

  1. לדלל את דגימות DNA ל -0.2 ng / μL באמצעות EB. כל מדגם שהוא כבר מתחת ריכוז זה, כלומר השליטה השלילית, נשאר בריכוז הנוכחי שלה.
  2. מערבבים 5 μL של ה- DNA מטוהרים עם 10 μL חיץ תמהיל האנזים 5 μL. דגירה דגימות ב 55 צלזיוס למשך 5 דקות.
  3. הוסף 5 μL של נטרול חיץ דגירה הפתרון על 23 צלזיוס למשך 5 דקות.
  4. הוסף 5 μL של כל אחד ממדדי רצף ספציפי מדגם ו -15 μL של PCR תערובת מאסטר.
  5. ב thermocycler, דגירת הדגימות ב 72 צלזיוס במשך 3 דקות, 95 צלזיוס למשך 30 שניות, לפני 12 מחזורים של 95 צלזיוס למשך 10 שניות, 55 C למשך 30 שניות ו -72 C למשך 30 שניות. דגירת דגימות לבסוף ב 72 צלזיוס למשך 5 דקות.
  6. לטהר את הדנ"א המוכן באמצעות טיהור החרוז כמו קודם, אבל עם elution סופי של 30 μL של EB.

6. Lכמות ibrary ולבדוק את איכות

הערה: הכמות והאיכות של הספריות המוכנות הוערכה באמצעות ערכה ומכשור מסחרית.

  1. דגירת רכיבי הערכה ב 23 צלזיוס למשך 30 דקות לפני השימוש.
  2. הוסף 2 μL של DNA כדי 2 μL של חיץ מערבולת דקות 1 ב -2,000 סל"ד.
  3. ספין למטה המדגם כדי להבטיח שהוא בתחתית של התחתית.
  4. הכנס את דוגמיות, קלטת ניתוח וטיפים לתוך המכשיר, ולבצע ניתוח עפ"י הוראות על ידי התוכנה.

רצפי DNA 7.

  1. העברת דגימות ספריות רצפי DNA המוכנות לכמת לשירות רצף רצף באמצעות הסוף לזווג 300 נ"ב רצף 45.

8. ניתוח של נתוני רצף גלם

הערה: פקודות עבור כל תוכנית משתמש במערכת הפעלה לינוקס מוצגים מתחת צעד פרוטוקול. הצינור משמש יםניתוח נתוני equence מוצג באיור 1. התוכנית בנויה כתוכנית להיות מותקן על ידי המשתמש לפני הניתוח. תהליך זה אמור להתבצע בנפרד עבור כל דגימה.

  1. לנתח ולהציג נתוני רצף ה- DNA באמצעות FastQC 46 על ידי הקלדה לשורת הפקודה / נתיב אל קובץ / fastqc, ואחריו קדימה הפוך גלם קורא raw_read2.fastq raw_read1.fastq.
  2. ציין ספריית פלט על ידי הקלדת output_fastqc -o ואת תבנית הקובץ של קבצים לקריאה גלם ידי fastq -f.
  3. הצג את קובץ הפלט (איור 2).
    הנתיב אל קובץ / fastqc raw_read1.fastq raw_read2.fastq -o output_directory -f fastq.

9. זמירה בקרת איכות הנתונים רצף סינון

  1. הפעל את תכנית הזמירה, 28 Trimmomatic ידי הקלדה לתוך java-jar / נתיב אל קובץ שורת הפקודה /-0.35.jar trimmomatic.
  2. ציין את הקבצים הם זיווג קבצים סוף על ידי הקלדת "PE". מדינה 16 pr המרכזייחידות ocessing (CPUs) צריכות לשמש את התכנית על ידי הקלדת -threads 16.
  3. יש לרשום את שני קבצים כדי לבדוק QC ידי הקלדת שמותיהם של קדימה הגלם הפוך קורא. התחילית של קבצי פלט נקבעת על ידי הקלדת תחמיץ -baseout.
  4. הגדר את האפשרויות עבור התוכנית על ידי הקלדת ILLUMINACLIP: NexteraPE-PE.fa: 2: 30: 10 בכירים: 3 נגרר: 3 SLIDINGWINDOW: 4: 20 הגידולים: 200 HEADCROP: 15 MINLEN: 36.
  5. לכשיושלם, לנתח את הרצפים הגזוזים באמצעות FastQC כמו קודם ולהשוות את פלט נתוני רצף גלם כדי להבטיח זמירה שבוצע בהצלחה.
    הערה: כלי תוכנה, Trimmomatic, גזוז קורא עוד יותר על ידי הסרת באיכות נמוכה מובילה או בסיסים N (להלן איכות 3), הסרת נגרר באיכות נמוכה או בסיסים N (להלן איכות 3) וסריקה כל לקרוא עם חלון הזזה רחב 4-בסיס. הפרמטרים נקבעו לחיתוך כאשר האיכות הממוצעת לכל בסיס יורדת מתחת 20 ולאחר מכן לרדת כל קורא להלן 36 בסיסים. לבסוף, 15 בסיסים היו קצוצים frאום בראש כל לקרוא וקורא היו קצוץ לשמור 200 בסיסים מההתחלה של קריאה. השלב האחרון זה בוצע כדי להתגבר על כמה בעיות איכות כאשר רצף ארוך (> 200 נ"ב) קורא. אלה יכולים להיות מותאמים עבור דגימות ספציפיות 28.
    java-jar /path-to-file/trimmomatic-0.35.jar PE -threads 16 raw_read1.fastq raw_read2.fastq ILLUMINACLIP תחמיץ -baseout: NexteraPE-PE.fa: 2: 30: 10 בכירים: 3 נגרר: 3 SLIDINGWINDOW: 4 : 20 גידולים: 200 HEADCROP: 15 MINLEN: 36

10. Metagenome האסיפה

  1. מזג את המזווג, הגזוז קורא ידי הקלדת חתול ואחריו מזווג הקורא; silage_read1_unpaired.fastq silage_read2_unpaired.fastq. כתוב את קבצי קובץ חדש על ידי הקלדה> silage_merged_unpaired.fastq
    חתול silage_read1_unpaired.fastq silage_read2_unpaired.fastq> silage_merged_unpaired.fastq
  2. כדי דה נובו להרכיב את ה- DNA רצף, השתמש Spades (מאסף הגנום סנט פטרסבורג) 30 על ידי הקלדת / נתיב אל-file / spades.py. ציין כי 16 מעבדים ישמשו ידי הקלדת -t 16 וכי הפרמטר metagenomic צריך להחיל על ידי הקלדת --meta.
  3. לזהות את גזוז קדימה קורא באמצעות -1 silage_read1_paired.fastq וכן להפך קורא ידי -2 silage_read2_paired.fastq. המזווג הממוזג קורא שצוינו על ידי silage_merged_unpaired.fastq -s.
  4. הגדר את תיקיית הפלט ידי הקלדת -o silage_spades.
    הנתיב אל קובץ / spades.py -t 16 --meta -1 silage_read1_paired.fastq -2 silage_read2_paired.fastq -s silage_merged_unpaired.fastq -o silage_spades

11. חפיפה קראו מותאם-סוף

  1. מיזוג זוגות רצף ה- DNA קורא באמצעות FLASH (התאמת אורך תענית סיפורים קצרים) 29 על ידי הקלדת לתוך שורת הפקודה / נתיב אל קובץ / פלאש. ציין כי 16 מעבדים אמורים לשמש באמצעות -t 16 ואת קידומת הפלט ידי הקלדת -o תחמיץ.
  2. זהה גזוז קורא ידי הקלדת silage_trimmed_R1.fastq silage_trimmed_R2.fastq
    הנתיב אל קובץ / פלאש -t 16 -o הבזיק silage_read2_paired.fastq silage_read1_paired.fastq

סיווג טקסונומי 12.

  1. סוג / נתיב אל קובץ / קראקן ולציין את מסד הנתונים על ידי הקלדת --db / נתיב אל קובץ / סטנדרטי.
  2. הגדר כי 16 מעבדים אמור לשמש על ידי הקלדת --threads 16 ולזהות ספריית פלט באמצעות --output FLASHed_silage_extendedFrags_kraken.txt. הקלד את שם קובץ קלט; FLASHed_silage.extendedFrags.fastq
    הנתיב אל קובץ / קראקן --db תקן --thread 16 --output FLASHed_silage_extendedFrags_kraken.txt FLASHed_silage.extendedFrags.fastq
    הערה: סיווג של פיגומי רצף DNA נאספו באמצעות קראקן 7 הושלם נגד האחרון, מסד נתוני קראקן תקן שהכילו את כל רצפי גנום פרוקריוטים זמינים.
  3. העברת עמודות 2 ו -3 מקובץ פלט לקובץ חדש על ידי הקלדת לחתוך -f2,3 FLASHed_silage_extendedFrags_kraken.txt> FLASHed_silage_extendedFrags_kraken.int
  4. לחתוך -f2,3 FLASHed_silage_extendedFrags_kraken.txt> FLASHed_silage_extendedFrags_kraken.int
  5. לייבא את הקובץ החדש לתוך כתר 12 על ידי הקלדת ktImportTaxonomy. ציין את קובץ הקלט ידי הקלדת FLASHed_silage_extendedFrags_kraken.int. זהה את קובץ הפלט על ידי הקלדת -o FLASHed_silage_extendedFrags_kraken.out.html.
    הנתיב אל קובץ / ktImportTaxonomy FLASHed_silage_extendedFrags_kraken.int -o FLASHed_silage_extendedFrags_kraken.out.html

13. ביאור פונקציונלי

  1. עבור אל אתר האינטרנט 47 MG-RAST, http://metagenomics.anl.gov/. הירשם כמשתמש חדש במידת הצורך. לאחר הכניסה לאתר, לחץ על הכפתור "העלאה". העלה את הפיגומים שהורכבו שלב 10.
  2. ברגע שהקבצים נטען, לחץ על "שלח" ופעל בהתאם להוראות ולהמתין השלמת ניתוח.
  3. לאחר הניתוח הושלם, להציג את הקישור שנשלח באמצעות email מ MG-RAST, או לחילופין, לחץ על "התקדמות". יש רשימה של עבודות שהושלמו. הקש על id העבודה הרלוונטי ולאחר מכן על הקישור "בדף ההורדה".
  4. בדף ההורדה, תחת הכותרת "Clustering חלבון 90%", לחץ על כפתור החלבון להוריד את קובץ חלבון חזה, 550.cluster.aa90.faa.
  5. כדי לסווג את החלבונים כמו putatively שנמנה עם סוגי אנזים מסוים CAZy, להשוות את החלבונים שהורדו למסד הנתונים CAZy 48. הורד את מסד אנזימים פחמימות-Active (CAZy) מקבצים הם: AA.zip, CE.zip, GH.zip, GT.zip ו PL.zip. קבצים אלה מייצגים המעמדות אנזים הבאים בהתאמה: פעילויות עזר (AA), פחמימות esterases (CE), glycoside Hydrolases (GH), Glycosyl טרנספראז (GT) ו פוליסכריד Lyases (PL).
  6. לפתוח את קבצי מסד הנתונים ויסמנו את החלבונים על ידי קביעת דמיון חלבון חלבוני מסד CAZy באמצעות אלגור USEARCH UBLASTithm 49. כדי להשתמש לולאה bash (עבור i ב .txt *) כדי לבצע איטרציות עד 5 סוג קבצי txt הנתונים "עבור i ב * .txt; לעשות".
  7. הפעל USEARCH ידי הקלדת / נתיב אל קובץ / usearch8 עם -ublast פרמטר על מנת להשתמש באלגוריתם ublast. ואז להקליד את השם של קובץ חלבון הרצף שהורד MG-RAST "mgmXXXXXX.3.550.cluster.aa90.faa".
  8. כדי לציין את קובץ מסד הנתונים כדי לשמש סוג "-db $ i" וכדי לציין את סף E-ערך ב 1e -5, הקלד "1E-5 -evalue".
  9. כדי לסיים את החיפוש לאחר גילוי רצף היעד ולכן לסיווג כי רצף חלבון כמו השתייכות למעמד אנזים היעד, למשל GH, הקלד "-masaccepts 1".
  10. כדי להגדיר כי 16 מעבדים אמורים לשמש סוג "-threads 16" וכדי לציין את הפורמט של קובץ הפלט כסוג טקסט מופרד atab "-blast6out". כדי לזהות את קובץ סוג הפלט "$ i.ublast". כדי לסיים את הלולאה bash, type "; נעשה"
    עבור i ב * .txt;
    לעשות / נתיב אל קובץ / usearch8 -ublast ../mgmXXXXXX.3.550.cluster.aa90.faa -db $ i -evalue 1E-5 -maxaccepts 1 -threads 16 -blast6out i.ublast $;
    בוצע

14. חזותי CAZy ביאור

  1. כדי להמחיש את התפוקה מן ביאור CAZy כמו דיאגרמת ון, ליצור רשימות חלבון מזהה לכל סוג האנזים באמצעות לולאה bash. סוג "עבור i ב * .ublast; לעשות".
  2. כדי להעביר עמודה 1 מקובץ פלט לקובץ חדש, מסוג "חתול $ i | לחתוך -f 1> $ i.list".
  3. לסיים את הלולאה וסוג "; נעשה".
  4. פתח את קבצי .list בעורך טקסט. עבור אל אתר האינטרנט, לבחור את מספר סטים כמו 5 ולהדביק את התוכן של כל קובץ רשימה בקופסא נפרדת. הורד בתרשים וכתוצאה כקובץ .SVG.
    עבור i ב * .ublast;
    חתול לעשות $ i | לחתוך -f 1> $ i.list;
    בוצע

Representative Results

לפני עיבוד bioinformatic, רצף גלם קורא קוצצו ומתאמים הוסרו באמצעות Trimmomatic תוכנה 28. לאחר שלב הזמירה וסינון, מספר כניסות הופחת ל -50% של רצף הקורא (טבלה 1). ציון Phred הבסיס הממוצע היה> 30 לאחר בקרת איכות (איור 2).

זוגות של רצפי DNA אשר היו אזורים חופפים מוזגו באמצעות תוכנת FLASH 29 כדי ליצור אחת כבר קורא, שאינו חופף קורא נשמרו בקובץ נפרד. 45.47% קורא (105,343) בשילוב בהצלחה. בעקבות חופפים של קורא באמצעות FLASH של קורא, שברי הוארך וכתוצאה מכך עברו הסיווג הטקסונומי חיידקי באמצעות קראקן תוכנה 7 ו היו דמיינו לאחר מכן עם תוכנת כתר (איור 3).

.within-page = "1"> רוב מינים של חיידקים הנמצאים metagenome תחמיץ נמצאים בתוך 4 טווח המערכת פרוקריוטים: Firmicutes (34%), Actinobacteria (28%), פרוטאובקטריה (27%) ו Bacteroidetes (7%) . חלוקת כיתות הנוכחי בתוך טווח המערכת אלה ניתן לראות באיור 4. המין הנפוץ ביותר metagenome היה spp לקטובצילוס. (24%; Firmicutes), spp Corynebacterium. (8%; Actinobacteria), spp Propionibacterium. (3%; Actinobacteria) ו spp Prevotella. (3%; Bacteroidetes). מינים חשובים לבריאות בעלי חיים הקשורים במחלות נצפו גם; Spp Clostridium. (1%) spp Bacillus. (0.6%), spp ליסטריה. (0.2%) נחזו להיות נוכח במדגם התחמיץ.

ביאור פונקציונלי בוצע על התאספו קורא. Metagenome הורכב באמצעות מאסף Spades 30 באמצעות גזוז ומסונןלזווג-end מזווג קורא ליצירת 92,284 פיגומים. על מנת לזהות cellulases, חלבונים נחזו באמצעות MG-RAST והערות באמצעות מסד אנזימים פחמימות-Active (CAZy). של 97,562 חלבוני חזה, 6357 היו מפורשים כמו אנזים בפחמימות פעילות המשוערת באחד מחמש מעמדות האנזימים שמרכיבות את מסד נתוני CAZy (איור 5). תוצאות היו דמיינו כמו דיאגרמת ון באמצעות תוכנת InteractiVenn 50 מראה את חלוקת הסברי חלבון כולל אלו המכילים יותר מאחד ביאור בכיתת אנזים CAZy. מבין אלה, נחזו 3861 לקיים פעילות hydrolase glycoside ו יאופיינו הלאה במעבדה כדי לאשר פונקציה.

איור 1
איור 1: bioinformatic Metagenomics צינור עבור הניתוח של תחמיץ. שתי גישות עיקריות היושימוש כדי לחקור את Microbiome של תחמיץ, סיווג הטקסונומי ביאור תפקודי. אנא לחץ כאן כדי לצפות בגרסה גדולה יותר של דמות זו.

איור 2
איור 2: איכות רצף Per-בסיס לפני ואחרי קיצוץ מתאם הסרה. רצף שידורי בסיס עלילת איכות FASTQC מציגה את הציון הממוצע Phred פני האורך של הרצף קורא בקרת איכות לפני ואחרי. אנא לחץ כאן כדי לצפות בגרסה גדולה יותר של דמות זו.

איור 3
איור 3: טקסונומי Classification של Microbiome חיידקית של תחמיץ מוצק. סיווג של רצף גזוז וחופפים קורא מתוך FLASH בוצע באמצעות קראקן 7 ובהמשך מדמיין עם כתר. אנא לחץ כאן כדי לצפות בגרסה גדולה יותר של דמות זו.

איור 4
איור 4: התפלגות מחלקה טקסונומי של 4 טווח המערכת בשכיחותו Microbiome חיידקית של תחמיץ מוצק. האחוז לכל סוג של חיידקים בתוך ארבעה טווח המערכת הנפוצה ביותר. Firmicutes: וקלוסטרידיאה.את (אדום) ואת החיידקים (כחול כהה); פרוטאובקטריה: דלתא / אפסילון (ורוד), אלפא (בצבע כחול חיוור), גמא (כתום) בטא (טורקיז); Bacteroidetes: Flavobacteriia (כחול כהה) ו Bacteroidia(ירוק חיוור); Actinobacteria: Coriobacteriia (סגול כהה) ו Actinobacteria האחר (ירוק כהה). אנא לחץ כאן כדי לצפות בגרסה גדולה יותר של דמות זו.

איור 5
איור 5: CAZy ביאור של Proteome החזוי של Microbiome התחמיץ המוצק. דיאגרמת ון מראה את חלוקת חמשת כיתות האנזים מהערות CAZy ב proteome החזוי של Microbiome תחמיץ מוצק. אנא לחץ כאן כדי לצפות בגרסה גדולה יותר של דמות זו.

קורא # גלם # מסונן קורא (זיווג) # מסונן קורא # הבזיק קורא
(מְזוּוָג) (מזווג)
2,374,949 x2 231,679 x2 1,892,534 105,343

טבלה 1: סיכום טבלת רצף קורא.

Discussion

בעוד בניתוח סיליקון יכול לתת תובנה מצוינת קהילות החיידקים שנמצאות בתוך דגימות סביבתיות, זה קריטי, כי הסיווגים טקסונומיות הפגינו להתבצע בשיתוף עם בקרות רלוונטיות וכי בעומק של רצף מתאים הושג על מנת ללכוד את כולו אוכלוסיית 51 נוכחית.

עם כל ניתוח חישובית, ישנם מסלולים רבים כדי להשיג מטרה דומה. השיטות שבהם השתמשנו במחקר זה הם דוגמאות של שיטות מתאימות וישירה, כי כבר הפגיש להשיג מגוון של ניתוחים על Microbiome תחמיץ. מגוון ומספר גדל והולך של כלי ביואינפורמטיקה וטכניקות זמינים לנתח נתונים metagenomic, למשל Phylosift 8 ו MetaPhlAn2 52, ואלה יש להעריך לפני החקירה עבור הרלוונטיות שלהם המדגם req ניתוחuired 53. שיטות ניתוח metagenomic מוגבלים על ידי מסדי נתונים עבור זמין עבור סיווג, עומק רצף ואיכות רצף.

עיבוד bioinformatic הפגין כאן בוצע על מחשב מקומי, גבוה Powered; אולם מערכות מבוססות ענן זמינים אף הם. שירותי ענן מבוסס אלה מאפשרים להשכרה של כוח מחשוב הדרושים מבלי השקעת העלות הגבוהה של עבודה מקומית חזקה מתאימה. יישום הפוטנציאל של שיטה זו יהיה להעריך תחמיץ לפני השימוש בו בחקלאות, כדי לוודא ששום חיידקים מזיקים נוכחים ולכן למנוע מהם להיכנס לשרשרת המזון.

Materials

Name Company Catalog Number Comments
FastDNA SPIN Kit for Soil MP Bio 116560200 DNA Extraction
DNA FastPrep MP Bio 116004500 DNA Extraction
Agencourt AMPure XP beads Beckman Coulter A63880 DNA Purification
Elution Buffer Qiagen 19806 DNA Purification
Qubit Fluorometer Thermo Fisher Q33216 DNA Quantification
Qubit dsDNA HS Assay Kit Thermo Fisher Q32854 DNA Quantification
Nextera XT DNA Library Prep Kit Illumina FC-131-1024 Library Preparation
Nextera XT Index Kit Illumina FC-131-1001 Library Preparation
TapeStation 2200 Agilent G2964AA DNA Quantification
HS D100 ScreenTape Agilent 5067-5584 DNA Quantification
HS D100 ScreenTape Reagents Agilent 5067-5585 DNA Quantification
TapeStation Tips Agilent 5067-5153 DNA Quantification
TapeStation Tubes Agilent 401428 and 401425 DNA Quantification
HiSeq 2500 Illumina DNA Sequencing - provided by a sequencing service
High Power Analysis Workstation Various Local or cloud based, user preferred system

DOWNLOAD MATERIALS LIST

References

  1. Riesenfeld, C. S., Schloss, P. D., Handelsman, J. Metagenomics: genomic analysis of microbial communities. Annu. Rev. Genet. 38, (1), 525-552 (2004).
  2. Amann, R. I., Ludwig, W., Schleifer, K. H. Phylogenetic identification and in situ detection of individual microbial cells without cultivation. Microbiol. Rev. 59, (1), 143-169 (1995).
  3. Human Microbiome Project Consortium. Structure, function and diversity of the healthy human microbiome. Nature. 486, (7402), 207-214 (2012).
  4. Venter, J. C., et al. Environmental genome shotgun sequencing of the Sargasso Sea. Science. 304, (5667), 66-74 (2004).
  5. Vilanova, C., Iglesias, A., Porcar, M. The coffee-machine bacteriome: biodiversity and colonisation of the wasted coffee tray leach. Sci. Rep. 5, 17163 (2015).
  6. Hayden, E. C. Technology: The $1,000 genome. Nature. 507, (7492), 294-295 (2014).
  7. Wood, D. E., Salzberg, S. L. Kraken: ultrafast metagenomic sequence classification using exact alignments. Gen. Biol. 15, (3), 46 (2014).
  8. Darling, A. E., et al. PhyloSift: phylogenetic analysis of genomes and metagenomes. PeerJ. 2, (12), 243 (2014).
  9. Buchfink, B., Xie, C., Huson, D. H. Fast and sensitive protein alignment using DIAMOND. Nat. Meth. 12, (1), 59-60 (2015).
  10. Moreno-Hagelsieb, G., Hudy-Yuffa, B. Estimating overannotation across prokaryotic genomes using BLAST+, UBLAST, LAST and BLAT. BMC Res Notes. 7, (1), 651 (2014).
  11. Hauser, M., Steinegger, M., Söding, J. MMseqs software suite for fast and deep clustering and searching of large protein sequence sets. Bioinf. 32, (9), 1323-1330 (2016).
  12. Ondov, B. D., Bergman, N. H., Phillippy, A. M. Interactive metagenomic visualization in a Web browser. BMC Bioinf. 12, (2011).
  13. Kolde, R., Vilo, J. GOsummaries: an R Package for Visual Functional Annotation of Experimental Data. F1000Res. 4, 574 (2015).
  14. Reddy, T. B. K., et al. The Genomes OnLine Database (GOLD) v.5: a metadata management system based on a four level (meta)genome project classification. Nuc. Aci. Res. 43, (1), 1099-1106 (2015).
  15. Camacho, C., et al. BLAST+: architecture and applications. BMC Bioinf. 10, (1), 421 (2009).
  16. Chakravorty, S., Helb, D., Burday, M., Connell, N., Alland, D. A detailed analysis of 16S ribosomal RNA gene segments for the diagnosis of pathogenic bacteria. J. Micro. Met. 69, (2), 330-339 (2007).
  17. Fadrosh, D. W., et al. An improved dual-indexing approach for multiplexed 16S rRNA gene sequencing on the Illumina MiSeq platform. Microbiome. 2, (1), 6 (2014).
  18. Mikheyev, A. S., Tin, M. M. Y. A first look at the Oxford Nanopore MinION sequencer. Molecular Ecology Resources. 14, (6), 1097-1102 (2014).
  19. Schadt, E. E., Turner, S., Kasarskis, A. A window into third generation sequencing. Hum. Mol. Genet. 20, (4), 853-853 (2011).
  20. Shapiro, B., Hofreiter, M. A Paleogenomic Perspective on Evolution and Gene Function: New Insights from Ancient DNA. Science. 343, (6169), 1236573 (2014).
  21. Der Sarkissian, C., et al. Ancient genomics. Phil. Trans. R. Soc. B. 370, (1660), (2015).
  22. Patin, N. V., Kunin, V., Lidström, U., Ashby, M. N. Effects of OTU Clustering and PCR Artifacts on Microbial Diversity Estimates. Microb Ecol. 65, (3), 709-719 (2013).
  23. McInroy, G. R., Raiber, E. -A., Balasubramanian, S. Chemical biology of genomic DNA: minimizing PCR bias. Chem. Commun. 50, (81), 12047-12049 (2014).
  24. Aller, P., Rould, M. A., Hogg, M., Wallace, S. S., Doublié, S. A structural rationale for stalling of a replicative DNA polymerase at the most common oxidative thymine lesion, thymine glycol. Proc. Natl. Acad. Sci. U.S.A. 104, (3), 814-818 (2007).
  25. Ranjan, R., Rani, A., Metwally, A., McGee, H. S., Perkins, D. L. Analysis of the microbiome: Advantages of whole genome shotgun versus 16S amplicon sequencing. Biochem. Biophys. Res. Commun. 469, (4), 967-977 (2016).
  26. Sims, D., Sudbery, I., Ilott, N. E., Heger, A., Ponting, C. P. Sequencing depth and coverage: key considerations in genomic analyses. Nat Rev Genet. 15, (2), 121-132 (2014).
  27. Li, X., Rao, S., Wang, Y., Gong, B. Gene mining: a novel and powerful ensemble decision approach to hunting for disease genes using microarray expression profiling. Nuc. Aci. Res. 32, (9), 2685-2694 (2004).
  28. Bolger, A. M., Lohse, M., Usadel, B. Trimmomatic: a flexible trimmer for Illumina sequence data. Bioinf. 30, (15), 2114-2120 (2014).
  29. Magoc, T., Salzberg, S. L. FLASH: fast length adjustment of short reads to improve genome assemblies. Bioinf. 27, (21), 2957-2963 (2011).
  30. Bankevich, A., et al. SPAdes: a new genome assembly algorithm and its applications to single-cell sequencing. J. Comput. Biol. 19, (5), 455-477 (2012).
  31. Nurk, S., Meleshko, D., Korobeynikov, A. metaSPAdes: a new versatile de novo metagenomics assembler. (2016).
  32. Altschul, S. F., Gish, W., Miller, W., Myers, E. W., Lipman, D. J. Basic local alignment search tool. J. Mol. Biol. 215, (3), 403-410 (1990).
  33. Tanaseichuk, O., Borneman, J., Jiang, T. Phylogeny-based classification of microbial communities. Bioinf. 30, (4), 449-456 (2014).
  34. Bose, T., Haque, M. M., Reddy, C., Mande, S. S. COGNIZER: A Framework for Functional Annotation of Metagenomic Datasets. PLoS ONE. 10, (11), 0142102 (2015).
  35. Sharma, A. K., Gupta, A., Kumar, S., Dhakan, D. B., Sharma, V. K. Woods: A fast and accurate functional annotator and classifier of genomic and metagenomic sequences. Genomics. 106, (1), 1-6 (2015).
  36. Eikmeyer, F. G., et al. Metagenome analyses reveal the influence of the inoculant Lactobacillus buchneri CD034 on the microbial community involved in grass ensiling. J. Biotech. 167, (3), 334-343 (2013).
  37. Driehuis, F., Elferink, S. J. W. H. O. The impact of the quality of silage on animal health and food safety: A review. Vet. Quart. 22, (4), 212-216 (2000).
  38. Dunière, L., Sindou, J., Chaucheyras-Durand, F., Chevallier, I., Thévenot-Sergentet, D. Silage processing and strategies to prevent persistence of undesirable microorganisms. Anim Feed Sci Technol. 182, (1-4), 1-15 (2013).
  39. Vissers, M. M. M., et al. Minimizing the Level of Butyric Acid Bacteria Spores in Farm Tank Milk. J. of Dairy Sci. 90, (7), 3278-3285 (2007).
  40. Te Giffel, M. C., Wagendorp, A., Herrewegh, A. Bacterial spores in silage and raw milk. Antonie van. (2002).
  41. Wiedmann, M. ADSA Foundation Scholar Award-An Integrated Science-Based Approach to Dairy Food Safety: Listeria monocytogenes as a Model System. J. of Dairy Sci. 86, (6), 1865-1875 (2003).
  42. Low, J. C., Donachie, W. A review of Listeria monocytogenes and listeriosis. Vet J. 153, (1), 9-29 (1997).
  43. Schoder, D., Melzner, D., Schmalwieser, A. Important vectors for Listeria monocytogenes transmission at farm dairies manufacturing fresh sheep and goat cheese from raw. J.Food. (2011).
  44. Lindström, M., Myllykoski, J., Sivelä, S., Korkeala, H. Clostridium botulinumin Cattle and Dairy Products. Crit. Rev. Food Sci. Nutr. 50, (4), 281-304 (2010).
  45. Bentley, D. R., et al. Accurate whole human genome sequencing using reversible terminator chemistry. Nature. 456, (7218), 53-59 (2008).
  46. Andrews, S. Babraham Bioinformatic- FastQC: A Quality Control tool for High Throughput Sequence Data. (2015).
  47. Keegan, K. P., Glass, E. M., Meyer, F. FMG-RAST, a Metagenomics Service for Analysis of Microbial Community Structure and Function. Methods Mol. Biol. 1399, Chapter 13 207-233 (2016).
  48. Cantarel, B. L., et al. The Carbohydrate-Active EnZymes database (CAZy): an expert resource for Glycogenomics. Nuc. Aci. Res. 37, Database issue 233-238 (2009).
  49. Edgar, R. C. Search and clustering orders of magnitude faster than BLAST. Bioinf. 26, (19), 2460-2461 (2010).
  50. Heberle, H., et al. InteractiVenn: a web-based tool for the analysis of sets through Venn diagrams. BMC Bioinf. 16, (1), 213 (2015).
  51. Ni, J., Yan, Q., Yu, Y. How much metagenomic sequencing is enough to achieve a given goal. Sci. Rep. 3, 1968 (2013).
  52. Truong, D. T., et al. MetaPhlAn2 for enhanced metagenomic taxonomic profiling. Nat. Meth. 12, (10), 902-903 (2015).
  53. Oulas, A., et al. Metagenomics: tools and insights for analyzing next-generation sequencing data derived from biodiversity studies. Bioinform Biol Insights. 9, (9), 75-88 (2015).

Comments

0 Comments


    Post a Question / Comment / Request

    You must be signed in to post a comment. Please or create an account.

    Video Stats