Genetics

Metagenomic ניתוח של תחמיץ

Published: January 13, 2017 doi: 10.3791/54936

Richard K. Tennant¹, Christine M. Sambles¹, Georgina E. Diffey¹, Karen A. Moore¹, John Love¹

Introduction

Metagenomics הוא הניתוח הישיר של DNA מטוהר מן הקהילות ביולוגיות נמצאות בתוך דגימות סביבתיות ¹ ו שמש במקור כדי לזהות חיידקי unculturable נמצאים במשקעים ^2. Metagenomics כבר בשימוש נרחב במשך מספר יישומים, כגון זיהוי Microbiome האדם ^3, לסיווג אוכלוסיות חיידקים בתוך האוקיינוס ⁴ ואפילו לניתוח של קהילות חיידקים המתפתחים על מכונות קפה ^5. המבוא של טכנולוגיות רצף הדור הבא הביא תפוקת רצף גדולה ופלט. כתוצאה מכך, רצפי DNA הפכו יותר חסכוניים ⁶ ואת העומק של רצף שניתן לבצע גדלה מאוד, מה שמאפשר metagenomics להפוך כלי רב עצמה, אנליטי.

"Front-end" שיפורים בהיבט המעשי, המולקולרי של רצף metagenomic הניעו את הצמיחה של בכלי ביואינפורמטיקה סיליקון זמין עבור הסיווג הטקסונומי ^7-9, ביאור תפקודי ^10,11 וייצוג חזותי ^12,13 של נתוני רצף DNA. מספר הגדל וההולך של זמין, רצף פרוקריוטים ו האיקריוטים ¹⁴ הגנום מאפשר דיוק נוסף בסיווג קהילות חיידקים, אשר מבוצעות תמיד מול מסד נתוני התייחסות "עורפי" של הגנום רצף ^15. שתי גישות עיקריות ניתן לאמץ לניתוח metagenomic.

השיטה המקובלת יותר היא ניתוח של הגן 16S rRNA קידוד באזור של הגנום של חיידקים. 16S rRNA הוא שמור ביותר בין המינים פרוקריוטים אבל מפגין תשעה אזורים היפר-משתנה (V1 - V9) אשר ניתן לנצל לצורך זיהוי מינים ^16. המבוא של רצף ארוך יותר (≤ 300 נ"ב סוף לזווג) מותר לניתוח רצפי DNA פורש שני אזורים-משתנה יתר, בפרטV3 - באזור V4 ^17. התקדמות בטכנולוגיות רצף אחרות, כגון אוקספורד nanopore ¹⁸ PacBIO ^19, מתירה את גן 16S rRNA כולו להיות רצף בסמיכות.

בעוד 16S ספריות מבוססות rDNA לספק גישה ממוקדת, לשם זיהוי מינים ולאפשר זיהוי של דנ"א מספר נמוך עותק המתרחש באופן טבעי בתוך דגימות מטוהרות, ספריות רצף רובה לאפשר זיהוי של מינים שעלולים להכיל אזורי DNA כי הם או לא amplifiable ידי 16S רצפי פריימר סמן rRNA בשימוש, או בגלל ההבדלים בין רצף התבנית ואת רצף הגברה פריימר גדולים מדי ^20,21. יתר על כן, למרות polymerases DNA יש איכות גבוהה של שכפול ה- DNA, שגיאות בסיס בכל זאת יכולה להתרחש במהלך הגברת PCR ושגיאות המשולבות אלה עלולות לגרום סיווג שגוי של שמקורם מינים ^22. הטיות הגברת PCR של seq התבניתמשפיעה יכולה להתרחש גם; רצפים של DNA עם תוכן GC גבוה יכולים להיות בתת-ייצוג בברכת amplicon הסופי ²³ ובדומה שינויי בסיס טבעיים, כגון גליקול תימין, יכול לעצור polymerases DNA גורם כשלי ההגברה של DNA רצפי ^24. לעומת זאת, ספריית DNA רצף אקדח היא ספריית DNA כי הוכנה באמצעות כל ה- DNA מטוהר כי כבר שחולץ ממדגם ובהמשך מקוטע לתוך אורכי שרשרת דנ"א קצר לפני הכנה על רצף. סיווג טקסונומי של רצפי DNA שנוצר על ידי רצף הרובה הוא יותר כמדויק בהשוואה רצף amplicon 16S rRNA ^25, למרות העלות הכספית הנדרשת כדי להגיע לעומק רצף אמין הוא גדול יותר מזה של רצף amplicon ^26. היתרון העיקרי של metagenomics רצף אקדח הוא שאזורי רצף של הגנום השונה במדגם זמינים וסיקור גן פעם הם היוסווג ²⁷ טקסונומית.

נתוני רצף metagenomic מנותחים על ידי מגוון גדל והולך של כלי bioinformatic. כלים אלה מסוגלים לבצע מגוון רחב של יישומים, למשל, ניתוח בקרת איכות של הנתונים רצף גלם ^28, חופפים של סוף לזווג קורא ^29, דה נובו הרכבה של רצף מקריא contigs ופיגומים ^30,31, הסיווג הטקסונומי וויזואליזציה של רצף הקורא התאסף רצפי ^7,12,32,33 ואת הביאור התפקודי של רצפים התאספו ^34,35.

תחמיץ, המיוצר על ידי חקלאים בכל רחבי העולם מדגנים מותססים כמו תירס (Zea Mays), משמש ברובה כמו לבהמות. תחמיץ מטופל עם sp לקטובצילוס חיידק. כדי לסייע תסיסה ³⁶ אך עד כה, יש ידע מוגבל של אוכלוסיות חיידקים אחרים שנמצאו תחמיץ. fermentatioתהליך n יכול להוביל מיקרו אורגניזמים בלתי-רצויים ומזיקים פוטנציאל להיות נפוץ בתוך תחמיץ ^37. בנוסף שמרים ועובש, חיידקים הם סתגלניים במיוחד לסביבת אנאירובי תוסס תחמיץ ומזוהים בתדירות גבוהה יותר עם מחלות בעלי חיים ולא השפלה של התחמיץ ^38. חיידקים חומצה בוטירית ניתן להוסיף בטעות מאדמת נשאר בעת מילוי בממגורות תחמיץ והם מסוגלים להמיר את חומצת חלב, תוצר של עיכול אנאירובי, חומצה בוטירית, ובכך להגדיל את רמת החומציות של תחמיץ ^39. העלייה זו pH יכולה להוביל להתגברות חיידקים מקולקלים לא יוכל בדרך כלל כדי לקיים את צמיחה בתנאי תסיסת תחמיץ אופטימלי ^38. Spp Clostridium. , Spp ליסטריה. ו spp Bacillus. הם מדאיג במיוחד, במיוחד תחמיץ עבור להאכיל בקר לחלב, כפי נבגי החיידקים ששרדו את gastrבדרכי ointestinal ⁴⁰ יכולות להיכנס-שרשרת מזון, להוביל קלקול מזון, במקרים נדירים, כדי חי למותם של בני אדם ^37,39,41-44. יתר על כן, בעוד שקשה להעריך את ההשפעה הכלכלית המדויקת של טיפול וטרינרים ואובדן בעלי חיים הנגרם על ידי קלקול תחמיץ, היא עשויה להיות מזיק חווה אם התפרצות הייתה להתרחש.

ההשערה היא כי באמצעות גישת metagenomic אנחנו יכולים לסווג אוכלוסיות החיידקים שנמצאות בדגימות תחמיץ ויתר על כן לזהות קהילות חיידקים הקשורים קלקול תחמיץ כי היו, בתורו, יש פוטנציאל השפעה מזיקה על בעלי החיים, המאפשר פעולה מתקנת כדי להיות נלקח לפני התחמיץ הוא לשמש כמקור מזון.

Protocol

1. אתר מיקום

אסוף מדגם התחמיץ מאתר מתאים כגון בחווה. הנה, החווה ממוקמת Ballydulea, קורק ושות 'אירלנד (51 ° 51'58.4 "N 8 ° 16'48.7" W).

2. DNA הפקה

הערה: מיצוי DNA בוצע באמצעות ערכה מסחרית בהתאם להוראות היצרן. כביקורת שלילית, שהכילה לא מדגם, שפעלה לכל אורכו של שיטת הכנת הספרייה.

הוספת 100 - 400 מ"ג של מדגם חיץ פוספט נתרן 978 μL 122 μL חיץ אדמה תמוגה בתוך הצינורות תמוגה מסופק.
Homogenize דגימות ידי הנחת צינורות תמוגה לתוך homogenizer עבור 40 שניות במהירות של 6.0 m / s.
lysates צנטריפוגה ב 14,000 XG במשך 15 דקות ולהעביר את supernatant לצינור מיקרו צנטריפוגות נקי המכיל 250 μL של פתרון המשקע חלבון (PPS). מערבבים את הפתרון על ידי היפוך 10 פעמים צנטריפוגות14,000 XG במשך 5 דקות.
מוסיפים את supernatant ל -1 מטריצה מחייב מ"ל DNA בתוך שפופרת 15 מ"ל צנטריפוגות נקי. מערבבים את הפתרון על ידי צינור היפוך הזמן במשך 3 דקות. אפשר התערובת להסתפק 3 דקות, ואז להשליך 500 μL של supernatant. מערבבים את supernatant הנותרים.
העבר 600 μL של ההשעיה מסנן ספין צנטריפוגות ב 14,000 XG דקות 1. מחק את התסנין וחזור על התהליך עם ההשעיה הנותרת.
הוספת 500 μL של חיץ לשטוף את המטריצה DNA מחייבת בתוך מסנן ספין, ומערבבים על ידי pipetting, אז צנטריפוגות ב 14,000 XG דקות 1.
מחק את תסנין ו צנטריפוגות מסנן ספין שוב ב 14,000 XG במשך 2 דקות על מנת להבטיח את כל חיץ לשטוף יוסר. לייבש את מסנן ספין על 23 צלזיוס למשך 5 דקות.
טרום חמים (70 C) המים ללא DNase (DES) מחדש להשעות המטריצה DNA מחייבת ב 100 μL של DES בתוך מסנן ספין. מעבירים את מסנן ספין על 1.5 מ"ל מיקרו צנטריפוגות נקי tuצנטריפוגות להיות 14,000 XG במשך 1 דקות כדי elute DNA. אחסן את ה- DNA מטוהרים ב -20 C עד לניתוח נוסף מבוצע.

3. טיהור DNA DNA באמצעות חרוזי טיהור

הערה: לפני הכנת ספריית metagenomic את חילוץ DNA היה מטוהר באמצעות חרוזי טיהור כדי להבטיח דגימת DNA טהורה הושגה.

דגירת החרוזים ב 23 צלזיוס למשך 30 דקות לפני השימוש. מוסיפים 2 כרכים של חרוזים על דגימת DNA דגירה הפתרון על 23 צלזיוס למשך 5 דקות.
מניח את הדגימות על מגנט הפרדה במשך 5 דקות ולאחר מכן לבטל את supernatant. שטפו את החרוזים פעמיים עם 200 μL אתנול 80% טרי (EtOH). האוויר יבש חרוז במשך 10 דקות.
הסר את דגימות מן מגנט ההפרדה ולהוסיף 50 μL של חיץ elution (EB), ומערבבים על ידי pipetting.
לדגור על השעיית ב 23 צלזיוס למשך 5 דקות, ולאחר מכן למקם את הדגימות בחזרה אל מגנט ההפרדה במשך 3 דקות.
Transfer supernatant, אשר מכיל את ה- DNA, אל צינור נקי. מחק את החרוזים.
לכמת את ה- DNA מטוהר כהוראת סעיף ארבעה.

4. כימות DNA המטוהר

הערה: מטוהרים DNA היה לכמת באמצעות fluorometer ו פעמיים תקועים (dsDNA) רגישות גבוהה (HS) ערכת assay בעקבות הוראות היצרן.

כן פתרון עבודה באמצעות 199: 1 יחס של חיץ מגיב.
הוסף 10 μL של תקן זה DNA 190 μL של פתרון עובד.
הוסף 10 μL של DNA מטוהרים 190 μL של פתרון עובד. ההיקף הסופי צריך להיות 200 μL. דגירה דגימות תקן ו- DNA ב 23 צלזיוס למשך 2 דקות.
לנתח הסטנדרטים לפני דגימות DNA על fluorometer לפי ההוראות המופיעות על המסך.

5. הכנת ספריית רצף רובה

הערה: ספריית רצף רובה הוכנה באמצעותערכת כנת הספרייה מסחרית באמצעות הוראות היצרן.

לדלל את דגימות DNA ל -0.2 ng / μL באמצעות EB. כל מדגם שהוא כבר מתחת ריכוז זה, כלומר השליטה השלילית, נשאר בריכוז הנוכחי שלה.
מערבבים 5 μL של ה- DNA מטוהרים עם 10 μL חיץ תמהיל האנזים 5 μL. דגירה דגימות ב 55 צלזיוס למשך 5 דקות.
הוסף 5 μL של נטרול חיץ דגירה הפתרון על 23 צלזיוס למשך 5 דקות.
הוסף 5 μL של כל אחד ממדדי רצף ספציפי מדגם ו -15 μL של PCR תערובת מאסטר.
ב thermocycler, דגירת הדגימות ב 72 צלזיוס במשך 3 דקות, 95 צלזיוס למשך 30 שניות, לפני 12 מחזורים של 95 צלזיוס למשך 10 שניות, 55 C למשך 30 שניות ו -72 C למשך 30 שניות. דגירת דגימות לבסוף ב 72 צלזיוס למשך 5 דקות.
לטהר את הדנ"א המוכן באמצעות טיהור החרוז כמו קודם, אבל עם elution סופי של 30 μL של EB.

6. Lכמות ibrary ולבדוק את איכות

הערה: הכמות והאיכות של הספריות המוכנות הוערכה באמצעות ערכה ומכשור מסחרית.

דגירת רכיבי הערכה ב 23 צלזיוס למשך 30 דקות לפני השימוש.
הוסף 2 μL של DNA כדי 2 μL של חיץ מערבולת דקות 1 ב -2,000 סל"ד.
ספין למטה המדגם כדי להבטיח שהוא בתחתית של התחתית.
הכנס את דוגמיות, קלטת ניתוח וטיפים לתוך המכשיר, ולבצע ניתוח עפ"י הוראות על ידי התוכנה.

רצפי DNA 7.

העברת דגימות ספריות רצפי DNA המוכנות לכמת לשירות רצף רצף באמצעות הסוף לזווג 300 נ"ב רצף ^45.

8. ניתוח של נתוני רצף גלם

הערה: פקודות עבור כל תוכנית משתמש במערכת הפעלה לינוקס מוצגים מתחת צעד פרוטוקול. הצינור משמש יםניתוח נתוני equence מוצג באיור 1. התוכנית בנויה כתוכנית להיות מותקן על ידי המשתמש לפני הניתוח. תהליך זה אמור להתבצע בנפרד עבור כל דגימה.

לנתח ולהציג נתוני רצף ה- DNA באמצעות FastQC ⁴⁶ על ידי הקלדה לשורת הפקודה / נתיב אל קובץ / fastqc, ואחריו קדימה הפוך גלם קורא raw_read2.fastq raw_read1.fastq.
ציין ספריית פלט על ידי הקלדת output_fastqc -o ואת תבנית הקובץ של קבצים לקריאה גלם ידי fastq -f.
הצג את קובץ הפלט (איור 2).
הנתיב אל קובץ / fastqc raw_read1.fastq raw_read2.fastq -o output_directory -f fastq.

9. זמירה בקרת איכות הנתונים רצף סינון

הפעל את תכנית הזמירה, ²⁸ Trimmomatic ידי הקלדה לתוך java-jar / נתיב אל קובץ שורת הפקודה /-0.35.jar trimmomatic.
ציין את הקבצים הם זיווג קבצים סוף על ידי הקלדת "PE". מדינה 16 pr המרכזייחידות ocessing (CPUs) צריכות לשמש את התכנית על ידי הקלדת -threads 16.
יש לרשום את שני קבצים כדי לבדוק QC ידי הקלדת שמותיהם של קדימה הגלם הפוך קורא. התחילית של קבצי פלט נקבעת על ידי הקלדת תחמיץ -baseout.
הגדר את האפשרויות עבור התוכנית על ידי הקלדת ILLUMINACLIP: NexteraPE-PE.fa: 2: 30: 10 בכירים: 3 נגרר: 3 SLIDINGWINDOW: 4: 20 הגידולים: 200 HEADCROP: 15 MINLEN: 36.
לכשיושלם, לנתח את הרצפים הגזוזים באמצעות FastQC כמו קודם ולהשוות את פלט נתוני רצף גלם כדי להבטיח זמירה שבוצע בהצלחה.
הערה: כלי תוכנה, Trimmomatic, גזוז קורא עוד יותר על ידי הסרת באיכות נמוכה מובילה או בסיסים N (להלן איכות 3), הסרת נגרר באיכות נמוכה או בסיסים N (להלן איכות 3) וסריקה כל לקרוא עם חלון הזזה רחב 4-בסיס. הפרמטרים נקבעו לחיתוך כאשר האיכות הממוצעת לכל בסיס יורדת מתחת 20 ולאחר מכן לרדת כל קורא להלן 36 בסיסים. לבסוף, 15 בסיסים היו קצוצים frאום בראש כל לקרוא וקורא היו קצוץ לשמור 200 בסיסים מההתחלה של קריאה. השלב האחרון זה בוצע כדי להתגבר על כמה בעיות איכות כאשר רצף ארוך (> 200 נ"ב) קורא. אלה יכולים להיות מותאמים עבור דגימות ספציפיות ^28.
java-jar /path-to-file/trimmomatic-0.35.jar PE -threads 16 raw_read1.fastq raw_read2.fastq ILLUMINACLIP תחמיץ -baseout: NexteraPE-PE.fa: 2: 30: 10 בכירים: 3 נגרר: 3 SLIDINGWINDOW: 4 : 20 גידולים: 200 HEADCROP: 15 MINLEN: 36

10. Metagenome האסיפה

מזג את המזווג, הגזוז קורא ידי הקלדת חתול ואחריו מזווג הקורא; silage_read1_unpaired.fastq silage_read2_unpaired.fastq. כתוב את קבצי קובץ חדש על ידי הקלדה> silage_merged_unpaired.fastq
חתול silage_read1_unpaired.fastq silage_read2_unpaired.fastq> silage_merged_unpaired.fastq
כדי דה נובו להרכיב את ה- DNA רצף, השתמש Spades (מאסף הגנום סנט פטרסבורג) ³⁰ על ידי הקלדת / נתיב אל-file / spades.py. ציין כי 16 מעבדים ישמשו ידי הקלדת -t 16 וכי הפרמטר metagenomic צריך להחיל על ידי הקלדת --meta.
לזהות את גזוז קדימה קורא באמצעות -1 silage_read1_paired.fastq וכן להפך קורא ידי -2 silage_read2_paired.fastq. המזווג הממוזג קורא שצוינו על ידי silage_merged_unpaired.fastq -s.
הגדר את תיקיית הפלט ידי הקלדת -o silage_spades.
הנתיב אל קובץ / spades.py -t 16 --meta -1 silage_read1_paired.fastq -2 silage_read2_paired.fastq -s silage_merged_unpaired.fastq -o silage_spades

11. חפיפה קראו מותאם-סוף

מיזוג זוגות רצף ה- DNA קורא באמצעות FLASH (התאמת אורך תענית סיפורים קצרים) ²⁹ על ידי הקלדת לתוך שורת הפקודה / נתיב אל קובץ / פלאש. ציין כי 16 מעבדים אמורים לשמש באמצעות -t 16 ואת קידומת הפלט ידי הקלדת -o תחמיץ.
זהה גזוז קורא ידי הקלדת silage_trimmed_R1.fastq silage_trimmed_R2.fastq
הנתיב אל קובץ / פלאש -t 16 -o הבזיק silage_read2_paired.fastq silage_read1_paired.fastq

סיווג טקסונומי 12.

סוג / נתיב אל קובץ / קראקן ולציין את מסד הנתונים על ידי הקלדת --db / נתיב אל קובץ / סטנדרטי.
הגדר כי 16 מעבדים אמור לשמש על ידי הקלדת --threads 16 ולזהות ספריית פלט באמצעות --output FLASHed_silage_extendedFrags_kraken.txt. הקלד את שם קובץ קלט; FLASHed_silage.extendedFrags.fastq
הנתיב אל קובץ / קראקן --db תקן --thread 16 --output FLASHed_silage_extendedFrags_kraken.txt FLASHed_silage.extendedFrags.fastq
הערה: סיווג של פיגומי רצף DNA נאספו באמצעות קראקן ⁷ הושלם נגד האחרון, מסד נתוני קראקן תקן שהכילו את כל רצפי גנום פרוקריוטים זמינים.
העברת עמודות 2 ו -3 מקובץ פלט לקובץ חדש על ידי הקלדת לחתוך -f2,3 FLASHed_silage_extendedFrags_kraken.txt> FLASHed_silage_extendedFrags_kraken.int

לחתוך -f2,3 FLASHed_silage_extendedFrags_kraken.txt> FLASHed_silage_extendedFrags_kraken.int

לייבא את הקובץ החדש לתוך כתר ¹² על ידי הקלדת ktImportTaxonomy. ציין את קובץ הקלט ידי הקלדת FLASHed_silage_extendedFrags_kraken.int. זהה את קובץ הפלט על ידי הקלדת -o FLASHed_silage_extendedFrags_kraken.out.html.
הנתיב אל קובץ / ktImportTaxonomy FLASHed_silage_extendedFrags_kraken.int -o FLASHed_silage_extendedFrags_kraken.out.html

13. ביאור פונקציונלי

עבור אל אתר האינטרנט ⁴⁷ MG-RAST, http://metagenomics.anl.gov/. הירשם כמשתמש חדש במידת הצורך. לאחר הכניסה לאתר, לחץ על הכפתור "העלאה". העלה את הפיגומים שהורכבו שלב 10.
ברגע שהקבצים נטען, לחץ על "שלח" ופעל בהתאם להוראות ולהמתין השלמת ניתוח.
לאחר הניתוח הושלם, להציג את הקישור שנשלח באמצעות email מ MG-RAST, או לחילופין, לחץ על "התקדמות". יש רשימה של עבודות שהושלמו. הקש על id העבודה הרלוונטי ולאחר מכן על הקישור "בדף ההורדה".
בדף ההורדה, תחת הכותרת "Clustering חלבון 90%", לחץ על כפתור החלבון להוריד את קובץ חלבון חזה, 550.cluster.aa90.faa.
כדי לסווג את החלבונים כמו putatively שנמנה עם סוגי אנזים מסוים CAZy, להשוות את החלבונים שהורדו למסד הנתונים CAZy ^48. הורד את מסד אנזימים פחמימות-Active (CAZy) מקבצים הם: AA.zip, CE.zip, GH.zip, GT.zip ו PL.zip. קבצים אלה מייצגים המעמדות אנזים הבאים בהתאמה: פעילויות עזר (AA), פחמימות esterases (CE), glycoside Hydrolases (GH), Glycosyl טרנספראז (GT) ו פוליסכריד Lyases (PL).
לפתוח את קבצי מסד הנתונים ויסמנו את החלבונים על ידי קביעת דמיון חלבון חלבוני מסד CAZy באמצעות אלגור USEARCH UBLASTithm ^49. כדי להשתמש לולאה bash (עבור i ב .txt *) כדי לבצע איטרציות עד 5 סוג קבצי txt הנתונים "עבור i ב * .txt; לעשות".
הפעל USEARCH ידי הקלדת / נתיב אל קובץ / usearch8 עם -ublast פרמטר על מנת להשתמש באלגוריתם ublast. ואז להקליד את השם של קובץ חלבון הרצף שהורד MG-RAST "mgmXXXXXX.3.550.cluster.aa90.faa".
כדי לציין את קובץ מסד הנתונים כדי לשמש סוג "-db $ i" וכדי לציין את סף E-ערך ב 1e ^-5, הקלד "1E-5 -evalue".
כדי לסיים את החיפוש לאחר גילוי רצף היעד ולכן לסיווג כי רצף חלבון כמו השתייכות למעמד אנזים היעד, למשל GH, הקלד "-masaccepts 1".
כדי להגדיר כי 16 מעבדים אמורים לשמש סוג "-threads 16" וכדי לציין את הפורמט של קובץ הפלט כסוג טקסט מופרד atab "-blast6out". כדי לזהות את קובץ סוג הפלט "$ i.ublast". כדי לסיים את הלולאה bash, type "; נעשה"
עבור i ב * .txt;
לעשות / נתיב אל קובץ / usearch8 -ublast ../mgmXXXXXX.3.550.cluster.aa90.faa -db $ i -evalue 1E-5 -maxaccepts 1 -threads 16 -blast6out i.ublast $;
בוצע

14. חזותי CAZy ביאור

כדי להמחיש את התפוקה מן ביאור CAZy כמו דיאגרמת ון, ליצור רשימות חלבון מזהה לכל סוג האנזים באמצעות לולאה bash. סוג "עבור i ב * .ublast; לעשות".
כדי להעביר עמודה 1 מקובץ פלט לקובץ חדש, מסוג "חתול $ i | לחתוך -f 1> $ i.list".
לסיים את הלולאה וסוג "; נעשה".
פתח את קבצי .list בעורך טקסט. עבור אל אתר האינטרנט, לבחור את מספר סטים כמו 5 ולהדביק את התוכן של כל קובץ רשימה בקופסא נפרדת. הורד בתרשים וכתוצאה כקובץ .SVG.
עבור i ב * .ublast;
חתול לעשות $ i | לחתוך -f 1> $ i.list;
בוצע

Representative Results

לפני עיבוד bioinformatic, רצף גלם קורא קוצצו ומתאמים הוסרו באמצעות Trimmomatic תוכנה ^28. לאחר שלב הזמירה וסינון, מספר כניסות הופחת ל -50% של רצף הקורא (טבלה 1). ציון Phred הבסיס הממוצע היה> 30 לאחר בקרת איכות (איור 2).

זוגות של רצפי DNA אשר היו אזורים חופפים מוזגו באמצעות תוכנת FLASH ²⁹ כדי ליצור אחת כבר קורא, שאינו חופף קורא נשמרו בקובץ נפרד. 45.47% קורא (105,343) בשילוב בהצלחה. בעקבות חופפים של קורא באמצעות FLASH של קורא, שברי הוארך וכתוצאה מכך עברו הסיווג הטקסונומי חיידקי באמצעות קראקן תוכנה ⁷ ו היו דמיינו לאחר מכן עם תוכנת כתר (איור 3).

.within-page = "1"> רוב מינים של חיידקים הנמצאים metagenome תחמיץ נמצאים בתוך 4 טווח המערכת פרוקריוטים: Firmicutes (34%), Actinobacteria (28%), פרוטאובקטריה (27%) ו Bacteroidetes (7%) . חלוקת כיתות הנוכחי בתוך טווח המערכת אלה ניתן לראות באיור 4. המין הנפוץ ביותר metagenome היה spp לקטובצילוס. (24%; Firmicutes), spp Corynebacterium. (8%; Actinobacteria), spp Propionibacterium. (3%; Actinobacteria) ו spp Prevotella. (3%; Bacteroidetes). מינים חשובים לבריאות בעלי חיים הקשורים במחלות נצפו גם; Spp Clostridium. (1%) spp Bacillus. (0.6%), spp ליסטריה. (0.2%) נחזו להיות נוכח במדגם התחמיץ.

ביאור פונקציונלי בוצע על התאספו קורא. Metagenome הורכב באמצעות מאסף Spades ³⁰ באמצעות גזוז ומסונןלזווג-end מזווג קורא ליצירת 92,284 פיגומים. על מנת לזהות cellulases, חלבונים נחזו באמצעות MG-RAST והערות באמצעות מסד אנזימים פחמימות-Active (CAZy). של 97,562 חלבוני חזה, 6357 היו מפורשים כמו אנזים בפחמימות פעילות המשוערת באחד מחמש מעמדות האנזימים שמרכיבות את מסד נתוני CAZy (איור 5). תוצאות היו דמיינו כמו דיאגרמת ון באמצעות תוכנת InteractiVenn ⁵⁰ מראה את חלוקת הסברי חלבון כולל אלו המכילים יותר מאחד ביאור בכיתת אנזים CAZy. מבין אלה, נחזו 3861 לקיים פעילות hydrolase glycoside ו יאופיינו הלאה במעבדה כדי לאשר פונקציה.

איור 1: bioinformatic Metagenomics צינור עבור הניתוח של תחמיץ. שתי גישות עיקריות היושימוש כדי לחקור את Microbiome של תחמיץ, סיווג הטקסונומי ביאור תפקודי. אנא לחץ כאן כדי לצפות בגרסה גדולה יותר של דמות זו.

איור 2: איכות רצף Per-בסיס לפני ואחרי קיצוץ מתאם הסרה. רצף שידורי בסיס עלילת איכות FASTQC מציגה את הציון הממוצע Phred פני האורך של הרצף קורא בקרת איכות לפני ואחרי. אנא לחץ כאן כדי לצפות בגרסה גדולה יותר של דמות זו.

איור 3: טקסונומי Classification של Microbiome חיידקית של תחמיץ מוצק. סיווג של רצף גזוז וחופפים קורא מתוך FLASH בוצע באמצעות קראקן ⁷ ובהמשך מדמיין עם כתר. אנא לחץ כאן כדי לצפות בגרסה גדולה יותר של דמות זו.

איור 4: התפלגות מחלקה טקסונומי של 4 טווח המערכת בשכיחותו Microbiome חיידקית של תחמיץ מוצק. האחוז לכל סוג של חיידקים בתוך ארבעה טווח המערכת הנפוצה ביותר. Firmicutes: וקלוסטרידיאה.את (אדום) ואת החיידקים (כחול כהה); פרוטאובקטריה: דלתא / אפסילון (ורוד), אלפא (בצבע כחול חיוור), גמא (כתום) בטא (טורקיז); Bacteroidetes: Flavobacteriia (כחול כהה) ו Bacteroidia(ירוק חיוור); Actinobacteria: Coriobacteriia (סגול כהה) ו Actinobacteria האחר (ירוק כהה). אנא לחץ כאן כדי לצפות בגרסה גדולה יותר של דמות זו.

איור 5: CAZy ביאור של Proteome החזוי של Microbiome התחמיץ המוצק. דיאגרמת ון מראה את חלוקת חמשת כיתות האנזים מהערות CAZy ב proteome החזוי של Microbiome תחמיץ מוצק. אנא לחץ כאן כדי לצפות בגרסה גדולה יותר של דמות זו.

קורא # גלם	# מסונן קורא (זיווג) # מסונן קורא	# הבזיק קורא
(מְזוּוָג)	# מסונן קורא (זיווג) # מסונן קורא	# הבזיק קורא	(מזווג)
2,374,949 x2	231,679 x2	1,892,534	105,343

טבלה 1: סיכום טבלת רצף קורא.

Discussion

בעוד בניתוח סיליקון יכול לתת תובנה מצוינת קהילות החיידקים שנמצאות בתוך דגימות סביבתיות, זה קריטי, כי הסיווגים טקסונומיות הפגינו להתבצע בשיתוף עם בקרות רלוונטיות וכי בעומק של רצף מתאים הושג על מנת ללכוד את כולו אוכלוסיית ⁵¹ נוכחית.

עם כל ניתוח חישובית, ישנם מסלולים רבים כדי להשיג מטרה דומה. השיטות שבהם השתמשנו במחקר זה הם דוגמאות של שיטות מתאימות וישירה, כי כבר הפגיש להשיג מגוון של ניתוחים על Microbiome תחמיץ. מגוון ומספר גדל והולך של כלי ביואינפורמטיקה וטכניקות זמינים לנתח נתונים metagenomic, למשל Phylosift ⁸ ו MetaPhlAn2 ^52, ואלה יש להעריך לפני החקירה עבור הרלוונטיות שלהם המדגם req ניתוחuired ^53. שיטות ניתוח metagenomic מוגבלים על ידי מסדי נתונים עבור זמין עבור סיווג, עומק רצף ואיכות רצף.

עיבוד bioinformatic הפגין כאן בוצע על מחשב מקומי, גבוה Powered; אולם מערכות מבוססות ענן זמינים אף הם. שירותי ענן מבוסס אלה מאפשרים להשכרה של כוח מחשוב הדרושים מבלי השקעת העלות הגבוהה של עבודה מקומית חזקה מתאימה. יישום הפוטנציאל של שיטה זו יהיה להעריך תחמיץ לפני השימוש בו בחקלאות, כדי לוודא ששום חיידקים מזיקים נוכחים ולכן למנוע מהם להיכנס לשרשרת המזון.

Materials

Name	Company	Catalog Number	Comments
FastDNA SPIN Kit for Soil	MP Bio	116560200	DNA Extraction
DNA FastPrep	MP Bio	116004500	DNA Extraction
Agencourt AMPure XP beads	Beckman Coulter	A63880	DNA Purification
Elution Buffer	Qiagen	19806	DNA Purification
Qubit Fluorometer	Thermo Fisher	Q33216	DNA Quantification
Qubit dsDNA HS Assay Kit	Thermo Fisher	Q32854	DNA Quantification
Nextera XT DNA Library Prep Kit	Illumina	FC-131-1024	Library Preparation
Nextera XT Index Kit	Illumina	FC-131-1001	Library Preparation
TapeStation 2200	Agilent	G2964AA	DNA Quantification
HS D100 ScreenTape	Agilent	5067-5584	DNA Quantification
HS D100 ScreenTape Reagents	Agilent	5067-5585	DNA Quantification
TapeStation Tips	Agilent	5067-5153	DNA Quantification
TapeStation Tubes	Agilent	401428 and 401425	DNA Quantification
HiSeq 2500	Illumina		DNA Sequencing - provided by a sequencing service
High Power Analysis Workstation	Various		Local or cloud based, user preferred system