Genetics

تحليل Metagenomic من السيلاج

Published: January 13, 2017 doi: 10.3791/54936

Richard K. Tennant¹, Christine M. Sambles¹, Georgina E. Diffey¹, Karen A. Moore¹, John Love¹

Introduction

Metagenomics هو تحليل مباشر من الحمض النووي تنقيته من المجتمعات البيولوجية الموجودة في العينات البيئية ^1، وكان يستخدم في الأصل للكشف عن البكتيريا unculturable الموجودة في الرواسب ^2. وقد استخدم على نطاق واسع Metagenomics لعدد من التطبيقات، مثل تحديد microbiome الإنسان ^3، تصنيف السكان الميكروبية داخل المحيط ⁴ وحتى لتحليل المجتمعات البكتيرية التي تضع على آلات القهوة ^5. أدى إدخال تقنيات التسلسل الجيل القادم في أكبر الإنتاجية تسلسل والإخراج. ونتيجة لذلك، أصبح تسلسل الحمض النووي أكثر اقتصادا ⁶ وعمق تسلسل التي يمكن القيام بها قد زاد بشكل كبير، مما metagenomics لتصبح قوية وأداة تحليلية.

دفعت التعزيزات "الواجهة الأمامية" في الجانب العملي، الجزيئي للتسلسل metagenomic نمو فيأدوات سيليكون والمعلوماتية الحيوية المتاحة لتصنيف التصنيفية ^7-9، والشرح وظيفية ^10،11 و ^12،13 التمثيل المرئي للبيانات تسلسل الحمض النووي. تزايد عدد المتاحة، التسلسل أولية النواة وحقيقية النواة ¹⁴ الجينوم يسمح مزيد من الدقة في تصنيف المجتمعات الميكروبية، التي تتم دائما ضد "في نهاية العام" قاعدة بيانات مرجعية من الجينوم متسلسلة ^15. ويمكن اعتماد نهجين رئيسيين لتحليل metagenomic.

طريقة أكثر تقليدية هو تحليل الجينات 16S الريباسي الترميز المنطقة من جينوم بكتيري. يتم حفظها في 16S الريباسي للغاية بين الأنواع بدائيات النوى ولكن المعارض تسع مناطق فرط متغير (V1 - V9) التي يمكن استغلالها لتحديد الأنواع ^16. إدخال التسلسل الطويل (≤ 300 نقطة أساس نهاية الاقتران) يسمح لتحليل تسلسل الحمض النووي التي تغطي منطقتين شديدة متغير، ولا سيماوV3 - المنطقة V4 ^17. التقدم في تقنيات التسلسل الأخرى، مثل أكسفورد ثقب النانو ¹⁸ و ¹⁹ PacBIO، لا يسمح كامل الجينات 16S الريباسي لتكون متسلسلة متاخم.

بينما توفر 16S الحمض النووي المؤتلف المكتبات القائمة على نهج تستهدف تحديد الأنواع وتمكن من الكشف عن عدد المنخفضة نسخة الحمض النووي الذي يحدث طبيعيا في عينات النقاء والمكتبات بندقية التسلسل تسمح للكشف عن الأنواع التي قد تحتوي على مناطق الحمض النووي التي هي إما غير amplifiable من قبل 16S الريباسي تسلسل علامة التمهيدي المستخدمة، أو بسبب الخلافات بين تسلسل قالب وتسلسل تضخيم التمهيدي كبيرة جدا ^20،21. وعلاوة على ذلك، على الرغم من بلمرة الحمض النووي لديها الدقة العالية تكرار الحمض النووي، وأخطاء قاعدة يمكن مع ذلك أن يحدث خلال PCR والتضخيم، وهذه الأخطاء أدرجت يمكن أن يؤدي إلى تصنيف غير صحيحة من مصدرها الأنواع ^22. التحيز في التضخيم PCR من بعدها القالبيمكن أيضا أن تحدث uences. تسلسل الحمض النووي مع محتوى GC عالية يمكن أن يكون تحت الممثلة في تجمع amplicon النهائي ²³ وبالمثل التعديلات قاعدة غير طبيعية، مثل غليكول الثايمين، يمكن وقف بلمرة الحمض النووي تسبب الفشل في التضخيم من الحمض النووي تسلسل ^24. في المقابل، مكتبة الحمض النووي بندقية التسلسل هي مكتبة الحمض النووي التي تم إعدادها باستخدام كل من الحمض النووي المنقى الذي تم استخراجه من عينة ومجزأة في وقت لاحق إلى أطوال سلسلة أقصر الحمض النووي قبل التحضير لالتسلسل. وأكثر دقة مقارنة تصنيف التصنيفي للتسلسل الحمض النووي التي تم إنشاؤها بواسطة تسلسل طلقات نارية على 16S الريباسي amplicon التسلسل ^25، على الرغم من أن التكلفة المالية المطلوبة للوصول إلى عمق التسلسل موثوق هو أعظم من ذلك من amplicon تسلسل ^26. الفائدة الرئيسية من metagenomics بندقية التسلسل هو أن المناطق متسلسلة من مختلف العوامل الوراثية في العينة متاحة للتنقيب الجينات مرة واحدة أنها كانتتم تصنيف تصنيفيا ^27.

ويتم تحليل Metagenomic تسلسل البيانات من قبل مجموعة متزايدة من أدوات بيوينفورمتيك. هذه الأدوات هي قادرة على أداء مجموعة واسعة من التطبيقات، على سبيل المثال، تحليل ومراقبة جودة البيانات تسلسل الخام ^28، وتداخل في نهاية يقترن يقرأ ^29، دي نوفو تجميع تسلسل يقرأ لcontigs والسقالات ^30،31، تصنيف التصنيف والتصور تسلسل يقرأ وتجميع سلاسل ^{7،12،32،33} والشرح وظيفية من متواليات تجميعها ^34،35.

السيلاج، التى ينتجها المزارعون في جميع أنحاء العالم من الحبوب المخمرة مثل الذرة (ذرة شامية)، ويستخدم في الغالب كعلف للماشية. يتم التعامل مع السيلاج مع س البكتيريا الملبنة. لمساعدة التخمير ³⁶ ولكن حتى الآن، هناك معرفة محدودة السكان الميكروبية أخرى وجدت في السيلاج. على انزيمعملية ن يمكن أن يؤدي إلى الكائنات الدقيقة غير مرغوب فيها ويمكن أن تكون ضارة تصبح سائدة داخل السيلاج ^37. بالإضافة إلى الخمائر والفطريات والبكتيريا قابلة للتكيف بشكل خاص على البيئة اللاهوائية في تخمير الأعلاف وأكثر في كثير من الأحيان ترتبط مع الأمراض في الماشية بدلا من تدهور السيلاج ^38. بكتيريا حمض زبدي يمكن أن تضاف عن غير قصد من التربة لا تزال عند ملء الصوامع السيلاج وتكون قادرة على تحويل حمض اللبنيك، وهو منتج من الهضم اللاهوائي، لحامض زبدي، وبالتالي زيادة درجة الحموضة في السيلاج ^39. هذه الزيادة في درجة الحموضة يمكن أن يؤدي إلى زيادة في البكتيريا التلف التي عادة ما تكون غير قادرة على مواصلة النمو في ظل السيلاج الأمثل ظروف التخمر ^38. كلوستريديوم النيابة. ، الليسترية. وعصية النيابة. تثير القلق بشكل خاص، لا سيما في السيلاج كعلف للماشية الألبان، والجراثيم البكتيرية التي نجت من الاضالجهاز ointestinal ⁴⁰ يمكن أن تدخل في السلسلة الغذائية، يؤدي إلى تلف المواد الغذائية و، في حالات نادرة، إلى الحيوان وفيات بشرية ^{37،39،41-44.} وعلاوة على ذلك، في حين أنه من الصعب تقدير التأثير الاقتصادي المحدد من العلاج البيطري وفقدان الماشية الناجمة عن تلف السيلاج، فمن المحتمل أن تكون ضارة إلى مزرعة إذا كان تفشي تحدث.

والافتراض بأن باستخدام نهج metagenomic يمكننا تصنيف السكان الميكروبية الموجودة في عينات الأعلاف وعلاوة على ذلك تحديد المجتمعات الميكروبية المرتبطة تلف السيلاج من شأنه، في المقابل، من المحتمل أن يكون لها تأثير ضار على الماشية، مما يتيح إجراءات تصحيحية ليكون اتخذت قبل السيلاج لاستخدامه كمصدر للغذاء.

Protocol

1. الموقع الموقع

جمع العينة السيلاج من موقع مناسب مثل مزرعة. هنا، كانت تقع المزرعة في Ballydulea، شركة كورك، أيرلندا (51 ° 51'58.4 "N 8 ° 16'48.7" W).

2. استخراج الحمض النووي

تم إجراء استخراج الحمض النووي باستخدام طقم التجارية باتباع إرشادات الشركة المصنعة: ملاحظة. عنصر تحكم السلبية، التي لا تتضمن أي عينة، وكان يستخدم في جميع أنحاء طريقة إعداد مكتبة.

إضافة 100-400 ملغ من عينة إلى 978 ميكرولتر الصوديوم العازلة الفوسفات و 122 ميكرولتر العازلة تحلل التربة في أنابيب تحلل الموردة.
التجانس عينات عن طريق وضع أنابيب تحلل في الخالط لمدة 40 ق بسرعة 6.0 م / ث.
لست] أجهزة الطرد المركزي في 14000 x ج لمدة 15 دقيقة، وطاف لنقل أنبوب الطرد المركزي الصغيرة نظيفة تحتوي على 250 ميكرولتر من البروتين المتعجل الحل (PPS). مزيج الحل بواسطة عكس 10 مرات وأجهزة الطرد المركزيفي 14000 x ج لمدة 5 دقائق.
إضافة طاف إلى 1 مل الحمض النووي مصفوفة ملزم في 15 مل أنبوب الطرد المركزي نظيفة. مزيج الحل عن طريق أنبوب للقلب باستمرار لمدة 3 دقائق. يسمح هذا المزيج ليستقر لمدة 3 دقائق، ثم تجاهل 500 ميكرولتر من طاف. مزيج طاف المتبقية.
نقل 600 ميكرولتر من تعليق لمرشح وتدور أجهزة الطرد المركزي في 14000 x ج لمدة 1 دقيقة. تجاهل الترشيح وتكرار هذه العملية مع تعليق المتبقية.
إضافة 500 ميكرولتر من غسل العازلة إلى مصفوفة ملزم الحمض النووي داخل فلتر زيادة ونقصان، مزيج من قبل pipetting، ثم الطرد المركزي في 14000 x ج لمدة 1 دقيقة.
تجاهل الترشيح والطرد المركزي تصفية تدور مرة أخرى في 14000 x ج لمدة 2 دقيقة لضمان تتم إزالة كافة العازلة يغسل. تجفيف مرشح تدور في 23 مئوية لمدة 5 دقائق.
قبل دافئ (70 درجة) على مياه خالية من الدناز (DES) وإعادة تعليق المصفوفة ملزمة الحمض النووي في 100 ميليلتر من DES داخل فلتر زيادة ونقصان. نقل مرشح تدور لنظيفة 1.5 مل الدقيقة الطرد المركزي توأن تكون وأجهزة الطرد المركزي في 14000 x ج لمدة 1 دقيقة إلى أزل الحمض النووي. تخزين الحمض النووي تنقيته في -20 مئوية حتى يتم تنفيذ مزيد من التحليل.

3. الحمض النووي تنقية الخرز تنقية باستخدام الحمض النووي

تم الحصول قبل إعداد مكتبة metagenomic تمت تنقية الحمض النووي المستخرج باستخدام الخرز تنقية لضمان عينة من الحمض النووي النقي: ملاحظة.

احتضان حبات في 23 مئوية لمدة 30 دقيقة قبل الاستخدام. إضافة 2 مجلدات من الخرز لعينة من الحمض النووي واحتضان الحل عند 23 مئوية لمدة 5 دقائق.
وضع العينات على مغناطيس فصل لمدة 5 دقائق ثم تجاهل طاف. تغسل حبات مرتين مع 200 ميكرولتر الطازجة 80٪ من الإيثانول (ETOH). الهواء الجاف حبات لمدة 10 دقيقة.
إزالة عينات من المغناطيس الانفصال وإضافة 50 ميكرولتر من شطف العازلة (EB)، مزيج من قبل pipetting.
احتضان تعليق على 23 مئوية لمدة 5 دقائق، وبعد ذلك وضع العينات مرة أخرى إلى المغناطيس الفصل لمدة 3 دقائق.
آرansfer طاف، التي تحتوي على الحمض النووي لأنبوب نظيفة. تجاهل الخرز.
تحديد الحمض النووي تنقيته كما في القسم الرابع.

4. الكمي من الحمض النووي تنقية

ملاحظة: كان كميا تنقية الحمض النووي باستخدام مقياس التألق والمزدوج تقطعت بهم السبل (dsDNA) حساسية عالية (HS) طقم فحص باتباع إرشادات الشركة المصنعة.

إعداد محلول العمل باستخدام 199: 1 نسبة عازلة لالكاشف.
إضافة 10 ميكرولتر من كل مستوى الحمض النووي ل190 ميكرولتر من محلول العمل.
إضافة 10 ميكرولتر من الحمض النووي المنقى إلى 190 ميكرولتر من محلول العمل. يجب أن يكون الحجم النهائي 200 ميكرولتر. احتضان العينات القياسية والحمض النووي في 23 مئوية لمدة 2 دقيقة.
تحليل المعايير قبل عينات من الحمض النووي على التألق باستخدام التعليمات التي تظهر على الشاشة.

5. بندقية تسلسل إعداد مكتبة

ملاحظة: تم إعداد مكتبة بندقية التسلسل باستخدامالتجارية إعداد مكتبة عدة باستخدام إرشادات الشركة المصنعة.

تمييع عينات من الحمض النووي إلى 0.2 نانوغرام / ميكرولتر باستخدام EB. أي عينة التي هي بالفعل أقل من هذا التركيز، أي سيطرة سلبية، يتم ترك في تركيزه الحالي.
مزيج 5 ميكرولتر من الحمض النووي المنقى مع 10 ميكرولتر العازلة و 5 ميكرولتر مزيج إنزيم. احتضان العينات عند 55 مئوية لمدة 5 دقائق.
إضافة 5 ميكرولتر من تحييد العازلة واحتضان الحل عند 23 مئوية لمدة 5 دقائق.
إضافة 5 ميكرولتر من كل من مؤشرات التسلسل محددة عينة و 15 ميكرولتر من PCR مزيج الرئيسي.
في thermocycler، احتضان العينات عند 72 مئوية لمدة 3 دقائق، 95 مئوية لمدة 30 ثانية، قبل 12 دورات من 95 مئوية لمدة 10 ثانية، 55 مئوية لمدة 30 ثانية و 72 ج لمدة 30 ثانية. احتضان عينات أخيرا في 72 مئوية لمدة 5 دقائق.
تنقية الحمض النووي استعداد باستخدام تنقية حبة كما كان من قبل ولكن مع شطف النهائي من 30 ميكرولتر من EB.

6. Library الكمية وفحص الجودة

ملاحظة: كمية ونوعية المكتبات إعداد وتقييم استخدام عدة التجارية والأجهزة.

احتضان مكونات عدة في 23 مئوية لمدة 30 دقيقة قبل الاستخدام.
إضافة 2 ميكرولتر من الحمض النووي ل2 ميكرولتر من العازلة ودوامة لمدة 1 دقيقة في 2000 دورة في الدقيقة.
تدور باستمرار العينة لضمان أنها في الجزء السفلي من الأنبوب.
إدراج أنابيب العينات، شريط تحليل ونصائح في الصك، وإجراء تحليل وفقا لتوجيهات من قبل البرنامج.

تسلسل الحمض النووي 7.

نقل المكتبات تسلسل الحمض النووي عينات مستعدة وكميا في خدمة التسلسل والتسلسل باستخدام 300 نقطة أساس نهاية يقترن تسلسل ^45.

8. تحليل البيانات الخام تسلسل

ملاحظة: يتم عرض الأوامر لكل برنامج باستخدام نظام التشغيل لينكس أدناه الخطوة البروتوكول. خط الأنابيب المستخدمة في الصورةويظهر تحليل البيانات equence في الشكل 1. برامج ليتم تثبيتها من قبل المستخدم قبل التحليل. يجب أن يتم تنفيذ هذه العملية بشكل فردي لكل عينة.

تحليل وتصور البيانات تسلسل الحمض النووي باستخدام FastQC ⁴⁶ عن طريق الكتابة في سطر الأوامر / مسار إلى ملف / fastqc، تليها وإلى الأمام وعكس الخام يقرأ raw_read2.fastq raw_read1.fastq.
تحديد المجلد الإخراج عن طريق كتابة output_fastqc -o وتنسيق ملف من الملفات المقروءة الخام عن طريق fastq -f.
عرض ملف الإخراج (الشكل 2).
مسار إلى ملف / fastqc raw_read1.fastq raw_read2.fastq -o output_directory -f fastq.

9. مراقبة الجودة التشذيب وتصفية البيانات تسلسل

تشغيل برنامج التشذيب، Trimmomatic ²⁸ عن طريق كتابة في سطر الأوامر جافا جرة / مسار إلى ملف / trimmomatic-0.35.jar.
يتم إقران تحديد الملفات ملفات نهاية بكتابة "PE". الدولة أن 16 العلاقات العامة المركزيةوحدات ocessing (وحدات المعالجة المركزية) وينبغي أن تستخدم من قبل البرنامج عن طريق كتابة -threads 16.
قائمة الملفين إلى الاختيار مراقبة الجودة عن طريق كتابة أسماء الأمام الخام وعكس يقرأ. يتم تحديد بادئة من الناتج الملفات عن طريق كتابة السيلاج -baseout.
تحديد خيارات للبرنامج عن طريق كتابة ILLUMINACLIP: NexteraPE-PE.fa: 2: 30: 10 قيادي: 3 زائدة: 3 SLIDINGWINDOW: 4: 20 محصول: 200 HEADCROP: 15 MINLEN: 36.
مرة واحدة كاملة، وتحليل تسلسل قلص باستخدام FastQC كما كان من قبل ومقارنة الإخراج إلى تسلسل البيانات الخام لضمان وتقليم تم تنفيذها بنجاح.
ملاحظة: أداة البرمجيات، Trimmomatic، قلص يقرأ المزيد عن طريق إزالة الرائدة جودة منخفضة أو قواعد N (أقل جودة 3)، وإزالة زائدة جودة منخفضة أو قواعد N (أقل جودة 3) ومسح كل قراءة مع 4-قاعدة نافذة انزلاق واسعة. وقد تم تحديد معايير لقطع عندما تنخفض متوسط الجودة في قاعدة أقل من 20 ومن ثم إلى إسقاط أي يقرأ أدناه 36 قواعد طويلة. وأخيرا، تم اقتصاص 15 قاعدة الابام على رأس كل قراءة ويقرأ تم اقتصاص للحفاظ على 200 قاعدة من بداية القراءة. تم تنفيذ هذه الخطوة النهائية للتغلب على بعض قضايا الجودة عند تسلسل طويلة (> 200 سنة مضت) يقرأ. هذه يمكن تعديلها لعينات محددة ^28.
جافا جرة /path-to-file/trimmomatic-0.35.jar PE -threads 16 raw_read1.fastq raw_read2.fastq -baseout السيلاج ILLUMINACLIP: NexteraPE-PE.fa: 2: 30: 10 قيادي: 3 زائدة: 3 SLIDINGWINDOW: 4 : 20 محصول: 200 HEADCROP: 15 MINLEN: 36

10. الجمعية Metagenome

دمج المفردة، وقلص يقرأ بكتابة القط تليها يقرأ المفردة. silage_read1_unpaired.fastq silage_read2_unpaired.fastq. إرسال الملفات إلى ملف جديد عن طريق كتابة> silage_merged_unpaired.fastq
القط silage_read1_unpaired.fastq silage_read2_unpaired.fastq> silage_merged_unpaired.fastq
لدي نوفو تجميع الحمض النووي التسلسل، استخدم البستوني (سانت بطرسبورغ الجينوم المجمع) ³⁰ عن طريق كتابة / مسار ل-file / spades.py. تحديد أن 16 وحدات المعالجة المركزية هي لاستخدامها من قبل بكتابة -t 16 وأن المعلمة metagenomic يجب تطبيقها عن طريق كتابة --meta.
تحديد قلصت إلى الأمام يقرأ باستخدام -1 silage_read1_paired.fastq والعكس يقرأ من قبل -2 silage_read2_paired.fastq. وأونبايريد المدمجة يقرأ يتم تحديده من قبل silage_merged_unpaired.fastq -s.
تحديد المجلد الإخراج عن طريق كتابة -o silage_spades.
مسار إلى ملف / -t spades.py 16 --meta -1 silage_read1_paired.fastq -2 silage_read2_paired.fastq -s silage_merged_unpaired.fastq -o silage_spades

11. المقترنة نهاية مقروءة التداخل

دمج أزواج من تسلسل الحمض النووي يقرأ باستخدام FLASH (سريع طول تعديل قصيرة يقرأ) ²⁹ عن طريق الكتابة في سطر الأوامر / مسار إلى ملف / فلاش. تحديد أن 16 وحدات المعالجة المركزية وينبغي أن تستخدم باستخدام -t 16 و البادئة الانتاج عن طريق كتابة -o السيلاج.
تحديد قلص يقرأ بكتابة silage_trimmed_R1.fastq silage_trimmed_R2.fastq
مسار إلى ملف / فلاش -t 16 -o تومض silage_read2_paired.fastq silage_read1_paired.fastq

12. تصنيف تصنيفية

نوع / مسار إلى ملف / كراكن وتحديد قاعدة البيانات عن طريق كتابة --db / مسار لملف / قياسي.
تحديد أن 16 وحدات المعالجة المركزية يجب استخدامها من قبل كتابة --threads 16 وتحديد مجلد الناتج باستخدام --output FLASHed_silage_extendedFrags_kraken.txt. اكتب اسم ملف الإدخال. FLASHed_silage.extendedFrags.fastq
مسار إلى ملف / --thread مستوى --db كراكن 16 --output FLASHed_silage_extendedFrags_kraken.txt FLASHed_silage.extendedFrags.fastq
ملاحظة: تم الانتهاء من تصنيف وتجميع السقالات تسلسل الحمض النووي باستخدام كراكن ⁷ ضد الأخيرة، قاعدة بيانات كراكن القياسية التي تحتوي على كل ما هو متاح تسلسل الجينوم بدائيات النوى.
أعمدة نقل 2 و 3 من ملف الإخراج وإلى ملف جديد عن طريق كتابة قطع -f2،3 FLASHed_silage_extendedFrags_kraken.txt> FLASHed_silage_extendedFrags_kraken.int

قطع -f2،3 FLASHed_silage_extendedFrags_kraken.txt> FLASHed_silage_extendedFrags_kraken.int

استيراد ملف جديد إلى الكرونا ¹² عن طريق كتابة ktImportTaxonomy. تحديد ملف الإدخال عن طريق كتابة FLASHed_silage_extendedFrags_kraken.int. تحديد ملف الإخراج عن طريق كتابة -o FLASHed_silage_extendedFrags_kraken.out.html.
مسار إلى ملف / ktImportTaxonomy FLASHed_silage_extendedFrags_kraken.int -o FLASHed_silage_extendedFrags_kraken.out.html

13. الشرح الوظيفي

انتقل إلى موقع ⁴⁷ MG-راست، http://metagenomics.anl.gov/. تسجيل كمستخدم جديد إذا لزم الأمر. بعد تسجيل الدخول، انقر على زر "تحميل". تحميل السقالات تجميعها من الخطوة 10.
بمجرد تحميل الملفات، انقر على "إرسال" واتبع التعليمات وينتظر الانتهاء من التحليل.
بعد التحليل الكامل، الاطلاع على الرابط إرسالها عبر متزعج من MG-راست، أو بدلا من ذلك، انقر على "التقدم". وهناك قائمة من المهام المكتملة. انقر على هوية المهمة ذات الصلة ومن ثم على وصلة إلى "صفحة التحميل".
على صفحة التحميل، تحت عنوان "البروتين تجميع 90٪"، انقر على زر البروتين لتحميل الملف البروتين وتوقع، 550.cluster.aa90.faa.
لتصنيف البروتينات التي تنتمي كما مزعومة لCAZy الطبقة انزيم معين، مقارنة البروتينات تحميلها على قاعدة البيانات CAZy ^48. تحميل قاعدة البيانات الانزيمات الكربوهيدرات النشطة (CAZy) من الملفات هي: AA.zip، CE.zip، GH.zip، GT.zip وPL.zip. وتمثل هذه الملفات الطبقات انزيم التالية على التوالي: الأنشطة المساعدة (AA)، الكربوهيدرات المونوأمينوأوكسيداز (CE)، غليكوزيدات هيدروليز (GH)، غليكوزيل ترانسفيراز (GT) والسكاريد Lyases (PL).
بفك ملفات قاعدة البيانات وتعليم البروتينات عن طريق تحديد التشابه البروتين البروتينات قاعدة بيانات CAZy باستخدام algor USEARCH UBLASTithm ^49. لاستخدام حلقة باش (لأنني في * النص) لتكرار خلال قاعدة البيانات 5 ملفات .txt نوع "لأنني في *. TXT، هل".
تشغيل USEARCH عن طريق كتابة / مسار لملف / usearch8 مع -ublast المعلمة لاستخدام خوارزمية ublast. ثم اكتب في اسم الملف تسلسل البروتين تحميلها من MG-راست، "mgmXXXXXX.3.550.cluster.aa90.faa".
للإشارة إلى ملف قاعدة بيانات لاستخدامها نوع "-db $ ط" وتحديد عتبة قيمة E في 1E ^-5، اكتب "-evalue 1E-5".
لإنهاء البحث بعد اكتشاف تسلسل الهدف، وبالتالي تصنيف هذا التسلسل البروتين أنها تنتمي إلى فئة انزيم الهدف، على سبيل المثال GH، اكتب "-masaccepts 1".
لتحديد ذلك 16 وحدات المعالجة المركزية يجب استخدام نوع "-threads 16" وتحدد شكل ملف الإخراج كنوع النص "-blast6out" مفصولة عتاب. لتحديد نوع ملف الإخراج "$ i.ublast". لإنهاء حلقة باش، ريب] "، يجري"
لأنني في *. TXT.
تفعل / مسار لملف / usearch8 -ublast ../mgmXXXXXX.3.550.cluster.aa90.faa -db $ ط -evalue 1E-5 -maxaccepts 1 -threads 16 -blast6out i.ublast $.
فعله

14. تصور CAZy الشرح

لتصور الإخراج من الشرح CAZy كما رسم تخطيطي لفين، وتوليد قوائم معرف البروتين لكل فئة الإنزيم باستخدام حلقة باش. نوع "لأنني في * .ublast، هل".
لنقل العمود 1 من ملف الإخراج وإلى ملف جديد، اكتب "القط $ ط | قطع -f 1> $ i.list".
إنهاء حلقة ونوع؛ "القيام به".
فتح ملفات .list في محرر النص. انتقل إلى موقع ويب، حدد عدد من مجموعات الى 5 ولصق محتوى كل ملف القائمة في مربع منفصل. تحميل الرسم البياني الناتج كملف .SVG.
لأنني في * .ublast.
القيام القط $ ط | قطع -f 1> $ i.list.
فعله

Representative Results

قبل تجهيزها بيوينفورمتيك، تسلسل الخام يقرأ وقلص وأزيلت محولات باستخدام برنامج Trimmomatic ^28. بعد خطوة وتقليم وتصفية، وعدد من يقرأ تم تخفيضها إلى 50٪ من تسلسل يقرأ (الجدول 1). وكان متوسط النقاط الأساسية PHRED> 30 بعد مراقبة الجودة (الشكل 2).

أزواج من تسلسل الحمض النووي الذي كان تم دمج مناطق متداخلة باستخدام برنامج فلاش ²⁹ لتوليد يعد احد يقرأ، غير متداخلة يقرأ تم الاحتفاظ بها في ملف منفصل. يقرأ 45.47٪ (105343) جنبا إلى جنب بنجاح. بعد تداخل من يقرأ باستخدام FLASH من يقرأ، شظايا بمد الناتجة خضعت تصنيف التصنيفية البكتيرية باستخدام برنامج كراكن ⁷ وكانت تصور في وقت لاحق مع برنامج الكرونا (الشكل 3).

. في غضون الصفحات = "1"> تم العثور على معظم الأنواع البكتيرية الموجودة في metagenome السيلاج خلال 4 من الكائنات الحية في بدائيات النواة: افيرميكوتس (34٪)، شعاويات (28٪)، متقلبات (27٪) وعصوانيات (7٪) . يمكن أن ينظر إلى توزيع الطبقات موجودة داخل هذه الشعب في الشكل (4). كانت الأنواع الأكثر وفرة في metagenome الملبنة النيابة. (24٪، افيرميكوتس)، الوتدية النيابة. (8٪، شعاويات)، بروبيونيباكتيريوم النيابة. (3٪، شعاويات) وPrevotella النيابة. (3٪، عصوانيات). وقد لوحظت أيضا الأنواع الهامة لصحة الحيوان والمتورطين في المرض؛ كلوستريديوم النيابة. (1٪) عصية النيابة. (0.6٪)، الليسترية. ويتوقع أن تكون موجودة في عينة السيلاج (0.2٪).

تم تنفيذ الشرح وظيفية على تجميعها يقرأ. تم تجميع metagenome باستخدام المجمع البستوني ³⁰ باستخدام قطع وتصفيتهاإقران نهاية وأونبايريد يقرأ توليد 92284 السقالات. من أجل تحديد السليلوزات، وتوقع البروتينات باستخدام MG-راست وشرحها باستخدام قاعدة بيانات الانزيمات الكربوهيدرات النشطة (CAZy). من البروتينات توقع 97562، والمشروح 6357 كما انزيم المفترض الكربوهيدرات الفعالة في واحدة من الانزيمات الطبقات الخمس التي تشكل قاعدة بيانات CAZy (الشكل 5). وتصور النتائج بمثابة مخطط فين باستخدام برنامج InteractiVenn ⁵⁰ تبين توزيع الشروح البروتين بما في ذلك تلك التي تحتوي على أكثر من CAZy الطبقة انزيم الشرح. من هؤلاء، كان من المتوقع أن يكون 3861 النشاط هيدرولاز الأنتراكينون والتي سيتواصل تميزت في المختبر للتأكد من وظيفة.

الشكل 1: بيوينفورمتيك Metagenomics خط أنابيب لتحليل الأعلاف. كانت نهجين رئيسيينتستخدم للتحقيق في microbiome من السيلاج، تصنيف التصنيف والشرح وظيفية. الرجاء انقر هنا لعرض نسخة أكبر من هذا الرقم.

الشكل 2: تسلسل الجودة لكل قاعدة قبل وبعد التشذيب وإزالة محول. تسلسل جودة مؤامرة لكل قاعدة من FASTQC يبين متوسط درجة PHRED عبر طول تسلسل يقرأ السيطرة قبل وبعد الجودة. الرجاء انقر هنا لعرض نسخة أكبر من هذا الرقم.

الشكل (3): التصنيفي Classificaنشوئها من البكتيرية Microbiome من السيلاج الصلبة. تصنيف تسلسل قلصت وتداخل يقرأ من تم تنفيذ FLASH باستخدام كراكن ⁷ و تصور في وقت لاحق مع الكرونا. الرجاء انقر هنا لعرض نسخة أكبر من هذا الرقم.

الشكل (4)
الشكل 4: توزيع الفئة التصنيفية للمن الكائنات الحية 4 الأكثر وفرة في البكتيرية Microbiome من السيلاج الصلبة. نسبة كل فئة من البكتيريا داخل من الكائنات الحية الأربعة الأكثر وفرة. افيرميكوتس: المطثيات (الحمراء)، والعصيات (الأزرق الداكن)؛ متقلبات: دلتا / إبسيلون (وردي)، ألفا (شاحب اللون الأزرق) وغاما (برتقالي) وبيتا (الفيروز)؛ عصوانيات: Flavobacteriia (الأزرق الداكن) وBacteroidia(أخضر باهت)؛ شعاويات: Coriobacteriia (الأرجواني الداكن) وغيرها من شعاويات (الأخضر الداكن). الرجاء انقر هنا لعرض نسخة أكبر من هذا الرقم.

الرقم 5: CAZy الشرح للبروتيوم توقع في صلب علف Microbiome. فين رسم بياني يوضح توزيع الطبقات انزيم خمسة من الشروح CAZy في بروتيوم توقع من microbiome السيلاج الصلبة. الرجاء انقر هنا لعرض نسخة أكبر من هذا الرقم.

يقرأ # الخام	# المصفاة يقرأ (الاقتران) يقرأ # المصفاة	# تومض يقرأ
(الاقتران)	# المصفاة يقرأ (الاقتران) يقرأ # المصفاة	# تومض يقرأ	(المفردة)
2374949 X2	231679 X2	1892534	105343

الجدول 1: يقرأ جدول ملخص التسلسل.

Discussion

في حين أن في تحليل SILICO يمكن أن تعطي فكرة ممتازة إلى المجتمعات الميكروبية التي تكون موجودة ضمن العينات البيئية، فمن الأهمية بمكان أن التصنيفات التصنيفية أظهرت أن يقوم بالتعاون مع الضوابط ذات الصلة والتي تم التوصل إلى عمق مناسب من تسلسل للقبض على كامل السكان الحالي ^51.

مع أي تحليل الحسابية، وهناك العديد من الطرق لتحقيق هدف مماثل. الأساليب التي استخدمناها في هذه الدراسة هي أمثلة على أساليب مناسبة وواضحة، والتي تم عرضها معا لتحقيق مجموعة من التحليلات على microbiome السيلاج. وهناك مجموعة متنوعة وعدد متزايد من الأدوات والتقنيات المعلوماتية الحيوية المتاحة لتحليل البيانات metagenomic، على سبيل المثال Phylosift ⁸ و MetaPhlAn2 ^52، وهذه يجب أن يتم تقييم مسبق للتحقيق لأهميتها بالنسبة للعينة ومسا تحليلuired ^53. تقتصر أساليب التحليل Metagenomic من قواعد البيانات الخاصة متاحة للتصنيف، وعمق التسلسل ونوعية التسلسل.

تم إجراء معالجة بيوينفورمتيك تظاهر هنا على، آلة تعمل بالطاقة العالية المحلية؛ ومع ذلك النظم القائمة على السحابة وتتوفر أيضا. هذه الخدمات المستندة إلى سحابة تسمح لاستئجار الطاقة الحسابية اللازمة دون الحاجة للاستثمار عالية التكلفة لمحطة العمل المحلية قوية مناسبة. ومن شأن التطبيق المحتمل لهذه الطريقة هو تقييم السيلاج قبل استخدامه في الزراعة لضمان عدم وجود البكتيريا الضارة المحتملة موجودة وبالتالي منعهم من دخول السلسلة الغذائية.

Materials

Name	Company	Catalog Number	Comments
FastDNA SPIN Kit for Soil	MP Bio	116560200	DNA Extraction
DNA FastPrep	MP Bio	116004500	DNA Extraction
Agencourt AMPure XP beads	Beckman Coulter	A63880	DNA Purification
Elution Buffer	Qiagen	19806	DNA Purification
Qubit Fluorometer	Thermo Fisher	Q33216	DNA Quantification
Qubit dsDNA HS Assay Kit	Thermo Fisher	Q32854	DNA Quantification
Nextera XT DNA Library Prep Kit	Illumina	FC-131-1024	Library Preparation
Nextera XT Index Kit	Illumina	FC-131-1001	Library Preparation
TapeStation 2200	Agilent	G2964AA	DNA Quantification
HS D100 ScreenTape	Agilent	5067-5584	DNA Quantification
HS D100 ScreenTape Reagents	Agilent	5067-5585	DNA Quantification
TapeStation Tips	Agilent	5067-5153	DNA Quantification
TapeStation Tubes	Agilent	401428 and 401425	DNA Quantification
HiSeq 2500	Illumina		DNA Sequencing - provided by a sequencing service
High Power Analysis Workstation	Various		Local or cloud based, user preferred system