Waiting
Login processing...

Trial ends in Request Full Access Tell Your Colleague About Jove
Click here for the English version

Genetics

تحليل بيانات تسلسل من دفعة الخميرة 2-الهجين شاشات المعلوماتي

Published: June 28, 2018 doi: 10.3791/57802

Summary

التسلسل بالغ السكان الخميرة المختارة للتفاعلات الإيجابية الخميرة 2-الهجين يحتمل أن تكون غلة ثروة معلومات حول التفاعل شريك البروتينات. هنا، يمكننا وصف تشغيل أدوات المعلوماتية الحيوية المحددة والبرامج المحدثة المخصصة لتحليل بيانات تسلسل من هذه الشاشات.

Abstract

ونحن قد تكيفت المقايسة 2-الهجين الخميرة في الوقت نفسه كشف العشرات من تفاعلات البروتين عابرة وثابتة ضمن شاشة واحدة تستخدم الفائق قصيرة-قراءة تسلسل الحمض النووي. مجموعات البيانات الناتجة عن تسلسل يمكن أن تتبع ما الجينات في عدد سكان التي هي إثراء من خلال التحديد للتفاعلات الإيجابية الخميرة 2-الهجين، بل أيضا إعطاء معلومات مفصلة حول المجالات الفرعية ذات الصلة من البروتينات كافية للتفاعل. وهنا يصف لنا مجموعة كاملة من البرامج القائمة بذاتها التي تسمح لغير الخبراء لأداء جميع المعلوماتية الحيوية والخطوات الإحصائية لمعالجة وتحليل ملفات فستق تسلسل الحمض النووي من تحليل 2-هجين خميرة دفعة. خطوات المعالجة المشمولة بهذه البرامج وتشمل: ما يلي تسلسل 1) رسم الخرائط والعد المقابلة لكل مرشح البروتين المشفرة داخل مكتبة فريسة 2-الهجين خميرة؛ 2) برنامج تحليل الإحصائي الذي يقيم في التشكيلات الجانبية للإثراء؛ و 3) أدوات لدراسة الإطار متعدية الجنسيات والموقف داخل منطقة الترميز لكل بلازميد المخصب الذي يشفر البروتينات المتفاعلة للفائدة.

Introduction

نهج واحد لاكتشاف تفاعلات البروتين هو الإنزيم (Y2H) 2-الهجين الخميرة، الذي يستغل هندسيا خلايا الخميرة التي تنمو فقط عندما وتين اهتمام بربط جزء من شريك المتفاعلة1. الآن يمكن أن يتم الكشف عن عدة Y2H التفاعلات مع مساعدة ضخمة يسلسل الفائق موازية. العديد من الأشكال وقد تم وصف2،3،،من45 بما في ذلك وضعنا وتزرع فيها السكان دفعة واحدة في ظل الظروف التي حدد للخميرة التي تحتوي على البلازميدات التي تنتج إيجابية التفاعل Y2H6. سير العمل نحن البلدان المتقدمة النمو، يسمى ديبن (التخصيب الحيوي لشبكات التقييم من البروتين)، ويحدد إينتيراكتوميس التفاضلية من نفس مكتبات فريسة لتحديد البروتينات التي تتفاعل مع واحد من البروتين (أو المجال) مقابل. بروتين آخر أو مجال المسخ كونفورماتيونالي متميزة. إحدى الخطوات الرئيسية في سير العمل هذا هو التجهيز السليم وتحليل بيانات تسلسل الحمض النووي. يمكن أن تكون بعض المعلومات المستقاة بمجرد إحصاء عدد القراءات لكل الجينات سواء قبل أو بعد التحديد التفاعلات Y2H بطريقة مشابهة لتجربة تسلسل الحمض النووي الريبي. ومع ذلك، يمكن استخراج معلومات متعمقة أكثر بكثير من مجموعات البيانات هذه بما في ذلك المعلومات المتعلقة بالمجال الفرعي بروتين معين التي قادرة على إنتاج تفاعل Y2H. وباﻹضافة إلى ذلك، بينما النهج ديبن الذي قيمة، تحليل العديد من عينة replicates يمكن أن تكون مرهقة ومكلفة. هو التخفيف من حدة هذه المشكلة باستخدام نموذج إحصائي تم تطويره خصيصا لمجموعات البيانات ديبن حيث هو عدد replicates محدودة6. لجعل معالجة وتحليل مجموعات البيانات تسلسل الحمض النووي موثوق بها وكاملة وقوية وموجودا للمحققين دون الخبرة المعلوماتية الحيوية، قمنا بتطوير مجموعة من البرامج التي تغطي كافة الخطوات للتحليل.

ويشمل هذا الجناح من البرامج القائمة بذاتها التي يتم تشغيلها على أجهزة كمبيوتر سطح المكتب MAPster وديبن و Stat_Maker. MAPster هو واجهة مستخدم الرسومية التي يسمح كل ملف فستق في قائمة الانتظار لرسم خرائط الجينوم استخدام برنامج HISAT27، إنتاج ملف.sam قياسية للاستخدام في تطبيقات المتلقين للمعلومات. وقد ديبن عدة وحدات. وهو يعين والتهم ما يلي المقابلة للجينات خاصة مماثلة للقياس الكمي نوع تسلسل الحمض النووي الريبي استخدام الوحدة النمطية 'العد الجينات'. كما تستخرج في تسلسل المقابلة على مفترق الطرق بين المجال النسخي Gal4 وتسلسل فريسة وجمع موقف تلك الوصلات للسماح بعمليات التفتيش بمقارنة الجداول والرسوم البيانية (باستخدام الوحدة النمطية 'Junction_Make') يسمح الوحدة النمطية 'Blast_Query' التفتيش سهلة، كوانتيتيشن، ومقارنة التسلسلات تقاطع مفرق Gal4. تقييم Stat_Maker على ما يلي كل الجينات إثراء البيانات إحصائيا كوسيلة لتحديد أولويات المحتمل Y2H مرات. وهنا، نحن تصف كيفية استخدام هذه البرامج لتحليل تسلسل الحمض النووي تجربة البيانات من Y2H ديبن الكامل. تتوفر إصدارات ديبن لتشغيلها على أنظمة الكمبيوتر، ماك و لينكس. برامج أخرى مثل برنامج رسم الخرائط MAPster ووحدة الإحصاء ديبن Stat_Maker تعتمد على subroutines التي تعمل تحت Unix وتتوفر فقط على أنظمة Mac و linux.

Subscription Required. Please recommend JoVE to your librarian.

Protocol

1-تعيين الملفات فستق

ملاحظة: ديبن البرمجيات، فضلا عن العديد من البرامج المعلوماتية الحيوية استخدام بيانات تسلسل الحمض النووي حيث تم تعيين تسلسل كل قراءة لموقفها في مرجع الحمض النووي. يمكن استخدام مجموعة متنوعة من برامج رسم الخرائط لهذا بما في ذلك واجهة MAPster هنا أن يستخدم البرنامج HISTAT2 لإنتاج.sam الملفات المستخدمة في الخطوات اللاحقة.

  1. تعيين تسلسل البيانات إلى الإصدار الصحيح من الجينوم. لمكتبات Y2H المنشأ الماوس، استخدام الجينوم mm10 التسخن؛ لأولئك الذين يستخدمون الجينات البشرية، استخدام الجينوم مرجع hg38 التسخن، للجينات Saccharomyces cerevisiae ، استخدام الجينوم مرجع التسخن SacCer3.
  2. تثبيت MAPster.
    1. تحميل برنامج MAPster وتثبيتها. البرمجيات ويمكن الاطلاع على استخدام مستعرض ويب في التالي: https://github.com/emptyewer/MAPster/releases. HISAT2 يعمل على الأنظمة المستندة إلى Unix مثل Apple Macintosh. وبسبب هذا، سيتم تشغيل البرنامج MAPster فقط على أنظمة متوافقة مثل "أبل ماكنتوش" ولينكس.
      ملاحظة: متطلبات النظام لبرنامج "أبل ماك": ماك + 10، 10، > 4 غيغابايت من ذاكرة الوصول العشوائي، > 500 غيغابايت من مساحة القرص، والوصول إلى الإنترنت لتنزيل جينومات مرجع. قد يحتاج المستخدمون إلى التشاور مع مؤسسي ذلك الشخص إذا كان مشروعهم بروتوكولات الأمان تقييد حقوق وأذونات مسؤول.
  3. أدخل الملفات المطلوبة والمعلمات من خلال علامة التبويب "الرئيسية" (الشكل 1). حدد الزر "بيرويس" مناسبة لإدخال الملفات أما أزواج أو مزاوج مع فستق كتنسيق الملف الافتراضي.
    1. لتحليل ديبن، تشغيل الخيار "بايرويسي" إلى "إيقاف تشغيل" لتشغيل تنسيق قراءة واحدة.
    2. تحميل ملفات إلى MAPster ببساطة عن طريق السحب والإفلات في الإطار المناسب.
    3. حدد مرجع مصدر الحمض النووي/الجينوم الذي يتوافق مع مصدر إدراج مكتبة فريسة Y2H. جينومات المفهرسة من عدة نموذج الكائنات يتم سردها في مربع "الجينوم" ويمكن تحميلها تلقائياً من مركز جامعة جونز هوبكنز "علم الأحياء الحسابي". سيتم تخزين مرجع جينومات محلياً لاستخدامها في وقت لاحق.
    4. الإشارة إلى العدد عمليات الكمبيوتر أن تكون مكرسة لبرنامج رسم الخرائط تحت خانة "المواضيع"، منذ HISAT2 يدعم متعدد خيوط. سيتم البحث في الكمبيوتر mAPster وتشير إلى الحد الأقصى لعدد المعالجات المتوفرة بشكل افتراضي.
    5. تحديد اسم ملف إخراج. سيتم استخدام اسم الملف هذا في جميع مراحل عملية ديبن حيث يوصي باسم قصيرة بعد وصفي بدون مسافة أو أحرف خاصة. تحديد مجلد لإخراج الملفات المعينة باستخدام الزر "فتح دليل الإخراج".
    6. مرة واحدة وقد تم اختيار الملفات المناسبة والمعلمات، إضافة وظيفة التعيين لوظائف قائمة الانتظار باستخدام الزر "إضافة إلى قائمة انتظار". يمكن حذف أسماء الملفات في الإطار الرئيسي واستبدالها بملفات مطابقة لنموذج جديد ويمكن إضافتها إلى قائمة الانتظار بعد توفير اسم ملف إخراج المطابق.
    7. انقر فوق الزر "تشغيل قائمة انتظار" حالما يتم إدخال كافة مهام في قائمة انتظار العمل.
      ملاحظة: بمجرد وظيفة رسم خرائط قد وضعت في قائمة الانتظار، تحديد تلك الوظيفة يسبب إعدادات المعلمة التي سيتم عرضها في نافذة "معلمات الوظيفة" وبيان سطر الأوامر مع كافة الوسائط ليتم عرضها في إطار "الأوامر الوظيفة". وتشمل خيارات الإخراج توجيه سواء للحفاظ على ما يلي: أن تفشل لمحاذاة، وتحديد عدد التحالفات الأولية المسموح بها لكل عملية قراءة. ملف الإخراج الافتراضي من MAPster في شكل سام (مثل ملف '.sam'). سوف يحتوي على كافة على ما يلي تسلسل من ملفات فستق المحدد لهذه العينة بما في ذلك تلك التي كانت (تعيين) ولم تكن (غير معينة) المعينة بنجاح إلى جيوم المحدد.

2-بيوينفورماتيك معالجة استخدام البرمجيات ديبن

ملاحظة: البرنامج ديبن حاليا تجميع لاستخدامها مع مكتبات فريسة تحتوي على تسلسلات كدنا الماوس، تسلسل كدنا البشرية، أو تسلسل الحمض النووي الجينومي S. cerevisiae . يقبل بتنسيق ملف قياسي.sam ديبن ويمكن قبول ملف سام (.sam) يحتوي على قراءات كل المعينة وغير المعينة أو ملفات منفصلة لكل من يقرأ المعينة وغير المعينة.

  1. تحميل البرمجيات ديبن وتثبيته. البرمجيات ويمكن الاطلاع على استخدام مستعرض ويب في التالي: https://github.com/emptyewer/DEEPN/releases. حدد الإصدار الذي يطابق منصة الحوسبة والتحميل. لتثبيت، افتح حزمة التثبيت التي تم تنزيلها.
    ملاحظة: تتوفر إصدارات ديبن للكمبيوتر، وماك، لينكس سيسريمس. ينبغي أن يكون لأنظمة ماك والكمبيوتر > 500 غيغابايت من مساحة القرص الثابت و > 4 غيغابايت من ذاكرة الوصول العشوائي.
  2. قم بفتح البرنامج ديبن. من الإطار الرئيسي (الشكل 2) حدد معلومات مكتبة فريسة المقابلة من مربع التحديد أعلى. حدد مجلد حيث يمكن الذهاب الملفات التي تمت معالجتها عن طريق النقر فوق الزر "مجلد العمل" التنقل إلى المجلد/الدليل. يمكن للمرء إنشاء مجلد/دليل جديد إذا لزم الأمر. ديبن حالما يتم تحديد مجلد "العمل"، سيتم إنشاء ثلاثة مجلدات فرعية بعنوان unmapped_sam_files، و mapped_sam_files، و sam_files.
    1. إذا كان استخدام ملفات.sam التي تحتوي على ما يلي كل المعينة وغير المعينة مثل تلك المنتجة مع الإعدادات الافتراضية للبرنامج MAPster، وضعها في المجلد 'sam_files'. وأﻻ وضع ملفات.sam في unmapped_sam_files و mapped_sam_files وفقا لذلك.
  3. بدء المعالجة بواسطة النقر فوق الزر "الجينات Count + مفرق تجعل".
    ملاحظة: سوف تبدأ التجهيز مع الوحدة النمطية عدد الجينات التي سوف تستخدم خرائط مواقع لعد عدد القراءات تقابل كل الجينات. سوف ثم استخراج جعل تقاطع تقاطع تسلسل (تسلسل التي تنصهر فيها مباشرة المتلقين للمعلومات من المجال Gal4-تفعيل) من على ما يلي والتعرف عليها باستخدام خوارزمية الانفجار. سيقوم هذا بإنشاء مجموعة كاملة من المجلدات المصورة في الشكل 3. تجهيز الوقت يعتمد على حجم وعدد من ملفات البيانات تسلسل وسرعة المعالجة للكمبيوتر المستخدم. يقرأ مرات نموذجي تتراوح بين 12 – 30 ح مجموعة من البيانات تجريبية من 250 مليون. يمكن أن تبدأ إجراء عدد الجينات وإجراء Junction_Make على حدة بواسطة النقر فوق الزر "Count الجينات" أو الزر "مفترق طرق تجعل".
  4. تنزيل وتثبيت Stat_Maker (https://github.com/emptyewer/DEEPN/releases). وهذا تحليل الإحصائي حزمة مصممة لمجموعات البيانات ديبن الذي يعمل حاليا فقط على أنظمة Unix ماك.
    1. افتح Stat_Maker ثم انقر فوق الزر "التحقق من تثبيت" (الشكل 4). إذا كان قيد التشغيل لأول مرة، Stat_Maker سيتم تلقائياً تثبيت البحث والتطوير، والنتوءات، وبيوكوندوكتور عن طريق سحب هذه الموارد من الإنترنت. حالما يتم الكشف عن البحث والتطوير، والنتوءات، وبيوكوندوكتور، وسوف تصبح نشطة Stat_Maker وإتاحة المزيد من إدخال المستخدم.
    2. انقر فوق الزر "اختيار مجلد" للانتقال إلى مجلد العمل التي تتم معالجتها ديبن. سوف العثور على Stat_Maker وقائمة الملفات للتحليل الإحصائي في النافذة تلقائياً.
    3. سحب وإسقاط الملفات المناسبة من إطار قائمة الملف أعلاه في windows الملف أدناه لكل مجموعة بيانات متجهة، والطعم وكل شروط النمو: غير المحددة (وسائل الإعلام له +) وتحديدها (وسائل الإعلام له-). الأهم من ذلك، يتطلب Stat_Maker مجموعات البيانات المكررة لإفراغ ناقلات وحدها، نموذجين للسكان غير المحددة ونموذجين لتحديد. وهذا يعطي تقديراً للتنوع داخل هذه التجربة.
    4. انقر فوق الزر "تشغيل". اعتماداً على سرعة الكمبيوتر، سوف تأخذ العملية الحسابية بين 5 – 15 دقيقة.
  5. استعراض النتائج من إخراج Stat_Maker، التي يتم وضعها في مجلد فرعي جديد ضمن المجلد العمل الرئيسي المسمى "Stat_Maker النتائج".
    ملاحظة: يتم العثور على النتائج في ملف csv (قيم مفصولة بفواصل) التي يمكن فتحها في برامج جداول البيانات. Stat_Maker وسوف رتبة يضرب الجينات التي من المحتمل أن الأثران إثراء عند التحديد مع الطعم للفائدة على اختطارها بتيف فارغة (الشكل 5). كما جدولت هو النسبة المئوية لما يلي لكل مجموعة من البيانات حيث توجد إدراج الجينات المنبع، المصب، أو داخل الإطار القراءة المفتوحة، وما إذا كان الجين موجود أيضا داخل الإطار الصحيح القراءة متعدية الجنسيات. في كثير من الأحيان، وسوف التقاط ديبن تفاعلات Y2H قوية الطعم مع أجزاء من كدنا معينة التي هي خارج الإطار القراءة السليمة للبروتين المقابل أو لجزء من كدنا أن المتلقين للمعلومات من إطاره القراءة المفتوحة المقابلة. المسح الضوئي الناتج الإجمالي من Stat_Maker يبسط كشف والقضاء على هذه الزيارات غير ذي صلة.
  6. لاستعراض البيانات الموجودة على كل المرشحين المحتملين، افتح البرنامج ديبن، حدد المعلومات مكتبة فريسة المقابلة ومن ثم مجلد العمل الصحيح باستخدام المجلد "العمل".
    1. انقر فوق الزر "استعلام الانفجار". وهذا يحمل نافذة جديدة (الشكل 6). في مربع النص العلوي، اكتب اسم الجينات أو رقم NM بنك الجينات لتحديد الجينات المرشحة للفائدة. وتناظر هذه الأسماء الجينات الأسماء المسرودة في ملف الإخراج ستاتماكير. أدخل نوع أو العودة، الذي يبدأ استرجاع الجينات للفائدة.
    2. حدد مجموعات البيانات التي سيتم استخدامها لتحليل استخدام القوائم "تحديد مجموعة البيانات". بشكل عام، هذه تشمل ناقلات فقط والطعم عينات نمت تحت ظروف غير انتقائية ونمت تحت شروط اختيار العينة الطعم. في البداية، مجموعات البيانات سوف يستغرق بضع لحظات لتحميل، ومع ذلك، سوف تذهب استعلام اللاحقة من نفس مجموعات البيانات مع جينات مختلفة سريعاً. سيتم عرض Blast_Query نقاط الانصهار على طول التسلسل من الفائدة وكيف وفيرة كل نقطة الانصهار. يمكن عرض هذا في تنسيق جدول باستخدام علامة التبويب "نتائج" أو تنسيق رسومي باستخدام علامة التبويب "مؤامرة" على حد سواء. هذه النتائج يمكن تصديرها إلى ملف.csv عن طريق النقر فوق الزر "حفظ.csv" في الجزء العلوي الأيمن.

3-تحقق مرشحين حددها ديبن

ملاحظة: هو الغرض من ديبن و Stat_Maker لتحديد الجينات المرشحة التي تعطي Y2H تفاعل إيجابي. التحقق من هذه التفاعلات Y2H يمكن أن يكون القيام به باستخدام تنسيق Y2H ثنائي تقليدية استخدام بلازميد الطعم لمصلحة يقترن بلازميد المجال 'فريسة' Gal4-تفعيل فارغة، فضلا عن يقترن بلازميد فريسة تحمل جزء الجينات/كدنا على الاهتمام. ليس ممكناً لعزل بلازميد الفعلية من الاهتمام داخل الخليط من الحمض النووي المعزولة من الخميرة السكان يتعرضون لانتقاء Y2H. ومع ذلك، أحد يمكن حسابياً إعمار ما الجزء الجينات/كدنا أن ينتج التفاعل Y2H تصميم كبسولة تفجير ل 5 '3' ينتهي هذا الجزء وتضخيم هذا الجزء من الحمض النووي معزولة عن السكان الخميرة. يصف هذا القسم كيفية البحث عن نهاية الجزء فريسة المرشح 5 'و 3'.

  1. فتح برنامج ديبن واختيار المعلمات "تحديد معلمة" ومجلد العمل "تحديد العمل مجلد" المقابلة للمشروع. بدء تشغيل الوحدة النمطية Blast_Query بواسطة النقر فوق الزر "استعلام الانفجار".
  2. اكتب اسم الجينات من الفائدة أو في بنك الجينات "نيوتن متر" رقم في مربع النص العلوي. حدد من القائمة المنسدلة مجموعة البيانات الذي يتوافق مع السكان الخميرة المحدد للطعم من الفائدة لاسترداد جدول تقاطع المواقف تحت علامة التبويب 'النتائج'. بشكل افتراضي، سيتم ترتيب Blast_Query المواقف المختلفة وفقا لما وفرة في dataset، كمياً بجزء في المليون من إجمالي عدد الوصلات الموجودة داخل قاعدة البيانات.
    1. البحث عن موقف الأكثر وفرة بأن "في ارف" و "في إطار". القيمة لموقف يتوافق مع موقف النوكليوتيدات من الجينات مع تسلسل مرجع نكبي (عدد 'شمال البحر الأبيض المتوسط') الموجودة في مربع النص العلوي. هذا التسلسل يمكن استردادها من بنك الجينات (https://www.ncbi.nlm.nih.gov/nuccore/) أو نسخها من مربع النص السفلي في إطار Blast_Query.
      ملاحظة: يمكن العثور على مثال في الشكل 6، الفريق الأوسط. في dataset مركز، تظهر 'النتائج' كمفترق الطرق الأكثر وفرة: 'موقف': 867؛ '#Junctions': 20033.821؛ الاستعلام 'ابدأ'، 1؛ الأقراص المدمجة: في ارف؛ و 'الإطار': في الإطار. النوكليوتيدات 867 التسلسل المرجعي نكبي بنك الجينات NM_019648 هو بداية الجزء الفريسة.
  3. إذا كان "بدء الاستعلام" هو 1، تصميم 5 ' نهاية التمهيدي تشمل النوكليوتيدات المقابلة لرقم الموضع وتمديد النيوكليوتيدات 25 في اتجاه مجرى النهر من هذا الموقف (الشكل 7). إذا كان "بدء تشغيل الاستعلام" أكثر من 1، تشير إلى أن هناك النيوكليوتيدات إضافي بين المجال التفعيل Gal4 وتسلسل فريسة للفائدة والتمهيدي أن تبدأ زيادة المصب وفقا لقيمة "بدء تشغيل الاستعلام".
  4. من إطار ديبن انقر فوق الزر "قراءة العمق" تحت "تحليل البيانات". بمجرد فتح النافذة "عمق القراءة"، اكتب نكبي مرجع تسلسل (NM) عدد الجينات اسم أو في مربع النص العلوي. استخدم القائمة المنسدلة لتحديد مجموعة البيانات ذات الصلة الذي يحتوي على الجين المخصب للفائدة. استخدام الجدول على اليسار وعرض الرسومات على الحق في تحديد عدد القراءات عثر في البيانات التي تتوافق مع الجينات للفائدة (الشكل 7ب).
  5. تصميم تمهيدي نهاية 3 'التي سيتم التقاط تسلسل جزء الجينات على حسابها"عمق القراءة". إذا كانت كثرة القراءات ويتجاوز ORF ووقف كودون، تصميم التمهيدي بحيث يشمل كودون التوقف ومنطقة فقط المنبع كودون التوقف. إذا تسلسل للجينات لا تمتد إلى الماضي كودون التوقف، استخدم "الجدول نتائج" للبحث عن منطقة 3 'الأكثر بعدا التي يمكن الكشف عنها واستخدام هذا الموقف أبعد 3' موقف لوضع الدليل التمهيدي.
    ملاحظة: البرنامج "عمق القراءة" بفحص في الفواصل الزمنية لإيجاد تسلسل التي تطابق الجينات/كدنا المحدد للفائدة. ويساعد هذا التنبؤ حيث 5 'و 3' نهاية الجزء الأكثر وفرة فريسة لذلك الجين في العينة. التقلبات في عمق القراءة على طول التسلسل العادي، كما يتبين في الشكل 7. إذا كان من الواضح أن عمق قراءة الماضي كودون التوقف، تشير إلى أن تتجاوز الجزء فريسة كودون التوقف وهكذا ببساطة على التمهيدي 3 ' يمكن أن تتوافق مع المنطقة المحيطة كودون التوقف.
  6. أداء فعل PCR 50 ميليلتر للجينات. كل رد يحتوي على 25 بمول لكل إلى الأمام وعكس التمهيدي مطابقة بلازميد فريسة-مكتبة (انظر الجدول للمواد). تحتوي أيضا على ردود الفعل 25 ميليلتر من x PCR عالية الدقة 2 ميكس ماجستير، 5 ميكروغرام من عينات الحمض النووي، والمياه تصل إلى 50 ميليلتر.
    1. تضخيم ردود الفعل لدورات 25 مع تمديد أوقات 3 دقيقة في 72 درجة مئوية، الصلب درجة حرارة 55 درجة مئوية لمدة 30 ق، ويشوه عند 98 درجة مئوية لمدة 10 س يسبق ركوب الدراجات التي تمسخ s 30 عند 98 درجة مئوية واتبع مع حضانة 5 دقيقة عند 72 درجة مئوية.

Subscription Required. Please recommend JoVE to your librarian.

Representative Results

تعيين البيانات فستق: الخطوة الأولى
في عمليا جميع خ ع تطبيقاته ديبن الإخراج الأولى هو ملف من ما يلي تسلسل قصيرة التي يجب تعيينها بالمحاذاة للجينوم، ترانسكريبتوميك، أو أخرى مرجعية الحمض النووي8. في الآونة الأخيرة، تم تطوير هذا البرنامج المحاذاة HISAT2 التي تستخدم خوارزميات الفهرسة الدولة من الفن إلى زيادة هائلة في تعيين سرعة7،9. HISAT2 يعمل بفاعلية على جهاز كمبيوتر سطح مكتب وخريطة الحجم عادة قراءة الملف في غضون دقائق. وهذا سمح لنا بالتفاف HISAT2 إلى واجهة مستخدم الرسومية يسمى MAPster التي يمكن تعيين فاستق الملفات محلياً، مما يسمح للمستخدمين لتجنب الاعتماد على مجموعات الكمبيوتر عالية الأداء البعيد التي تعمل عادة مع لغة سطر الأوامر (الشكل 1). وتشمل الميزات الهامة من MAPster وجود معلمات الإعداد المسبق لتسلسل الحمض النووي الريبي والجينوم كله تجارب رسم الخرائط، القدرة على وظائف متعددة في قائمة الانتظار، والوصول إلى مجموعة كاملة من معلمات HISAT2 قابل للتعديل بسهولة للمستخدمين الخبراء وتخصيص التطبيقات. بغية توضيح الوظائف في MAPster، تم تعيين ملف بيانات تسلسل الحمض النووي الريبي خلية آب متاحة علنا إلى مرجع GRChg38 فرقة الجينوم بالإضافة إلى نسخة الحمض النووي. الملف فاستق تكرار 1 أهاب A11 تم تنزيلها من "الأرشيف قراءة التسلسل نكبي" ويتضمن ما يلي: 38.3 مليون. تم تشغيل mAPster على ايماك أبل مع 3.5 جيجاهرتز إنتل كور i7 معالج الافتراضي باستخدام معلمات تسلسل الحمض النووي الريبي لقراءة الملف مزاوج. تم التعيين في أقل من خمس دقائق. وكان المعدل العام لمحاذاة 96.6 في المائة. يتم العثور على نتائج مشابهة مع datasets ديبن النموذجية ما يلي: 15 مليون/العينة، على الرغم من أن المعدل العام لمحاذاة أقل بسبب وجود ناقل تسلسل من بلازميد فريسة Y2H.

العثور على مرشح يضرب بمساعدة Stat_Maker.
البرنامج ستاتماكير ينتج ملف excel عرض يلخص معظم المعلومات ذات الصلة اللازمة لتحديد مرشح البروتينات المتفاعلة. لأنه يجعل من Stat_Maker استخدام من روتين فرعي المستندة إلى unix، سوف تعمل على ماك (OS10.10 +) لكن ليس الكمبيوتر. أولاً، وهو يلخص ما يلي في صفحة في الدقيقة لكل الجينات لمكافحة ناقلات الأمراض والسكان الطعم وأيضا تنتج احتمال الترتيب سواء إثراء مورثة خاصة عند تحديده للتفاعل Y2H مع الطعم للفائدة حقاً أكبر من تخصيب اليورانيوم من تلك الجينات عند تحديده للتفاعل مع عنصر تحكم ناقل فقط (الشكل 5). وثانيا، ينفذ العمليات الحسابية الوحدة النمطية بلاستكويري في الجينات كل تقييم ستاتماكير ويجدول النسبة المئوية ليقرأ الوصلات الموجودة في الإطار الصحيح متعدية الجنسيات وتسلسل الترميز التي ستكون مطلوبة لاصيل الناحية البيولوجية ذات الصلة إينتيراكتور. هذا الإخراج مجتمعة يجعل من الممكن للمرشحين بسرعة الفرز والتصفية لتحديد تلك التي يمكن أن تكون أقرب بتفتيش بلاستكويري. مع هذا الإخراج، واحد أولاً فرز للمرشحين الذين مع probabily أعلى من يجري إثراء من خلال التحديد للتفاعل Y2H في البروتين الطعم للفائدة وليس عند تحديده للتفاعل على بلازميد ناقلات وحدها. في الممارسة العملية، نجد أن P > 0.95 يعمل بشكل جيد. ثم يمكن أن يكون في المرتبة المرشحين لتلك التي قد تقاطع معظم ما يلي: في منطقة الترميز وفي الإطار القراءة الصحيحة باستخدام وظيفة فرز بسيطة. هنا، المرشحين مع > 85% وصلات التي في هذا الإطار الصحيح متعدية الجنسيات، وتوجد أما داخل فتح قراءة الإطار/البروتين ترميز المنطقة (ORF) أو أن تبدأ فقط المراحل الأولى من كودون ابدأ (المنبع). عامل التصفية هذا الأخير يلغي 60 – 80 في المائة من المرشحين التي لها قيمة P مقبولة، وضع قائمة بأكثر بكثير من الناحية البيولوجية ذات الصلة ويمكن التحكم فيها لمزيد من التفتيش.

البرنامج ديبن.
لب برنامج ديبن حزم عدة وحدات حسابية معا لدمج جميع الخطوات المعلوماتية الحيوية باستخدام ملفات SAM. Gene_Count يوفر عدد القراءات كل الجينات، بتنفيذ حساب شبيه الحمض النووي الريبي seq كوانتيتيشن. يمكن استخدام برامج أخرى تقوم بإجراء هذا النوع من الحساب، وكذلك، ومع ذلك، تنسيق الملف ستحتاج إلى تعديل لتكون متوافقة مع الوحدات النمطية الأخرى ديبن والبرنامج Stat_Maker. بدلاً من ذلك، الوحدة النمطية Gene_Count يمكن أن تستخدم لتحديد التجارب رناسيق، ومع ذلك، كانت الحزم الأخرى المتكاملة مع برامج إحصاءات محددة المتقدمة10. تم تحسين عملية مطابقة قراءة معين خاص مع الجينات المقابلة للاهتمام منذ البرمجيات ديبن الأولية باستخدام بنية شجرة بيانات لتعيين الجينات. وقد أثر هذا كثيرا التعجيل بسرعة معالجة نموذجية dataset التي تحتوي على 10 مليون المعينة ما يلي: أن يأخذ 5 – 10 دقيقة على سطح مكتب الكمبيوتر مع متطلبات الحد الأدنى للنظام. تحليلات أخرى، وبخاصة تحليل القراءات مفرق تمتد إلى المجال Gal4 في تفعيل والمرشح المتفاعلة ذات الاهتمام، ومكتفية ذاتيا. كما يتم حزمها مع الوجوريثم الانفجار الذي يعمل محلياً وتحليل الإجراءات لجمع كل التقاطع يقرأ بشكل صحيح ومواقفهم لجميع جينات معينة. واحدة من عيوب البرمجيات ديبن هو أنه يجعل استخدام قواعد البيانات المنسقة الخاصة التي تقوم بتعريف التي exons في جينومات مرجعية تستخدم لتعريف كدناس أو الترميز المناطق، وتنسيق قواعد البيانات التي تحدد تسلسل وبدء متعدية الجنسيات وتوقف كل كدنا/الجينات المستخدمة. وجدنا أنه من الصعب لاسترداد كافة معلومات قاعدة البيانات يتطلب ديبن في شكل موثوق بها أن تفتقر إلى بعض الأخطاء زائفة التي واجهناها مع فهرسة من جينات معينة. وهكذا، نحن المجتمعين قواعد بيانات جديدة نحن الجودة التي تسيطر وجزءاً لا يتجزأ منها في برامج ديبن لمرجع داخلي متسقة. في الوقت الراهن، الماوس، والإنسان، ومكتبات فريسة Y2H S. cerevisiae معتمدة من قبل قواعد البيانات المضمنة شريطة أن يتم تعيين ملفات فستق الحمض النووي ضد mm10 أو hg38، أو SacCer3 قواعد بيانات مرجعية متاحة من التسخن. يمكن معالجة مكتبات Y2H من الكائنات المختلفة بواسطة ديبن شريطة أن يبني قواعد بيانات مماثلة ووضعها في البرنامج ديبن. عموما، ولكن العبوة مكتفية ذاتيا من كافة الوحدات النمطية ديبن وقواعد البيانات، وبرامج أخرى جعل هذه التحليلات bioinformatic موجوداً للمحققين على جميع المستويات من الخبرة.

Figure 1
الشكل 1 : واجهة MAPster- لقطة شاشة من الإطار الرئيسي ل MAPster. تظهر المربعات لإدخال الملفات المطلوبة والأشكال. إيقاف تشغيل "بيرويس" (A) لمعالجة ملفات تسلسل كما يقرأ نهاية واحدة. الجينوم المرجع المحدد مع القائمة 'الجينوم' بار (ب). يتم تحديد عدد المعالجات المستخدمة من قبل HISAT2 مع القائمة "مؤشرات الترابط"، (ج). يمكن كتابة اسم النموذج الجديد في نافذة النص "اسم ملف الإخراج" (د). يمكن تعيين الدليل من أجل ملفات الإخراج في (ه). أدناه هو نافذة عرض قائمة انتظار لنهاية واحدة قراءة الملفات. بعد إضافة نموذج إلى قائمة الانتظار، يمكن البدء في رسم الخرائط باستخدام الزر "تشغيل قائمة انتظار" (F). الرجاء انقر هنا لمشاهدة نسخة أكبر من هذا الرقم-

Figure 2
الشكل 2 : واجهة ديبن. صورة لواجهة المستخدم الرسومية المستخدمة لتشغيل الوحدات النمطية ديبن. الرجاء انقر هنا لمشاهدة نسخة أكبر من هذا الرقم-

Figure 3
الشكل 3 : انتهاء تجهيز- وبمجرد أن ديبن معالجة البيانات، يتم إنشاء المجلدات الفرعية التالية. يمكن أن تفقد هذه، ولكن عمليات المصب تتطلب أن تظل هذه المجلدات الفرعية ضمن المجلد العمل الرئيسي، وأن تحتفظ بمحتويات وأسماء. الرجاء انقر هنا لمشاهدة نسخة أكبر من هذا الرقم-

Figure 4
الشكل 4 : تحليل Stat_Maker- صورة لواجهة المستخدم الرسومية ل Stat_Maker، الذي تم تحميل مع الملفات المناسبة للسماح للمعالجة. يظهر أعلى العرض المبدئي ل Stat_Maker. بمجرد تم التحقق من وجود دعم البيانات الأساسية عن طريق النقر فوق الزر "التحقق من تثبيت"، والمجلد العمل المناسب المحددة وبعد النقر فوق الزر "اختيار مجلد"، واجهة المستخدم الرسومية سوف تصبح نشطة، مما يسمح لتحميل الملفات. الرجاء انقر هنا لمشاهدة نسخة أكبر من هذا الرقم-

Figure 5
الشكل 5 : مقتطفات من إخراج Stat_Maker. جزء من الإخراج Stat_Maker مقارنة في إثراء المرشحين فريسة على بروتين بيت مفرد لناقلات وحدها (فارغة بتيف-اختطارها). كما هو موضح من تحليل المقابلة لما إذا كان يتضمن والبلازميدات المقابلة للمرشح فريسة الإطار المفتوح-القراءة الصحيحة. كل الجينات تقييمها له عدة قيم: قاعدة ومركزنا والطعم والتخصيب. 'القاعدة' هي نسبة متوسط القراءات (جزء في المليون) التي لوحظت للجينات داخل مجموعات البيانات 2 المقابلة للسكان مكررة تحتوي على ناقل فقط وحدها ونمت تحت ظروف غير انتقائية. "مركزنا" تشير إلى أن نسبة متوسط القراءات (جزء في المليون) التي لوحظت للجينات داخل مجموعات البيانات 2 المقابلة للسكان مكررة تحتوي على ناقل فقط وحدها ونمت تحت ظروف انتقائية (مثلاً-له). 'الطعم' تشير إلى أن نسبة ما يلي (جزء في المليون) التي لوحظت بالنسبة للجينات داخل مجموعات البيانات 2 المقابلة للسكان 2 يحتوي على بلازميد الطعم ونمت تحت ظروف انتقائية (مثلاً-له). "التخصيب" (تخصيب) هو log2 ((Bs/Bn)/(مقابل/Vn)) هو Bs على ما يلي للطعم ضمن التحديد، الجبهة الوطنية ما يلي للطعم تحت عدم اختيار، مقابل متجه وحدة ضمن التحديد، حيث Vn متجه وحدة ضمن التحديد. الرجاء انقر هنا لمشاهدة نسخة أكبر من هذا الرقم-

Figure 6
الرقم 6 : عرض Blast_Query- إخراج Blast_Query من وجهات نظر مختلفة 3. العلوي هو العرض المبدئي ل Stat_Maker قبل أن يتم تحديد مجموعات البيانات للمرشح. الفريق الأوسط طريقة عرض مثال لجدول البيانات عرض المعلومات على مرشح معين لاثنين من مجموعات مختلفة. يظهر أسفل طريقة عرض رسم لجداول البيانات، عدد نقاط تقاطع معين على طول الجين/كدنا تهم التآمر. الرجاء انقر هنا لمشاهدة نسخة أكبر من هذا الرقم-

Figure 7
الشكل 7 : البحث عن كبسولة تفجير 5 'و 3' تضخيم. (أ) يبين تسلسل افتراضية وكيفية تصميم اليغو 5 ' لالتقاط الإطار الصحيح والانصهار نقطة بين المجال Gal4 في تفعيل وتسلسل فريسة للفائدة. في المثال 1، موقف نقطة الانصهار في النوكليوتيداتال 10 مع بداية ف 1. استخدام الإزاحة المذكورة أعلاه النيوكليوتيدات 0 الجدول، تضاف إلى العثور على 5 ' بدء موقف التمهيدي. نقطة الانصهار بلازميد فريسة أعيد بناؤها يظهر أن المجال التفعيل Gal4 هو تنصهر فيها مباشرة إلى الفريسة في النوكليوتيدات 10. في المثال 2، "بدء الاستعلام" هو 3، الأمر الذي يتطلب إزاحة النوكليوتيدات 1 بغية التقاط نقطة البداية الصحيحة والإطار لإدراج الفريسة. التخطيطي الفريسة أعيد بناؤها يبين أن هناك النيوكليوتيدات 2 بين المجال التفعيل Gal4 والموقف المعروف لإدراج الجارحة التي يجب أن تكون مسؤولة. (ب) يبين "عمق قراءة" النافذة. يستخدم لإدخال رقم التسلسل المرجع نكبي مربع النص في الجزء العلوي والقائمة المنسدلة تحت '.sam حدد ملف' يستخدم لتحديد البيانات للعينة المحتوية على الجينات التفاعل المخصب إذا الفائدة. ويبين "عمق القراءة" متواليات كم (محور ص) عثر في البيانات التي تتوافق مع مواقف النوكليوتيدات تسلسل الفائدة (س). الرجاء انقر هنا لمشاهدة نسخة أكبر من هذا الرقم-

Subscription Required. Please recommend JoVE to your librarian.

Discussion

جناح البرامج المشروحة هنا يسمح أحد لمعالجة وتحليل بيانات تسلسل الحمض النووي الإنتاجية العالية من تجربة ديبن تماما. البرنامج الأول الذي استخدم هو MAPster، الذي يأخذ على ما يلي تسلسل الحمض النووي في الملفات القياسية فستق وخرائط موقفهم على مرجع الحمض النووي للتجهيز النهائي بمجموعة كاملة من البرامج المعلوماتية بما في ذلك البرمجيات ديبن. الأداة المساعدة للواجهة MAPster وقدرته على قائمة الانتظار متعددة الوظائف، الجمع بين ملفات الإدخال، اسم كوفينينتلي إخراج الملفات، مقترنة بسرعة HISAT2 الأساسية ويوفر البرنامج7 أنها تسيطر على مخطط أداة سهلة الاستخدام لمجموعة متنوعة من تطبيقات تتجاوز ديبن. MAPster يمكن الوصول إلى العديد من المعلمات للبرنامج HISAT2 التي هي مناسبة لأنواع أخرى من تحليل البيانات بالإضافة إلى ديبن. بعض هذه الميزات تتضمن معلمات الإعداد المسبق لتسلسل الحمض النووي الريبي وتجارب رسم خرائط الجينوم كله والوصول إلى مجموعة كاملة من معلمات HISAT2 قابل للتعديل بسهولة للمستخدمين الخبراء وتطبيقات مخصصة. على سبيل المثال، إضافة الزر تسلسل الحمض النووي الريبي التنسيق التي من شأنها تسهيل محاضر جلسات الجمعية العامة. محاذاة كتل زر كريسبر إلى حبلا تكملة عكس سيكون مناسباً لملف الحمض النووي مرجعية المستمدة من تسلسل الحمض النووي الريبي الدليل. تم العثور على المعلمات الاختيارية تحت أربع علامات تبويب المسمى، "الإدخال والمحاذاة، وسجل والإخراج". وتشمل خيارات الإدخال القدرة لتغيير تنسيقات ملف الإدخال وقم بتحديد خيارات التشذيب القراءة الأساسية. المحاذاة وعلامات التسجيل تشمل الخيارات حدد حبلا واحد فقط على مرجع الحمض النووي وتحديد العقوبات الفجوة وعدم تطابق للدرجات المحاذاة. القدرة على سهولة في قائمة الانتظار متعددة الوظائف رسم الخرائط مع إعداد المعلمة المتميزة كل ينبغي جعل MAPster فائدة للمستخدمين الخبراء وغير الخبراء متابعة خ ع التطبيقات المعقدة.

البرامج ديبن و Stat_Maker هي مكرسة لتحليل البيانات المعلوماتية الحيوية المحددة من شاشات دفعة Y2H. وهذا هو الوصول إلى طائفة واسعة من المحققين ويشكل bioinformatic متجاورة حزمة برامج تشغيل من خلال واجهة مستخدم الرسومية. هذه الحزمة قد تم كذلك الأمثل والمتكاملة من الوصف الأصلي6 بحيث أنه يعمل بشكل أسرع، وهو تبسيط تحليل مرات مرشح. يمكن تشغيل جميع الخطوات المعلوماتية الحيوية على كمبيوتر سطح مكتب. الرئيسي وتحيط البرمجيات ديبن هذه الخريطة مواقع لحساب يقرأ كم تتوافق مع كل الجينات وبالتالي تشكل الأساس لكيف يثري جين معين بناء على التحديد. هذا البرنامج كما يرى 'تقاطع' تسلسل التي تتوافق مع الإدراج للفائدة كما هي تنصهر فيها مجال التنشيط النسخي بلازميد فريسة ويجدول هذه النتائج حيث أن أحد يمكن تصور جميع أجزاء مختلفة من ارف خاص أو كدنا غير كافية للتفاعل. وبالإضافة إلى ذلك، يوفر هذا أيضا معلومات للتحقق من الإطار القراءة لكل إدراج. الذراع الثالثة من البرنامج بيوينفورماتيك هو Stat_Maker، الذي يستخدم ملفات الإخراج معالجتها بواسطة ديبن لحساب الإحصائية أهمية الفاسدون الجينات الناتجة عن التفاعل مع بروتين طعم معين مقابل (وحدة متجه المجال Gal4-الحمض النووي-ملزمة بتيف فارغة-اختطارها). تحسن الذي حدث مؤخرا هو أن Stat_Maker لا يوفر ترتيب إحصائية لكل مرشح فحسب، بل أيضا يجدول المقابلة المعلومات المستخرجة من تقاطع تسلسل المقابلة، جعلها متوفرة في ملف واحد مما يجعل من الأسهل بكثير للمحققين بدراسة واستعراض النتائج.

Subscription Required. Please recommend JoVE to your librarian.

Disclosures

الكتاب لا تمت بصلة إلى الكشف عن

Acknowledgments

هذا العمل كان يدعمها في "المعاهد الوطنية للصحة": R21 المعاهد الوطنية للصحة EB021870-01A1 و "منحة مشروع بحوث جبهة الخلاص الوطني": 1517110.

Materials

Name Company Catalog Number Comments
Mapster https://github.com/emptyewer/MAPster/releases
DEEPN software https://github.com/emptyewer/DEEPN/releases
Statmaker https://github.com/emptyewer/DEEPN/releases
Minimum computer system Apple Mac Intel Core i5 or better
- 4 Gb RAM or better
- 500 Gb Disk spce or better
- OS 10.10 or higher
Dell Intel i5-7400 or better
- 4 Gb RAM or better
- 500 Gb Disk spce or better
- Windows 7 or higher

DOWNLOAD MATERIALS LIST

References

  1. Fields, S., Song, O. A novel genetic system to detect protein-protein interactions. Nature. 340 (6230), 245-246 (1989).
  2. Rajagopala, S. V. Mapping the Protein-Protein Interactome Networks Using Yeast Two-Hybrid Screens. Advances in Experimental Medicine and Biology. 883, 187-214 (2015).
  3. Weimann, M., et al. A Y2H-seq approach defines the human protein methyltransferase interactome. Nature Methods. 10 (4), 339-342 (2013).
  4. Yachie, N., et al. Pooled-matrix protein interaction screens using Barcode Fusion Genetics. Molecular Systems Biology. 12 (4), 863 (2016).
  5. Trigg, S. A., et al. CrY2H-seq: a massively multiplexed assay for deep-coverage interactome mapping. Nature Methods. , (2017).
  6. Pashkova, N., et al. DEEPN as an Approach for Batch Processing of Yeast 2-Hybrid Interactions. Cell Reports. 17 (1), 303-315 (2016).
  7. Kim, D., Langmead, B., Salzberg, S. L. HISAT: a fast spliced aligner with low memory requirements. Nature Methods. 12 (4), 357-360 (2015).
  8. Reinert, K., Langmead, B., Weese, D., Evers, D. J. Alignment of Next-Generation Sequencing Reads. Annual Review of Genomics and Human Genetics. 16, 133-151 (2015).
  9. Pertea, M., Kim, D., Pertea, G. M., Leek, J. T., Salzberg, S. L. Transcript-level expression analysis of RNA-seq experiments with HISAT, StringTie and Ballgown. Nature Protocols. 11 (9), 1650-1667 (2016).
  10. Conesa, A., et al. A survey of best practices for RNA-seq data analysis. Genome Biology. 17, 13 (2016).

Tags

علم الوراثة، العدد 136، التفاعل البروتين، تسلسل الجيل المقبل، وتحليل تسلسل الحمض النووي، الخميرة 2-الهجين
تحليل بيانات تسلسل من دفعة الخميرة 2-الهجين شاشات المعلوماتي
Play Video
PDF DOI DOWNLOAD MATERIALS LIST

Cite this Article

Krishnamani, V., Peterson, T. A.,More

Krishnamani, V., Peterson, T. A., Piper, R. C., Stamnes, M. A. Informatic Analysis of Sequence Data from Batch Yeast 2-Hybrid Screens. J. Vis. Exp. (136), e57802, doi:10.3791/57802 (2018).

Less
Copy Citation Download Citation Reprints and Permissions
View Video

Get cutting-edge science videos from JoVE sent straight to your inbox every month.

Waiting X
Simple Hit Counter