Waiting
Login processing...

Trial ends in Request Full Access Tell Your Colleague About Jove
Click here for the English version

Genetics

طريقة سريعة والكمية لتعديل بوستترانسلاشونال والخيار تمكين تعيين الببتيدات للجينوم

Published: May 22, 2018 doi: 10.3791/57633

Summary

هنا نقدم أداة بروتيوجينوميك بوجو والبروتوكولات المتعلقة بتعديل سريع، الكمية، بوستترانسلاشونال، والخيار تمكين رسم خرائط الببتيدات يتم تحديدها من خلال الطيف الكتلي على مورثات مرجع. هذه الأداة استخدامها لدمج وتصور بروتيوجينوميك ودراسات البروتين شخصية التواصل مع بيانات الجينوم متعامد.

Abstract

عبر الحديث بين الجينات، والنصوص، والبروتينات هي المفتاح للاستجابات الخلوية؛ ومن ثم، ببطء ويجري تمديد تحليل المستويات الجزيئية ككيانات متميزة للدراسات المتكاملة تعزيز فهم ديناميات الجزيئية داخل الخلايا. الأدوات الحالية للتصور وإدماج البروتيوميات مع datasets اوميكس الأخرى غير كافية لدراسات واسعة النطاق. وعلاوة على ذلك، أنهم فقط التقاط تسلسل الأساسية، تحديد تجاهل التعديلات بوستترانسلاشونال وكوانتيتيشن. ولمعالجة هذه المسائل، قمنا بتطوير بوجو خريطة الببتيدات مع التعديلات بوستترانسلاشونال المرتبطة بها، والتقدير الكمي مرجع التعليق التوضيحي الجينوم. وبالإضافة إلى ذلك، قد وضعت الأداة لتمكين تعيين الببتيدات المحددة من قواعد بيانات تسلسل مخصصة تتضمن متغيرات واحد من الأحماض الأمينية. بينما بوجو أداة سطر الأوامر، واجهة رسومية بوجوجي تمكن الباحثين غير المعلوماتية الحيوية لسهولة تعيين الببتيدات إلى 25 الأنواع التي يدعمها انسيمبل الجينوم التعليق التوضيحي. الإخراج الذي تم إنشاؤه تقترض تنسيقات الملفات من ميدان علم الجينوم، وذلك التصور معتمد في معظم المتصفحات الجينوم. لدراسات واسعة النطاق، تدعمه بوجو تراكخوبجينيراتور لإنشاء مستودعات ويب قابلة للوصول للبيانات المعينة للجينوم أن تمكن أيضا مشاركة البيانات بروتيوجينوميكس بسهولة. يمكنك تعيين هذه الأداة مع القليل من الجهد، ملايين الببتيدات إلى مرجع الجينوم في غضون دقائق قليلة فقط، تفوق غيرها من الأدوات المتاحة تسلسل-الهوية على أساس. هذا البروتوكول يوضح النهج الأفضل لرسم الخرائط بروتيوجينوميكس عن طريق بوجو مع مجموعات البيانات المتاحة للجمهور للكمية وفوسفوبروتيوميكس، فضلا عن دراسات واسعة النطاق.

Introduction

في الخلايا والجينوم والترنسكربيتوم والبروتين تؤثر في بعضها البعض تعدل من استجابة للمحفزات الداخلية والخارجية وتتفاعل مع بعضها البعض القيام بمهام محددة تؤدي إلى الصحة والمرض. ولذلك، تميز والتحديد الكمي للجينات، والنصوص، والبروتينات أمر حاسم لفهم العمليات الخلوية تماما. الجيل التالي التسلسل (خ ع) إحدى الاستراتيجيات الأكثر شيوعاً التطبيقي لتحديد وتقدير حجم التعبير الجيني ونسخة. ومع ذلك، عادة تعبير البروتين يقيمها الكتلي (مللي ثانية). وقد مكن أوجه التقدم الكبير في تكنولوجيا مايكروسوفت على مدى العقد الماضي أكثر تعريفاً كاملا والتحديد الكمي بروتيوميس، مما يجعل البيانات قابلة للمقارنة مع ترانسكريبتوميكس1. أصبحت بروتيوجينوميكس ومتعددة-اوميكس كطرق لدمج بيانات خ ع ومرض التصلب العصبي المتعدد نهج قوية لتقييم العمليات الخلوية عبر العديد من المستويات الجزيئية، تحديد أنواع فرعية سرطان والمؤدية إلى رواية أهداف المخدرات المحتملة بالسرطان2 , 3-من المهم أن نلاحظ أن بروتيوجينوميكس كان يستخدم في البداية تقديم أدلة البروتين للجينات ونص الشروح4. جينات عدة كان يعتقد في السابق أن يكون غير الترميز قد خضعت مؤخرا لإعادة تقييم النظر في الأنسجة البشرية على نطاق واسع datasets5،،من67. وبالإضافة إلى ذلك، تستخدم بيانات البروتين بنجاح لدعم جهود التعليق التوضيحي في الكائنات الحية غير النموذجي8،9. ومع ذلك، تكامل البيانات بروتيوجينوميك يمكن استغلالها إلحاقا بتسليط الضوء على بروتين التعبير فيما يتعلق بالميزات الجينوم وتوضيح عبر الحديث بين النصوص والبروتينات بتوفير نظام مرجعي مجتمعة وأساليب التصور المشترك.

من أجل توفير مرجعاً مشتركاً للبروتينات، ترانسكريبتوميكس، وبيانات الجينوم، نفذت العديد من الأدوات الببتيدات رسم الخرائط التي يتم تحديدها من خلال مرض التصلب العصبي المتعدد على الجينوم إحداثيات10،،من1112 ،13،،من1415،،من1617. وتختلف النهج في جوانب مثل رسم الخرائط المرجعية، ودعم المتصفحات الجينوم، ودرجة التكامل مع أدوات البروتيوميات الأخرى كما هو مبين في الشكل 1. بينما بعض أدوات خريطة عكس الببتيدات المترجمة على جينوم16، استخدام الآخرين موقفا المشروح محرك بحث داخل تعليق توضيحي البروتينات والجينات لإعادة بناء تسلسل النوكليوتيدات من الببتيد15. لا يزال آخرون استخدام ترجمة إطار 3 أو 6 للجينوم لخريطة الببتيدات ضد11،13. وأخيراً، تخطي تسلسل النوكليوتيدات العديد من الأدوات واستخدام الأحماض الأمينية تسلسل الترجمات من النصوص الجيش الملكي النيبالي-تسلسل معين كوسيط لتعيين الببتيدات إلى الجينوم المقترنة إحداثيات10،12، ،من 1417. ومع ذلك، ترجمة تسلسل النوكليوتيدات عملية بطيئة وقواعد البيانات المخصصة عرضه للأخطاء التي تروج لرسم خرائط الببتيد. لتعيين سرعة والفائق، إشارة صغيرة وشاملة أمر حاسم. ولذلك، مرجع بروتين موحدة مع إحداثيات الجينوم المرتبطة بها ضروري الببتيد دقيقة لرسم خرائط الجينوم. جوانب جديدة في بروتيوجينوميكس، مثل إدماج المتغيرات والتعديلات بوستترانسلاشونال (بتمس)2،3، تكتسب زخما من خلال الدراسات التي أجريت مؤخرا. ومع ذلك، هذه عموما لا تدعمها الحالية بروتيوجينوميك أدوات رسم الخرائط كما هو مبين في الشكل 1. لتحسين سرعة ونوعية لرسم الخرائط، بوجو تم وضع أداة تتيح التعيين السريع والكمية من الببتيدات إلى الجينوم18. وبالإضافة إلى ذلك، تمكن بوجو تعيين الببتيدات مع ما يصل إلى اثنين تسلسل المتغيرات والتعديلات بوستترانسلاشونال المشروح.

وقد وضعت للتعامل مع الزيادة السريعة في مجموعات البيانات عالية الدقة الكمية التقاط بروتيوميس والتعديلات العالمية بوجو ويوفر أداة مركزية لتحليلات واسعة النطاق مثل اختلاف الشخصية والطب الدقة. توضح هذه المقالة تطبيق هذه الأداة على تصور وجود تعديل بوستترانسلاشونال فيما يتعلق بالخصائص الجينية. وعلاوة على ذلك، يبرز هذا المقال تحديد أحداث الربط البديل عن طريق الببتيدات المعينة ورسم الخرائط من الببتيدات يتم تحديدها من خلال قواعد البيانات متغير المخصصة لجينوم إشارة. هذا البروتوكول يستخدم مجموعات البيانات المتاحة للجمهور تحميل من أرشيف فخر19 لإثبات هذه وظائف بوجو. وبالإضافة إلى ذلك، يصف هذا البروتوكول تطبيق تراكخوبجينيراتور لإنشاء محاور موجوداً على الإنترنت من الببتيدات المعينة للجينوم للدراسات بروتيوجينوميكس على نطاق واسع.

Protocol

1-إعداد وتحميل الإعداد

ملاحظة: تظهر الأمثلة مسار الملف والمجلد بتنسيق Windows لسهولة الوصول للمستخدمين القياسيين. وتتوفر أيضا بوجو وبوجوجي ماك وأنظمة التشغيل لينوكس.

  1. تحميل بوجو وبوجوجوي من GitHub
    1. فتح مستعرض ويب وانتقل إلى بوجو في GitHub (http://github.com/cschlaffner/PoGo/). حدد النشرات وتحميل ملف مضغوط مضغوط الإصدار الأخير. استخراج الملف المضغوط إلى مجلد الملفات القابلة للتنفيذ (مثل، C:\PoGo\executables\).
    2. التنقل في مستعرض ويب إلى بوجوجوي في GitHub (http://github.com/cschlaffner/PoGoGUI/). حدد النشرات وتنزيل أحدث ملف جرة الإصدار (على سبيل المثال، "بوجوجي-v1.0.2.jar"). تخزين الملف جرة في مجلد الملفات القابلة للتنفيذ.
  2. تحميل الشرح الجينوم وتسلسل البروتين الترميز المترجمة
    ملاحظة: تحميل الشرح الجينوم وتسلسلات ترميز البروتين المترجمة للأنواع المدعومة من جينكودي7 (www.gencodegenes.org) أو انسيمبل20 (www.ensembl.org) في تنسيق نقل عامة (الفروق) وتسلسل البروتين في تنسيق FASTA.
    1. في مستعرض ويب، انتقل إلى www.gencodegenes.org وحدد البيانات | الإنسان | الإصدار الحالي. تحميل الشرح الجينات شاملة عبر وصلة الفروق واستخراج ملف gz-المضغوطة إلى مجلد البيانات (مثلاً، C:\PoGo\Data\) باستخدام برنامج حيويى (مثلاً، 7-الرمز البريدي).
    2. تحميل ترميز بروتين تسلسل ترجمة نسخة عن طريق الرابط فاستا واستخراج ملف gz-المضغوطة إلى مجلد البيانات التي تم إنشاؤها في الخطوة السابقة.
      1. وبدلاً من ذلك، انتقل في مستعرض ويب إلى www.ensembl.org وحدد التنزيلات متبوعاً تحميل البيانات عبر بروتوكول نقل الملفات. البحث عن أنواع مدعومة (مثلاً، الإنسان). تحميل أحدث ملف للإفراج عن الشرح نسخة باستخدام الارتباط الفروق في العمود مجموعة الجينات . اختر الملف باسم هيكل "species.release.gtf.gz" واستخراج ملف gz-المضغوطة إلى مجلد البيانات.
    3. تحميل أحدث إصدار تسلسل الترجمة نسخة ترميز البروتين في فاستا باستخدام الارتباط في العمود تسلسل البروتين (فاستا) . اختر الملف مع هيكل اسم "species.release.pep.all.fa.gz" واستخراج ملف gz-المضغوطة إلى مجلد البيانات.
  3. إعداد الببتيد ملفات تحديد الهوية
    ملاحظة: بوجو فقط يدعم تنسيق 4-العمود الذي يحتوي على المعرف عينة، تسلسل الببتيد، عدد الببتيد-الطيف-مباريات (النظام)، وقيمة الكمية. ومع ذلك، بوجوجي يدعم ملف تعريف موحد تنسيقات مزيدينتمل ومزيد مزتاب، وتحويل لهم في شكل 4 أعمدة بوجو باستخدام api مرض التصلب العصبي المتعدد--البيانات الأساسية متاحة للجمهور في إطار21. يمكن تحميل الملفات في تنسيق مزتاب أو مزيدينتمل، ومزيد من أرشيف فخر19. وبدلاً من ذلك، يمكن توفير بيانات في تنسيق ملف مفصولة بعلامات جدولة بتمديد.tsv أو.pogo. الشكل الذي يحتوي على 4 أعمدة مع رؤوس الأعمدة التالية: عينة المعرف (نماذج)، الببتيد تسلسل (ببتيد)، عدد من الببتيد-الطيف-مباريات (النظام)، والببتيد كوانتيتيشن (كوانت). على سبيل مثال يظهر في الشكل 2.
    1. تحميل مثال لملف بتنسيق مزتاب من دراسة البروتينات في الخصية البشرية من الفخر أرشيف19 (22من https://www.ebi.ac.uk/pride/archive/projects/PXD006465/files).
    2. حفظ واستخراج ملف gz-المضغوطة إلى مجلد البيانات التي تم إنشاؤها في الخطوة 1.2.1.
      ملاحظة: بدلاً من ذلك، تحميل بيانات المثال للبشرية فوسفوبروتيوميكس بحثت مع ماكسكوانت من الأرشيف فخر (ملف "Traktman_2013_MaxQuantOutput-full.zip" من https://www.ebi.ac.uk/pride/archive/projects/PXD005246/files23).
    3. حفظ واستخراج ملف مضغوط zip في مجلد البيانات الذي تم إنشاؤه في الخطوة 1.2.1.
    4. فتح جدول بيانات فارغ، واستيراد الملف peptides.txt من مجلد c:/بوجو/البيانات/Traktman_2013_MaxQuantOutput-كامل/جنبا إلى جنب/txt/باستخدام الخيار البيانات | من CSV النص/. في الإطار "فتح"، انقر فوق تحرير.
    5. قم بإزالة كافة الأعمدة باستثناء "التسلسل"، "تجربة BR1"، "تجربة BR2"، "تجربة BR3"، "نسبة H/L تطبيع BR1"، "نسبة H/L تطبيع BR2"، و "نسبة H/L تطبيع BR3".
    6. حدد الأعمدة "نسبة H/L تطبيع BR1"، "نسبة H/L تطبيع BR2"، "نسبة H/L تطبيع و BR3"، وانقر فوق تحويل | أونبيفوت الأعمدة. حدد الأعمدة "تجربة BR1" و "تجربة BR2" "BR3 التجربة" وكرر عملية unpivot.
    7. قم بتحديد العمود الناتج "السمة" وتقسيم محتويات باستخدام تحويل | تقسيم العمود | طريق محدد. حدد مساحة كمحدد في القائمة المنسدلة. كرر العملية للعمود "Attribute.1".
    8. قم بإزالة الأعمدة الناتجة عن "Attribute.1.1"، "Attribute.2"، "Attribute.3"، و "Attribute.1.1.1".
    9. إضافة عمود باستخدام إضافة العمود | العمود المخصص الخيار. التكيف مع صيغة العمود المخصص لتمثيل ما يلي: "= [Attribute.4]=[Attribute.1.2]".
    10. تطبيق عامل تصفية على العمود المخصص الذي تم إنشاؤه لتصفية كافة الأسطر التي تحتوي على "خطأ"؛ وستظل فقط الأسطر التي تحتوي على "TRUE".
    11. إزالة أعمدة "Attribute.1.2" و "مخصص"، وقم بتغيير ترتيب الأعمدة المتبقية إلى ما يلي: "Attribute.4"، "التسلسل"، "Value.1"، و "قيمة".
    12. تغيير أسماء الأعمدة إلى "التجربة" "ببتيد"، "النظام" و "كوانت"، على التوالي. تحميل الملف باستخدام الصفحة الرئيسية | إغلاق & تحميل.
    13. حفظ الملف كملف المفصول باستخدام الملف | حفظ باسم ، وحدد نوع "نص (محدد بعلامة جدولة) (*.txt)". قم بتغيير الاسم إلى "peptides_pogo.txt" وحفظه في المجلد c:/بوجو/البيانات.

2-رسم الخرائط الببتيدات مع التعديلات بوستترانسلاشونال المشروح والتصور بما في ذلك كوانتيتاتيون

ملاحظة: يمكن تحميل ملف الإخراج الناتج في أي مستعرض الجينوم دعم تنسيق البيانات القابلة للتوسيع المستعرض (سرير). مجموعة مختارة من برامج التصفح هو مستعرض الجينوم التكاملية (IGV)24 (الذي يستخدم في ما يلي) و "متصفح الجينوم التسخن"25"متصفح الجينوم انسيمبل"20. من المهم ملاحظة أن الشرح الفروق والبروتين FASTA الإصدارات المستخدمة لرسم الخرائط بوجو تطابق إصدار الجينوم في مستعرض الجينوم. استخدام النشرات انسيمبل البشرية 57-75 والإصدارات جينكودي 3d-19، GRCh37/hg19؛ لإصدارات انسيمبل 76 أو أعلى و GENCODE 20 أو أعلى، استخدام GRCh38/hg38. لإصدارات انسيمبل الماوس 74 أو أعلى و M2 جينكودي أو أعلى، استخدم GRCm38.

  1. خريطة الببتيدات باستخدام بوجوجي (انظر الشكل 3).
    1. انتقل إلى مجلد الملفات القابلة للتنفيذ. بدء تشغيل البرنامج بواسطة النقر المزدوج على أيقونة بوجوجي-vX.X.X.jar.
      ملاحظة: سيتم بدء واجهة المستخدم الرسومية والسماح بتحديد خيارات سهلة والبصرية.
    2. استخدم الزر حدد بجوار "بوجو للتنفيذ". ثم، انتقل في مجلد الملفات القابلة للتنفيذ إلى المجلد الفرعي أنظمة التشغيل ذات الصلة (مثلاً، C:\PoGo\Executables\Windows\). قم بتحديد الملف القابل للتنفيذ بوجو (مثلاً، PoGo.exe) وتأكيد التحديد عن طريق النقر فوق الزر فتح .
    3. حدد مرجع ملف الإدخال لتسلسل البروتين بواسطة النقر فوق تحديد. انتقل إلى مجلد البيانات، وحدد ملف الترجمة فاستا. وتؤكد التحديد عن طريق النقر فوق الزر فتح .
    4. حدد ملف التعليق التوضيحي نص باستخدام زر تحديد . انتقل إلى مجلد البيانات، وحدد ملف التعليق التوضيحي الفروق. تأكيد التحديد بواسطة النقر فوق الزر فتح .
    5. إضافة ملف تعريف الببتيد — يتم تمكين تحديد ملف متعددة — باستخدام الزر " إضافة " بجوار "ملفات الببتيد". حدد ملف في تنسيق معتمد مزتاب أو مزيدينتمل، أو مزيد، أو في شكل 4 أعمدة مفصولة بعلامات جدولة التحميل وإعدادها في الخطوة 1، 3.
    6. اونتيك مربعات الاختيار بجوار سرير والفروق في اختيار تنسيقات الإخراج. فقط اترك PTM سرير وبنا التحقق.
    7. تحديد الأنواع المناسبة للبيانات من القائمة المنسدلة التحديد. فمن الضروري أن الملف فاستا والملف الفروق، واختيار القائمة المنسدلة لنفس النوع.
    8. بدء رسم الخرائط عن طريق النقر فوق الزر ابدأ .
      ملاحظة: إذا لزم الأمر، بوجوجي سوف يتم تحويل ملف الإدخال إلى تنسيق بوجو توفير الملفات بوجو في نفس المجلد للمستقبل من الراحة وبدء عملية رسم الخرائط. تحويل ملف واحد مزتاب تحميلها في الخطوة 1.3.1 تستمر بين 10-20 دقيقة قبل أن يبدأ رسم الخرائط.
  2. تصور في عارض الجينوم التكاملية
    ملاحظة: انظر الشكل 4.
    1. تحميل ملف الإخراج بوجو المنتهية في "_ptm.bed" في إيجف من خلال الملف | التحميل من ملف وحدد الملف.
      ملاحظة: نظراً لحجمها، قد تتطلب بعض ملفات توليد فهرس للسماح إعادة شحن سريعة لمناطق الجينوم. إيجف سيتم مطالبة المستخدم تلقائياً إلى الجيل. اتبع الإرشادات التي تظهر أوضح.
    2. كرر الخطوة تحميل الملف المنتهي في "_noptm.bed". يحتوي هذا الملف على جميع الببتيدات وجدت دون أي تعديل.
    3. علما بأن كل ملف تحميل سيظهر كمسارات منفصلة مع اسم ملف تحديد المسار. إعادة ترتيب المسارات بواسطة سحبها وإفلاتها إلى الموضع الذي تريده في القائمة.
    4. لاحظ أن كل مسار في البداية يظهر بطريقة المنهار. لتوسيعها، انقر على الحق في اسم المسار وحدد الموسع على مرأى ومسمع من الببتيدات بما في ذلك التسلسل أو مسحوق لطريقة عرض مكدس.
    5. كرر الخطوة تحميل الملف المنتهي في ".gct". يحتوي هذا الملف على كوانتيتيشن الببتيد كل عينة المشروح.
    6. وخلافا للملفات المحملة أعلاه، سيتم تحميل كل عينة المشروح كمسار مستقل. تنظيم العينات عن طريق سحب وإسقاط عمليات.
    7. التنقل داخل الجينوم عن طريق تحديد كروموسوم في القائمة المنسدلة، اكتب إحداثيات الجينوم، البحث رمز جينات، أو انقر فوق وعقد لتحديد قسم من الكروموسوم لتكبير.

3-رسم الخرائط الببتيدات يتم تحديدها من خلال قاعدة بيانات مخصصة البديل لجينوم مرجع

ملاحظة: يمكن أن يتم تعيين بوجو باستخدام واجهة المستخدم الرسومية (GUI) أو من خلال واجهة سطر الأوامر. وقابلة للتبديل. في هذا الجزء من البروتوكول، يتم استخدام واجهة سطر الأوامر لتسليط الضوء على تبادل الأدوار. الجزء الثاني من هذا الباب البروتوكول يتطلب البرنامج أداة ص26. الرجاء التأكد من أن يتم تثبيت الحزمة.

  1. خريطة الببتيدات مرجع للجينوم مرجع.
    1. افتح موجه الأوامر (cmd) ثم انتقل إلى المجلد الملفات القابلة للتنفيذ من بوجو (مثلاً، C:\PoGo\Executables\).
    2. اكتب الأمر التالي:
      PoGo.exe-الفروق \PATH\TO\GTF-فاستا \PATH\TO\FASTA--في \PATH\TO\IN--تنسيق سرير-الأنواع ميسبيسيس
      1. بديلاً \PATH\TO\GTF، و \PATH\TO\FASTA، و \PATH\TO\IN مع مسارات لشرح الفروق وتسلسل البروتين فاستا، وملف التعريف الببتيد (في تنسيق العمود 4 مع الملف المنتهي ".tsv" أو ".pogo") على التوالي. أيضا بديلاً ميسبيسيس مع الأنواع التي تتفق مع البيانات (مثل الإنسان).
    3. تأكيد التنفيذ عن طريق الضغط على مفتاح "الإدخال". الانتظار حتى الانتهاء من التنفيذ قبل التقدم على أي زيادة.
      ملاحظة: قد يستغرق هذا بضع دقائق. الملف الناتج سيتم تخزينها في نفس المجلد مثل ملف الإدخال الببتيد، ويعتبر \PATH\TO\OUT.pogo.bed في ما يلي.
  2. استخراج البديل الببتيدات فقط من ملف الإدخال.
    1. فتح R وتحميل الإدخال الملف \PATH\TO\IN باستخدام الأمر التالي:
      إينبوتداتا <--read.table("PATH/TO/IN",header=TRUE,sep="\t")
    2. تحميل الببتيدات تم تعيينه مسبقاً باستخدام الأمر:
      مابيدبيبتيديس <--read.table("PATH/TO/OUT.pogo.bed",sep="\t",header=FALSE)
    3. إزالة الببتيدات الذي تم تعيينه بالفعل من إينبوتداتا:
      بيبتيديسنوتمابيد <--إينبوتداتا [! ( إينبوتداتا $الببتيد % في مابيدبيبتيديس % $V4)،]
    4. طباعة الببتيدات غير المعينة في ملف إدخال جديد:
      write.table (بيبتيديسنوتمابيد، "PATH\TO\IN.notmapped.pogo"، رأس = FALSE، سبتمبر = "\t"، col.names=TRUE,row.names=FALSE,quote=FALSE)
  3. خريطة الببتيدات المتبقية للجينوم إشارة السماح بعدم التطابق.
    1. كما هو الحال في الخطوة 3، 1، قم بفتح موجه الأوامر وانتقل إلى المجلد الملفات القابلة للتنفيذ من بوجو.
    2. اكتب الأمر أدناه يسمح لعدم تطابق الحمض الأميني 1 وبديلة \PATH\TO\GTF، و \PATH\TO\FASTA، و \PATH\TO\IN.notmapped.pogo مع مسارات لشرح الفروق وتسلسل البروتين FASTA الببتيد تحديد ملف تم إنشاؤه في الخطوة 3، 2. أيضا بديلاً ميسبيسيس مع الأنواع التي تتفق مع البيانات (مثلاً، الإنسان).
      1. PoGo.exe-الفروق \PATH\TO\GTF-فاستا \PATH\TO\FASTA--في \PATH\TO\IN-تنسيق سرير-الأنواع ميسبيسيس-مم 1
    3. تأكيد تنفيذ الأمر بالضغط على مفتاح "الإدخال". الانتظار حتى الانتهاء من التنفيذ قبل التقدم على أي زيادة.
      ملاحظة: قد يستغرق هذا بضع دقائق. الملف الناتج سيتم تخزينها في نفس المجلد مثل ملف الإدخال الببتيد، ويعتبر \PATH\TO\OUT.pogo_1MM.bed في ما يلي.
  4. تصور الببتيدات المعينة دون ومع عدم تطابق في إيجف كما هو موضح في الخطوة 2، 2.

4-رسم الخرائط باستخدام ملفات متعددة وتوليد محاور المسار لمجموعات البيانات الكبيرة

  1. رسم الخرائط الببتيدات من ملفات متعددة باستخدام بوجوجي
    1. انتقل إلى مجلد الملفات القابلة للتنفيذ وبدء تشغيل واجهة المستخدم الرسومية البرنامج عن طريق تشغيل بوجوجي-vX.X.X.jar.
    2. حدد بوجو الملف القابل للتنفيذ لنظام التشغيل قيد الاستخدام (لينكس هنا)، فضلا عن الملف FASTA مرجع تسلسل البروتين الإدخال وشرح الفروق الملف كما هو موضح في الخطوات بروتوكول 2.1.2-2.1.4.
    3. إضافة ملفات تعريف الببتيد باستخدام الزر " إضافة " بجوار "ملفات الببتيد"؛ يتم تمكين تحديد ملفات متعددة، فضلا عن السحب والإفلات في حقل فارغ أسفل "ملفات الببتيد".
    4. اونتيك مربعات الاختيار بجوار سرير PTM، والفروق، وبنا في المقطع تنسيقات الإخراج وترك فقط فحص سرير.
    5. حدد خيار دمج عدة ملفات الإدخال في إخراج واحد.
      ملاحظة: سيؤدي هذا في ملف إخراج واحد يجمع بين جميع الببتيدات من ملفات الإدخال. ترك هذا الخيار غير محدد سيؤدي تنفيذ البرنامج لكل ملف الإدخال متسلسلة بشكل منفصل.
    6. تحديد الأنواع المناسبة للبيانات من القائمة المنسدلة اختيار يتفق مع الملفات FASTA والفروق.
    7. بدء رسم الخرائط عن طريق النقر فوق الزر ابدأ . البرنامج إذا لزم الأمر، سيتم تحويل ملفات الإدخال إلى تنسيق بوجو. وهذا قد يستغرق بعض الوقت لتنفيذه. وفي الوقت نفسه، تحميل الأدوات المطلوبة والبرامج النصية لتوليد محور المسار.
  2. إعداد لجيل وصل المسار
    1. فتح مستعرض ويب وانتقل إلى https://github.com/cschlaffner/TrackHubGenerator وقم بتحميل الملف "TrackHubGenerator.pl". حفظ الملف إلى مجلد الملفات القابلة للتنفيذ.
    2. في مستعرض ويب، انتقل إلى www.hgdownload.soe.ucsc.edu/admin/exe/وحدد المجلد لنظام التشغيل قيد الاستخدام (لينكس هنا). تحميل أداة بيدتوبيجبيد والبرنامج النصي فيتشتشرومسيزيس في مجلد الملفات القابلة للتنفيذ27.
  3. إنشاء محور مسار من الببتيدات المعينة
    ملاحظة: بعد انتهاء بوجوجي برسم خرائط الببتيدات، لوحة وصل مسار يمكن إنشاء تلقائياً لكافة الملفات الناتجة في شكل سرير المخزنة في نفس المجلد.
    1. فتح إطار المحطة طرفية واكتب الأمر التالي:
      TrackHubGenerator.pl بيرل المسار/إلى/اسم الجمعية فبيد التسخن البريد الإلكتروني
      1. استبدل المسار/إلى/اسم مع مسار ملف واسم للوحة الوصل المسار (مثلاً، ~/PoGo/Data/Mytrackhub)، الجمعية مع الجمعية الجينوم الذي التعليق التوضيحي أساس (مثلاً، hg38 لحقوق الإنسان)، فبيد مع المسار إلى المجلد الذي يحتوي على سرير الملفات التي سوف تقوم بلوحة وصل المسار (مثلاً، ~/PoGo/Data/)، التسخن مع المجلد حيث يتم تخزين الأدوات التي تم تحميلها من التسخن (مثلاً، ~/PoGo/Executables/)، والبريد الإلكتروني مع عنوان البريد إلكتروني للشخص المسؤول عن المسار لوحة الوصل.
    2. تأكيد التنفيذ عن طريق الضغط على مفتاح "الدخول"؛ يستغرق التنفيذ سوى وقت قصير لإنهاء.
    3. نقل لوحة الوصل المسار الذي تم إنشاؤه (أي، ~/PoGo/Data/Mytrackhub/المجلد المنشأ) مع كافة محتوياته إلى ملقم بروتوكول نقل الملفات ويب قابلة للوصول.
      ملاحظة: ملقم FTP مع ملقم ويب المرتبطة بها مما يتيح الوصول إلى مركز المسار عن طريق بروتوكولات ftp و http المفضل. مستودعات github (github.com) وفيجشاري (figshare.com) تدعم هذا النوع من الوصول ويمكن استخدامها بدلاً من ملقم FTP.
  4. تصور لوحة وصل مسار في مستعرض الجينوم التسخن
    1. في مستعرض ويب، انتقل إلى https://genome.ucsc.edu/وحدد MyData | تتبع المحاور. انقر فوق علامة التبويب محاور بي.
    2. نسخ عنوان url الخاص بلوحة وصل المسار في حقل النص.
      ملاحظة: يتكون URL عنوان الخادم، وموقع مركز المسار واسم الملف hub.txt (مثلاً، http://ngs.sanger.ac.uk/production/proteogenomics/WTSI_proteomics_PandeyKusterCutler_tissues_hi/hub.txt).
    3. تحميل لوحة الوصل المسار عن طريق النقر فوق إضافة لوحة الوصل.
      ملاحظة: سيتم تحميل لوحة الوصل، وسوف تظهر رسالة قصيرة تفيد بتفاصيل المحور المسار مثل الاسم ومعلومات جهة الاتصال للشخص المسؤول عن مركز المسار، واستخدمت الجمعية الجينوم. سوف يعود الموقع إلى الصفحة الرئيسية.
    4. حدد جينوميبرووسير لإدخال عرض المستعرض.
      ملاحظة: سيظهر محور المسار مخصص في الجزء العلوي من القائمة. إذا كانت ملفات سرير متعددة بنيت أساسا لمحور المسار، سوف تمثل كل من الملفات كمسار مستقل داخل لوحة الوصل.

Representative Results

تصوير رسومي تسليط الضوء على الذي يتم تطبيق مرحلة سير العمل العادية من البروتين بوجو18 ، فضلا عن الخيارات النهائية للتصور، ويظهر في الشكل 5. البروتيوميات بندقية (أي، هضم البروتينات تليها اللوني السائل مقترنة بالترادف الكتلي proteolytic) خطوة تمهيدي لرسم الخرائط بروتيوجينوميك. الأطياف جنبا إلى جنب الشامل الناتج عن ذلك عادة مقارنة بنظرية الأطياف مستمدة من قواعد تسلسل البروتين. الدراسات بروتيوجينوميكس إدخال تسلسل ترجمة النصوص الرواية مع ترميز المتغيرات المحتملة وغير مترادفين النوكليوتيدات واحدة (سنفس) في قاعدة البيانات، مما يجعل من الصعب على هذه العودة تتصل بسهولة بالجينوم مرجع8. يدعم تنسيقات الملفات للإبلاغ الموحد عن تعريفات الببتيد من تجارب الكتلي واجهة المستخدم الرسومية بوجو (بوجوجي) ويقوم بتحويلها إلى صيغة مبسطة 4 أعمدة بوجو. يلتف على أداة سطر الأوامر بوجو بوجوجوي وهكذا يتيح تعيين الببتيدات على إحداثيات الجينوم استخدام التعليق التوضيحي مرجع الجينات ترميز البروتين عموما المنصوص عليها في الفروق وتسلسل نسخة مترجمة في شكل FASTA. تنسيقات الإخراج مختلفة يتم إنشاؤها بواسطة بوجو لتمكين تصور جوانب مختلفة من الببتيدات يتم تحديدها من خلال الطيف الكتلي، بما في ذلك التعديلات بوستترانسلاشونال وتقدير مستوى الببتيد. يمكن كذلك تحويل ملفات الإخراج في السرير ودمجها في الدلائل موجوداً على الإنترنت تسمى محاور المسار. يمكن تصور ملفات الإخراج واحد، فضلا عن محاور المسار، ثم في المتصفحات مثل "مستعرض الجينوم التسخن"25، "مستعرض الجينوم انسيمبل"20، إيجف24وبيوداليانسي28 (انظر أسفل الشكل 5 ).

طبقنا بوجو لتحليل مشروع البروتين البشري الخرائط التي تمت تصفيتها في أهمية عالية كما هو موضح في رأيت et al. 7 وأنه بالمقارنة باثنين أدوات أخرى لرسم الخرائط بروتيوجينوميك، هما إيبيج14 وبجكس10. وتتألف dataset 233,055 الببتيدات فريدة من نوعها عبر الأنسجة الكبار والجنين 59 أسفر عن مجموعة تسلسل ما يزيد على 3 مليون. بوجو تفوقت هذه الأدوات على حد سواء في وقت التشغيل (6.9 x و x 96.4 أسرع، على التوالي)، واستخدام الذاكرة (20% و 60% أقل من الذاكرة، على التوالي) كما هو موضح في الشكل 618. ويرد مثال على الببتيد المعينة بنجاح في الشكل 7.

بينما بوجو فاقت إلى حد كبير الأدوات الأخرى في السرعة والذاكرة، فأيضا قادرة على التعديلات بوستترانسلاشونال رسم الخرائط والمعلومات الكمية المرتبطة الببتيدات على الجينوم. يصور الشكل 8 أ تخطيطياً تصور شكل سرير في مستعرض جينوم للصق الببتيدات رسم الخرائط إلى إكسون واحد وعبر الوصلات. بوجو يستخدم خيار التلوين لتوفير المساعدات البصرية سهلة فيما يتعلق بالطابع الفريد لرسم خرائط الببتيد داخل الجينوم. تعيينات باللون الأحمر تشير إلى الطابع الفريد لنسخة واحدة، بينما يبرز الأسود رسم الخرائط لجينة واحدة. ومع ذلك، الببتيد مشتركة بين النصوص المختلفة. تعيينات رمادية تظهر ببتيد المشتركة بين جينات متعددة. هذه، على سبيل المثال، أقل موثوقة للتحديد الكمي للجينات أو غير جديرة بالثقة لاستدعاء التعبير عن الجينات. خيار سرير PTM بوجو يعيد تعريف رمز اللون لاستيعاب أنواع مختلفة من التعديلات بوستترانسلاشونال كما هو موضح في الشكل 8B. بالإضافة إلى ذلك، يتم الإشارة إلى بتمس بكتل سميكة (انظر الشكل 8 (ب)). PTM واحدة من نوع هو أبرز كتلة سميكة الموضع من بقايا الأحماض الأمينية المعدلة، بينما هي موزعة بتمس متعددة من نفس النوع بكتلة سميكة من الأحماض الأمينية المعدلة الأولى إلى آخر.

طبقنا بوجو وتراكخوبجينيراتور فيما بعد إلى مجموعة من 50 خطوط خلايا سرطان القولون والمستقيم بما في ذلك كله من البروتين وفوسفوبروتيومي29. بينما وصل المسار تحميل في "مستعرض الجينوم التسخن" يظهر الببتيدات المعينة للجينوم ويسلط الضوء على الطابع الفريد للتعيينات ومواقع الفسفرة (انظر الشكل 9)، يتم توفير بيانات إضافية في مجلد إضافي. قم بتمكين ملفات بنا تصور كوانتيتيشن الببتيد وفوسفوبيبتيدي في سياق الجينوم. ومع ذلك، لا توفر ملفات بنا تصور سهلة من الببتيدات التي تمتد عبر الوصلة تقاطعات (انظر الشكل 10 أعلى). وتنقسم الببتيدات عبر تقاطعات الوصلة أجزائها كل الخرائط إلى exons. وفي حين أنه من الممكن تحديد الببتيدات الوصلة من خلال القيم الكمية نفسها من تعيينات إكسون، تحميل الخرائط على أساس تسلسل ملفات مثل السرير أو الفروق التي تربط exons واسطة إنترون رقيقة يمتد خط الدعم التفسير (انظر الشكل 10 أسفل).

لتسليط الضوء على فائدة الخيار تمكين رسم الخرائط، طبقنا بوجو في تكوينات اثنين إلى dataset من البروتين البشري الخصية تفتيش ضد نيكستبروت للبحث عن المفقودين البروتينات باستخدام استراتيجية متعددة إنزيم22. نيكستبروت تضم إلى جانب مرجع تسلسل البروتين ما يزيد على 5 مليون واحد من الأحماض الأمينية المتغيرات30. رسم الخرائط الببتيدات المحددة مع متغير واحد من الأحماض الأمينية لا تدعمه أدوات رسم خرائط أخرى. وحددت مجموعة الببتيدات فريدة من نوعها 177,012. الأولى بنجاح هذه، تم تعيين الببتيدات 99.8 ٪ (176,694) دون السماح بعدم التطابق. إزالة من قائمة الببتيد التي تم تحديدها وأسفرت الببتيدات 0.2% (318) التي كانت فيما بعد استبدال حمض أميني واحد السماح المعينة. وادي هذا إلى تعيينات 3,446 من الببتيدات 162 لم أن تعيينه للجينوم مرجع باستخدام أي أداة أخرى متاحة. أن ارتفاع متوسط عدد من التعيينات بما في ذلك عدم تطابق، فتم تعيين الببتيدات 62 فقط موضع واحد، تشير إلى تسلسل البديل الحقيقي. هو أبرز مثال على الببتيد تعيينها مع استبدال حمض أميني واحد مع التسلسل وتسلسل الجينوم المترجمة في الشكل 11.

Figure 1
رقم 1. المقارنة البصرية لأدوات مختلفة من رسم الخرائط الببتيد للجينوم. ويرد فيما يتعلق بمختلف جوانب المقارنة. وتشمل هذه الجوانب إشارة تعيين ومستوى الاندماج في أطر، والدعم من مستعرضات الإنترنت وغير متصل. بالإضافة إلى ذلك، هو إبراز جوانب رواية بروتيوجينوميكس ودعم الميزة بشكل منفصل. بوجو فقط وتفتقر إلى القدرة على تعيين مباشرة إلى تسلسل جينوم مقارنة بغيرها من الأدوات. ومع ذلك، وهو يدعم كافة ميزات الرواية التي لا تدعم معظم الأدوات الأخرى. الرجاء انقر هنا لمشاهدة نسخة أكبر من هذا الرقم-

Figure 2
رقم 2. مثال لملف الإدخال لتعيين الببتيدات. بوجو يقبل إدخال البيانات في تنسيق مع 4 أعمدة مفصولة بعلامات جدولة. رؤوس الأعمدة في السطر الأول من 'تجربة' 'الببتيد'، 'النظام' و 'كوانت'، مما يدل في الأسطر التالية التجربة أو المعرف عينة وتسلسل الببتيد، والعدد من المباريات الطيف الببتيد وقيمة كمية الببتيد، على التوالي. هي دعم ملحقات اسم الملف txt. * و *.tsv و *.pogo. الرجاء انقر هنا لمشاهدة نسخة أكبر من هذا الرقم-

Figure 3
الشكل 3. واجهة بوجوجي مع الخطوات المميزة لتحديدات ملف وخيارات المعلمة- ويوضح الشكل خطوات تحديد وتحميل الملفات المطلوبة كلها واختيار خيارات من أجل رسم الخرائط الببتيدات مع التعديلات بوستترانسلاشونال على الجينوم البشرية مرجع. الرجاء انقر هنا لمشاهدة نسخة أكبر من هذا الرقم-

Figure 4
الشكل 4. لقطة البيانات عارض الجينوم التكاملية (IGV) تحميل الإجراء. الرقم الذي يسلط الضوء على الخطوات اللازمة لتحميل ملفات الإخراج بوجو في المستعرض إيجف. وعلاوة على ذلك، فإنه يظهر خيار توسيع مسار الببتيدات المعينة لتسليط الضوء على رسم الخرائط والتسلسل. الرجاء انقر هنا لمشاهدة نسخة أكبر من هذا الرقم-

Figure 5
الرقم 5. تبسيط سير عمل خطوات من LC-MS/MS للتصور في المتصفحات الجينوم. تعيين بوجو يتبع تحديد الببتيدات من الأطياف الشامل جنبا إلى جنب. ولتحقيق التعيين للجينوم، يستخدم بوجو مرجع التعليق التوضيحي المقدمة كنص الترجمة متواليات (فاستا) وشرح الجينوم (الفروق). إخراج مختلفة يتم إنشاؤها بتنسيقات يمكن تحميله بشكل منفصل في المتصفحات الجينوم. بالإضافة إلى ذلك، يمكن دمج الملفات في تنسيق سرير في محاور المسار دعم التصور لمجموعات البيانات الكبيرة. الرجاء انقر هنا لمشاهدة نسخة أكبر من هذا الرقم-

Figure 6
الشكل 6. قياس بوجو ضد بجكس وإيبيج. بوجو يتفوق الأدوات الأخرى على قياس. رسم الخرائط 233,055 الببتيدات فريدة من نوعها عبر 59 الكبار والجنين الأنسجة الناتجة في تسلسل ما يزيد على 3 مليون، كان بوجو 6.9 x و x 96.4 أسرع من بجكس وإيبيج، على التوالي. وعلاوة على ذلك، يلزم بوجو 20% و 60% أقل من الذاكرة مقابل بجكس وإيبيج، على التوالي. بينما بوجو وبجكس انتهت بنجاح، أسفرت iPiG خطأ ذاكرة 16 غيغا بايت. الرجاء انقر هنا لمشاهدة نسخة أكبر من هذا الرقم-

Figure 7
رقم 7. عرض المثال مستعرض "الجينوم التسخن" من الببتيدات المعينة. ويوضح الشكل الببتيدات تعيينها إلى mTOR الجينات. بينما يظهر المسار مجتمعة الببتيدات التي تمتد عبر تقاطعات الوصلة ورسم الخرائط فقط إلى إكسون واحد مع تسلسل المرتبطة بها، على المسارات الخاصة بالانسجة فقط تسليط الضوء على التعيين في شكل مكثف. الرجاء انقر هنا لمشاهدة نسخة أكبر من هذا الرقم-

Figure 8
الرقم 8. التخطيطي لتعيين الترميز باللون والتصور- (أ) في ملف الإخراج القياسي السرير، تظهر الببتيدات رسم الخرائط إلى إكسون ككتل واحد (يسار)، بينما الببتيدات رسم الخرائط عبر تسليط الضوء على exons متعددة إكسون تغطي الأجزاء ككتل (يمين). وترد إينترونس رقيقة وصل خطوط. كولوركوديس بوجو الطابع الفريد لرسم الخرائط أو الببتيدات للجينات، والنصوص باستخدام نظام الطبقة 3. (ب) بالإضافة إلى هيكل كتلة التنسيق سرير، سرير PTM الإخراج يبرز موقف التعديلات بوستترانسلاشونال ككتل سميكة. وجود PTM واحدة من نوع يبرز بقايا الأحماض الأمينية المعدلة مع كتلة سميكة، بينما يتم دمج مواقع متعددة من PTM نفسه في كتل طويلة تمتد من الأول إلى آخر تعديل الموقع. ويتم لاحقاً تقسيم تعيينات الببتيد بترميز نوع ولون PTM استناداً إلى التعديل. الرجاء انقر هنا لمشاهدة نسخة أكبر من هذا الرقم-

Figure 9
الرقم 9. تعقب عرض المحور في مستعرض الجينوم التسخن سرطان القولون والمستقيم بيانات البروتين وفوسفوبروتيومي- ويتألف محور المسار بيانات البروتين الكامل، فضلا عن فوسفوبروتيومي. بينما اللون الأحمر في المسارات البروتين وفوسفوبروتيومي تشير إلى الطابع الفريد للتعيين لنسخة واحدة من SFN، إظهار مسارات تنتهي في _ptm المواقع الفسفرة داخل الببتيدات. هنا، يشير اللون الأحمر إلى نوع التعديل الفسفرة. وقد حددت الببتيدات اثنين فقط مع كل عرض من الفسفرة واحد (كتل سميكة). الرجاء انقر هنا لمشاهدة نسخة أكبر من هذا الرقم-

Figure 10
الرقم 10. عرض فوسفوبيبتيديس سرطان القولون والمستقيم والمرتبطة كوانتيتيشن في إيجف- ويبين الشكل مجموعة فرعية من خطوط خلايا السرطان 50. وعلاوة على ذلك يظهر أربعة أعمدة من كتل في ظلال مختلفة من الضوء الأحمر. اللون يشير إلى الوفرة النسبية من منخفضة (أبيض) إلى أعلى (أحمر). بينما الأعمدة الأربعة قد يؤدي في البداية إلى الاعتقاد بأن هناك 4 الببتيدات، يصبح من الواضح مع المرتبطة بها على أساس تسلسل الفروق ملف الإخراج هذه هي في الواقع الببتيدات اثنين، التي تغطي كل تقاطع وصلة. الرجاء انقر هنا لمشاهدة نسخة أكبر من هذا الرقم-

Figure 11
رقم 11. عرض ببتيد مع متغير من الأحماض الأمينية في إيجف- ويوضح الشكل ببتيد مع متغير واحد من الأحماض الأمينية المعينة للجينوم الإشارة في بداية الترجمة من الجينات GPSM1. البديل هو المتمركزة على بقايا الأحماض الأمينية 8 والنتائج في الاستعاضة عن ألانين إلى فالين (A→V). تسلسلات ترجمة النصوص المشروح (الأزرق) تسليط الضوء على البديل بالمقارنة مع تسلسل الببتيد. الرجاء انقر هنا لمشاهدة نسخة أكبر من هذا الرقم-

Discussion

هذا البروتوكول توضح هذه المقالة كيفية تمكين أداة البرنامج بوجو وواجهة المستخدم الرسومية بوجوجوي تعيين سريعة من الببتيدات على إحداثيات الجينوم. هذه الأداة يوفر ميزات فريدة مثل تعديل الكمية، بوستترانسلاشونال، وتم تمكين الخيار تعيين إلى الجينوم باستخدام مرجع التعليق التوضيحي. هذا المقال يوضح الأسلوب في دراسة بروتيوجينوميك على نطاق واسع، ويسلط الضوء على كفاءتها وسرعة الذاكرة مقارنة بغيرها من الأدوات المتاحة18. بالاقتران مع أداة تراكخوبجينيراتور، الذي يقوم بإنشاء محاور موجوداً على الإنترنت للجينوم والجينوم ربط البيانات، بوجو، مع واجهة المستخدم الرسومية، دراسات بروتيوجينوميكس على نطاق واسع يتيح لتصور البيانات الخاصة بهم في سياق الجينوم بسرعة. وعلاوة على ذلك، علينا أن نظهر السمات الفريدة بوجو مع مجموعات تفتيش ضد قواعد بيانات متغير والكمية فوسفوبروتيوميكس22،29.

واحد من الملفات، مثل ملف بنا، توفر قيمة التصور والروابط بين ميزات الببتيد والمكاني الجينوم. ومع ذلك، من المهم أن نلاحظ أن تفسير استناداً إلى هذه وحدها قد تكون صعبة أو مضللة بسبب فرض قيود عليها بجوانب واحد من بروتيوجينوميكس مثل التفرد والتعديلات بوستترانسلاشونال والقيم الكمية. ولذلك، من المهم أن تختار بعناية أي ملفات الإخراج وخيارات وتركيبات مناسبة لمسألة بروتيوجينوميك في متناول اليد وتعديل التركيبات. على سبيل المثال، قد تكون معلومات حول الطابع الفريد للتعيين لمحور الجينوم محددة ذات قيمة كبيرة للتعليق التوضيحي ل ميزة الجينوم7، بينما التقدير الكمي عبر عينات مختلفة قد تكون أكثر ملاءمة للدراسات المتعلقة ميزات الجينوم للتغيرات في وفرة البروتين29. يجب أن يتم إنشاء الإخراج قبل بوجو لكل إعداد. في حالة لا يتم إنشاء إخراج، أو تظهر الملفات فارغة في مجلد الإخراج، فمن المستحسن التحقق من ملفات الإدخال للمحتوى المطلوب وتنسيق الملف المطلوب. في الحالات حيث تنسيق الملف أو المحتوى لا تتبع توقعات بوجو (مثلاً، يفترض أن تحتوي على تسلسلات ترجمة نسخة الملف فاستا يحتوي على تسلسل النوكليوتيدات من النصوص)، رسائل الخطأ وسوف أطلب من المستخدم التحقق من ملفات الإدخال.

القيود المفروضة على البروتوكول والأداة تستند معظمها إعادة استخدام تنسيقات الملفات التي تستخدم عادة في علم الجينوم. ويرافق repurposing تنسيقات الملفات المستخدمة في علم الجينوم لتطبيقات بروتيوجينوميك قيود محددة. هذه نتيجة لمجموعات مختلفة من المتطلبات للتصور الجينوم توسيط للجينوم والبيانات بروتيوجينوميك، مثل الحاجة إلى تصور التعديلات بوستترانسلاشونال من بيانات البروتيوميات. وهذا مقيد في تنسيقات الملف الجينوم باستخدام ميزة واحدة. قد وضعت العديد من الأساليب والأدوات للبروتينات لثقة تعريب التعديلات بوستترانسلاشونال داخل الببتيد تسلسل31،32،،من3334. بيد يعيق التصور من العديد من التعديلات بطريقة فريدة من نوعها وملموس على الجينوم بنية تنسيقات الملفات الجينوم. ولذلك التصور كتلة واحدة من بتمس متعددة من نفس النوع لا تشكل أي غموض من مواقع تعديل بل هو نتيجة لاشتراط متباينة من المجتمع علم الجينوم تصور ملامح واحدة فقط في كل مرة. ومع ذلك، قد بوجو ميزة رسم الخرائط بوستترانسلاشونال تعديلات على إحداثيات الجينوم لتمكين الدراسات ركزت على تأثير الجينوم ميزات مثل المتغيرات النوكليوتيدات واحدة على التعديلات بوستترانسلاشونال. استخدام بوجو، تعيين متغير يزيد عدد إجمالي التعيينات. ومع ذلك، الترميز باللون الفريد من الببتيدات المعينة يبرز تعيينات موثوق بها من هم غير موثوق بها. تعيين متغير الببتيدات وحدد من الخيارين النوكليوتيدات واحدة معروفة يمكن أن يكون مصحوبا تصور الببتيدات المعين جنبا إلى جنب مع المتغيرات في تنسيق VCF. بهذه الطريقة رمز اللون تشير إلى مخطط غير موثوق بها من الببتيد البديل تنقضه وجود البديل النوكليوتيدات المعروفة.

خطوة حاسمة لاستخدام بوجو هو استخدام الملفات الصحيحة وتنسيقات. استخدام تسلسلات النسخة المترجمة كتسلسل البروتين لمرافقة التعليق التوضيحي في تنسيق الفروق هو المعيار الرئيسي. هو عنصر حاسم آخر عندما تفكر في استخدام بوجو لخريطة الببتيدات مع عدم التطابق من الأحماض الأمينية الذاكرة. بينما الذاكرة-ذات كفاءة عالية لتطبيق قياسي، زيادة كبيرة واضعافا مضاعفة عدد تعيينات ممكن مع واحد أو اثنين من عدم التطابق يؤدي إلى زيادة أسي وبالمثل في استخدام الذاكرة18. ونحن نقترح تعيين مراحل كما هو موضح في هذا البروتوكول أول مرة خريطة الببتيدات دون عدم التطابق وإزالتها من المجموعة. الببتيدات غير المعينة مسبقاً اللاحقة ثم يمكن تعيينها باستخدام عدم تطابق واحد ويمكن أن يتكرر هذا الإجراء مع عدم تطابق اثنين الببتيدات المتبقية غير المعينة.

إذ شهد زيادة كبيرة في الإنتاجية من الطيف الكتلي ودراسات التواصل الجينوم وبيانات البروتين البشري أصبحت أكثر تواترا في السنوات الأخيرة، أدوات لتمكين سهولة التواصل هذه الأنواع من البيانات في نفس نظام الإحداثيات لا غنى عنه. سوف تساعد الأداة المعروضة هنا بضرورة الجمع بين الجينوم وبيانات البروتين البشري لتعزيز فهم أفضل للدراسات التكاملية عبر مجموعات البيانات الكبيرة والصغيرة عن طريق تعيين الببتيدات على تعليق توضيحي مرجع. ومن الأمور المشجعة، طبق بوجو على خريطة الببتيدات إلى المرشحين الجينات في نفس الشكل التوضيحي مرجع لدعم جهود الشرح من الجينات الجديدة التي أعرب عنها في الخصية البشرية35. النهج المقدمة هنا مستقلة عن قواعد البيانات المستخدمة لتحديد الببتيد. البروتوكول قد تساعد في تحديد والتصور لترجمة رواية المنتجات باستخدام تكييف ملفات الإدخال من تسلسل الترجمة وملفات الفروق من تجارب تسلسل الحمض النووي الريبي المقترنة.

العديد من الأساليب والأدوات مع طائفة واسعة من سيناريوهات التطبيق الخاص لتعيين الببتيدات إلى إحداثيات الجينوم، بدءاً من تعيين الببتيدات مباشرة إلى تسلسل الجينوم للجيش الملكي النيبالي-تسلسل تسترشد رسم الخرائط، وقد أدخلت10، 11 , 12 , 13 , 14 , 15 , 16 , 17-ومع ذلك، هذه يمكن أن يؤدي إلى عدم تعيين بشكل صحيح الببتيدات عند التعديلات بوستترانسلاشونال موجودة، وقد يكون نشر الأخطاء في رسم الخرائط الأساسية لقراءة تسلسل الحمض النووي الريبي لمستوى الببتيد. وقد وضعت بوجو على وجه التحديد التغلب على تلك العقبات والتعامل مع الزيادة السريعة في مجموعات بيانات كمية البروتين عالية الدقة للتكامل مع منصات الجينوميات متعامد. الأداة الموضحة هنا يمكن إدماج مهام سير العمل الفائق. من خلال واجهة رسومية بوجوجي، الأداة سهلة الاستعمال ويتطلب أي تدريب متخصص المعلوماتية الحيوية.

Disclosures

الكتاب ليس لها علاقة بالكشف عن.

Acknowledgments

تم تمويل هذا العمل من قبل ويلكوم ترست (WT098051) ومنح المعاهد الوطنية للصحة (U41HG007234) للمشروع جينكودي.

Materials

Name Company Catalog Number Comments
PoGo (software) NA NA https://github.com/cschlaffner/PoGo
PoGoGUI (software) NA NA https://github.com/cschlaffner/PoGoGUI
TrackHubGenerator (software) NA NA https://github.com/cschlaffner/TrackHubGenerator
Integrative Genomics Viewer (software) NA NA http://software.broadinstitute.org/software/igv/
UCSC genome browser (website) NA NA https://genome.ucsc.edu/
GENCODE (website) NA NA http://gencodegenes.org
Ensembl (website) NA NA http://ensembl.org
bedToBigBed (software) NA NA http://hgdownload.soe.ucsc.edu/admin/exe/
fetchChromSizes.sh (software) NA NA http://hgdownload.soe.ucsc.edu/admin/exe/

DOWNLOAD MATERIALS LIST

References

  1. Aebersold, R., Mann, M. Mass-spectrometric exploration of proteome structure and function. Nature. 537 (7620), 347-355 (2016).
  2. Mertins, P., et al. Proteogenomics connects somatic mutations to signalling in breast cancer. Nature. 534 (7605), 55-62 (2016).
  3. Zhang, H., et al. Integrated proteogenomic characterization of human high-grade serous ovarian cancer. Cell. 166 (3), 755-765 (2016).
  4. Jaffe, J. D., Berg, H. C., Church, G. M. Proteogenomic mapping as a complementary method to perform genome annotation. Proteomics. 4 (1), 59-77 (2004).
  5. Wilhelm, M., et al. Mass-spectrometry-based draft of the human proteome. Nature. 509 (7502), 582-587 (2014).
  6. Kim, M. S., et al. A draft map of the human proteome. Nature. 509 (7502), 575-581 (2014).
  7. Wright, J. C., et al. Improving GENCODE reference gene annotation using a high-stringency proteogenomics workflow. Nature Communications. 7, 11778 (2016).
  8. Nesvizhskii, A. I. Proteogenomics: concepts, applications and computational strategies. Nature Methods. 11 (11), 1114-1125 (2014).
  9. Armengaud, J., et al. Non-model organisms, a species endangered by proteogenomics. Journal of Proteomics. 105, 5-18 (2014).
  10. Askenazi, M., Ruggles, K. V., Fenyo, D. PGx: putting peptides to BED. Journal of Proteome Research. 15 (3), 795-799 (2016).
  11. Choi, S., Kim, H., Paek, E. ACTG: novel peptide mapping onto gene models. Bioinformatics. 33 (8), 1218-1220 (2017).
  12. Ghali, F., et al. ProteoAnnotator-open source proteogenomics annotation software supporting PSI standards. Proteomics. 14 (23-24), 2731-2741 (2014).
  13. Has, C., Lashin, S. A., Kochetov, A. V., Allmer, J. PGMiner reloaded, fully automated proteogenomic annotation tool linking genomes to proteomes. Journal of Integrative Bioinformatics. 13 (4), 293 (2016).
  14. Kuhring, M., Renard, B. Y. iPiG: integrating peptide spectrum matches into genome browser visualizations. PLoS One. 7 (12), e50246 (2012).
  15. Pang, C. N., et al. Tools to covisualize and coanalyze proteomic data with genomes and transcriptomes: validation of genes and alternative mRNA splicing. Journal of Proteome Research. 13 (1), 84-98 (2014).
  16. Sanders, W. S., et al. The proteogenomic mapping tool. BMC Bioinformatics. 12 (115), (2011).
  17. Wang, X., et al. ProBAMsuite, a bioinformatics framework for genome-based representation and analysis of proteomics data. Molecular & Cellular Proteomics. 15 (3), 1164-1175 (2016).
  18. Schlaffner, C. N., Pirklbauer, G. J., Bender, A., Choudhary, J. S. Fast, quantitative and variant enabled mapping of peptides to genomes. Cell Systems. 5 (2), 152-156 (2017).
  19. Vizcaino, J. A., et al. The PRoteomics IDEntifications (PRIDE) database and associated tools: status in 2013. Nucleic Acids Research. 41, D1063-D1069 (2013).
  20. Aken, B. L., et al. Ensembl 2017. Nucleic Acids Research. 45 (D1), D635-D642 (2017).
  21. Perez-Riverol, Y., et al. Ms-data-core-api: an open-source, metadata-oriented library for computational proteomics. Bioinformatics. 31 (17), 2903-2905 (2015).
  22. Wang, Y., et al. Multi-protease strategy identifies three PE2 missing proteins in human testis tissue. Journal of Proteome Research. , (2017).
  23. Greseth, M. D., Carter, D. C., Terhune, S. S., Traktman, P. Proteomic screen for cellular targets of the vaccinia virus F10 protein kinase reveals that phosphorylation of mDia regulates stress fiber formation. Molecular & Cellular Proteomics. 16 (4 Suppl 1), S124-S143 (2017).
  24. Thorvaldsdottir, H., Robinson, J. T., Mesirov, J. P. Integrative genomics viewer (IGV): high-performance genomics data visualization and exploration. Briefings in Bioinformatics. 14 (2), 178-192 (2013).
  25. Kent, W. J., et al. The human genome browser at UCSC. Genome Research. 12 (6), 996-1006 (2002).
  26. The R Development Core Team. R: A Language and Environment for Statistical Computing. , R Foundation for Statistical Computing. Vienna, Austria. (2008).
  27. Kent, W. J., Zweig, A. S., Barber, G., Hinrichs, A. S., Karolchik, D. BigWig and BigBed: enabling browsing of large distributed datasets. Bioinformatics. 26 (17), 2204-2207 (2010).
  28. Down, T. A., Piipari, M., Hubbard, T. J. Dalliance: interactive genome viewing on the web. Bioinformatics. 27 (6), 889-890 (2011).
  29. Roumeliotis, T. I., et al. Genomic determinants of protein abundance variation in colorectal cancer cells. Cell Reports. 20 (9), 2201-2214 (2017).
  30. Gaudet, P., et al. The neXtProt knowledgebase on human proteins: 2017 update. Nucleic Acids Research. 45, D177-D182 (2017).
  31. Fermin, D., Walmsley, S. J., Gingras, A. C., Choi, H., Nesvizhskii, A. I. LuciPHOr: algorithm for phosphorylation site localization with false localization rate estimation using modified target-decoy approach. Molecular & Cellular Proteomics. 12 (11), 3409-3419 (2013).
  32. Fermin, D., Avtonomov, D., Choi, H., Nesvizhskii, A. I. LuciPHOr2: site localization of generic post-translational modifications from tandem mass spectrometry data. Bioinformatics. 31 (7), 1141-1143 (2015).
  33. Hansen, T. A., Sylvester, M., Jensen, O. N., Kjeldsen, F. Automated and high confidence protein phosphorylation site localization using complementary collision-activated dissociation and electron transfer dissociation tandem mass spectrometry. Analytical Chemistry. 84 (22), 9694-9699 (2012).
  34. Taus, T., et al. Universal and confident phosphorylation site localization using phosphoRS. Journal of Proteome Research. 10 (12), 5354-5362 (2011).
  35. Weisser, H., Wright, J. C., Mudge, J. M., Gutenbrunner, P., Choudhary, J. S. Flexible data analysis pipeline for high-confidence proteogenomics. Journal of Proteome Research. 15 (12), 4686-4695 (2016).

Tags

علم الوراثة، 135 قضية، البروتيوميات، وعلم الجينوم، برمجيات المصدر المفتوح، والشرح، بروتيوجينوميكس، رسم الخرائط، والتصور، والجينوم المستعرض، على نطاق واسع، المسار-محاور
طريقة سريعة والكمية لتعديل بوستترانسلاشونال والخيار تمكين تعيين الببتيدات للجينوم
Play Video
PDF DOI DOWNLOAD MATERIALS LIST

Cite this Article

Schlaffner, C. N., Pirklbauer, G.More

Schlaffner, C. N., Pirklbauer, G. J., Bender, A., Steen, J. A. J., Choudhary, J. S. A Fast and Quantitative Method for Post-translational Modification and Variant Enabled Mapping of Peptides to Genomes. J. Vis. Exp. (135), e57633, doi:10.3791/57633 (2018).

Less
Copy Citation Download Citation Reprints and Permissions
View Video

Get cutting-edge science videos from JoVE sent straight to your inbox every month.

Waiting X
Simple Hit Counter