IR-تكس: أداه تكامل البيانات المفتوحة المصدر لنسخ البيانات الكبيرة المصممة لمكافحه ناقلات الملاريا

Biology
 

Summary

ويستكشف IR-تكس المبيدات الحشرية المرتبطة بمقاومه الحشرات في الأنواع الأخرى من الشلل. المقدمة هنا هي تعليمات كامله لاستخدام التطبيق ، والتعديلات لاستكشاف مجموعات البيانات الناسخة متعددة ، واستخدام اطار لبناء قاعده بيانات تفاعليه لمجموعات من المعطيات الناسخة من اي كائن حي ، ولدت في اي منصة.

Cite this Article

Copy Citation | Download Citations | Reprints and Permissions

Ingham, V. A., Bennett, A., Peng, D., Wagstaff, S. C., Ranson, H. IR-TEx: An Open Source Data Integration Tool for Big Data Transcriptomics Designed for the Malaria Vector Anopheles gambiae. J. Vis. Exp. (155), e60721, doi:10.3791/60721 (2020).

Please note that all translations are automatically generated.

Click here for the english version. For other languages click here.

Abstract

IR-تكس هو تطبيق مكتوب في لامعه (حزمه R) التي تسمح باستكشاف التعبير عن (فضلا عن تعيين وظائف ل) النصوص التي ترتبط التعبير مع الأنماط الظاهرية مقاومه المبيدات الحشرية في البعوض غامماي انوبهيلاس . ويمكن استخدام التطبيق علي الإنترنت أو تحميلها واستخدامها محليا من قبل اي شخص. يمكن تعديل التطبيق المحلي لأضافه مجموعات بيانات مقاومه المبيدات الحشرية الجديدة المتولدة من منصات متعددة الوظائف. يوضح هذا الدليل كيفيه أضافه قواعد بيانات جديده ومعالجه البيانات المفقودة. وعلاوة علي ذلك ، يمكن ان يكون IR-تكس بالبالكامل وبسهوله الارتداد إلى استخدام مجموعات البيانات omics من اي معطيات تجريبية ، مما يجعلها موردا قيما لكثير من الباحثين. ويوضح البروتوكول فائده الاشعه تحت الحمراء في تحديد مرشحي المقاومة الجديدة للمبيدات الحشرية باستخدام الناقل الجلوتاثيون الميكروسومي, GSTMS1, كمثال. هذا النص هو اوبريجولاتيد في العديد من السكان المقاومين البيروثروميد من كوت ديفوار وبوركينا فاسو. ويوفر تحديد النصوص المترابطة مزيدا من التبصر بالأدوار المفترضة لهذا الجين.

Introduction

وقد أسفرت القدرة علي قياس التعبير عن اعداد كبيره من النصوص في وقت واحد من خلال منصات ميكروصفيف وتكنولوجيا RNAseq في توليد مجموعات بيانات واسعه ربط التعبير النص مع النمط الظاهري معينه في كل من الكائنات النموذجية وغير النموذجية. وتعد مجموعات البيانات هذه موردا غنيا للغاية بالنسبة للباحثين ، ويمكن زيادة قوتها من خلال الجمع بين المجموعات ذات الصلة في نهج دمج كبير للبيانات. ومع ذلك ، تقتصر هذه المنهجية علي تلك التي لديها مهارات خاصه في المعلوماتية الحيوية. وصفت هنا هو برنامج, IR-تكس (نشرت سابقا من قبل جهام وآخرون.1) التي تتم كتابتها في حزمه R تسمي لامعه2 ويسمح للمستخدمين مع القليل من التدريب المعلوماتية الحيوية لدمج واستجواب هذه البيانات مع سهوله نسبيه.

تمت كتابه IR-تكس ، الذي تم العثور عليه في http://www.lstmed.ac.uk/projects/IR-TEx، لاستكشاف النصوص المرتبطة بمقاومه المبيدات الحشرية في " انوهيلليس جامباي" ، وهو ناقل الملاريا الافريقي الرئيسي1. الملاريا مرض طفيلي ناجم عن أنواع البلازما التي تنتقل بين البشر من خلال لدغات البعوض الأنثوي Anopheles . وقد ثبت ان استهداف ناقلات البعوض بالمبيدات الحشرية هو أنجع الوسائل للوقاية من الاعتلال والوفاات المتصلة بالملاريا في افريقيا. وكان التوسع في الاداات (اي الشباك المبيدة الطويلة الأمد) محوريا أيضا في التخفيضات الكبيرة في حالات الملاريا منذ 2000 الفترة من3 إلى 4. مع وجود عدد محدود جدا من المبيدات الحشرية المتاحة ، هناك ضغط تطوري قوي علي البعوض ، والمقاومة الآن علي نطاق واسع في ناقلات الملاريا الافريقيه4.

بالاضافه إلى ذلك, الطفرات موقع الهدف5 والتخليص الأيضي من المبيدات الحشرية6,7 لا تزال الاساسيه درس أليات المقاومة, ولكن غيرها من أليات مقاومه قويه الآن الناشئة1. ولم تكن العديد من هذه أليات الجديدة مرتبطة في السابق بمقاومه المبيدات الحشرية ولكنها اكتشفت من خلال البحث عن أنماط مشتركه للتعبير الجيني عبر العديد من السكان المقاومين باستخدام تطبيق IR-TEx ومن ثم التحقق منها وظيفيا من خلال نهج الجينوم1.

وصف هنا هو نهج خطوه بخطوه لاستخدام IR-تكس ، سواء علي شبكه الإنترنت وعند تثبيت محليا. يصف البروتوكول كيف يمكن دمج مجموعات بيانات مقاومه المبيدات الحشرية الجديدة في الحزمة الحالية ويشرح كيفيه العمل مع البيانات المفقودة. وأخيرا ، فانه يصف كيفيه استخدام هذا البرنامج مع غيرها-omics مجموعات البيانات التي لا علاقة لها بمقاومه المبيدات الحشرية ، التالي الجمع بين البيانات من مختلف-omics النهج في حين تعمل أيضا مع القيم المفقودة والتطبيع بحيث تكون البيانات قابله للمقارنة.

Protocol

1. باستخدام تطبيق ويب IR-تكس

  1. تشغيل التطبيق في مستعرض ويب
    1. افتح تطبيق الويب IR-تكس باتباع الرابط في أسفل الصفحة التي تم العثور عليها في http://www.lstmed.ac.uk/projects/IR-TEx.
    2. بمجرد تهيئه صفحه الويب ، انقر فوق زر التطبيق في اعلي الصفحة ، والذي سيعرض التطبيق والمخرجات المقترنة به.
    3. أقرا كل إخراج متعلق بالإدخال الافتراضي ل AGAP008212 (CYP6M2) في مربع معرف النص مع الشروط التالية: مجموعات بيانات coluzzii التي هي ' 1 ' معرضه للمبيدات الحشرية البيروثروميد أو ' 2 ' غير المعرضة لأي صنف من مبيدات الحشرات والنصوص المرتبطة بها | r | > 0.98
  2. استكشاف التعبير عن نسخه من الفائدة
    1. لتحديد نسخه من الفائدة ، إدخال معرف النص في مربع معرف النص ، تذكر ان النصوص نهاية في -RX تعتمد علي ايسوفورم من الفائدة.
    2. حدد مجموعات البيانات للاستجواب عن طريق تحديد المربعات ذات الصلة ل ' 1 ' البلدان ؛ ' 2 ' حاله التعرض ، ' 3 ' الأنواع ذات الاهميه ؛ ' 4 ' الفئة التي تهم المبيدات الحشرية ، وجميعها مع ضمان ان تؤدي هذه المعايير إلى > 1 شملت مجموعه البيانات (انظر الجدول التكميلي 1 في نغهام وآخرون1).
      ملاحظه: (iii) يشير إلى عضو في مجمع الأنواع الذي يهتم به المستخدم. حاليا ، تتوفر البيانات ل . coluzzii و. ارابينسيس.
    3. انقر فوق تحديث طريقه العرض في أسفل قائمه التحديد أو اضغط علي رجوع، متجاهلا قيمه الارتباط المطلق (في الوقت الحالي).
    4. إعطاء وقت التطبيق للتحديث.
    5. قراءه الرسم البياني الأول كما: سجل2 اضعاف التغيير بين السكان مقاومه والبعوض المختبر الحساسة من النص الفائدة عبر كل مجموعه البيانات التي تستوفي المعايير المحددة في الخطوة 1.2 (الشكل 1). ويمكن الاطلاع علي تفاصيل جميع مجموعات البيانات في نغهام وآخرون1.
    6. أقرا المعلومات الموجودة أسفل الرسم البياني علي النحو التالي: التغيرات المزدوجة بين البعوض المقاوم والحساس لكل مجموعه بيانات ذات صله ، بالاضافه إلى القيم p المصححة (Q). يمثل كل صف تحقيقات فرديه علي ميكروصفيف. تم الإبلاغ عن منهجيه عرض رسوميه سابقا1.
    7. أقرا الجدول الإضافي أدناه باعتباره عدد التجارب التي يكون فيها نص الفائدة كبيرا وكذلك العدد الإجمالي للتجارب التي تتطابق مع المعايير المحددة في الخطوة 1.2.
    8. لتنزيل البيانات في تنسيق فصل علامة التبويب ، انقر فوق الزر تنزيل ضمن الجدولين. يسمح هذا للمستخدم باستكشاف البيانات بطريقه أسهل باستخدام برنامج مثل Excel.
    9. تفسير الخريطة علي النحو التالي: تمثل كل نقطه مواقع التجميع التقريبية لبعوض المقاوم في كل مجموعه بيانات يتم فيها التعبير عن الفائدة بشكل مختلف. ألوان تتبع نظام ضوء المرور التي يتم شرحها في التطبيق (الشكل 2).
    10. للخطوات التالية وال1.2.8 ، احفظ المخرجات الرسوميه بالنقر بزر الأيمن ، والنقر فوق حفظ الصورة ك... ، واختيار مجلد مناسب.
      ملاحظه: في مثيل خطا إخراج بواسطة التطبيق ، فمن المحتمل ان لا تطابق مجموعات البيانات المعايير المضمنة. تحقق من الجدول التكميلي 1 في جهام وآخرون1 إذا حدث هذا.
  3. تحديد الوظائف المفترضة/مسارات السجل الخاص بالفائدة
    1. يمكن استخدام الارتباطات (الحد الأدنى r2 القيمة inputted) من أنماط التعبير من النصوص عبر مجموعات البيانات متعددة للتنبؤ وظيفة النص ويحتمل ان توضح المستنسخات المنظمة من نفس المسار. باستخدام المثال من جهام وآخرون1 (AGAP001076; CYP4G16) ، اتبع الخطوات 1.2.1 – 1-2-2 في القسم أعلاه ، واختيار جميع مجموعات البيانات للطاقة القصوى.
    2. قبل النقر فوق تحديث طريقه العرض، نقل المنزلق قيمه الارتباط المطلق إلى 0.85 ، وانقر فوق تحديث عرض أو اضغط علي العودة.
    3. افحص جدول الارتباط (الموجود في القاع) للبحث عن النسخ المتعددة التي يتم عرضها الآن وترتبط (| r | = 0.85) بالنسخة المكتوبة.
    4. التعامل مع المنزلق قيمه الارتباط المطلق ومراقبه اي تغييرات في الرسم البياني في القاع والجدول; ستظل المخرجات من الخطوة 1-3-2 دون تغيير. كما هو مبين في الشكل 3 (| r | > 0.9 ، | r | > 0.8) ، وخفض صرامة قيمه الارتباط سوف تظهر المزيد من النصوص ولكن سوف اعرض المزيد من الضجيج.
    5. قراءه الجدول أدناه الإخراج الرسوميه الذي (بالاضافه إلى المعلمات الموضحة في الخطوة 1.2.6) يحتوي علي قيمه الارتباط لكل نص.
    6. لتنزيل البيانات بتنسيق مفصول بعلامات تبويب ، انقر فوق الزر تنزيل .
    7. يمكن اجراء تحليل الإثراء الوظيفي علي قائمه معرف النسخة التي تم تنزيلها باستخدام تحليل DAVID8. مره واحده علي موقع ديفيد (وجدت في https://david.ncifcrf.gov/) ، حدد تحليل وظيفي. لصق قائمه الجينات الكاملة ، وذلك باستخدام الجينات معرفات [معرف دون RX ، والتي يمكن القيام به في اكسيل عن طريق ادراج عمود علي يمين المعرف المنهجي والكتابة = اليسار (x1 ، 10)، حيث X1 هو خليه الهوية النظامية]. حدد المعرف ك VectorBase_ID وقائمه الجينات وانقر فوق إرسال قائمه.
    8. انقر فوق الزر تجميع التعليقات التوضيحية الوظيفية للحصول علي نظره عامه حول الثراء الموجودة في شبكه الارتباط هذه ، مما يسمح بتعيين داله محتمله إلى النص. استكشف الثراء المعمقة من خلال النظر إلى الفئات المختلفة والنقر علي + أزرار لكل منها والنقر علي الرسم البيانيلاحقا.

2. تحميل وتنفيذ IR-تكس محليا

  1. تحميل وتشغيل IR-تكس
    1. انتقل إلى الرابط الموجود في http://github.com/LSTMScientificComputing/IR-TEx; وانقر علي استنساخ أو تنزيل | تحميل الرمز البريدي. مباشره إلى مجلد الاختيار وفك ضغط الملف في هذا المجلد.
    2. قم بتنزيل أحدث إصدار من برنامج R لنظام التشغيل المناسب من الرابط الموجود في http://cran.r-project.org/mirrors.html. قم بتثبيت البرنامج.
    3. قم بتنزيل وتثبيت أحدث برنامج R Studio ، مره أخرى لنظام التشغيل المناسب من الرابط الموجود في http://www.rstudio.com/products/rstudio/download/.
    4. بمجرد تثبيت ، فتح ستوديو R | الترميز التكميلي ملف 1 وتشغيل كل سطر لاعداد نظام IR-تكس.
    5. بمجرد تثبيت كافة الحزم وتحديثها بنجاح حسب الحاجة ، انتقل إلى الملف | فتح، حدد موقع IR-تكس. R، تسليط الضوء ، وفتح. يجب ان يكون هذا الآن مرئيا في الإطار العلوي من R Studio.
    6. لتشغيل التطبيق ، اضغط علي زر تشغيل التطبيق في اعلي يمين النافذة ، وسوف يطفو علي السطح نافذه ثانيه حيث سيتم تحميل التطبيق. بمجرد اكتمال التحميل ، للحصول علي الوظائف الكاملة انقر فوق فتح في المستعرض الموجود في اعلي يمين النافذة المحملة.
  2. أضافه مجموعات بيانات المقاومة إلى IR-تكس (التي تم إنشاؤها باستخدام مجموعه Anopheles جامماي 15K Agilent)
    1. لأضافه مجموعه بيانات جديده تم تحليلها تم إنشاؤها علي نفس النظام الأساسي ميكرواري (2196) إلى مجموعه البيانات المتوفرة ، قم بتنزيل التطبيق وحدد موقع المجلد غير المضغوط الذي تم تحميله في القسم 2.1.
    2. فتح ملف إضافي 1، الذي يمثل إخراج من تحليل limma علي 2196 1-mexp. باستخدام اكسيل ، في العمود H1 ، اكتب Fold_Change، وفي H2 ، اكتب = 2 ^ b2، الذي b2 هو تغيير السجل اضعاف. تطبيق هذا خلال العمود H لإنتاج التغييرات اضعاف الخام.
    3. ترتيب ملف إضافي 1 بحيث يكون العمود A هو المعرف ، العمود b هو تغيير الطي من العمود h (نسخ العمود h ، تمييز العمود b ، ثم انقر بزر الماوس الأيمن ولصق القيم) والعمود C هو القيمة p المعدلة. احذف كافة الاعمده الأخرى واحفظها كملف محدد بعلامات جدوله.
    4. فتح الترميز التكميلي ملف 2 وتشغيل باستخدام ورقه محدده بعلامات جدوله التي تم إنتاجها في الخطوة 2-2-3.
      NEWFILE_FC = c (' البلد ' ، ' حاله التعرض ' ، ' الأنواع ' ، ' المبيدات الحشرية ')
      NEWFILE_Q = c (' البلد ' ، ' حاله التعرض ' ، ' الأنواع ' ، ' المبيدات الحشرية ')
      ملاحظه: يجب تغيير الحقول ضمن علامات اقتباس مفرده لعكس المعلومات من مجموعه البيانات الجديدة. وتشير حاله التعرض إلى ما إذا كانت العينات قد جمعت بعد التعرض للمبيدات الحشرية (المكشوفة/غير المكشوفة). المبيدات الحشرية: إذا "غير مكشوف" ، استخدم "لا شيء". انظر Fold_Changes. للبيانات الوصفية من عينات أخرى. تاكد من ان الإملاء متناسق.
    5. افتح الجغرافية .txt، قم بالتمرير إلى الصف النهائي المحتل ، وحدد أدناه. اكتب اسم مجموعه البيانات متبوعا بالسؤالين Q و NEWFILE_Q في العمود 1 وخط العرض لموقع تجميع العينات في العمود 2 وخط الطول في العمود 3. حفظ التغييرات.
    6. إذا تم استخدام اي إدخالات الرواية (اي غامبيا) ، والتي ليست متاحه للاختيار في مجموعه البيانات (انظر الجدولالتكميلي 1 1وآخرون) ، وهذه سوف تحتاج إلى أضافه إلى التعليمات البرمجية. للقيام بذلك ، افتح IR-تكس. R في RStudio وحدد موقع سطر 26 كما هو موضح من قبل RStudio ، عند هذه النقطة يجب ان تبدا التالية:
      'اللوحة الجانبية (.... '.
      ملاحظه: كل من الصفوف الاجراء يتعلق بعنصر من بيانات التعريف إدخال في الصفوف أسفل اسم مجموعه البيانات في Fold_Changes في الخطوة 2.2.5.
    7. لأضافه بيانات تعريف الرواية ، مرر إلى نهاية سطر بيانات التعريف الخاصة بالاختيار ، وحدد موقع المصطلح ' المحدد = '. مباشره بعد هذا ينبغي ان يكون فاصله وقوس مغلقه; عند هذه النقطة ، انقر فوق المؤشر داخل قوس مغلق. بعد علامة اقتباس أحاديه النهائي ، اكتب فاصله متبوعه بعلامة اقتباس أحاديه متبوعا ببيانات التعريف الجديدة (علي سبيل المثال ، "غامبيا") ، واحفظ التغييرات. انظر أدناه للحصول علي مثال.
      checkboxGroupInput (' المدخلات القطرية ' ، ' حدد البلدان ذات الصلة ' ، ج (' بوركينا فاسو ' ، ' كوت ديفوار ' ، ' الكاميرون ، ' غينيا الاستوائية ' ، ' زامبيا ' ، ' تنزانيا ' ، ' السودان ' ، ' أوغندا ' ، ' توغو ' ، ' غامبيا ') ، مختاره = c (' بوركينا فاصو ' ، ' كوت ديفوار ' ، ' الكاميرون ' ، ' غينيا الاستوائية ' ، ' زامبيا ' ، ' تنزانيا ' ، ' السودان ' ، ' توغو ')
    8. تشغيل التطبيق. يجب ان يظهر إدخال بيانات التعريف الجديد كمربع اختيار غير محدد تحت العنوان ذي الصلة. إذا أراد المستخدم ان يتم تحديده ، فيجب اضافته بعد المحدد = c (... ، كما هو موضح أدناه:
      checkboxGroupInput (' المدخلات القطرية ' ، ' حدد البلدان ذات الصلة ' ، ج (' بوركينا فاسو ' ، ' كوت ديفوار ' ، ' الكاميرون ' ، ' غينيا الاستوائية ' ، ' زامبيا ' ، ' تنزانيا ' ، ' السودان ' ، ' أوغندا ' ، ' توغو ' ، ' غامبيا ') ، مختاره = c (' بوركينا فاسو ' ، ' كوت ديفوار ' ، ' الكاميرون ' ، ' غينيا الاستوائية ' ، ' زامبيا ' ، ' تنزانيا ' ، ' السودان ' ، ' أوغندا ' ، ' غامبيا ')
    9. لأضافه مجموعات بيانات مقاومه لم يتم تنفيذها علي A-MEXP-2196 ، راجع القسم 3.

3. تعديل IR-تكس للاستخدام مع مجموعات بيانات مختلفه

  1. الاستخدام عبر الانظمه الاساسيه متعددة الomics والمتابعة مع البيانات المفقودة
    1. للمتابعة مع "0" في مجموعات البيانات: راجع مصدر مجموعه البيانات للمعني المحدد ل "0". فمن المستحسن ان "0" هو (متحفظ) استبدال مع "NA". كما هو الحال مع التغييرات اضعاف الخام (ب/ا) ، "0" يشير إلى اشاره غير المكتشفة في حاله تجريبية B. في حاله ان الشرط التجريبي A يسلك تعبيرا جوهريا ، يمكن للمستخدم تطبيق قيمه تغيير اضعاف صغيره.
    2. فتح ملف إضافي 2..txt، ملف RNAseq تكييفها من Uyhelji et al.9. يمثل هذا الملف القالب الذي يجب ان تستند اليه البيانات الجديدة: العمود A = المعرف ، العمود B = تغيير الطي الخام ، والعمود C = القيمة p المعدلة. استخدم هذا الملف لتشغيل من خلال الخطوات التالية.
    3. قم بتشغيل الرمز R لمطابقه المعرفات في ملف محدد بعلامات تبويب واحده عبر الانظمه الاساسيه ، ثم تنظيم البيانات وتطبيعها (ملف الترميز الإضافي 2). يتم تضمين التعليمات داخل الملف. سيتم فصل اي FILEPATH بواسطة "/" ل MacOS أو "//" ل Windows (تغيير هذه من "\" ، كما ستظهر).
    4. إخراج الملف الذي تم إنتاجه في نهاية الاضافيه ترميز ملف 2 إلى موقع الاختيار للاستخدام في الخطوة 3-1-5. الاضافيه ترميز ملف 2 سيتم إخراج ملف Fold_Changes جديد. النسخ الاحتياطي للملف الأصلي.
    5. تنفيذ التعليمات البرمجية الواردة في الترميز التكميلي ملف 3. العثور علي ملف الإخراج المسمي FC_distribPlot في المجلد المحدد ك filepath. تحقق من توزيعات تغيير السجل2 اضعاف للتحقق من ان التوزيعات تغيير السجل2 اضعاف متطابقة تقريبا عبر مجموعات البيانات.
    6. اتبع الإرشادات من الخطوة 2.2.6 لتحرير ملفات اضافيه والتاكد من توافق الFold_Changesالجديد.
  2. تعديل IR-تكس للاستخدام مع مجموعات بيانات جديده تماما
    1. افتح IR-تكس. R في rstudio وحدد الخطوط (23 – 34) التي تبدا ب:
      'لوحه الجدولة ('
      وتنتهي في:
      زر المرسل ("عرض التحديث" ، رمز ("تحديث"))
      ),
    2. تغيير AGAP008212-RA وجدت في الأسطر أدناه إلى نسخه من الاهتمام في البيانات الجديدة.
      textInput ("textInput" ، "معرف النص" ، القيمة = ' AGAP008212 ') ،
    3. حدد موقع الخيارات الاربعه التي تبدا ب:
      checkboxGroupInput (
      يمكن تعديل هذه الخيارات لتمثل بيانات التعريف الهامه التي يرغب المستخدم في تصفيه البيانات الجديدة بها. في كل حاله ، يجب علي المستخدم تغيير البلدان المحددة ذات الصلة؛ حدد حاله التعرض؛ تحديد الأنواع ذات الصلة ؛ وحدد فئة المبيدات الحشرية لتكون ممثله للبيانات (اي, حدد نوع الانسجه; حدد الجنس; حدد الشريحة العمرية; حدد حاله المرض).
    4. تحديد بيانات التعريف المقترنة بمجموعه البيانات والإدخال لاستبدال الخيارات الموجودة مباشره بعد c الأول ('. في كل مثيل ، سيتم تضمين الخيارات ضمن علامات الكلام وفصلها عن التحديد التالي بواسطة فاصله. بعد التحديد النهائي ، يجب إغلاق القوس. مثال لحاله المرض تحديد :
      c (' المصابة ' ، ' غير مصاب ' ، ' غير معروف ')
    5. اختر اي من هذه البيانات الوصفية سيتم اختياره عند فتح التطبيق. يمكن تغيير هذه عن طريق تعديل الخيارات بعد تحديد = c ('. مثال لحاله المرض تحديد :
      مختاره = c (' المصابة ' ، ' غير مصاب ')
      وهذا سيرشد التطبيق لتحديد مجموعات البيانات فقط مطابقه هذه المعايير علي التحميل الاولي.
    6. لإنشاء جدول بيانات جديد ، اتبع التخطيط الموجود في الFold_Changes والإرشادات الواردة في القسم 2. تغيير بيانات التعريف لكل تغيير المعنية الموضحة في الخطوة التالية ، بالبالضبط كما هو مكتوب في التعليمات البرمجية (R حساس لحاله الأحرف). في عمود أزاله السموم ، إدخال أسماء الجينات ، وفي عمود نوع النص ، وإدخال أوصاف الجينات لكل نسخه. اتبع المقطع 3.2 عند أضافه مجموعات بيانات جديده.
    7. إذا كان التعيين غير ذي صله بالمتطلبات التجريبية ، حدد موقع الأسطر التالية من التعليمات البرمجية ووضع ' # ' في الامام:
      الخطوط 49 – 51:
      br (), br (),
      withSpinner (بلوتوتبوت ("الجغرافيا")) ،
      إخراج النص (' Geography_legend ') ،
      خطوط 493 بدء التشغيل:
      الناتج $ الجغرافيا <-العارضون ({
      إلى خط 602 نهاية:
      الإخراج $ Geography_legend <-النص ({
      لصق ("النصوص الهامه فقط (p" ، كما. التعبير ("< =") ، "0.05): FC > 5 = الأحمر ، FC > 1 = العنبر ، FC < 1 = الأخضر" ، sep = "")
      })

Representative Results

باستخدام الملف Fold_Changes المضمن مع IR-تكس ، قارننا النصوص التي تم التعبير عنها بصوره مختلفه بشكل ملحوظ في مجموعات البيانات المقاومة لل anopheles coluzzii و anopheles في غامبيا للضوابط الحساسة من كوت ديفوار وبوركينا فاسو. وقد أسفر ذلك عن 18 سجلا للفائدة (الجدول 1؛ ويمكن تنفيذ هذا البحث باستخدام Excel أو R أو برامج أخرى). اثنين من هذه, ATPase (AGAP006879) والبلورات α (AGAP007160), وقد ذكرت سابقا, مع السابق لها تاثير كبير علي المقاومة البيروثروميد1. الاضافه إلى هذين المستنسخين ، كانت هناك مستنسخان لأزاله السموم ، GSTMS1 (fcμ = 1.95 و 1.85) و UGT306A2 (fcμ = 2.29 و 2.28).

وقد أجريت المصادقة علي اثنين من هذه النصوص (GSTMS1، وهو محضر لأزاله السموم ؛ و AGAP009110 ، وهي نسخه غير معروفه وخاصه بالبعوض تحتوي علي نطاق الربط β-1 ، و 3 غلوكان) كما سبق وصفها1. تم اجراء التحليل باستخدام مجموعات التمهيدي الموصوفة في ملف إضافي 3 وأظهرت ان هذه النسخ كانت بشكل ملحوظ في السكان متعددة المقاومة من كوت ديفوار (Tiassalé) واخري من بوركينا فاسو (banfora) ، مقارنه مع المختبر-المعرضة N'Gousso (الشكل 4ا).

كما أظهرت كل من النسخ الحاملة الكبيرة في كل من السكان المقاومين, تم اجراء الضربة القاضية المستحثة علي البعوض من المختبر LSTM مستعمره Tiassalé. وتنبع هذه المستعمرة من كوت ديفوار وتقاوم جميع الفئات الرئيسية من المبيدات الحشرية المستخدمة في الصحة العامة ، كما سبق وصفها في1و10. وقد ادي توهين التعبير GSTMS1 إلى زيادة كبيره (ع = 0.021) في معدل الوفاات بعد التعرض للديلتامميثرين مقارنه بالضوابط المحقونة بالحقن ، مما يدل علي اهميه هذه النسخة في مقاومه البيروثرويد (الشكل 4ب). وعلي العكس من ذلك ، ادي AGAP009110 الضربة القاضية إلى عدم حدوث تغير كبير (ع = 0.082) في معدل الوفاات بعد التعرض (الشكل 4ب).

GSTMS1 هي واحده من ثلاثه تم العثور عليها في ا. غامباي البعوض11. علي الرغم من ان أعضاء من الطبقات ابسيلون ودلتا من gsts كانت متورطة في السابق في أزاله السموم من المبيدات الحشرية12,13,14, هذا هو الدليل الأول لمعرفتنا لدور الميكروسومي gsts في مقاومه البيروثرويد15. ولاستكشاف الوظيفة المفترضة لهذه النسخة الكترونيه في البعوض المضاد لل ( Anopheles ) ، تم تحديد التعبير والارتباط في الاشعه تحت الحمراء-تكس. وقد تجاوزت GSTMS1 بشكل كبير في 20 من أصل 21 مجموعات البيانات المتاحة لهذه الأنواع ، باستثناء جزيرة bioko. وفي كل موقع ، كان التعبير الفوقي اقل من خمسه اضعاف بالمقارنة مع السكان المعرضين للاصابه (الشكل 5).

وبما ان الميكروبات المجهرية قد أهملت إلى حد كبير باعتبارها ديتوكسيفيرس مبيدات حشرية محتمله ، لا يعرف الكثير عن دورها في مقاومه المبيدات الحشرية15. وباستكشاف الارتباط المتبادل بين النصوص الأخرى ، يمكن توضيح الوظائف المفترضة من خلال افتراض التنظيم المشترك أو المشاركة في نفس المسارات. لتعظيم الطاقة في شبكه الارتباط ، تم اختيار كافة مجموعات البيانات ميكروصفيف الموجودة في IR-تكس ، و | r | من > 0.75 تم اختياره. ويبين الجدول 2 الناتج من IR-تكس.

يتم إثراء هذه النصوص في النشاط اوكسيوريدكتيز واستقلاب الجلوكوز/الكربوهيدرات في أداه الشرح الوظيفية ديفيد8. كل من الجلوكوز-6-فوسفات الهيدروجين والسيتاثيوني غاما-lyase الحفاظ علي مستوي الجلوتاثيون في خلايا الثدييات16،17 التالي ربط مباشره مع GSTMS1، الجلوتاثيون-S-ترانسفيراسي. Catalase هو سريع المفعول الاكسده المستجيب الذي يحمي الخلايا من الاضرار الناجمة عن أنواع الأكسجين التفاعلية ، وهو منتج ثانوي من التعرض البيروثرويد. فالاساسكلوفير هيدرولاز هو هيدرولاز التي قد تلعب دورا في أزاله السموم في خلايا الثدييات18. CYP4H17 موجود أيضا في شبكه الارتباط. سيتوكروم p450s هي الأيض مباشره من مبيدات الحشرات البيروثروميد ، وهذه المنتجات انهيار يمكن زيادة استقلاب من قبل GSTs. أخيرا, وقد تورط CYP4H17 في مقاومه البيروثروميد في ا. funestus19. معا, هذه البيانات تدعم بقوة دورا ل GSTMS1 في أزاله السموم غريب حيوي.

Figure 1
الشكل 1: تغيير السجل2 اضعاف AGAP002865-RA في جميع مجموعات البيانات. المحور السيني تفاصيل مجموعات البيانات المختلفة ، والمعلومات التي يمكن العثور عليها في الجدول التكميلي 1 في منشور سابق1، والمحور ص يظهر تغيير السجل2 اضعاف في نص الفائدة. تشير الخطوط المنقطة الرمادية الفاتحة إلى عتبات تقريبيه للاهميه ، والتي اتخذت هنا لتكون تغييرا اضعاف < 0.8 أو اضعاف التغيير من > 1.2. يشير الخط الأسود المنقط إلى تغيير الطي 1 (اي لا يوجد اختلاف في التعبير بين السكان المقاومين والمعرضين للاصابه). يرجى النقر هنا لعرض نسخه أكبر من هذا الرقم.

Figure 2
الشكل 2: توزيع المصفوفات المجهرية التي تبين التعبير التفاضلي الكبير لAGAP002865 في السكان المقاومين. يتم تمثيل التغييرات اضعاف في نظام ضوء حركه المرور: تغيير الأخضر اضعاف من < 1 ، تغيير البرتقالي اضعاف من > 1 ، وتغيير اضعاف الأحمر من > 5. يتم عرض مجموعات البيانات ذات التعبير التفاضلي الهام (p ≤ 0.05) فقط. يرجى النقر هنا لعرض نسخه أكبر من هذا الرقم.

Figure 3
الشكل 3: شبكات الارتباط من AGAP001076 (CYP4G16). يتم حساب الارتباطات الزوجية عبر كافة النصوص عبر مجموعات بيانات ميكروصفيف 31 ، مع تطبيق القطع المعرفة من قبل المستخدم. يظهر هنا (ا) | r | > 0.9 (ب) | r | > 0.8 جميع النصوص المعروضة علي الرسم البياني تستوفي هذا المعيار وتتبع تغييرات التعبير AGAP001076. يرجى النقر هنا لعرض نسخه أكبر من هذا الرقم.

Figure 4
الشكل 4: تعبير mRNA والنمط الظاهري عند توهين GSTMS1 و AGAP009110. (ا) تعبير MRNA عن GSTMS1 و AGAP009110 في فئتين من السكان المقاومين للمقاومة المتعددة من كوت ديفوار وبوركينا فاسو ، علي التوالي. وقد قورنت المستويات بالمختبر المعرض للاصابه بالغاز . مستويات الاهميه المحسوبة من قبل ANOVA مع اختبار دونيت الخاصة بعد. (ب) التوهين المستحث بالنسبة لكل من المستنسخين مقارنه بالضوابط التي تحقن بالغاز المضاد لل gfp. GSTMS1 التوهين يظهر زيادة كبيره في معدلات الوفاات بعد التعرض ديلتاميورين (محسوبة من قبل ANOVA مع اختبار tukey بعد المخصصة ؛ * p ≤ 0.05 ، * * p ≤ 0.01). يرجى النقر هنا لعرض نسخه أكبر من هذا الرقم.

Figure 5
الشكل 5: التعبير عن الGSTMS1 في المجتمعات السكانية الخاصة بالسكان. خريطة تبين التعبير التفاضلي بشكل ملحوظ من GSTMS1 في مجموعات البيانات ميكروصفيف المتوفرة. تم العثور علي GSTMS1 الفرق بشكل كبير في 20 من أصل 21 مجموعات البيانات ميكروصفيف. يرجى النقر هنا لعرض نسخه أكبر من هذا الرقم.

معرف النسخة وصف بوركينا فاسو كوت ديفوار
AGAP006879-RA اتباز 27.94 43.05
AGAP007160-الميزانية العادية ا-بلورات 11.49 10.58
AGAP007160-RC ا-بلورات 11.14 10.38
AGAP007160-RA ا-بلورات 9.78 9.84
AGAP009110-RA غير معروف 9.26 5.96
AGAP007780-RA نازعه الانزيم 10.49 3.77
AGAP006383-RA أوليجوساكتشاريلترانسفيراسي الوحدة الفرعية المعقدة بيتا 3.69 5.57
AGAP007249-الميزانية العادية فيتينتين 4.61 3.86
AGAP003357-RA RAG1-تنشيط البروتين 1-مثل البروتين 4.31 4.05
AGAP007249-RA فيتينتين 4.48 3.46
AGAP001998-RA mRpS10 3.46 2.85
AGAP007589-RA UGT306A2 2.29 2.28
AGAP000165-RA GSTMS1 1.95 1.85
AGAP002101-RA ايزوليوسيل-ترنا سينثاتيز 0.57 0.59
AGAP002969-RA أسباراجينيل-trna سينثاتيز 0.45 0.45
AGAP004199-RA مذاب الناقل الاسره 5 (الصوديوم--بالاقتران أحاديه الناقل الأحادي) ، عضو 8 0.35 0.48
AGAP004684-RA rRNA-معالجه البروتين CGR1 0.36 0.22
AGAP006414-RA Cht8 0.024 0.36

الجدول 1: السجلات التفاضلية بشكل كبير في نفس اتجاه التغيير المزدوج في بوركينا فاصو والسكان في كوت ديفوار. معرف النص ، وصف الجينات ، ومتوسط التغيير اضعاف لكل مجموعه بيانات من البلدين التي تمثل coluzzii و.

الارتباط الاسم المنهجي نوع النص
1 AGAP000165-RA GSTMS1
0.82 AGAP004904-RA الكاتلاز
0.76 AGAP007243-RA 26S الوحدة التنظيمية البروتينية 8
0.79 AGAP008358-RA CYP4H17
0.76 AGAP009436-RA فلاسيكلوفير هيدروداز
0.75 AGAP010739-RA الجلوكوز-6-فوسفات 1-نازعه الهيدروجين
0.85 AGAP011172-RA سيستاثيونيني جاما-لياز
0.76 AGAP012678-RA الجلوكوز-6-فوسفات 1-نازعه الهيدروجين

الجدول 2: النصوص المشتركة المرتبطة GSTMS1. يظهر الجدول الناتج من شبكه الارتباط ل GSTMS1 علي IR-تكس مع | r | من > 0.75. يظهر الجدول ارتباط سبيرمان ، ومعرف النص ، ووصف الجينات لكل نسخه مترابطة.

ملف إضافي 1: ملف إخراج من صفيف 2196 تحليلها علي limma. يتكون الملف من قابل لضربه قاضيه مقارنه صفيف التحكم gfp ، الموصوفة بمزيد من التفاصيل في Arrayexpress (E-mtab-4043) ومنشور سابق آخر1. تمثل الاعمده معرف AGAP (SystematicName) ، وسجل تغيير الطيات (logFC) ، وقيم تعبير السجل (AveExpr) ، وإحصاء t (t) ، والقيمة p غير المصححة (p. Value) ، والقيمة p المعدلة (الضبط. P. Val) ، و B الاحصائيه (B)20. ولأغراض هذا الملف ، فان البعوض الموجود في كوت ديفوار هو anopheles كولوزي ، ولا يتعرض للمبيدات الحشرية ، مع مجموعه خطوط الطول والعرض 5.4 و 6.0 علي التوالي. الرجاء انقر هنا لعرض هذا الملف (انقر بزر الماوس الأيمن للتحميل).

ملف إضافي 2: ملف إخراج من تجربه RNAseq. تحليل RNAseq ماخوذ من Uyhelji et al.9 ويصف التغييرات في الناسخ من البعوض Anopheles عندما يتعرض ل50 ٪ الملوحة. هذا الملف مقتبس من الجدول S2 من المنشور ويتضمن معرف AGAP (SystematicID) ، وتغيير الطي الخام (Fold_Change) ، والقيمة p المعدلة (q_value). الرجاء انقر هنا لعرض هذا الملف (انقر بزر الماوس الأيمن للتحميل).

ملف إضافي 3: قائمه التمهيدي للنتائج التمثيلية. AGAP معرف ، اسم الجينات ، dsRNA إلى الامام ، dsRNA عكس ، qPCR إلى الامام ، و qPCR التمهيدي عكس مجموعات لكل نسخه. الرجاء انقر هنا لعرض هذا الملف (انقر بزر الماوس الأيمن للتحميل).

الترميز التكميلي ملف 1. الرجاء انقر هنا لعرض هذا الملف (انقر بزر الماوس الأيمن للتحميل).

الترميز التكميلي ملف 2. الرجاء انقر هنا لعرض هذا الملف (انقر بزر الماوس الأيمن للتحميل).

الترميز التكميلي ملف 3. الرجاء انقر هنا لعرض هذا الملف (انقر بزر الماوس الأيمن للتحميل).

Discussion

الناسخ البيانات الكبيرة تنتج قوائم آلاف من النصوص التي يتم التعبير عنها باختلاف لكل حاله تجريبية. يتم تنفيذ العديد من هذه التجارب علي الكائنات ذات الصلة والأنماط الظاهرية ويتم تحليلها بشكل حصري تقريبا كتجارب مستقله. الاستفادة من هذه المصادر الغنية للبيانات عن طريق دراسة البيانات بشكل كلي ودون افتراضات نظرية 1) يؤدي إلى تحديد النسخ الجديدة للمرشحين و 2) منع التخلص من البيانات القيمة ببساطه لان هناك الكثير من المعلومات للتحقق من صحة في المجري1.

يوفر IR-تكس للمستخدمين خلفيه محدوده للمعلوماتية الحيوية مع القدرة علي فحص مجموعات البيانات المتعددة بسهوله ، وتصور التغييرات في مجموعات البيانات ، وتنزيل المعلومات المرتبطة1. علي الرغم من ان IR-تكس لا يدعم البحث عن أكثر من نسخه واحده في كل بحث ، يمكن للمستخدمين فحص ملفات Fold_Changes المقترنة ببساطه باستخدام Excel أو R أو البرامج المناسبة الأخرى. فائده اضافيه من IR-تكس ينبع من استخدام شبكات الارتباط للتنبؤ وظيفة النص ، وإدخال البروتينات افتراضيه أو النصوص مع وظائف غير معروفه واستخدام البرمجيات المصب للبحث عن ثراء1.

في المثال الموضح في هذا البروتوكول ، يتم استخدام IR-تكس وفقا لوظيفته الاصليه. هنا ، فانه يسمح استكشاف النصوص المرتبطة بمقاومه المبيدات الحشرية والتصور لتوزيع الإفراط في والتعبير عن طريق رسم خرائط الرسومات. ويتم التحقق من صحة نصوص الفائدة في الجسم الخارجي لتحديد ما إذا كان التعبير المفرط أو الناقص للنصوص المعطية يساهم في النمط الظاهري الملاحظ1 (مثل مقاومه المبيدات الحشرية). وقد تبين هنا ، كماورد في التقريرالسابق ، انه يمكن استخدام مجموعه بيانات في نهج يحركه الافتراض لتحديد النصوص المتعلقة بالفائدة علي أساس كل بلد علي حده. ويمكن بعد ذلك استخدام IR-تكس ل 1) استكشاف التعبير عن النص و 2) تاطير وظيفة النص عن طريق تطبيق شبكه ارتباط أزواج عبر جميع النصوص الواردة في كل مجموعه البيانات omics. وهنا ، تبين ان GSTMS1 مرتبطة ارتباطا وثيقا مع عدد من النصوص الأخرى المتورطة في أزاله السموم. وتبين هذه البيانات (إلى جانب الضربة القاضية للنسخة التي أدت إلى زيادة كبيره في معدل الوفاات بعد التعرض للمبيدات الحشرية) اهميه هذه النسخة في التخليص البيولوجي البيولوجي.

يمثل IR-تكس موردا قيما لاستكشاف النصوص المتعلقة بمقاومه المبيدات الحشرية علي الويب أو باستخدام التطبيقات المحلية. يوضح هذا البروتوكول كيفيه تعديل IR-تكس للانظمه المختلفة-omics بالاضافه إلى بيانات جديده تماما. يوضح الدليل كيفيه استخدام IR-تكس لدمج البيانات من الانظمه الاساسيه متعددة الomics وقواعد البيانات مع المعلومات المفقودة وكذلك كيفيه استعاده IR-تكس ببساطه لذلك فمن المفيد لأي شخص البحث في مجموعات بيانات التدوين.

Disclosures

وليس لدي المؤلفين ما يفصحون عنه.

Acknowledgments

تم تمويل هذا العمل من قبل زمالة تنميه المهارات التابعة لV.I. (MR/R024839/1) ومنحه تحدي المجتمع الملكي (CH160059) إلى H.R.

Materials

Name Company Catalog Number Comments
Laptop with browser Any - -
R Program The R Project for Statistical Computing - https://www.r-project.org/
R Studio R Studio - https://www.rstudio.com/

DOWNLOAD MATERIALS LIST

References

  1. Ingham, V. A., Wagstaff, S., Ranson, H. Transcriptomic meta-signatures identified in Anopheles gambiae populations reveal previously undetected insecticide resistance mechanisms. Nature Communications. 9, (1), 5282 (2018).
  2. Chang, W., Cheng, J., Allaire, J., Xie, Y., McPherson, J. shiny: Web Application Framework for R. (2017).
  3. Bhatt, S., et al. The effect of malaria control on Plasmodium falciparum in Africa between 2000 and 2015. Nature. 526, (7572), 207-211 (2015).
  4. Ranson, H., Lissenden, N. Insecticide Resistance in African Anopheles Mosquitoes: A Worsening Situation that Needs Urgent Action to Maintain Malaria Control. Trends in Parasitology. 32, (3), 187-196 (2016).
  5. Donnelly, M. J., et al. Does kdr genotype predict insecticide-resistance phenotype in mosquitoes. Trends in Parasitology. 25, (5), 213-219 (2009).
  6. Stevenson, B. J., et al. Cytochrome P450 6M2 from the malaria vector Anopheles gambiae metabolizes pyrethroids: Sequential metabolism of deltamethrin revealed. Insect Biochemistry and Molecular Biology. 41, (7), 492-502 (2011).
  7. Müller, P., et al. Field-Caught Permethrin-Resistant Anopheles gambiae Overexpress CYP6P3, a P450 That Metabolises Pyrethroids. PLoS Genetics. 4, (11), 1000286 (2008).
  8. Huang, D., et al. The DAVID Gene Functional Classification Tool: a novel biological module-centric algorithm to functionally analyze large gene lists. Genome Biology. 8, (9), 183 (2007).
  9. Uyhelji, H. A., Cheng, C., Besansky, N. J. Transcriptomic differences between euryhaline and stenohaline malaria vector sibling species in response to salinity stress. Molecular Ecology. 25, (10), 2210-2225 (2016).
  10. Edi, C. V., Benjamin, K. G., Jones, C. M., Weetman, D., Ranson, H. Multiple-Insecticide Resistance in Anopheles gambiae Mosquitoes, Southern Côte d’Ivoire. Emerging Infectious Diseases. 18, (9), 1508-1511 (2012).
  11. Ding, Y., Ortelli, F., Rossiter, L., Hemingway, J., Ranson, H. The Anopheles gambiae glutathione transferase supergene family: annotation, phylogeny and expression profiles. BMC Genomics. 4, (1), 1-16 (2003).
  12. Enayati, A. A., Ranson, H., Hemingway, J. Insect glutathione transferases and insecticide resistance. Insect Molecular Biology. 14, (1), 3-8 (2005).
  13. Ranson, H., et al. Identification of a novel class of insect glutathione S-transferases involved in resistance to DDT in the malaria vector Anopheles gambiae. The Biochemical Journal. 359, 295-304 (2001).
  14. Riveron, J. M., et al. A single mutation in the GSTe2 gene allows tracking of metabolically based insecticide resistance in a major malaria vector. Genome Biology. 15, (2), 27 (2014).
  15. Pavlidi, N., Vontas, J., Van Leeuwen, T. The role of glutathione S-transferases (GSTs) in insecticide resistance in crop pests and disease vectors. Current Opinion in Insect Science. 27, 97-102 (2018).
  16. Salvemini, F., et al. Enhanced glutathione levels and oxidoresistance mediated by increased glucose-6-phosphate dehydrogenase expression. Journal of Biological Chemistry. 274, (5), 2750-2757 (1999).
  17. Deplancke, B., Gaskins, H. R. Redox control of the transsulfuration and glutathione biosynthesis pathways. Current Opinion in Clinical Nutrition & Metabolic Care. 5, (1), (2002).
  18. Puente, X. S., López-Otn, C. Cloning and expression analysis of a novel human serine hydrolase with sequence similarity to prokaryotic enzymes involved in the degradation of aromatic compounds. Journal of Biological Chemistry. 270, (21), 12926-12932 (1995).
  19. Riveron, J. M., et al. Genome-wide transcription and functional analyses reveal heterogeneous molecular mechanisms driving pyrethroids resistance in the major malaria vector Anopheles funestus across Africa. G3: Genes, Genomes, Genetics. 7, (6), 1819-1832 (2017).
  20. Smyth, G. K. Linear models and empirical bayes methods for assessing differential expression in microarray experiments. Statistical Applications in Genetics and Molecular Biology. 3, (1), 3 (2004).

Comments

0 Comments


    Post a Question / Comment / Request

    You must be signed in to post a comment. Please or create an account.

    Usage Statistics