IR-TEx: שילוב נתונים קוד פתוח כלי אינטגרציה עבור נתונים גדולים הטרנססקריפט מיועד וקטור מלריה אנופלס gambiae

Biology
 

Summary

IR-TEx בוחנת התנגדות קוטל החרקים פרופילים הקשורים במין אנופלס gambiae. בתנאי להלן הוראות מלאות לשימוש ביישום, שינויים לחקר מספר מערכות הנתונים transcript מרובים, ושימוש במסגרת לבנות מסד נתונים אינטראקטיבי עבור אוספים של נתונים transcript מכל אורגניזם, שנוצר בכל פלטפורמה.

Cite this Article

Copy Citation | Download Citations | Reprints and Permissions

Ingham, V. A., Bennett, A., Peng, D., Wagstaff, S. C., Ranson, H. IR-TEx: An Open Source Data Integration Tool for Big Data Transcriptomics Designed for the Malaria Vector Anopheles gambiae. J. Vis. Exp. (155), e60721, doi:10.3791/60721 (2020).

Please note that all translations are automatically generated.

Click here for the english version. For other languages click here.

Abstract

IR-TEx הוא יישום שנכתב ב מבריק (חבילת R) המאפשר חקירה של הביטוי של (כמו גם הקצאת פונקציות) תעתיקים אשר הביטוי קשור לפנוטיפים ההתנגדות קוטלי חרקים ביתושים אנופלס gambiae . ניתן להשתמש ביישום באופן מקוון או להורדה ולשימוש מקומי על-ידי כל אחד. ניתן לשנות את היישום המקומי כדי להוסיף נתונים חדשים של עמידות לקוטלי חרקים שנוצרו מפלטפורמות מרובות omics. מדריך זה מדגים כיצד להוסיף ערכות נתונים חדשות ולטפל בנתונים חסרים. יתר על כן, IR-TEx יכול להיות באופן מלא ובקלות והקלטנו כדי להשתמש-omics datasets מכל נתונים ניסיוניים, מה שהופך אותו משאב יקר לחוקרים רבים. הפרוטוקול ממחיש את כלי השירות של IR-TEx בזיהוי חדש מועמדים התנגדות קוטל חרקים באמצעות מיקרו הגלוטתיון המיקרוזומאז, GSTMS1, כדוגמה. התעתיק הזה ממוקם במספר רב של אוכלוסיות עמידות מחוף השנהב ובורקינה פאסו. הזיהוי של התעתיקים של מתאם משותף מספק תובנה נוספת לתוך התפקידים המפוטלים של הגן הזה.

Introduction

היכולת למדוד את הביטוי של מספר גדול של תעתיקים בו באמצעות פלטפורמות microarray ו RNAseq הטכנולוגיה הביא את הדור של מערכות נתונים עצומים שיוך ביטוי תעתיק עם פנוטיפ מסוים בשני מודל ואורגניזמים שאינם מודל. אלה ערכות נתונים הם משאב עשיר מאוד עבור חוקרים, את הכוח של אשר ניתן להגדיל על ידי שילוב של ערכות רלוונטיות בגישה שילוב נתונים גדול. עם זאת, מתודולוגיה זו מוגבלת לאלה עם מיומנויות ביואינפורמטיקה מסוימות. המתואר כאן היא תוכנית, IR-TEx (שפורסמו בעבר על ידי לנגהם et al.1) כי הוא נכתב בחבילה R בשם מבריק2 ומאפשר למשתמשים עם הכשרה ביואינפורמטיקה קטנה לשלב ולחקור את ערכות הנתונים האלה בקלות יחסית.

IR-TEx, שנמצאו ב http://www.lstmed.ac.uk/projects/IR-TEx, נכתב כדי לחקור את התעתיקים הקשורים התנגדות קוטל חרקים ב אנופלס gambiae, וקטור אפריקה הגדול מלריה1. מלריה היא מחלה טפילית הנגרמת על ידי מינים פלמודניום , המועבר בין בני אדם באמצעות עקיצות של אנופלס יתושים נקבה. מיקוד וקטור היתושים עם הקוטלי החרקים הוכח להיות האמצעי היעיל ביותר למניעת תחלואה ותמותה הקשורים למלריה באפריקה. שינוי קנה המידה של כלים (כלומר, חרקים נטס ארוכות טווח) היה גם מרכזי הפחתת דרמטי במקרים מלריה מאז 20003. עם מספר מצומצם מאוד של קוטלי חרקים זמין, יש לחץ אבולוציוני חזק על היתושים, והתנגדות היא כיום נפוצה בווקטורים אפריקאים מלריה4.

בנוסף, מוטציות באתר היעד5 ואת הסיווג המטבולית של קוטלי החרקים6,7 להישאר מנגנונים המחקר העיקרי של התנגדות, אבל מנגנונים אחרים עמידים חזק מתעוררים כעת1. רבים מנגנונים חדשים אלה לא היו קשורים בעבר עם התנגדות קוטל חרקים אבל זוהו על ידי חיפוש דפוסים נפוצים של ביטוי גנים על פני אוכלוסיות עמידות מרובות באמצעות האפליקציה IR-TEx ולאחר מכן מאומת פונקציונלית על ידי גישות גנומיקה1.

המתואר כאן הוא גישה צעד-אחר-צעד כדי להשתמש ב-IR-TEx, הן באינטרנט והן כאשר מותקנים באופן מקומי. הפרוטוקול מתאר כיצד ניתן לשלב ערכות נתונים של התנגדות קוטל חרקים חדשים לתוך החבילה הקיימת ומסבירה כיצד לפעול עם מידע חסר. לבסוף, הוא מתאר כיצד להשתמש בתוכנה זו עם ערכות נתונים אחרות של omics שאינן קשורות להתנגדות לקוטל חרקים, ובכך שילוב נתונים מגישות שונות-omics תוך הפעלה גם עם ערכים חסרים ונורמליזציה, כך שהנתונים הם דומים.

Protocol

1. שימוש ביישום האינטרנט IR-TEx

  1. הפעלת היישום בדפדפן אינטרנט
    1. פתח את יישום האינטרנט של IR-TEx על-ידי ביצוע הקישור שבתחתית הדף שנמצא ב- http://www.lstmed.ac.uk/projects/IR-TEx.
    2. לאחר אתחול דף האינטרנט, לחץ על לחצן היישום שבראש הדף, שיציג את היישום והתפוקות המשויכות.
    3. קרא כל פלט הקשור לערך ברירת המחדל של AGAP008212-RA (CYP6M2) בתיבה מזהה התמליל עם התנאים הבאים: מערכות נתונים של coluzzii שנמצאות (i) חשופות לקוטלי חרקים או (ii) שלא נחשפו לשום מחלקת קוטל חרקים, והתעתיקים המשויכים עם התאמה של | r | . > 0.98
  2. לחקור ביטוי של תעתיק של עניין
    1. כדי לבחור תעתיק של עניין, הקלט את מזהה התמליל בתיבה מזהה התמליל, וזכור כי התעתיקים מסתיימים ב -RX התלויים בסוג הריבית.
    2. בחר את ערכות הנתונים לחקור על-ידי תקתוק התיבות הרלוונטיות עבור מדינות (i); (2) מעמד החשיפה (iii) מין עניין; ו-(iv) מעמד של קוטל חרקים, ובכל זאת, תוך הקפדה על כך שקריטריונים אלה יגרמו ל-> 1 לכלול ערכת נתונים (ראה טבלה משלימה 1 בלינגהאם et al.1).
      הערה: (iii) מתייחס לחבר במתחם המינים של ה -gambiae שהמשתמש מעוניין בו. נכון לעכשיו, הנתונים זמינים עבור . coluzzii ו -...
    3. לחץ על עדכן תצוגה בתחתית תפריט הבחירה או לחץ על החזרוהתעלם מערך מתאם מוחלט (כיום).
    4. תן ליישום זמן לעדכן.
    5. קרא את הגרף הראשון בתור: שינויהקיפול של יומן הרישום בין אוכלוסיה עמידה לבין אוכלוסיית יתושים הרגישים למעבדה של תעתיק הריבית בכל ערכת נתונים העונה על הקריטריונים שנבחרו בשלב 1.2 (איור 1). הפרטים של כל ערכות הנתונים ניתן למצוא ב-לנגהם et al.1.
    6. קרא את המידע מתחת לגרף בתור: השינויים בקיפול בין היתושים העמידים והרגישים לכל ערכת נתונים רלוונטית, בנוסף לערכי p המתוקן (Q). כל שורה מייצגת בדיקה בודדת במיקרו-מערך. המתודולוגיה עבור תצוגה גרפית דווחה בעבר1.
    7. קרא את הטבלה הנוספת להלן כמספר הניסויים שבהם תעתיק הריבית משמעותי, כמו גם את המספר הכולל של הניסויים התואמים את הקריטריונים שנבחרו בשלב 1.2.
    8. כדי להוריד את הנתונים בתבנית המופרדת באמצעות טאבים, לחץ על לחצן ההורדה תחת שתי הטבלאות. הדבר מאפשר למשתמש לחקור נתונים בצורה קלה יותר באמצעות תוכנית כגון Excel.
    9. יש לפרש את המפה כדלקמן: כל נקודה מייצגת את אתרי האוסף המשוער של יתושים עמידים בכל ערכת נתונים שבה תעתיק הריבית מתבטאת באופן מהותי. הצבעים לעקוב אחר מערכת אור התנועה כי הוא הסביר באפליקציה (איור 2).
    10. עבור שלבים 1.2.5 ו-1.2.8, שמור את התפוקות הגרפיות על-ידי לחיצה ימנית, לחיצה על שמור תמונה כ. .., ובחירת תיקיה מתאימה.
      הערה: במקרה של שגיאת פלט על-ידי היישום, סביר להניח שאין ערכות נתונים המתאימות לקריטריונים שאינם מוספים. בדוק את הטבלה השלמה 1 בלינגהאם ואח '1 אם הדבר יתרחש.
  3. זיהוי פונקציות ומסלולים של תעתיק מעניין
    1. קשרי גומלין (מינימום r2 ערך משתנה) של דפוסי הביטוי של תעתיקים על פני ערכות נתונים מרובות ניתן להשתמש כדי לנבא את פונקציית התעתיק ולהבהיר תעתיקים של עותקים מאותו מסלול. שימוש בדוגמה שבין לנגהם ואח '1 (AGAP001076-RA; CYP4G16), בצע את השלבים 1.2.1 – 1.2.2 במקטע לעיל, בחירת כל ערכות הנתונים עבור הכוח המקסימלי.
    2. לפני שתלחץ על ' עדכון תצוגה', העבר את המחוון ' ערך מתאם מוחלט ' ל-0.85 ולחץ על ' עדכן תצוגה ' או על ' החזר'.
    3. בדוק את טבלת המתאם (הטבלה התחתונה ביותר) כדי למצוא את התעתיקים המרובים המוצגים כעת ומתואמים (| r | = 0.85) עם התמליל התואם.
    4. טפל במחוון ערך המתאם המוחלט ובצע שינויים בגרף התחתון ובטבלה התחתונה; התפוקות משלב 1.3.2 הפעולה יישארו ללא שינוי. כפי שמוצג באיור 3 (| r | > 0.9, | r | > 0.8), הפחתת החשיבות של ערך המתאם תראה יותר תעתיקים, אך יציג יותר רעש.
    5. קרא את הטבלה מתחת לפלט הגרפי, אשר (בנוסף לפרמטרים המתוארים בשלב 1.2.6) מכיל את ערך המתאם עבור כל תעתיק.
    6. כדי להוריד את הנתונים בתבנית המופרדת באמצעות טאבים, לחץ על לחצן הורד .
    7. ניתן לבצע ניתוח העשרה פונקציונלי ברשימת מזהי התעתיק שהורדת באמצעות ניתוח דוד8. פעם אחת באתר דוד (נמצא ב https://david.ncifcrf.gov/), בחר ניתוח פונקציונלי. הדבקת רשימת הגנים המלאה, שימוש במזהי גנים [מזהה ללא ה-RX, שניתן לבצע ב-excel על-ידי הוספת עמודה מימין למזהה הסיסטמטי והקלדה = LEFT (X1, 10), כאשר X1 הוא תא המזהה הסיסטמטי]. בחר את המזהה כרשימת VectorBase_ID והגנים ולחץ על רשימת השולחים.
    8. לחץ על לחצן קיבוץ ביאור פונקציונלי כדי להניב מבט כולל על הenrichments שנמצאו ברשת מתאם זו, דבר המאפשר להקצות פונקציה פוטנציאלית לתמליל. חקור enrichments מעמיק על-ידי התבוננות בקטגוריות השונות ולחיצה על לחצני + עבור כל אחד ולאחר מכן לחיצה על תרשים.

2. הורדה ויישום של IR-TEx באופן מקומי

  1. הורדה והפעלה של IR-TEx
    1. עבור אל הקישור שנמצא ב- http://github.com/LSTMScientificComputing/IR-TEx; ולחץ על שיבוט או על הורד | הורד Zip. ישירות לתיקיית הבחירה ולפתוח את הקובץ בתיקייה זו.
    2. הורד את הגירסה העדכנית ביותר של תוכנת R עבור מערכת ההפעלה המתאימה מהקישור שנמצא ב- http://cran.r-project.org/mirrors.html. התקן את התוכנית.
    3. הורד והתקן את תוכנת R Studio העדכנית ביותר, שוב עבור מערכת ההפעלה המתאימה מהקישור שנמצא ב- http://www.rstudio.com/products/rstudio/download/.
    4. לאחר ההתקנה, פתח סטודיו R | קידוד משלים קובץ 1 ולהפעיל כל שורה כדי להגדיר את המערכת עבור IR-TEx.
    5. לאחר כל החבילות מותקנים ומעודכנים בהצלחה כנדרש, עבור לקובץ | פתח, אתר את IR-TEx. R, האר ופתח. זה אמור להיות גלוי כעת בחלון העליון של R Studio.
    6. כדי להפעיל את האפליקציה, לחץ על הלחצן הפעל app בקצה הימני העליון של החלון, וחלון שני יצוץ שבו האפליקציה תטען. לאחר השלמת הטעינה, לקבלת פונקציונליות מלאה לחץ על פתח בדפדפן הממוקם בחלק הימני העליון של החלון שנטען.
  2. הוספת ערכות נתונים התנגדות ל-IR-TEx (שנוצר באמצעות אנופלס gambiae 15k מערך Agilent)
    1. כדי להוסיף ערכת נתונים מנותח חדשה שנוצרה על פלטפורמת microarray זהה (A-MEXP-2196) למערכת הנתונים הזמינה, הורד את האפליקציה ואתר את התיקייה הנפתחת שהורדת בסעיף 2.1.
    2. פתח קובץ נוסף 1, המייצג פלט מניתוח limma על a-mexp-2196 1. באמצעות Excel, בעמודה H1, כתיבה Fold_Changeו-H2, כתוב = 2 ^ B2, שבו B2 הוא שינוי קיפול היומן. החל זאת בעמודה H כדי ליצור שינויי קיפול גולמיים.
    3. סדר קובץ נוסף 1 כגון עמודה A הוא המזהה, עמודה b הוא שינוי הקיפול מעמודה h (העתק עמודה h, סמן עמודה b, לאחר מכן לחץ לחיצה ימנית והדבק ערכים) ועמודה C היא ערך ה-p המותאם. מחק את כל העמודות האחרות ושמור כקובץ מופרד באמצעות טאבים.
    4. פתח את קובץ הקידוד המשלים 2 והפעל באמצעות הגיליון המופרד באמצעות טאבים המיוצר בשלב 2.2.3.
      NEWFILE_FC = c (' מדינה ', ' מצב חשיפה ', ' מינים ', ' קוטל חרקים ')
      NEWFILE_Q = c (' מדינה ', ' מצב חשיפה ', ' מינים ', ' קוטל חרקים ')
      הערה: יש לשנות שדות במרכאות בודדות כדי לשקף מידע מערכת הנתונים החדשה. מצב החשיפה מתייחס אם הדגימות נאספו בעקבות חשיפה לקוטל חרקים (נחשף/לא נחשף). קוטל חרקים: אם ' חשוף ', השתמש באפשרות ' ללא '. ראה Fold_Changes txt. למטא-נתונים מדגימות אחרות. ודא שאיות הוא עקבי.
    5. פתח את גאוגרפיה. txt, גלול אל השורה האחרונה שנכבשה ובחר להלן. הקלד את שם ערכת הנתונים, ואחריו Q ו- NEWFILE_Q בעמודה 1, קו הרוחב של אתר אוסף המדגם בעמודה 2, והאורך בעמודה 3. שמור את השינויים.
    6. אם נעשה שימוש בערכים החדשניים (כלומר, גמביה), שאינם זמינים לבחירה בערכת הנתונים (ראה למשל, הטבלה המשלים 11), יש להוסיף את אלה לקוד. כדי לעשות זאת, פתח את IR-TEx. R ב-RStudio ואתר את קו 26 כפי שמצוין על-ידי RStudio, באיזו נקודה הבאים צריכים להתחיל:
      '.. .
      הערה: כל אחת משורות ההליך מתייחסת לפריט של מטא-נתונים הנכנסים לשורות שמתחת לשם קבוצת הנתונים ב-Fold_Changes. txt בשלב 2.2.5.
    7. כדי להוסיף את המטא-נתונים החדשניים, גלול לסוף קו המטא-נתונים של הבחירה, ואתר את המונח ' נבחר = '. מיד לאחר מכן צריך להיות מסגרת פסיק וסוגר סגור; בשלב זה, לחץ על הסמן בתוך הכן הסגור. לאחר הגרש האחרון, הקלד פסיק, ואחריו גרש, ואחריו המטה-נתונים החדשים (למשל, ' גמביה '), ושמור את השינויים. ראה להלן דוגמה.
      , "בורקינה פאסו", "השנהב", "מדינה" קמרון ', ' גינאה המשוונית ', ' זמביה ', ' טנזניה ', ' סודאן ', ' אוגנדה ', טוגו ', ' גמביה '', נבחר = c (' בורקינה פאסו ', ' השנהב ', ' ', ' קמרון ', ' גינאה המשוונית ', ' זמביה ', ' טנזניה ', ' סודאן ', ' אוגנדה ', ' טוגו
    8. . תריץ את האפליקציה ערך המטא-נתונים החדש אמור להופיע כתיבת שנתות שלא נבחרה תחת הכותרת הרלוונטית. אם המשתמש רוצה שהוא ייבחר, יש להוסיף אותו לאחר שנבחר = c (..., כפי שמוצג להלן:
      , "בורקינה פאסו", "קוט השנהב", "קמרון", "כניסת מדינה", בחר מדינות רלוונטיות גינאה המשוונית ', "זמביה", ' טנזניה ', ' סודאן ', ' אוגנדה ', "טוגו", " גמביה", נבחר = c (' בורקינה פאסו ', ' השנהב ', ' ' בשנת '),' ' מהגינאה המשוונית ', ' ' משנת ' ' ' ' של ' ' ' ' ', ' משנת ',
    9. כדי להוסיף מערכות נתונים התנגדות שאינן מתבצעות ב-A-MEXP-2196, ראה סעיף 3.

3. שינוי IR-TEx לשימוש עם ערכות נתונים שונות

  1. שימוש בפלטפורמות מרובות-omics והמשך בנתונים חסרים
    1. כדי להמשיך ב-"0" בערכות נתונים: עיין במקור ערכת הנתונים עבור המשמעות הספציפית של "0". מומלץ ל-"0" (שמרני) להיות מוחלף ב-"NA". כמו עם שינויי קיפול גולמיים (B/A), "0" מציין אות שאינו מזוהה במצב ניסיוני B. במקרה שהמצב הנסיוני המוצגים מוצגים ביטוי משמעותי, המשתמש יכול להחיל ערך שינוי קטן בקיפול.
    2. פתח קובץ נוסף 2. txt, קובץ RNAseq המותאם מתוך ההגאי ואח '9. קובץ זה מייצג את התבנית שבה יש לבסס נתונים חדשים: עמודה A = מזהה, עמודה B = שינוי קיפול גולמי ועמודה C = מותאם לערך p. השתמש בקובץ זה כדי לפעול בשלבים הבאים.
    3. הפעל את קוד R כדי להתאים מזהים לקובץ מופרד באמצעות טאבים בודד על-פני פלטפורמות, ולאחר מכן ארגן ונרמל את הנתונים (קידוד משלים בקובץ 2). הוראות כלולות בתוך הקובץ. כל FILEPATH יופרד באמצעות "/" עבור MacOS או "//" עבור Windows (שינוי אלה מתוך "\", כפי שהם יופיעו).
    4. פלט את הקובץ המיוצר בסוף של קידוד משלים קובץ 2 למיקום של בחירה לשימוש בשלב 3.1.5. משלימה קידוד קובץ 2 יהיה פלט קובץ Fold_Changes. txt החדש. גבה את הקובץ המקורי.
    5. הפעל את הקוד הכלול בקידוד משלים קובץ 3. חפש את קובץ הפלט בשם FC_distribPlot. png בתיקיה שצוינה כ- filepath. בדוק את ההפצות של שינוי הקיפול של יומןהרישום כדי לוודא כי ההפצות של שינוי הקיפולשל יומן הרישום כמעט זהות בין ערכות נתונים.
    6. בצע את ההוראות משלב 2.2.6 כדי לערוך קבצים נוספים ולהבטיח תאימות של ה -Fold_Changes. txtהחדש.
  2. שינוי IR-TEx לשימוש עם ערכות נתונים חדשות לחלוטין
    1. פתח את IR-TEx. R ב-rstudio ואתר את הקווים (23 – 34) המתחילים ב:
      'tabpanel ('
      ומסתיימת ב:
      לחצן שליחה ("תצוגת עדכון", סמל ("רענן"))
      ),
    2. שנה את ה -AGAP008212-RA שנמצא בשורות שמתחת לתעתיק של עניין בנתונים החדשים.
      טקטישים (' textInput שמה ', ' תעתיק ', ערך = ' AGAP008212-RA '),
    3. אתר את ארבע האפשרויות המתחילות באפשרות:
      מבדוק בוקגרופינשים (
      ניתן לשנות אפשרויות אלה כדי לייצג מטא-נתונים חשובים שהמשתמש מבקש לסנן את הנתונים החדשים על-ידי. בכל מקרה, על המשתמש לשנות את המדינות הרלוונטיות בחר; בחר מצב חשיפה; בחר מינים רלוונטיים; ובחר מחלקת קוטל חרקים כדי לייצג את הנתונים (כלומר, בחר סוג רקמה; בחר מין; בחר בסוגר גיל; בחר מצב מחלה).
    4. זהה את המטא-נתונים המשויכים לערכת הנתונים ולקלט כדי להחליף את האפשרויות הקיימות מיד לאחר ה-c הראשון ('. בכל מקרה, האפשרויות יהיו כלולות בתוך סימוני דיבור ומופרדות מהבחירה הבאה בפסיק. לאחר הבחירה הסופית, יש לסגור את הכן. דוגמה לבחירת מצב מחלה היא:
      c (' נגוע ', ' נגוע ', ' לא ידוע ')
    5. בחר אילו מתוך מטה-נתונים אלה ייבחרו בעת פתיחת האפליקציה. ניתן לשנות אותן על-ידי שינוי האפשרויות לאחר הבחירה = c ('. דוגמה לבחירת מצב מחלה היא:
      נבחר = c ("נגוע", "נגוע")
      פעולה זו תנחה את היישום לבחור רק ערכות נתונים המתאימות לקריטריונים אלה בטעינה ראשונית.
    6. כדי ליצור טבלת נתונים חדשה, פעל בעקבות הפריסה שנמצאה ב -Fold_Changes. txt ובהוראות בסעיף 2. שנה את המטא-נתונים לכל שינוי בהתאמה המתואר בשלב 3.2.4, בדיוק כפי שכתוב בקוד (R הוא תלוי רישיות). לתוך טור דטוקסיפיקציה, שמות גנים של קלט, ובעמודת סוג התמליל, תיאורים של גן קלט עבור כל תעתיק. בצע את סעיף 3.2 בעת הוספת ערכות נתונים חדשות.
    7. אם המיפוי אינו רלוונטי לדרישות הנסיוניות, אתר את השורות הבאות של קוד ומקום ' ' בחזית:
      קווים 49 – 51:
      br (), br (),
      עם טווה ("גאוגרפיה") (plotOutput),
      textOutput (' Geography_legend '),
      שורות 493 מתחילות:
      פלט $ גיאוגרפיה מגרש < עיבודים ({
      לשורה 602 הסיום:
      פלט $ Geography_legend טקסט < עיבודים ({
      הדבק ("תעתיקים משמעותיים בלבד" (p), בתור ביטוי ("< ="), "0.05): FC > 5 = אדום, FC > 1 = ענבר, FC < 1 = ירוק", ספט = "")
      })

Representative Results

באמצעות הקובץ Fold_Changes. txt הכלול עם IR-TEx, השוונו את התעתיקים שהיו משמעותית באופן משמעותי ביטא אנופלס coluzzii ו אנופלס gambiae datasets לפקדים רגישים מחוף השנהב ו בורקינה פאסו. הדבר הניב 18 תעתיקים של ריבית (טבלה 1; ניתן לבצע חיפוש זה באמצעות Excel, R או תוכניות אחרות). שניים אלה, ATPase (AGAP006879) ו α-crystallin (AGAP007160), דווחו בעבר, עם לשעבר יש השפעה משמעותית על התנגדות pyreגרון1. בנוסף לשני התעתיקים הללו, שתי תעתיקים של הדטוקסיפיקציה, GSTMS1 (fc 1.95 ו-1.85) וUGT306A2 (fcμ = 2.29 ו-2.28) היו נוכחים.

האימות qPCR של שניים מהתעתיקים הללו (GSTMS1, תעתיק של דטוקסיפיקציה, ו-AGAP009110-RA, תמליל לא ידוע, המכיל מתחם מאגד של β-1, 3-glucan) בוצעו כמתואר בעבר1. הניתוח בוצע באמצעות סטים מבוססי שתוארו בקובץ 3 נוסף והראה כי התעתיקים הללו היו מוקדמים ביותר באוכלוסייה מרובת-השנהב (Tiassalé) ועוד אחת מ בורקינה פאסו (בפורה), לעומת המעבדה הרגישה n Gousso (איור 4א).

כפי ששני התעתיקים הראו upregulation משמעותיים בכל האוכלוסיות העמידות, המכונה RNAi-המושרה בוצעה על יתושים ממושבת LSTM מעבדה Tiassalé. מושבה זו נובעת מחוף השנהב והיא מתנגדת לכל כיתות הגדולות של קוטל חרקים המשמש בבריאות הציבור, כפי שמתואר בעבר1,10. הנחת הביטוי של GSTMS1 הביא לעלייה משמעותית (p = 0.021) בתמותה לאחר חשיפה דלטמרתין רין לעומת שולטת gfp-מוזרק, הוכחת את החשיבות של תעתיק זה בהתנגדות pyreגרון (איור 4ב). לעומת זאת, AGAP009110-RA מסקרה הביא ללא משמעות (p = 0.082) שינוי תמותה לאחר החשיפה (איור 4ב).

GSTMS1 הוא gt מיקרוזומבית והוא אחד משלושה נמצאו יתושים gambiae 11. למרות שחברי אפסילון ו דלתא של מחלקות הגנוסטים היו מעורבים בעבר בקוטל הרעלים12,13,14, זוהי ההוכחה הראשונה לידע שלנו לתפקיד של מיקרוזומנים ההתנגדות של פירגרון15. כדי לחקור את הפונקציה הפוטיבית של תעתיק זה ב- אנופלס gambiae sl היתושים, הביטוי והקורלציה ב-IR-TEx זוהו. GSTMS1 התבטא באופן משמעותי ב -20 מתוך 21 מערכות נתונים הזמינות עבור מינים אלה, למעט האי ביוקו. בכל מיקום, ביטוי היתר היה פחות מחמש-קיפול בהשוואה לאוכלוסיות החשופות (איור 5).

כמו GSTs מיקרוזומיום התעלמו במידה רבה ככל הפוטנציאל לרעלים קוטל חרקים, מעט ידוע על תפקידם בהתנגדות לקוטל חרקים15. על-ידי לחקור את המתאם המשותף של תעתיקים אחרים, ניתן להבהיר פונקציות באמצעות ההנחה של coregulation או מעורבות במסלולים אותם. כדי למקסם את העוצמה ברשת המתאם, כל ערכות הנתונים של המיקרו-מערך הקיימות ב-IR-TEx נבחרו, וכן | r | של > 0.75 נבחר. Table 2 מציג את הפלט מ-IR-TEx.

התעתיקים הללו מועשרים בפעילות מחמצן ומטבוליזם של גלוקוז/פחמימות בכלי הביאור הפונקציונלי של דוד8. גם גלוקוז-6-פוספט דהידרוגנאז ו cytathione גמא-lyase לשמור על רמת הגלוטתיון בתאי היונקים16,17 וכך לקשר ישירות עם GSTMS1, גלוטתיון-S-transferase. קטלאז הוא משחק מהיר למתח חמצוני משיב המגנה על התאים מפני נזק מיני חמצן תגובתי, תוצר לוואי של חשיפה pyreגרון. הידרולז הוא הידרוקלז שעשוי לשחק תפקיד בדטוקסיפיקציה בתאי היונקים18. CYP4H17 קיים גם ברשת המתאם. ציטוכרום p450s הם ישירים חילוף החומרים של קוטלי החרקים pyreגרון, ואת המוצרים האלה התמוטטות יכול להיות נוסף מטבוליזם על ידי GSTs. לבסוף, CYP4H17 היה מעורב התנגדות pyre, ב 19. ביחד, נתונים אלה תומכים מאוד בתפקיד עבור GSTMS1 בדטוקסיפיקציה של xenobiotic יוטי.

Figure 1
איור 1: שינוי קיפול של Log2 של AGAP002865-RA בכל ערכות הנתונים. ציר ה-x מפרט את ערכות הנתונים השונות, מידע שניתן למצוא בטבלה משלימה 1 בפרסום קודם1, וציר ה-y מציג את שינויהקיפול של יומן הרישום בתעתיק הריבית. הקווים האפורים-בהירים מצביעים על סף משוער של משמעות, שנלקח כאן כדי להיות שינוי מתקפל של < 0.8 או שינוי מתקפל של > 1.2. הקו השחור המנוקד מציין שינוי מתקפל של 1 (כלומר, אין הבדל בביטוי בין האוכלוסיות העמידות והחשופות). אנא לחץ כאן כדי להציג גירסה גדולה יותר של איור זה.

Figure 2
איור 2: הפצת מיקרומערכים המראים ביטוי דיפרנציאלי משמעותי של AGAP002865-RA באוכלוסיות עמידות. שינויי קיפול מיוצגים במערכת הרמזורים: שינוי קיפול ירוק של < 1, שינוי קיפול כתום של > 1 ושינוי קיפול אדום של > 5. רק מערכות נתונים עם ביטוי דיפרנציאלי משמעותי (p ≤ 0.05) מוצגים. אנא לחץ כאן כדי להציג גירסה גדולה יותר של איור זה.

Figure 3
איור 3: רשתות מתאם של AGAP001076-RA (CYP4G16). קשרי גומלין של זיווגים מחושבים על-פני כל התעתיקים על-פני 31 ערכות הנתונים של המיקרו-מערך, עם החלת החתך המוגדר על-ידי המשתמש. המוצגכאן הוא (א) | r | > 0.9 ו-(ב) | r | . > 0.8 כל התעתיקים המוצגים על הגרף עונים על קריטריון זה ובצע את שינויי הביטוי של AGAP001076-RA. אנא לחץ כאן כדי להציג גירסה גדולה יותר של איור זה.

Figure 4
איור 4: ביטוי mRNA ופנוטיפ לגבי הנחתה של GSTMS1 ו-AGAP009110-RA. (א) mrna ביטוי של GSTMS1 ו AGAP009110-RA בשתי אוכלוסיות מרובות עמידות בחוף השנהב ובורקינה פאסו, בהתאמה. הרמות הושוו למעבדה הרגישה. .. רמות המובהקות שחושבו על-ידי ANOVA במבחן של דנט הפוסט-הוק. (ב) החליש את שני התעתיקים בהשוואה ל-gfp-הזריקו בקרות. GSTMS1 החליש מראה עלייה משמעותית בתמותה לאחר חשיפה דלטמרתין רין (מחושב על ידי ANOVA עם מבחן tukey לאחר הוק; * p ≤ 0.05, * * p ≤ 0.01). אנא לחץ כאן כדי להציג גירסה גדולה יותר של איור זה.

Figure 5
איור 5: ביטוי של GSTMS1 ב אנופלס gambiae ו אנופלס האוכלוסייה coluzzii . מפה המציגה את הביטוי הדיפרנציאלי הניכר של GSTMS1 בערכות נתונים זמינות של מערך מיקרו. GSTMS1 נמצא להיות דיפרנציאלי באופן משמעותי ב 20 מתוך 21 ערכות נתונים microarray. אנא לחץ כאן כדי להציג גירסה גדולה יותר של איור זה.

מזהה תמליל תיאור/ בורקינה פאסו חוף השנהב
AGAP006879-RA היכל הפאוס 27.94 43.05
AGAP007160-RB א-crystallin 11.49 10.58
AGAP007160-RC א-crystallin 11.14 10.38
AGAP007160-RA א-crystallin 9.78 9.84
AGAP009110-RA לא ידוע 9.26 5.96
AGAP007780-RA נדב דהידרוגנאז 10.49 3.77
AGAP006383-RA גירסת משנה מoligosaccharyltransferase מורכבת 3.69 5.57
AGAP007249-RB טיסה 4.61 3.86
AGAP003357-RA מפעיל חלבון 1-RAG1 4.31 4.05
AGAP007249-RA טיסה 4.48 3.46
AGAP001998-RA mRpS10 3.46 2.85
AGAP007589-RA UGT306A2 2.29 2.28
AGAP000165-RA GSTMS1 1.95 1.85
AGAP002101-RA איאולאוסייל-tRNA חומרים הבורסה 0.57 0.59
AGAP002969-RA asparaginyl-tRNA חומרים הבורסה 0.45 0.45
AGAP004199-RA הובלה משפחתית 5 (נתרן בשילוב טרנספורטר monocarboxylate אוחר), חבר 8 0.35 0.48
AGAP004684-RA rRNA-עיבוד חלבון CGR1 0.36 0.22
AGAP006414-RA Cht8 0.024 0.36

טבלה 1: התעתיקים הדיפרנציאליות באופן משמעותי באותו כיוון שינוי מתקפל על פני אוכלוסיות בורקינה פאסו וחוף השנהב. מזהה התמליל, תיאור הגנים ושינוי הקיפול הממוצע עבור כל ערכת נתונים משתי המדינות המייצגות את ה . coluzzii ו-a. האוכלוסייה gambiae .

מתאם שם שיטתי תעתיק מכתב
1 AGAP000165-RA GSTMS1
0.82 AGAP004904-RA קטלאז
0.76 AGAP007243-RA משנה 8 של פרוטאז הרגולטורים
0.79 AGAP008358-RA CYP4H17
0.76 AGAP009436-RA ואלאקרוקלוביר הידרולז
0.75 AGAP010739-RA גלוקוז-6-פוספט 1-דהידרוגנאז
0.85 AGAP011172-RA ציסטטטין גמא-ליאז
0.76 AGAP012678-RA גלוקוז-6-פוספט 1-דהידרוגנאז

שולחן 2: התעתיקים בקורלציה עם GSTMS1. הטבלה מציגה פלט של רשת המתאם עבור GSTMS1 ב-IR-TEx עם | r | של > 0.75. הטבלה מציגה את הקורלציה, התעתיק ותיאור הגן של הספרמן עבור כל תעתיק בקורלציה משותפת.

קובץ נוסף 1: קובץ הפלט מ-MEXP-2196 מערך שנותחו על limma. הקובץ נובע מהנוק- אין לעומת מערך בקרת gfp , המתואר בפירוט רב יותר ב-Arrayexpress (E-mtab-4043) ובפרסום קודם אחר1. עמודות מייצגות את מזהה ה-AGAP (סיסטמטישם), שינוי קיפול של יומן (logFC), ערכי ביטוי יומן רישום (וכלי), סטטיסטיקת t (t), ערך p לא מתוקן (P. Value), המותאם לערך p (ת'). פ. ואל) ו-B סטטיסטיקה (ב)20. לצורך הקובץ הזה, היתושים הם אנופלס coluzzi מ חוף השנהב והם חשופים לקוטלי החרקים, עם רוחב האוסף קו האורך של-5.4 ו 6.0, בהתאמה. אנא לחץ כאן כדי להציג קובץ זה (לחץ לחיצה ימנית כדי להוריד).

קובץ נוסף 2: קובץ פלט מניסוי RNAseq. ניתוח RNAseq שנלקח מאאוהלג'י ואח '9 המתאר שינויים בטרנססקריפט של אנופלס יתושים כאשר הם חשופים ל-50% מליחות. קובץ זה מותאם מלוח S2 של הפרסום וכולל את מזהה ה-AGAP (סיסטמאיד), שינוי קיפול גולמי (Fold_Change) ומותאם לערך p (q_value). אנא לחץ כאן כדי להציג קובץ זה (לחץ לחיצה ימנית כדי להוריד).

קובץ נוסף 3: פריימר רשימה עבור תוצאות הנציג. מזהה AGAP, שם גן, dsRNA קדימה, dsRNA הפוכה, qPCR קדימה, ו-qPCR היפוך התחל סטים עבור כל תעתיק. אנא לחץ כאן כדי להציג קובץ זה (לחץ לחיצה ימנית כדי להוריד).

קידוד משלים קובץ 1. אנא לחץ כאן כדי להציג קובץ זה (לחץ לחיצה ימנית כדי להוריד).

קידוד משלים קובץ 2. אנא לחץ כאן כדי להציג קובץ זה (לחץ לחיצה ימנית כדי להוריד).

קידוד משלים קובץ 3. אנא לחץ כאן כדי להציג קובץ זה (לחץ לחיצה ימנית כדי להוריד).

Discussion

הטרנססקריפט הגדול מייצרת רשימות של אלפי תעתיקים אשר מבוטאים באופן מהותי לכל מצב ניסיוני. רבים של ניסויים אלה מבוצעים על אורגניזמים קשורים ופנוטיפים וכמעט באופן בלעדי מנותח כניסויים עצמאיים. ניצול אלה מקורות נתונים עשירים על ידי בחינת הנתונים הוליסטי וללא הנחות תאורטית יהיה 1) להוביל זיהוי של תעתיקים המועמדים החדשים 2) למנוע את השלכת של נתונים יקרי ערך פשוט כי יש יותר מדי מידע כדי לאמת ב vivo1.

IR-TEx מספק למשתמשים רקע מוגבל בביואינפורמטיקה עם היכולת לבחון בקלות ערכות נתונים מרובות, להמחיש את השינויים בערכות הנתונים ולהוריד את המידע המשויך1. למרות ש-IR-TEx אינו תומך בחיפוש יותר מתמליל אחד בכל חיפוש, משתמשים יכולים לבדוק את קבצי ה-Fold_Changes. txt המשויכים פשוט על-ידי שימוש ב-Excel, R או בתוכניות מתאימות אחרות. השירות הנוסף של IR-TEx נובע השימוש ברשתות מתאם כדי לחזות את הפונקציה תעתיק, קלט של חלבונים היפותטי או תעתיקים עם פונקציות לא ידועות ושימוש של תוכנת מטה לחפש enrichments1.

בדוגמה המתואר בפרוטוקול זה, IR-TEx משמש בהתאם לתפקודו המקורי. כאן, זה מאפשר חקירה של תעתיקים הקשורים התנגדות קוטל חרקים ויזואליזציה של התפלגות מעל ומתחת ביטוי באמצעות מיפוי גרפיקה. התעתיקים של הריבית מאומתים ב-vivo כדי לקבוע אם ביטוי או מתחת של התעתיקים הנתון תורם לפנוטיפ שנצפה1 (למשל, עמידות לקוטל חרקים). הוא הוצג כאן, כפי שדווח בעבר1, כי ניתן להשתמש בערכת נתונים בגישה מונחה השערות כדי לזהות תמלילים של עניין על בסיס ספציפי למדינה. לאחר מכן ניתן להשתמש ב-IR-TEx ל-1) לחקור את הביטוי של התעתיק ו-2) את פונקציית התעתיק על-ידי החלת רשת מתאם זיווגים חכמה בכל התעתיקים הכלולים בערכת נתונים של כל הפונקציות. כאן, GSTMS1 הוכח להיות בקורלציה משותפת עם מספר תעתיקים אחרים מעורבים דטוקסיפיקציה. נתונים אלה (יחד עם משנוק של התעתיק שגרם לעלייה משמעותית בתמותה לאחר חשיפה לקוטל חרקים) ממחיש את החשיבות של התעתיק הזה בסיווג xenobiotic יוטי.

IR-TEx מייצג משאב בעל ערך לחקר תעתיקים של התנגדות לקוטלי חרקים באינטרנט או באמצעות יישומים מקומיים. פרוטוקול זה מדגים כיצד לשנות את IR-TEx עבור פלטפורמות שונות של omics, כמו גם נתונים חדשים לחלוטין. המדריך מדגים כיצד להשתמש ב-IR-TEx כדי לשלב נתונים מפלטפורמות מרובות omics ו-datasets עם נתונים חסרים, כמו גם כיצד לבטל את IR-TEx פשוט כך שהוא שימושי עבור כל מי שחוקר מערכות נתונים transcript.

Disclosures

. למחברים אין מה לגלות

Acknowledgments

עבודה זו ממומנת על ידי מלגת פיתוח מיומנויות MRC כדי V.I. (MR/R024839/1) ו רויאל החברה אתגר המענק (CH160059) כדי משאבי אנוש

Materials

Name Company Catalog Number Comments
Laptop with browser Any - -
R Program The R Project for Statistical Computing - https://www.r-project.org/
R Studio R Studio - https://www.rstudio.com/

DOWNLOAD MATERIALS LIST

References

  1. Ingham, V. A., Wagstaff, S., Ranson, H. Transcriptomic meta-signatures identified in Anopheles gambiae populations reveal previously undetected insecticide resistance mechanisms. Nature Communications. 9, (1), 5282 (2018).
  2. Chang, W., Cheng, J., Allaire, J., Xie, Y., McPherson, J. shiny: Web Application Framework for R. (2017).
  3. Bhatt, S., et al. The effect of malaria control on Plasmodium falciparum in Africa between 2000 and 2015. Nature. 526, (7572), 207-211 (2015).
  4. Ranson, H., Lissenden, N. Insecticide Resistance in African Anopheles Mosquitoes: A Worsening Situation that Needs Urgent Action to Maintain Malaria Control. Trends in Parasitology. 32, (3), 187-196 (2016).
  5. Donnelly, M. J., et al. Does kdr genotype predict insecticide-resistance phenotype in mosquitoes. Trends in Parasitology. 25, (5), 213-219 (2009).
  6. Stevenson, B. J., et al. Cytochrome P450 6M2 from the malaria vector Anopheles gambiae metabolizes pyrethroids: Sequential metabolism of deltamethrin revealed. Insect Biochemistry and Molecular Biology. 41, (7), 492-502 (2011).
  7. Müller, P., et al. Field-Caught Permethrin-Resistant Anopheles gambiae Overexpress CYP6P3, a P450 That Metabolises Pyrethroids. PLoS Genetics. 4, (11), 1000286 (2008).
  8. Huang, D., et al. The DAVID Gene Functional Classification Tool: a novel biological module-centric algorithm to functionally analyze large gene lists. Genome Biology. 8, (9), 183 (2007).
  9. Uyhelji, H. A., Cheng, C., Besansky, N. J. Transcriptomic differences between euryhaline and stenohaline malaria vector sibling species in response to salinity stress. Molecular Ecology. 25, (10), 2210-2225 (2016).
  10. Edi, C. V., Benjamin, K. G., Jones, C. M., Weetman, D., Ranson, H. Multiple-Insecticide Resistance in Anopheles gambiae Mosquitoes, Southern Côte d’Ivoire. Emerging Infectious Diseases. 18, (9), 1508-1511 (2012).
  11. Ding, Y., Ortelli, F., Rossiter, L., Hemingway, J., Ranson, H. The Anopheles gambiae glutathione transferase supergene family: annotation, phylogeny and expression profiles. BMC Genomics. 4, (1), 1-16 (2003).
  12. Enayati, A. A., Ranson, H., Hemingway, J. Insect glutathione transferases and insecticide resistance. Insect Molecular Biology. 14, (1), 3-8 (2005).
  13. Ranson, H., et al. Identification of a novel class of insect glutathione S-transferases involved in resistance to DDT in the malaria vector Anopheles gambiae. The Biochemical Journal. 359, 295-304 (2001).
  14. Riveron, J. M., et al. A single mutation in the GSTe2 gene allows tracking of metabolically based insecticide resistance in a major malaria vector. Genome Biology. 15, (2), 27 (2014).
  15. Pavlidi, N., Vontas, J., Van Leeuwen, T. The role of glutathione S-transferases (GSTs) in insecticide resistance in crop pests and disease vectors. Current Opinion in Insect Science. 27, 97-102 (2018).
  16. Salvemini, F., et al. Enhanced glutathione levels and oxidoresistance mediated by increased glucose-6-phosphate dehydrogenase expression. Journal of Biological Chemistry. 274, (5), 2750-2757 (1999).
  17. Deplancke, B., Gaskins, H. R. Redox control of the transsulfuration and glutathione biosynthesis pathways. Current Opinion in Clinical Nutrition & Metabolic Care. 5, (1), (2002).
  18. Puente, X. S., López-Otn, C. Cloning and expression analysis of a novel human serine hydrolase with sequence similarity to prokaryotic enzymes involved in the degradation of aromatic compounds. Journal of Biological Chemistry. 270, (21), 12926-12932 (1995).
  19. Riveron, J. M., et al. Genome-wide transcription and functional analyses reveal heterogeneous molecular mechanisms driving pyrethroids resistance in the major malaria vector Anopheles funestus across Africa. G3: Genes, Genomes, Genetics. 7, (6), 1819-1832 (2017).
  20. Smyth, G. K. Linear models and empirical bayes methods for assessing differential expression in microarray experiments. Statistical Applications in Genetics and Molecular Biology. 3, (1), 3 (2004).

Comments

0 Comments


    Post a Question / Comment / Request

    You must be signed in to post a comment. Please or create an account.

    Usage Statistics