Transcriptomic ניתוח

Genetics

Your institution must subscribe to JoVE's Genetics section to access this content.

Fill out the form below to receive a free trial or learn more about access:

 

Summary

גלקסי והדוד צמחו ככלים פופולריים המאפשרים לחוקרים ללא הכשרה ביואינפורמטיקה לנתח ולפרש נתוני RNA-seq. אנו מתארים פרוטוקול לחוקרי אלגנס לבצע ניסויים-Seq RNA, גישה ולעבד את הנתונים באמצעות גלקסי ולקבל מידע ביולוגי משמעותי מרשימות הגן באמצעות DAVID.

Cite this Article

Copy Citation | Download Citations

Amrit, F. R., Ghazi, A. Transcriptomic Analysis of C. elegans RNA Sequencing Data Through the Tuxedo Suite on the Galaxy Project. J. Vis. Exp. (122), e55473, doi:10.3791/55473 (2017).

Please note that all translations are automatically generated.

Click here for the english version. For other languages click here.

Abstract

סידור הדור הבא (NGS) טכנולוגיות חוללו מהפכת אופי החקירה ביולוגית. מתוכם, רצף RNA (RNA-seq) התפתחה ככלי רב עוצמה לניתוח גנטי ביטוי ומיפוי transcriptome. עם זאת, טיפול מערכי נתונים-Seq RNA דורש מומחיות חישובית מתוחכמת מציב אתגרים טמונים עבור חוקרי ביולוגיה. צוואר הבקבוק הזה כבר מיתנה ידי פרויקט גלקסי גישה פתוחה המאפשרת למשתמשים ללא כישורים ביואינפורמטיקה לנתח נתוני Seq RNA, ואת מסד ביאור, ויזואליזציה, משולב דיסקברי (דוד), ג'ין אונטולוגיה (GO) בסוויטה ניתוח ארוך המסייע לגזור משמעות ביולוגית מ ערכות נתונים גדולות. עם זאת, עבור משתמשים לראשונה וביואינפורמטיקה חובבנים, למידה עצמית והכרתי עם פלטפורמות אלה יכולים להיות זמן רב מרתיע. אנו מתארים עבודה פשוטה אשר יסייעו לחוקרים אלגנס לבודד RNA תולעת, לערוך ניסוי RNA-seqולנתח את הנתונים באמצעות פלטפורמות גלקסי ודוד. פרוטוקול זה מספק הוראות בשלבים לשימוש מודולים גלקסי השונה עבור גישה לנתוני NGS גלם, מבדקי איכות, יישור, וניתוח ביטוי גני דיפרנציאלי, המנחה את המשתמש עם פרמטרים בכל צעד כדי ליצור רשימת גנים שיכולים להיות מוקרנת על העשרה כיתות גן או תהליכים ביולוגיים באמצעות DAVID. בסך הכל, אנו צופים כי מאמר זה יספק מידע על C. elegans חוקר התחייבות ניסויים-Seq RNA בפעם הראשונה, כמו גם משתמשים תכוף פועלים מספר קטן של דוגמאות.

Introduction

והרצף הראשון של הגנום האנושי, בצע באמצעות שיטת dideoxynucleotide-הרצף של פרד סאנגר, לקח 10 שנים, ועלות כ 3 מיליארדים 1 $, 2. עם זאת, בעוד קצת יותר מעשור מאז הקמתה, הדור הבא רצף (NGS) טכנולוגיה הפכה אותו ניתן לרצף את הגנום האנושי כולו בתוך שבועות ועבורנו 1000 $. מכשירי ניו NGS המאפשרים הולכים וגוברים במהירויות של אוסף רצף נתונים ביעילות מדהימה, יחד עם הפחתות חד בעלויות, הם מהפכה בביולוגיה מודרנית בדרכים בלתי נתפסות כמו פרויקטי רצף הגנום הופכים דבר שבשגרה במהירות. בנוסף, התפתחויות אלה מגולוון התקדמות בתחומים רבים אחרים כגון ניתוח ביטוי גנים באמצעות RNA-רצף (RNA-seq), חקר שינויי אפיגנטיים הגנום כולו, אינטראקציות חלבון דנ"א, וסינון עבור מגוון המיקרוביאלי ב מארחים אנושיים. NGS מבוסס RNA-Seq בפרט אפשר לזהות transcriptomes המפה מקיפה עם דיוק ורגישות, חליף טכנולוגית microarray כשיטת בחירת פרופיל ביטוי. בעוד טכנולוגית microarray נעשה שימוש נרחב, הוא מוגבל על ידי הסתמכותו על מערכים קיימים עם מידע גנומי ידוע, ואת חסרונות אחרים כגון הכלאת צלב מגוון מוגבל של שינויים בביטוי שניתן למדידה באופן מהימן. רנ"א-seq, ומצד שני, יכול לשמש כדי לזהות הן תעתיקי ידועים ובלתי ידועים בעת הפקת רעש רקע נמוך בשל אופי מיפוי ה- DNA חד משמעי שלה. RNA-seq, יחד עם הכלים גנטיים הרבים המוצעים על ידי אורגניזמים מודל כגון שמרים, זבובים, תולעים, דגים ועכברים, שמשו כבסיס תגליות ביו אחרונה רבות וחשובות. עם זאת, אתגרים משמעותיים להישאר שהופכים NGS הנגיש לקהילה המדעית הרחבה יותר, כולל מגבלות אחסון, עיבוד, ובעיקר, מ ' ניתוח ביואינפורמטיקה eaningful של כמויות גדולות של נתונים רצף.

ההתקדמות המהירה בטכנולוגיות סידור וצבירת נתונים מעריכי יצרה צורך גדול פלטפורמה חישובית שתאפשרנה לחוקרים לגשת, לנתח ולהבין את המידע הזה. מערכות מוקדמות היו תלויות במידה רבה על ידע בתכנות מחשב, ואילו, דפדפני בגנום כמו צמח שדה שאפשרו שאינו מתכנתים לגשת והציגו את הנתונים לא אפשרו ניתוחים מתוחכמים. הפלטפורמה, הגישה פתוחה מבוסס אינטרנט, גלקסי ( https://galaxyproject.org/ ), מלאה את החלל הזה, הוכחה להיות צינור ערך המאפשר לחוקרים לעבד נתוני NGS ולבצע מגוון של פשוט-מורכב ביואינפורמטיקה מנתח. גלקסי בתחילה הוקם, והוא מתוחזק, על ידי מעבדות של אנטון Nekrutenko (אוניברסיטת פן סטייט) וג'יימס טיילור (אוניברסיטת ג'ונס הופקינס)f "> 3. גלקסי מציעה מגוון רחב של משימות חישובית שהופך אותו 'one-stop shop' עבור הצרכים ביואינפורמטיקה ספור, כולל כל השלבים הכרוכים במחקר RNA-seq. Itallows למשתמשים לבצע עיבוד נתונים או בשרתים שלה או מקומית על המכונות שלהם. נתונים וזרימות עבודה יכולים להיות מועתקות ומשותפים. הדרכות באינטרנט, באיזור עזרה, וכן עמודי ויקי ( https://wiki.galaxyproject.org/Support ) מוקדשים פרויקט גלקסי לספק תמיכה עקבית. עם זאת, עבור משתמשים בפעם ראשונה, במיוחד אלו ללא הכשרה ביואינפורמטיקה, בצנרת יכול להיראות מרתיע ואת התהליך של למידה עצמית והכרה יכול להיות זמן רב. בנוסף, המערכת הביולוגית למדה, ואת הפרטים של הניסוי ושיטות, השפעה ההחלטות אנליטיים בכמה שלבים, ואלה יכולים להיות קשים לניווט ללא הדרכה.

הכולל RN A-Seq Workflow גלקסי מורכב להעלות נתונים ובדיקת איכות ואחריו ניתוח באמצעות חבילת טוקסידו 4, 5, 6, 7, 8, 9, שהינה קולקטיבית של כלים שונים הנדרשים בשלבים שונים של ניתוח נתוני Seq RNA 10, 11, 12, 13, 14. ניסוי טיפוסי Seq-RNA מורכב החלק הניסיוני (הכנת מדגם, בידוד mRNA והכין ספריית cDNA), את NGS ואת ניתוח הנתונים ביו-אינפורמטיקה. סקירה של סעיפים אלה, ואת הצעדים הכרוכים בצנרת גלקסי, מוצגות באיור 1.

3fig1.jpg"/>
איור 1: סקירה כללית של Workflow RNA-seq. איור של הצעדים הניסיוניים חישובית מעורבים בניסוי RNA-seq להשוות את פרופיל ביטוי גנים של שני זני תולעת (A ו- B, קווים כתומים וירוקים וחצים, בהתאמה). המודולים השונים של מנוצל גלקסי מוצגים תיבות עם הצעד המתאים בפרוטוקול שלנו מצוין אדום. התוצרים של פעולות שונות כתובים אפור עם פורמטים של קבצים בכחול. אנא לחץ כאן כדי להציג גרסה גדולה יותר של דמות זו.

הכלי הראשון בסוויטת טוקסידו הוא תכנית יישור שנקראה "Tophat". זה מחליש את הקלט NGS קורא לרסיסים קטנים ולאחר מכן ממפה אותם בגנום הפניה. בתהליך דו-שלבי זה מבטיח קורא פורש אזורים אינטרוניים יישור אשר אחרת יכול להיות דיsrupted או החמיץ מטופלות ומיפו. זה מגביר כיסוי ומקל על זיהוי של צומת אחוי רומן. פלט Tophat מדווח כשני קבצים, קובץ BED (עם מידע על צומת אחוי הכוללים מיקום גנומית) וקובץ BAM (עם פרטי מיפוי של כל קורא). הבא, את קובץ BAM מיושר נגד הגנום התייחסות כדי להעריך את השפע של תעתיקים בודדים בתוך כל דגימה באמצעות הכלים עוקבים בסוויטת טוקסידו שנקראה "חפת". חפת פונקציות ידי סריקת היישור לדווח שברי תמליל באורך מלא או "transfrags" כי היקף כל גרסות אחוי האפשריות נתוני הקלט עבור כל גן. בהתבסס על זה, זה יוצר "transcriptome" (הרכבה של כל התמלילים שנוצרו לכל גן לכל גן) עבור כל דגימה להיות רצף. מכלולי חפת אלו מכן התמוטטו יחד או התמזגו יחד עם מחדשבגנום ference לייצר קובץ הסברים יחיד ניתוח הפרש במורד שימוש באפשרות הבאה, "Cuffmerge". לבסוף, את ביטוי גני הפרש אמצעי כלי "Cuffdiff" בין דגימות ידי השוואת תפוקות TopHat של כל אחת מהדגימות לקובץ פלט Cuffmerge הסופי (איור 1). חפתים משתמשות FPKM / RPKM (שברים / קורא לכל kilobase של תמליל למיליון ממופה כניסות) ערכים לדווח שכיחותם תמליל. ערכים אלה משקפים את הנורמליזציה של נתוני NGS גלם עבור עומק (מספר ממוצע של קורא ממדגם כי ליישר בגנום ההפניה) ואורך גן (יש גנים באורכים שונים, כך ספירה צריכה להיות מנורמלת עבור אורך של גן להשוות רמות בין הגנים). FPKM ו RPKM הם בעצם אותו דבר עם RPKM בשימוש-Seq רנ"א חד-סוף שבו כל קריאה מקבילה שבר יחיד, ואילו, FPKM משמשRNA-seq זיווג-סוף, כפי שהוא מסביר את העובדה כי שני קורא יכול מתאים לאותו שבר. בסופו של דבר, התוצאה של ניתוחים אלו היא רשימה של גנים לידי ביטוי באופן דיפרנציאלי בין התנאים ו / או הזנים שנבדקו.

לאחר ריצת גלקסי מוצלחת הושלמה "רשימת גנים" מופקת, הצעד ההגיוני הבא דורש יותר ביואינפורמטיקה מנתח להסיק ידע משמעותי מן המערכים הנתונים. חבילות תוכנה רבות צמחו כדי לספק את הצורך הזה, כולל חבילות חישובית הזמינים לציבור מבוססי אינטרנט כגון דוד (Database עבור ביאור, ויזואליזציה וגילוי משולב) 15. DAVID מקל הקצאת משמעות ביולוגית לרשימות גן גדולות ממחקרי תפוקה גבוהה על ידי השוואת רשימת הגנים המועלים מאגר המידע הביולוגי המשולב שלה חושף את ההסברים הביולוגיים המשויכים לרשימת הגן. זה ואחריו ניתוח העשרה, כלומר, בדיקות כדי IDEntify אם בכלל בכיתת תהליך או גן ביולוגית ייצוג יתר רשימת הגן (ים) באופן מובהק סטטיסטי. זה הפך בחירה פופולרית בגלל שילוב של בסיס-ידע רחב, משולב אלגוריתמים אנליטיים חזקים המאפשרים לחוקרים לזהות נושאים ביולוגיים מועשרים בתוך הגנומיקה נגזרת "רשימות גנים" 10, 16. יתרונות נוספים כוללים את יכולתו לעבד רשימות גנים שנוצרו על כל פלטפורמת סידור וממשק ידידותי למשתמש מאוד.

נמטודות Caenorhabditis elegans היא מערכת מודל גנטית, ידועה יתרונותיה הרבים כגון גודל קטן, גוף שקוף, תכנית גוף פשוט, וקלות התרבות מוכנה שלהם מצוינים דיסקציה גנטי ומולקולרי. יש תולעים גנום קטן, פשוט היטב מבואר הכולל עד 40 גנים שמורה% עם homologs האנושי ידוע 17. ואכן, C. elegansהיה מטזואניים הראשון בגנום אשר היה רצף לחלוטין 18, ואחד המינים הראשונים שבו RNA-seq שמש כדי למפות transcriptome של אורגניזם 19, 20. מחקרי תולעת מוקדם מעורבים ניסויים עם שיטות שונות ללכידת RNA תפוקה גבוהה, כנת ספרייה וסדר וכן צינורות ביואינפורמטיקה שתרמו לקידום הטכנולוגיה 21, 22. בשנים האחרונות, RNA-seq מבוסס ניסויים בתולעים הפכו להיות דבר שבשגרה. אבל, עבור ביולוגי תולעת מסורתיים האתגרים שמציבים ניתוח חישובית של נתוני Seq RNA להישאר מכשול מרכזי עבור ניצול גדול יותר וטוב יותר של הטכניקה.

במאמר זה, אנו מתארים פרוטוקול לשימוש בפלטפורמת גלקסי לנתח נתוני תפוקה גבוהה-Seq RNA המופקים C. elegans. לקבלה לראשונה רבים וקטן-SCAמשתמשים le, הדרך הכי יעילה וחסכונית וישירה לבצע ניסוי RNA-seq היא לבודד RNA במעבדה ולנצל מתקן NGS מסחרי (או בתוך הבית) עבור הכנת ספריות cDNA סידור ואת NGS עצמה. לפיכך, אנו ראשונים יש פרטנו את השלבים כרוכים בבידוד, כימות ואיכות הערכה של C. elegans דגימות RNA עבור RNA-seq. הבא, אנו מספקים צעד אחר צעד הוראות שימוש בממשק גלקסי עבור ניתוחים של נתוני NGS, החל בדיקות לבדיקות בקרת איכות שלאחר רצף ואחריו יישור, הרכבה, וכימותי הפרש של ביטוי גנים. בנוסף, כללנו כיוונים לבחון את רשימות גן נובע גלקסי ללימודי העשרה ביולוגיים באמצעות DAVID. כצעד סופי בזרימת העבודה, אנו מספקים להנחיות לטעינת נתוני Seq RNA על לשרתים ציבוריים כגון ארכיון לקרוא רצף (SRA) על צמח השדה ( http: // www.ncbi.nlm.nih.gov/sra) כדי להפוך אותו לנגיש בחופשיות לקהילה המדעית. בסך הכל, אנו צופים כי מאמר זה יספק מידע מקיף מספיק כדי ביולוגי תולעת התחייבות ניסויים-Seq RNA בפעם הראשונה, כמו גם משתמשים תכוף פועלים מספר קטן של דוגמאות.

Subscription Required. Please recommend JoVE to your librarian.

Protocol

בידוד RNA 1.

  1. אמצעי זהירות
    1. נגבו את פני השטח כולו עובד, מכשירים טפטפות באמצעות תרסיס RNase, זמין מסחרית לחסל כל RNases הנוכחי.
    2. יש להשתמש בכפפות בכל העת, לשנות אותם באופן קבוע עם נרות חדשים במהלך השלבים השונים של הפרוטוקול.
    3. השתמש בעצות מסננות בלבד ולשמור את כל הדגימות על קרח כמה שיותר, כדי למנוע שפלת RNA.
      הערה: על מנת לקבל את הנתונים הטובים ביותר מפלטפורמות NGS, חשוב להתחיל עם RNA באיכות גבוהה. שיטות בידוד והכנת RNA להשתנות תלוי מוצא מדגם, השיטה של ​​העדפה רצף החוקר. ערכות כמה זמינות מסחרי יכולות לשמש למטרה זו או RNA יכול גם להיות מבודד באמצעות שיטת פנול, כלורופורם סטנדרטית של מיצוי RNA. עם או מתודולוגיה, באמצעי הזהירות המפורטים לעיל יש לפעול לאורך כל תהליך למזער זיהום OBTAin דגימות RNA וטהור.
  2. תולעי קציר
    1. סנכרן אוכלוסיית התולעת ידי טיפול הלבנת היפוכלוריט 23 כדי להשיג 1,000-1,500 תולעים בוגרות אלגנס לפי גילים לכל זן.
    2. לשטוף את התולעים מצלחות באמצעות פתרון ספין חיץ M9 ב 325 XG על צנטריפוגות בראש הטבלה עבור 30 s. לשאוב את החיץ M9 והותיר אחריו גלולה של תולעים. חזור על פעולה זו לפחות שלוש פעמים כדי לחסל שריד חיידקים.
    3. כדי גלול התולעת, להוסיף ~ 500 μL של חיץ ימס (אם באמצעות ערכה מסחרית) או Trizol (פתרון מונה-פאזית של פנול isothiocyanate guanidine; אם פנול: מיצוי כלורופורם המתואר 1.3.3 נעשה) לשבש רקמות תולעת , לבטל RNases ולייצב חומצות גרעין.
      הערה: הפרוטוקול יכול להיות מושהה כאן על ידי פלאש הקפאת דגימות בחנקן נוזלי ואחריו אחסון ב -80 ° C.
  3. בידוד RNA
  4. דגימות תולעת Sonicate ב משרעת 45% במחזורים של 20 s. 'על' ו 40 s. 'OFF' (8-12 מחזורים לכל זן). שמור על דגימות קרח בכל עת.
    הערה: ודא כי החללית sonicator הוא שקוע בתוך המאגר והוא נשמר ברמה קבועה לאורך כל הדרך. הימנע מקציף של המדגם ולנקות את החללית ביסודיות-בין דגימות. מחזורי Sonication עשויים להשתנות בהתאם לסוג של sonicator בשימוש. מומלץ כי תנאי sonication מותאמים ראשון על מדגם בדיקה לפני תחילת ניסוי.
  5. אם באמצעות ערכה זמינה מסחרי, להמשיך עם בידוד RNA על פי הפרוטוקול שנקבע. עבור בידוד RNA באמצעות שיטה פנול, כלורופורם, בצע את השלבים הבאים.
  6. צנטריפוגה sonicated דגימות ב 16,000 XG במשך 10 דקות. ב 4 ° C.
  7. העברת supernatant לתוך צינור microfuge 1.5 מ"ל RNase ללא ולהוסיף 100 μL של כלורופורם (1/5 ה היקף מגיב בידוד RNA / DNA).
    זְהִירוּת: כלורופורם הוא רעיל. כדי למזער את החשיפה ולהימנע משאיפת, לעבוד במנדף כימי בעת טיפול בחומר הזה.
  8. וורטקס דגימות ביסודיות עבור 30 - 60 s. ולתת דוגמאות לשבת בטמפרטורת החדר למשך 3 דקות.
  9. צנטריפוגה ב 11,750 XG במשך 15 דקות. ב 4 מעלות צלזיוס. להעביר רק את השכבה העליונה מימית כדי טיפול לוקח צינור microfuge RNase ללא חדשים שלא לשאוב ממשק לבן המכילים DNA. חזור על שלבים 1.3.4 דרך 1.3.6.
  10. הוספת 250 μL (70% של שלב מימי או 1/2 RNA / נפח מגיב DNA בידוד) של 2-פרופנול ו להפוך את הצינור לערבב. בואו צינורות לשבת בטמפרטורת החדר למשך 10 דקות או להשאיר לילה בשעה -80 ° C.
  11. צנטריפוגה דגימות ב 11,750 XG במשך 10 דקות. ב 4 מעלות צלזיוס. למזוג supernatant בזהירות רבה, משאירים מאחוריהם כמה μL בתחתית הצינור כך גלולה אינה מופרעת.
  12. לשטוף גלולה עם 500 μL של 75% אתנול (שנעשה באמצעות RNase ללא מים) ומסובב ב XG 16,000 עבור 5 דקות. אt 4 מעלות צלזיוס.
  13. סר כמו supernatant ככל האפשר מבלי להפריע הגלולה. אוויר יבש גלול במנדף במשך כמה דקות.
  14. להוסיף 30 μL של RNase ללא מים ולעזור לפזר את גלולת RNA על ידי חימום על 10 דקות. ב 60 מעלות צלזיוס.
  15. יש לבדוק את איכות RNA וכמות באמצעות bioanalyzer.
    הערה: Bioanalyzer יוצר שחמחם R NA ואני ntegrity N (רין) כמדד איכות RNA. RIN של לפחות 8 הוא הסף המומלץ עבור דגימות RNA-seq (יותר עדיף). כמות ואיכות RNA יכול להיות גם בדק spectrophotometrically אבל צריך גם להיות מלווה על ידי הערכה חזותית של שלמות RNA. כדי לעשות זאת, הפעל את דגימות על ג'ל 1.2% agarose מספיק זמן כדי להשיג הפרדה מתאימה של 28s ו 18s להקות RNA ריבוזומלי. הנוכחות של שתי להקות שונות (1.75 KB עבור rRNA 18S ו 3.5 kb עבור rRNA 28S במקרה של סי אלגנס ') היא מדידה מקובלת של איכות RNA.
  16. השתמש ~ 100 ng / μL RNA ל ship למתקן הספק / NGS עבור הכנת ספריות רצף.
    הערה: דגימות RNA אמורות להישלח על קרח יבש כדי לספק שירותי סידור. רוב הספקים לבצע בדיקת בקרת איכות RNA עצמאית לפני הכנת ספרייה.

2. RNA-seq ניתוח נתונים

  1. הורדה של נתוני רצף גלם
    1. הורד את נתוני רצף fastq הגלם הדחוסים מקודדים בפורמט fastq.gz מנותן NGS באמצעות "פרוטוקול העברת קבצים" (ftp).

איור 2
איור 2: פריסה של משתמש גלקסי ממשק לוח ותפקידים RNA-seq מפתח. תכונות עיקריות של הדף הם מורחבות ומודגשים. (א) מדגיש את הפונקציה "ניתוח נתונים" שבכותרת האינטרנט המשמש גישה (ב) הוא "בר ההתקדמות" המציין את המקום בשרת גלקסי מנוצל על ידי הפעולה. (ג) הוא "סעיף הכלים" המפרט את כל הכלים שניתן להריץ על הממשק גלקסי. (ד) מציג את "NGS: RNA ניתוח" סעיף כלי המשמש לניתוח RNA-seq. (ה) מתארת את הפנל "ההיסטוריה" שמפרט את כל הקבצים שנוצרו באמצעות גלקסי. (F) מציג דוגמה של תיבת הדיאלוג שנפתח כאשר לחיצה על כל קובץ בסעיף היסטוריה. בתוך (F), בתיבה הכחולה מדגיש הסמלים שניתן להשתמש בהם כדי להציג, editthe תכונות או למחוק את הנתונים, את המלבן הסגול מדגיש הסמלים שניתן להשתמש בהם כדי "לערוך" את התגיות במערך או ביאור, וכן, את תיבת אדום מציין סמלים כדי להוריד את הנתונים, להציג פרטים של המשימה שבוצעו או להפעיל מחדש את הפעולה. אנא לחץ כאן כדי להציג גרסה גדולה יותר של דמות זו.

  1. תחילת עבודה עם גלקסי
    הערה: גלקסי ניתן להריץ בשרת ציבורי בחינם באמצעות פלטפורמה מבוססת אינטרנט המספקת גישה ענן ואחסון מוגבל בחינם. זה יכול גם להוריד ולהפעיל באופן מקומי על המחשב של המשתמש או אשכולות חישובית בהנחיית מוסדות אבל עיבוד מקומי, עשוי להיות מוגבל על ידי גבולות נתוני אחסון ומגבלות כוח העיבוד של מחשבי משתמשים. פרטים על הורדה והתקנה ניתן לגשת בכל https://wiki.galaxyproject.org/Admin/GetGalaxy . בפרוטוקול זה אנו מתארים את השימוש מבוסס האינטרנט של צינור גלקסי.
    1. לאחר ההורדה ואחסון נתוני NGS על המחשב של המשתמש, גלקסי הגישה בlaxy.org/" target = "_blank"> https://usegalaxy.org/.
    2. רישום חשבון המשתמש על ידי לחיצה על "משתמש" בכותרת של העמוד, כניסה ולהתחיל ידי היכרות עם פאנל ממשק המשתמש.
      הערה: מומלץ שמשתמש לראשונה לנצל את המדריך "התחל כאן" הנמצא בדף הבית כדי לקבל להכיר עם למעלה ערכה הבסיסית של גלקסי ( https://github.com/nekrut/galaxy/wiki/Galaxy101-1 ) .
    3. לחץ על "ניתוח נתונים" (איור 2 א) בלוח הכותרת לגשת "צפה Home ניתוח" שהוא גם מסך ההפעלה על גלקסי.
      הערה: הכותרת גם בתי קישורים אחרים שאת פרטיו ניתן לראות על ידי מעבר עם העכבר מעל אותם. הפינה הימנית העליונה של הכותרת יש סרגל התקדמות מנטרת החלל מנוצל עבור המשימות (איור 2B).
    4. גללקק על "NGS: RNA ניתוח" משימה ב "תפריט כלים" בלוח השמאלי (איור 2C) לגשת כל הכלים הדרושים לניתוח נתוני seq RNA.
      הערה: "תפריט הכלים" קטלוגים כל פעולות הצעות גלקסי. תפריט זה לפצל מבוסס על משימות לחיצה על כל אחת תפתח רשימה של כל הכלים הדרושים כדי לבצע את המשימה.
    5. צור ההיסטוריה ניתוח חדש על ידי לחיצה על סמל גלגל השיניים בחלק העליון של הלוח "היסטוריה" בצד ימין (איור 2E). בחר "צור חדש" אפשרות מהתפריט המוקפץ. תן זה "היסטוריה" שם מתאים לזהות את הניתוח.
      הערה: הפנל "ההיסטוריה" מציג את כל הקבצים שהועלו לניתוח כמו גם את כל קבצי הפלט המופקים על ידי הפעלת משימות על גלקסי. לחיצה על שם של קובץ בלוח זה פותח תיבת דו-שיח עם מידע מפורט על משימה שבוצעהוקטע של בסיס הנתונים (איור 2F). סמלים בתיבה זו לאפשר למשתמש "מבט", "לעריכת התכונות" או "למחוק" את הנתונים (איור 2F, שמסומן בכחול). בנוסף, המשתמש יכול גם "ערוך" תגי במערך או ביאור (איור 2F, מודגשים בצבע סגול), "להוריד" את הנתונים, "צפה בפרטים" של המשימה, "שידור חוזר" את המשימה או אפילו "לחזות" את הנתונים מן זו תיבת הדיאלוג (איור 2F, מסומן באדום).
    6. לחץ על הפונקציה "העלאת קובץ" תחת "קבל נתונים" ב "ToolsMenu" כדי להעלות קבצים fastq גלם.
      הערה: לחיצה על זה, או כל כלי אחר נפתחה בתיאור קצר של המבצע, ואת המבחן עצמו, בלוח באמצע "ניתוח הממשק". פאנל זה שרוכים יחד"כלי" מהלוח השמאלי ואת "קבצי קלט" מימין הפאנל "היסטוריה" (2E איור). הנה, קבצי קלט "היסטוריה" נבחרים ופרמטרים נוספים המוגדרים לרוץ משימה נתונה. מערך הנתונים של הפלט המתקבל מכל מבחן נשמר אחורה "היסטוריה". כלולים במבחן בלוח 'ממשק הניתוח "הסברים על כל הפרמטרים זמינים להפעלת כלי נתון יחד עם רשימה מפורטת של כל קבצי הפלט שהכלי מציע.
    7. אחרי שהמשימה נפתחת "ממשק הניתוח", לחץ על "בחר קובץ מקומי" או "בחר קובץ FTP" '(העלאה מהירה יותר), לנווט אל התיקייה המכילה את הקבצים רצף ובחר את הנתונים המתאימים כדי להעלות.
    8. אפשר גלקסי ל "גילוי אוטומטי" את (הגדרת ברירת המחדל) סוג הקובץ נטען. בחר 'ג elegans 'בתפריט הנפתח עבור בגנום.
    9. לחץ על "התחל" כדי להתחיל בהעלאת נתונים. לאחר העלאת הקובץ, הוא יישמר בלוח "ההיסטוריה", וניתן לגשת משם.
    10. אם קבצי נתוני רצף מרובה מיוצרים למדגם יחיד, לשלב אותם באמצעות הכלי "לשרשר". לשם כך, לפתוח את האפשרות "טקסט מניפולציה" ב "תפריט כלים".
    11. לחץ על הכלי "לשרשר", לבחור את הקבצים שצריך בשילוב מהתיבה הנפתחת באמצע "ממשק ניתוח" ולחץ על "הרץ".
      הערה: קבצי פלט המיוצר באמצעות משימה זו מופקים בפורמט fastq. תכנית המיפוי יש מגבלה של 16,000,000 רצפים לכל קובץ fastq וכאשר מגיע לגבול הזה קובץ fastq חדש מופק עבור הרצפים הנותרים. ה '; לשרשר" כלי נחוץ במקרים כאלה לשלב את מערכי נתונים.
    12. המרת קבצי פורמט fastq נטען לפורמט fastqsanger הנדרש לניתוח RNA-seq גלקסי ידי שימוש באפשרות "ספרית fastq" נמצא תחת "NGS: QC ומניפולציה" סעיף (ראה קובץ משלים).
    13. בחר את נתוני fastq המתאימים תחת "קובץ החתן" האפשרות להפעיל את הכלי באמצעות פרמטרי ברירת מחדל.
      הערה: קבצי פלט המיוצרים באמצעות משימה זו מופקים בפורמט fastqsanger.
  2. בדיקות נתונים fastqsanger בקרת איכות
    1. בדוק את איכות fastqsanger נטען קורא שימוש באפשרות "FastQC" הממוקם תחת "NGS: QC ומניפולציה" בתפריט "כלים".
    2. בחר את קובץ הנתונים fastqsanger מטופח מתוך התפריט הנפתח עבור 'שורt לקרוא נתונים מהספרייה הנוכחית" ולהפעיל את הכלי באמצעות פרמטרי ברירת מחדל.
      הערה: שים לב מיוחד לאיכות קוראה בנוכחות כל רצפי מתאם. מתאמים בדרך כלל מוסרים כחלק עיבוד נתוני RNA-seq פוסט ידי ספקי NGS אך במקרים מסוימים, ניתן להשאיר מאחור. להסבר על תקני איכות ללכת http://www.bioinformatics.babraham.ac.uk/projects/fastqc/ .
    3. בדוק עם ספק NGS ואם מתאמי נוכחים, לקצץ אותם באמצעות הכלי "קליפ" מן "NGS: QC ומניפולציה" בתפריט משימה.
      הערה: קבצי פלט המיוצרים באמצעות משימה זו מופקים בפורמט txt הגלם כמו גם ב- HTML שניתן לפתוח בכל דפדפן אינטרנט.
  3. ניתוח נתונים עם Suite טוקסידו
    1. TopHat
      1. הורד את הגרסה האחרונה של fasta הגנום התייחסות GTF (פורמט העברת גנים) קבצים מקובץ העלאה" כמתואר לעיל 2.2.6.
      2. פתח את "NGS: ניתוח RNA" ולחץ על הכלי "TopHat" למפות את הרצף קורא לגנום ההתייחסות שהורד.
      3. בחר את התשובה המתאימה מהתפריט הנפתח לשאלה "האם נתונים אלו יחיד בסוף או זיווג-סוף?"
      4. בחר את קובץ fastq המתאים.
      5. בחר "השתמש בגנום מההיסטוריה" בתפריט הנפתח לצד ולבחור הגנום התייחסות שהוריד בשלב 2.4.1.1.
      6. בחר "ברירת מחדל" עבור פרמטרים אחרים ולחץ על "הרץ".
        הערה: בין קבצי פלט המיוצר באמצעות משימה זו, קובץ "Accepted Hits" משמש על הצעדים הבאים.
    2. חפתים ו Cuffmerge
      1. בחר את "קאףהכלי ב 'קישורי NGS: הסעיף' רנ"א הניתוח להרכיב את התעתיקים, מעריך שפע המבחן שלהם לביטוי הפרש.
      2. בתפריט הנפתח הראשון, לבחור את "הלהיטים Accepted (בפורמט BAM)" ממופה קובץ המתקבל מניתוח TopHat.
      3. בתפריט הנפתח השני, להגדיר ביאור הפניה לקובץ GTF שהוריד בשלב 2.4.1.1.
      4. בחר ב'כן 'לאפשרות "בצע הטיה תיקון" ולהפעיל את המשימה תוך שימוש בהגדרות ברירת המחדל עבור כל הפרמטרים האחרים.
        הערה: בין קבצי פלט המיוצר באמצעות משימה זו, קובץ "מקבל תמלולים" משמש על הצעדים הבאים.
      5. פתח כלי "Cuffmerge" ב "NGS: ניתוח RNA" כדי למזג את "מורכבים תמלולים" מיוצר עבור כל הדגימות-Seq RNA.
        הערה: תיבת הראשון המאכלס העצמי הכלי והרשימות כל חפתים.
      6. בחר את הקובץ "מורכב התמלולים" עבור כל הזנים / התנאים שנבדקו, לרבות ביולוגי משכפל של הזן / מצב זהה (ראה דיון על משכפל ביולוגי).
      7. בחר ב'כן 'עבור "ביאור אסמכתה לשימוש" ולבחור את קובץ GTF שהוריד בשלב 2.4.1.1.
      8. בתיבה הבאה, שוב בחר "כן" עבור האפשרות "נתוני הרצף השתמש" ולבחור את קובץ fasta הגנום כולו שהוריד בשלב 2.4.1.1.
      9. שמירה על פרמטרים אחרים כמו ברירת המחדל, לחץ על "הרץ".
        הערה: Cuffmerge ומייצר קובץ פלט GTF יחיד.
    3. Cuffdiff
      1. נווט אל הכלי "Cuffdiff" ב "NGS: RNA ניתוח" סעיף. בתפריט "תמלולים", לבחור את קובץ הפלט הממוזגת מ Cuffmerge.
      2. תוויתתנאי 1 ו 2 עם שמות שני זנים / מצב.
        הערה: Cuffdiff יכול לבצע השוואות בין יותר משני זנים או תנאים וכן ניסויים כמובן זמן. כל שעליך לעשות הוא להשתמש באפשרות "תנאים חדשים הוסף" כדי להוסיף כל מצב חדש זנים /, לפי הצורך.
      3. עבור כל זן / מצב, תחת פרט בחר "המשכפלים" קבצי הפלט "Hits Accepted" מ TopHat המתאים המשכפלים הביולוגית השונה של אותו / מצב מתח. החזק את מקש "cmd", אם באמצעות מחשב מקינטוש, ועל מקש "Ctrl", אם באמצעות מחשב, כדי לבחור קבצים מרובים.
      4. השאר את כל אפשרויות אחרות כפרמטרי ברירת מחדל. לחץ על "רץ" כדי להפעיל את המשימה.
        הערה: Cuffdiff מייצר קבצי פלט רבים במתכונת טבלאית כמו את ההודעה הסופית של הניתוח RNA-seq. אלה כוללים קבצים עם מעקב FPKM תמלילים, גנים (בשילובערכי FPKM של תעתיקי שיתוף זהות גן), תמלילי ראשוניים רצפי קידוד. כל קבצי הנתונים שנוצרו ניתן לצפות בכל יישום גיליון אלקטרוני ומכילים תכונות דומות כגון שם גן, לוקוס, לקפל שינוי (ב מידת log2) וכן נתונים סטטיסטיים על השוואות בין זנים / תנאים, כוללים ערך p וערכי q. הנתונים בקבצים אלו ניתן למיין מבוססים על מובהקות סטטיסטיות של הבדלים או לקפל שינוי בביטוי גנים (גודל וכיוון השינוי, כמו למעלה או פוך גנים מוסדרים) מניפולציות על פי דרישות המשתמשים. אם המרה בין מזהה גנים שונים יש צורך (למשל, Wormbase גן מזהה לעומת מספר cosmid), כלים זמינים Biomart ( http://www.biomart.org/ ) יכול להיות מנוצל.

3. ג'ין אונטולוגיה (GO) ניתוח המונח באמצעות DAVID

  1. DAVID גישה מן h האתרttps: //david.ncifcrf.gov/. לחץ על "ניתוח התחל" בכותרת של דף האינטרנט. בשינה "שלב 1", להעתיק ולהדביק את רשימת הגנים המתקבלים גלקסי לתוך א בתיבה "שלב 2", בחר "Wormbase ג'ין מזהה" כמזהה עבור גני הקלט.
    הערה: DAVID מכיר הכי זמינות לציבור קטגוריות ביאור, כך מזהה גנים אחרים (כגון Entrez גן מזהה או סמל גן) יכול לשמש גם.
  2. בשינה "שלב 3", בחר "ג'ין רשימה" (גנים להיות מנותחים) תחת "סוג הרשימה" ולאחר מכן לחץ על הסמל "שלח רשימה".
    הערה: "ניתוח אשף", תפתח את הרשימה כל כלי DAVID המקושרים שניתן להריץ על רשימת הגן נטענת (איור 3). לחץ על הקישורים הבאים כדי לגשת מודולים מקבילים רלוונטיים לפי הדרישה של המשתמשים. כדי לזהות את הכלים המתאימים לביצוע משימה מסוימת, לחץ על 'אילו כלים DAVID להשתמש? "קישור על" ; דף "ניתוח האשף. לחץ על הקישור "התחל הניתוח" שבכותרת כדי לחזור לדף הבית "אשף הניתוח" בכל נקודה במהלך הניתוח.

איור 3
איור 3: פריסה של דף האינטרנט האשף ניתוח דוד דוגמאות מבצעים יציאות. האינטרנט "אשף הניתוח" ממשק המשתמש מפרט את הכלים המשמשים לניתוח רשימת גן שהועלתה להעשרה המבוססת על פרמטרים שונים. לחיצה על כלים אלה מדווחים הנתונים נותחו ב דף אינטרנט חדש. דוגמאות של הדוחות הטבלאיים המופקים "ג'ין סיווג פונקציונלי", "תרשים ביאור פונקציונלי" ו "Clustering ביאור פונקציונלי" מוצגות ריבועים (חיצים).> אנא לחץ כאן כדי להציג גרסה גדולה יותר של דמות זו.

  1. ביאור כלי פונקציונלי 1: Clustering ביאור הפונקציונלי
    1. לחץ על מודול "Clustering הביאור הפונקציונלי" כדי לעבור לדף הסיכום. שמור קטגוריות ביאור ברירת המחדל ולחץ על "Clustering ביאור הפונקציונלי" כדי ליצור אשכולות של תנאי סימון דומים מדורגים על ידי ציון העשרה שלהם.
    2. לחץ על השם המקושר של כל מונח לקרוא פרטים על כך "RT" (מונחים הקשורים) לרשימת מונחים דומים אחרים הקשורים לאותה הקטגוריה.
    3. לחץ על הסרגל הסגול לרשום את הגנים הקשורים מונח ואת "G" האדומה לפרט את כל הגנים הקשורים לכל התנאים בתוך אשכול.
    4. לחץ על הסמל הירוק כדי לראות תצוגה דו-ממדית של כל הגנים והתנאים באשכול.
      הערה: שלושת הטורים האחרונים לפרט את תוצאות אנליטיות סטטיסטיות עבור כלטווח. התוצאות לכך וכל Analytics האחר ניתן להוריד בפורמט .txt ידי לחיצה על הקישור "הוריד קובץ".
  2. ביאור כלי פונקציונלי 2: תרשים ביאור פונקציונלי
    1. חזרה לדף הסיכום ולחץ על "תרשים ביאור פונקציונלי" כדי לזהות מונחים ביולוגיים ייצוג יתר משמעותי (פעילות גורם שעתוק למשל או פעילות קינאז) המשויכים לרשימת הגן.
    2. לחץ על שם מונח כדי לקבל מידע מפורט יותר "RT" (מונחים הקשורים) לרשימת מונחים קשורים אחרים.
    3. לחץ על הסרגל הסגול לפרט את כל הגנים הקשורים להתכתב קטגורית פרט.
      הערה: שתי העמודות האחרונות לפרט את תוצאות-המבחנים הסטטיסטיים עבור כל קטגוריה.
  3. ביאור כלי פונקציונלי 3: טבלת ביאור פונקציונלית
    1. חזרה לדף סיכום ולחץ על 'functioשולחן ביאור סופי "כדי לראות רשימה של כל ההסברים מקושרים הגנים ברשימה בלי שום חישובים סטטיסטיים.
      הערה: כלי זה יכול להיות שימושי לצורך הניתוח הגנטי-ידי-גן של רשימה או להסתכל ספציפית, גנים מעניינים מאוד.
  4. כלי סיווג גן פונקציונליים
    1. חזור אל "אשף ניתוח" ולחץ על מודול "גן פונקציונלי סיווג" כדי להפריד את רשימת הגנים קלט לקבוצות תפקודית הקשורה של גנים מדורגים לפי "ציון העשרה" שלהם, מדד העשרה הכוללת של הקבוצה הגן ברשימה.
    2. לחץ על שם מונח כדי לקבל מידע מפורט יותר "RG" לחשוף גנים הקשורים תפקודי של קבוצת הגנים
    3. לחץ על (דוחות ארוכים) "T" האדום לרשימת ביולוגיה הקשורים ואת הסמל הירוק כדי לראות תצוגה דו-ממדית של כל הגנים והתנאים.
  5. ג'ין-שםViewer תצווה
    1. חזור אל "ניתוח אשף" ולחץ על "Viewer יצווה ג'ין-שם" לתרגם "Wormbase ג'ין מזהה" לתוך שמות הגן המתאימים שלהם. (WBGene00022855 = tcer-1).
    2. לחץ על שם הגן כדי להשיג יותר מידע גנטי ספציפי.
    3. לחץ על "RG" (גנים הקשורים) קישור לצד כל גן לחשוף גנים צפויים להיות קשור מבחינה פונקציונלית הגן של עניין.

4. נתונים גולמיים העלאה אל הארכיון לקרוא רצף צמח השדה (SRA)

  1. גש לדף האינטרנט SRA על כניסת הקישור" צמח השדה או לפתוח חשבון חדש.
  2. לחץ על "Bioproject".
  3. לחץ על "כניעה" תחת הכותרת "באמצעות Bioproject" בצד שמאל.
  4. בחר באפשרות "ניו ההגשה". עדכון פרטים של המוסר. המשך דרך שבע כרטיסיות הנותריםמילוי, את הפרטים של הניסוי והנתונים בטעינה. לחץ על "שלח" כאשר הושלם.
    הערה: בכרטיסייה החמישית "Biosample", לעזוב את החריץ עבור "Biosample" ריק.
  5. רענן בדף שהתקבל על ידי לחיצה על הקישור "ההגשות שלי". הנתונים שהוגשו יירשמו עם מספר הגשה מוקצה, תיאור קצר מצב טעינה.
  6. לחץ על "Biosample" בחלק העליון של דף זה, בתיבה "להתחיל הגשה חדשה" וליצור "הגשה חדשה". שלח הגשות נפרדות עבור כל דגימה.
  7. כמו במקרה עם "Bioproject" ב 4.4, לעדכן את הפרטים של מוסר וממשיכים דרך שאר הלשוניות מילוי הפרטים של כל כרטיסיה. לאחר שהושלם בדיקה ולחץ על "שלח".
  8. נווט אל http: //www.ncbi.nlm.nih.goנ / SRA ליצור בגמר "ארכיון לקרוא רצף (SRA)" ההגשה.
  9. לחץ על "התחבר SRA" תחת "תחילת העבודה".
  10. בדף הבא לחץ על הקישור "צמח השדה PDA". קישור "העדפות עדכון" יפתח. השלם את הטופס ולחץ על "שמור העדפות".
  11. בדף שהתקבל, לחץ על הקישור "צור חדשה ההגשה". הזן שם מתאים תחת הכינוי "" ולחץ על "שמור". שולחן עם מזהה ההגשה ופרטים נוספים ייוצר.
  12. לחץ על "ניסוי חדש" ולהירשם לפחות ספריית סידור ייחודית אחד לכל "BioSample".
  13. ציין ולקשר של "BioProject" שנוצר בעבר ומזהה הגשת "BioSample". א "ניסוי חדש" ייוצר.
  14. לחץ על "חדש הפעלה" בתחתית הדףלאחר ניסוי SRA נעשה ולזהות את קבצי נתונים שצריכים להיות מקושר אליו.
  15. לחשב את סכום MD5 של כל קובץ נתונים. לשם כך על מסוף מקינטוש, לנווט אל Applications / Utilities / טרמינל. בטרמינל, הקלד "MD5" (ללא הגרשיים) ואחריו רווח. גרור ושחרר את הקבצים שצריכים נטען לתוך הטרמינל מ'מאתר ולחץ על Enter.
  16. טרמינל יחזיר סכום MD5 אלפאנומרי. הזן הזה כחלק מתהליך ההגשה עבור העלאת הקבצים. השתמש בשם המשתמש והסיסמה שסופק על ידי המערכת כדי להעלות קבצים באמצעות FTP.

Subscription Required. Please recommend JoVE to your librarian.

Representative Results

ב C. elegans, חיסול של תאי גזע germline (GSCs) מרחיב את תוחלת החיים, משפר עמידות ללחץ, ומרוממת הגוף שומן 24, 28. הפסד של GSCs, או הביאו על ידי לייזר אבלציה או על ידי מוטציות כגון GLP-1, גורמת להארכת תוחלת החיים באמצעות הפעלת רשת של שעתוק גורמי 29. גורם אחד כזה, TCER-1, המקודד את homolog תולעת של גורם התארכות שחבור שעתוק האנושי, 30 TCERG1. תוצאות הנציגים הבאות ממחישות כיצד RNA-seq שמש לזיהוי גנים שהביטויים הוא מווסת על ידי TCER-1 / TCERG1 הבא אובדן germline במחקר שלנו שפורסם לאחרונה 31. Transcriptomes של גיל בהתאמה, יום 2 מבוגרים של GLP-1 ו- tcer-1; GLP-1 מוטנטים הושוו. עבור כל זן, mRNA היה מבודד שני עותקים ביולוגייםTES (ארבע דגימות לחלוטין) באמצעות הפרוטוקול המתואר דגימות רנ"א סעיף 1. נשלח ספקית שירות מסחרית מוכנה ספריות cDNA מן הארבע הדגימות ובצעה 50 BP רצף סוף יחיד. הנתונים NGS גלם שהורד כמתואר בסעיף 2.1.

ערכת נתוני רצף פוסט

טבלה 1 היא אוסף של תוצאות הבדיקה כדי להעריך את איכות רצף גלם קורא. ניתוח בדיקת איכות "FASTQ" מדגיש את מספר רצפים לקרוא בלי "באיכות ירודה" קורא יחד עם תוכן GC 48-49% ובאורך לקרוא רצף קבוע של 51 נ"ב. צעד זה גם בודק את נתוני רצף עבור תכונות רבות אחרות כגון תוכן Kmer והוא עשוי באופן קולקטיבי את של 11 בדיקות בסך הכל. הגנום אלגנס הוא ~ 100 MBP. בהתבסס על מספר רצף קורא מכל מדגם זה ממופה הגנום, gכיסוי enome (הטור האחרון) נאמד באמצעות המשוואה לנדר / Waterman "C = LN / G", שבו, C מייצג כיסוי, G הוא אורך הגנום הפלואידים, L הוא אורך הקריאה N הוא מספר קורא. השתמשנו פרמטרי ברירת מחדל עבור כל השלבים וקבלנו 48 - 49% תוכן GC בכל הדגימות. כפי שניתן לראות, כיסוי בגנום היה בין 9x כדי 11x בדגימות.

זיהוי של TCER-1 / TCERG-1-מוסדר גנים ידי ניתוח ביטוי דיפרנציאלי ג'ין על גלקסי

לאורך השלבים המפורטים בסעיפים 2.2 עד 2.4, בצנרת 3 גלקסי שמשה להשיג רשימה של גנים לידי ביטוי באופן דיפרנציאלי בין GLP-1 ו- tcer-1; מוטציות GLP-1. גלקסי אפשר לנו לשלב את נתוני NGS משתי המשכפל עבור כל זן ובצע ניתוח הפרש ליצור קבצים טבלאיים הדגשת ביטוי הגנום הרחב יח"צofile. שימוש סף של שינוי אחד לפחות של פי גודל וערך P של 0.05 לפחות, רשימה של 835 גנים באו לידי ביטוי באופן דיפרנציאלי בין שני הזנים נוצרה 31. הרשימה חולקה בהתבסס על היותו ביטוי של גנים היה למטה מוסדר ב tcer-1; GLP-1 מוטנטים (359 UP גנים תעתיק אשר מתגברת ככל הנראה על ידי TCER-1 / TCERG1) או למעלה מוסדר (476 גנים DOWN תעתיק אשר שמודחק ככל הנראה על ידי TCER-1 / TCERG1) לעומת GLP-1 (איור 4).

איור 4
איור 4: זיהוי של TCER-1 / TCERG1-מוסדר גנים ב germline-פחות C. elegans מוטנטים באמצעות RNA-seq: תוצאות של גלקסי (א) ודוד (B) ניתוח. (א) ניתוח ביטוי גנים דיפרנציאלי של נתוני RNA-seq השוואה transcriptomes של GLP-1 ו- tcer-1; GLP-1 הניב סך של 835 גנים, מתוכם 359 זוהו כבני-מוסדרת TCER-1 / TCERG1 (UP) ו 476 כמו למטה מוסדר על ידי TCER-1 / TCERG1 (למטה). (ב) תוצאות של הניתוח "ביאור Clustering הפונקציונלית" של גנים המזוהים TCER-1 / TCERG1 מטרות באמצעות DAVID. עשרת אחוז של תהליכים ביולוגיים הוא למעלה מוסדר (UP) ו למטה מוסדר (למטה) חוגים של TCER-1 / TCERG1 מטרות. הגרפיקה המוצגת כאן מתקבלת על ידי התוויית קבוצות הגן המועשרת (ציר ה- X) והעשרת האחוז בהתאמה (ציר Y) המתקבלות כפלט של ניתוח DAVID. איור שונה מן אמרית ואח. 31 ו לשכפל באישור. אנא לחץ כאן כדי להציג גרסה גדולה יותר של דמות זו.

er.within-page = "1"> ג'ין אונטולוגיה העשרה ניתוח

כדי לקבל סקירה של כיתות הגן מועשר ב מטרות TCER-1 / TCERG1, ביצענו האונטולוגיה גן (GO) ניתוח ארוך באמצעות DAVID. TCER-1 / TCERG1-מוסדר UP ורשימות הגן DOWN הועלו באופן עצמאי על דוד ניתח כמתואר בסעיף 3. מעט ידוע על גנים ותהליכים הסלולר ממוקד ידי TCER-1 / TCERG1 בעבר 30, כך מצאנו את DAVID ניתוח להיות במיוחד חושפני ומועיל. ניתוח ביאור פונקציונלי של גני UP חשף חמישה אשכולות ביאור עם ציון העשרה של> 1.3, הגבוה ביותר כולל גני אנזים קידוד ציטוכרום P450 ו גנים בתגובה xenobiotic, ואחריו גנים מעורבים שינויי שומנים. זו קבלה חיזוק תוצאות ניתוח סיווג הגן הפונקציונלי כי זיהו קבוצות מיוחסות עם molecula הדומהפעילויות r עם ציוני העשרה משמעותיים. באמצעות גיליון אלקטרוני, הקבוצות שזוהו היו זממו נגד ציוני העשרה שלהם (איור 4). הנתונים הקודמים שלנו הציע TCER-1 / TCERG1 תפקד עם גורם שעתוק אריכות ימים משומר, DAF-16 / FOXO3A, כדי לקדם את תוחלת החיים של המבוגרים GSC-פחות 30. DAF-16 / FOXO3A, בתורו, היה מעורב בויסות חילוף חומרי שומנים במחקרים האחרונים 27, 32, 33. בהתבסס על ראיות אלו, וכן זיהוי של גני מטבולית-שומנים ומסלולים כמטרות פוטנציאליות TCER-1 / TCERG1 ב DAVID מנתח, התמקדנו גני חילוף החומרים של השומן שזוהו במחקר RNA-seq ללימודי מכניסטית מפורטים. בעקבות זאת להוביל, ובאמצעות ניסויים גנטיים מולקולריים הבאים, ביוכימיים, ופונקציונלי, הראינו כי TCER-1 / TCERG1 יחד עם DAF-16 / FOXO3A מתואמת enhanCED הן קטבולי השומנים ואת התהליכים האנאבוליים בתגובה אובדן germline 31. באופן דומה, Clustering ביאור הפונקציונלי של DOWN TCER-1 / TCERG1 יעדים המזוהים אשכולות ביאור מועשרים עבור פונקציות cytoskeletal, רגולציה חיובית של צמיחה, רבייה והזדקנות (איור 4). תצפיות אלה, והראיות הניסיוניות לתמיכה שלנו, מראים כי בעת איבוד germline, TCER-1 / TCERG1 גם מדכא צמיחה ופיזיולוגית רבייה בתאים סומטיים כמו גם את הביטוי של גנים אנטי-אריכות ימים 31.

לִטעוֹם רצפים סה"כ אורך GC% סה"כ קורא (גלקסי) ממופה קורא (גלקסי) סיקור הגנום
GLP-1 4000000 51 49 20700539 ~ 16,000,000 11x
GLP-1; tcer-1 4000000 51 49 18055444 ~ 13,000,000 9x
GLP-1 4000000 51 48 18947463 ~ 14,000,000 10x
GLP-1; tcer-1 4000000 51 48 13829643 ~ 10,000,000 7x

טבלה 1: פרטים Sample-Seq RNA. אוספים של תכונות נתונים גולמיים העריכו-סידור פוסט כדי לאשר את הצלחת בטווח רצף. נתוני רצף מניסוי הנציג מורכבים משני תנאים ביולוגיים, זן ביקורת (GLP-1 (tcer-1; GLP-1) עם שני ביולוגי משכפל רצף לכל. ניתוח בדיקת איכות "FastQC" מדגיש את מספר רצפים לקרוא בלי "איכות ירודה", נכתב, 48 - 49% תוכן GC ובאורך לקרוא רצף קבוע של 51bp. Modified ו לשכפל באישור מאל אמרית et. 31.

קובץ משלימה: שרשרת פיקוד בקצרה על הכלים לרוץ על הצינור גלקסי לניתוח נתוני Seq RNA. אנא לחץ כאן כדי להוריד את הקובץ.

Subscription Required. Please recommend JoVE to your librarian.

Discussion

המשמעות של פלטפורמת רצף גלקסי בביולוגיה המודרנית

פרויקט גלקסי הפך תפקיד עוזר ביולוגים ללא הכשרה ביואינפורמטיקה לעבד ולנתח נתוני רצף תפוקה גבוהה באופן מהיר ויעיל. פעם נחשב משימה הרקולס, הפלטפורמה הזמינה לציבור הזה עשתה הרצת אלגוריתם ביואינפורמטיקה מורכב כדי לנתח נתוני NGS תהליך פשוט, אמין, וקל. מלבד אירוח מגוון רחב של כלים ביואינפורמטיקה, המפתח להצלחה עבור גלקסי גם את הפשטות של ממשק המשתמש שלה כי שרוכים יחד את ההיבטים השונים של ניתוח רצף מורכב באופן אינטואיטיבי חלק. בשל תכונות אלה, בצנרת גלקסי רכשה שימוש רחב בקרב ביולוגים, כולל חוקרי C. elegans. בנוסף להיכרות המשתמש עם צינור הניתוח-Seq RNA, גלקסי גם מסייע להניח את יסודות ביולוגים בסיסיים כדי לתפוס אתקונספט של ניתוח נתונים ולהבין את הכלים מעורבים. ידע זה ראשוני למשתמש אולי עוד לרדוף פלטפורמות ביואינפורמטיקה מורכבות יותר כגון "ר" ו "Python". מלבד גלקסי, כלים ואריזות אחרים זמינים מסחרית כמו פתרונות קוד פתוח, אשר ניתן להשתמש בהם לצורך ניתוח RNA-seq. האפשרויות המסחריות קרובות עצמאיות חבילות תוכנה שאינן ידידותי למשתמש אבל יכול להיות יקר עבור חוקרים פרטיים שאינו משתמשי NGS קרובות. לחלופין, פלטפורמות קוד פתוח כגון BioWadrobe 34 ו ArrayExpressHTS 35 דורשים ידע בסיסי של שורת הפקודה סקריפטים רצים, אשר מציב אתגרים משמעותיים עבור-bioinformaticians שאינם. לפיכך, גלקסי נשאר משאב פופולרי הכרחי.

צעדים קריטיים בתוך הפרוטוקול

היתרונות המאמצים של גלקסי ודוד אף, ניסוי RNA-seq מוצלח עדייןמסתמך בעיקרו על עיצוב וביצוע קפדניים של הצעד הניסיון. למשל, יש צורך חיוני להבטיח הומוגניות גנטית לפני השוואת שני זנים ידי RNA-seq, ולקבוע אם יש הבדלים בשיעורי התפתחותי. בידוד RNA מן הזנים לפי גילאים הוא קריטי גם כן. באופן דומה, לתת דין וחשבון על השתנות של ביטוי גנים בתוך אותו הזן, חשוב להפעיל שני או יותר "משכפל ביולוגי" של כל זן. זה בעצם אומר גוברת ותולעי קצירת הזנים להיות רצף בניסויים לפחות twoindependent, למרות שלושה משכפל ביולוגי הוא מהתקן המומלץ. גלקסי מאחדת את נתוני משכפל ביולוגי רב כל כך שההבדלים גן הביטוי דיווחו בין הזנים הם לא רק תוצאה של השתנות "בתוך-המדגם".

החלטת עיצוב ביקורתית היא על שימוש רצף יחיד בסוף לעומת זיווג-סוף. עםרצף יחיד סוף, כל שבר הוא רצף חד-כיוונית ולכן התהליך הוא מהיר יותר, זול יותר ומתאים פרופיל תעתיק. בשנת רצף זיווג-סוף, לאחר שהבר הוא רצף מקצה אחד לקצה השני, סיבוב שני של סידור יתחדש בכיוון ההפוך. הוא מספק נתונים מעמיקים יותר מידע מיצוב נוסף של הגנום, כך הוא יותר מתאים הרכבה בגנום דה נובו, זיהוי SNP חדש לזיהוי שינויים אפיגנטיים, מחיקות, הוספות, ואת תנוחות הפוכות. בדומה לכך, המספר הכולל של הקורא והיקף כיסוי הגנום נדרש ללימודי ביטוי הפרש נאותים תלוי בהקשר. עבור הגנום קטן, כגון חיידקים ופטריות, ~ 5 מיליון קורא מספיק, בעוד, בשנת תולעים וזבובים ~ 10 מיליון קורא לספק כיסוי הולם. עבור אורגניזמים עם הגנום גדול כגון עכברים ובני אדם, 15-25 מיליון קורא הוא הטווח הנדרש. בנוסף, למספר קריאת הכיסוי, הוא גם שדortant שרוב NGS קורא ליישר בגנום הפניה. מערך של <70% קורא מעיד NGS העני או הנוכחות של מזהמים. בסך הכל, עבור C. elegans מחקרים-Seq RNA, שלושה ביולוגי משכפל רצף עם 50 BP רצף חד כיווני וכתוצאה מכך ~ 10-15 מיליון קורא ~ 5-10X כיסוי הגנום עבור כל דגימה היא מטרה אידיאלית.

למרות הקלות של שימוש גלקסי, יש כמה נקודות שיש לזכור על מנת להבטיח חוויית ניתוח נתונים חלקה נטול תקלות. זה הכרחי עבור המשתמש להיות בעל הבנה בסיסית של המטרה ותפקוד הכלים השונים המשמשים. כל כלי גלקסי דורש בחירה של פרמטרים והבנת הכלי שתעזור המשתמש לייעל את הגדרות מבוססות על הדרישה של הניסוי. דפי עזרת גלקסי להסביר כל פרמטר ומומלץ שהמשתמש לעיין בפרטים אלה כדי להחליט על משתנה מבחן.

רשימת הגן שהושג pOST ניתוח-Seq RNA הוא רק רשימה של גנים עד שהוא ממוקש עבור נתונים רלוונטיים ביולוגי באמצעות DAVID. זהו תרגיל חיוני הממירה נתונים מבוססי גנים בודדים לתוך התוצאות מבוססות ביולוגי-תהליך. היכרות עם רשימת הגן-Seq RNA באמצעות הניתוח השונה DAVID מספק לכן חלק אינטגרלי וחשוב של הפרוטוקול.

שינויים, פתרון בעיות ומגבלות

תקלה נפוצה עם ניתוח נתוני NGS היא משימות או בדיקות שאינן מצליחה, במיוחד בשלבים-בקרת איכות. המבחנים FastQC פועל על מדגם, כמה יכול לבוא בתור נכשל. עם זאת, זה לא בהכרח אומר המדגם אינו עומד בתקני איכות fastq. הכישלון יכול להיות הסבר חלופי שאמור להיחקר בזהירות.

לדוגמה, אם "תוכן רצף לפי בסיס" המבחן נכשל (דבר המצביע על כך שיש הבדל גדול מ 10% ביןבסיסים בכל תנוחה), לבדוק את השיטה להכנת ספריית oligodt. מחקרים קודמים הראו כי ספריות Illumina NGS עשויה להיות נטייה לבסיס 13 th להיות רצף שיש הטיה עבור בסיסים מסוימים גורמת המדגם להיכשל במבחן. בדומה לכך, כישלון של המבחן "תוכן Kmer" יכול לפעמים לייחס לעובדה הספריות הנגזרות תחול אקראי תהיינה כמעט תמיד מראות הטית Kmer בתחילה בשל דגימה חלקית של פריימרים האקראיים. לכן, חשוב לשקול את השאלות האלה מכשולים אחרים בצנרת הניתוח לפני קביעת גורלם של הניסוי.

תכונה חשובה נוספת שעשויים להשפיע ניתוח נתוני Seq RNA היא הפיתוחים המהירים ומהירים המתרחשים שיטות NGS ותוכנה אנליטית. באופן אידיאלי, אחד מצפה רשימת גנים זהה לנבוע ניתוח נתוני NGS מדגמים על שני צינורות או שתי הגירסות של אותו הצינורקַו. עם זאת, בעוד אלגוריתמים משפרים ללא הרף מורידים סטיות בניתוח RNA-seq והפיקו רשימות גן של דיוק רב יותר, זה בדרך כלל מוביל לפערים. למשל, ניתוח נתוני NGS מדגם משתמשים בגרסה ישנה לעומת חדשה יותר של אותו הכלים עשויים לייצר רשימות גנים שונות באופן משמעותי. וריאציה צנועה צפויה אך המשתמשים צריכים להיות מודע לכך פערים גדולים עשויים לשקף חולשות בתכנון או בביצוע הניסוי.

ביחד, הכלים אנליטיים פרויקט גלקסי והדוד שינו את האופן שבו נתוני NGS ניתן לרתום כדי לחלץ מידע ביולוגי רלוונטי. זה פתח לרמות חדשות לגמרי של עצמאות חקירה לקהילה המדעית, כולל חוקרי C. elegans. למשל, עלות צמצום הזמן של סידור יחד עם טוב יותר טכנולוגיית ריצוף מהר עומדת בפתחו של עידן transcriptomics ברמה של תולעים יחידים,רקמות תולעת בודדות ואפילו כמה תאי תולעת בחרו. מאמצים אלה כרוכי עליות דרמטיות נתוני NGS נוצרות. שמירה על קשר עם סוף אנליטי של עבודה זו תהיה אתגר, אבל בגלל הרבגוניות שלה, גלקסי צפוי להיות אינסטרומנטלי להעצמת מעבר transcriptomics האורגניזם כולו כדי RNA-seq ברמת תא בודדת ב C. elegans. ההתקדמות ותוצאת הידע צפויה לספק תובנה יוצאות דופן לתוך ביולוגיה בסיסית.

Subscription Required. Please recommend JoVE to your librarian.

Disclosures

החוקרים אין לחשוף.

Acknowledgments

המחברים מבקשים להביע את תודתם המעבדות, הקבוצות ויחידים אשר פתחו גלקסי ודוד, וכך עשו NGS נגיש נרחב עבור הקהילה המדעית. העזרה והייעוץ הניתנים על ידי עמיתיו באוניברסיטת פיטסבורג במהלך אימון ביואינפורמטיקה שלנו הוא הודה. עבודה זו נתמכה על ידי Scholar ניו קרן אליסון הרפואי הזדקנות הפרס (AG-NS-0879-12) ואת מענק מטעם המכון הלאומי לבריאות (R01AG051659) כדי AG.

Materials

Name Company Catalog Number Comments
RNase spray  Fisher Scientific 21-402-178
Trizol  Ambion 15596026
Sonicator Sonics Vibra Cell  VCX130
Centrifuge  Eppendorf 5415C
chloroform  Sigma Aldrich 288306
2-propanol  Fisher Scientific A416P-4
Ethanol Decon Labs 2705HC
RNase-free water  Fisher Scientific BP561-1
Bioanalyzer  Agilent G2940CA
Mac/PC

DOWNLOAD MATERIALS LIST

References

  1. Venter, J. C., et al. The sequence of the human genome. Science. 291, (5507), 1304-1351 (2001).
  2. Lander, E. S., et al. Initial sequencing and analysis of the human genome. Nature. 409, (6822), 860-921 (2001).
  3. Afgan, E., et al. The Galaxy platform for accessible, reproducible and collaborative biomedical analyses: 2016 update. Nucleic Acids Res. 44, (W1), W3-W10 (2016).
  4. Trapnell, C., Pachter, L., Salzberg, S. L. TopHat: discovering splice junctions with RNA-Seq. Bioinformatics. 25, (9), 1105-1111 (2009).
  5. Trapnell, C., et al. Transcript assembly and quantification by RNA-Seq reveals unannotated transcripts and isoform switching during cell differentiation. Nat Biotechnol. 28, (5), 511-515 (2010).
  6. Roberts, A., Trapnell, C., Donaghey, J., Rinn, J. L., Pachter, L. Improving RNA-Seq expression estimates by correcting for fragment bias. Genome Biol. 12, (3), R22 (2011).
  7. Roberts, A., Pimentel, H., Trapnell, C., Pachter, L. Identification of novel transcripts in annotated genomes using RNA-Seq. Bioinformatics. 27, (17), 2325-2329 (2011).
  8. Trapnell, C., et al. Differential gene and transcript expression analysis of RNA-seq experiments with TopHat and Cufflinks. Nat Protoc. 7, (3), 562-578 (2012).
  9. Trapnell, C., et al. Differential analysis of gene regulation at transcript resolution with RNA-seq. Nat Biotechnol. 31, (1), 46-53 (2013).
  10. Huang da, W., Sherman, B. T., Lempicki, R. A. Systematic and integrative analysis of large gene lists using DAVID bioinformatics resources. Nat Protoc. 4, (1), 44-57 (2009).
  11. Giardine, B., et al. Galaxy: a platform for interactive large-scale genome analysis. Genome Res. 15, (10), 1451-1455 (2005).
  12. Han, Y., Gao, S., Muegge, K., Zhang, W., Zhou, B. Advanced Applications of RNA Sequencing and Challenges. Bioinform Biol Insights. 9, (1), 29-46 (2015).
  13. Mardis, E. R. Next-generation sequencing platforms. Annu Rev Anal Chem (Palo Alto Calif). 6, 287-303 (2013).
  14. Yang, I. S., Kim, S. Analysis of Whole Transcriptome Sequencing Data: Workflow and Software. Genomics Inform. 13, (4), 119-125 (2015).
  15. Khatri, P., Draghici, S. Ontological analysis of gene expression data: current tools, limitations, and open problems. Bioinformatics. 21, (18), 3587-3595 (2005).
  16. Huang da, W., Sherman, B. T., Lempicki, R. A. Bioinformatics enrichment tools: paths toward the comprehensive functional analysis of large gene lists. Nucleic Acids Res. 37, (1), 1-13 (2009).
  17. Shaye, D. D., Greenwald, I. OrthoList: a compendium of C. elegans genes with human orthologs. PLoS One. 6, (5), e20085 (2011).
  18. Consortium, C. eS. Genome sequence of the nematode C. elegans: a platform for investigating biology. Science. 282, (5396), 2012-2018 (1998).
  19. Agarwal, A., et al. Comparison and calibration of transcriptome data from RNA-Seq and tiling arrays. BMC Genomics. 11, 383 (2010).
  20. Mortazavi, A., et al. Scaffolding a Caenorhabditis nematode genome with RNA-seq. Genome Res. 20, (12), 1740-1747 (2010).
  21. Bohnert, R., Ratsch, G. rQuant.web: a tool for RNA-Seq-based transcript quantitation. Nucleic Acids Res. 38, Web Server issue W348-W351 (2010).
  22. Lamm, A. T., Stadler, M. R., Zhang, H., Gent, J. I., Fire, A. Z. Multimodal RNA-seq using single-strand, double-strand, and CircLigase-based capture yields a refined and extended description of the C. elegans transcriptome. Genome Res. 21, (2), 265-275 (2011).
  23. Amrit, F. R., Ratnappan, R., Keith, S. A., Ghazi, A. The C. elegans lifespan assay toolkit. Methods. 68, (3), 465-475 (2014).
  24. Hsin, H., Kenyon, C. Signals from the reproductive system regulate the lifespan of C. elegans. Nature. 399, (6734), 362-366 (1999).
  25. Alper, S., et al. The Caenorhabditis elegans germ line regulates distinct signaling pathways to control lifespan and innate immunity. J Biol Chem. 285, (3), 1822-1828 (2010).
  26. Steinbaugh, M. J., et al. Lipid-mediated regulation of SKN-1/Nrf in response to germ cell absence. Elife. 4, (2015).
  27. Lapierre, L. R., Gelino, S., Melendez, A., Hansen, M. Autophagy and lipid metabolism coordinately modulate life span in germline-less. C. elegans. Curr Biol. 21, (18), 1507-1514 (2011).
  28. Rourke, E. J., Soukas, A. A., Carr, C. E., Ruvkun, G. C. elegans major fats are stored in vesicles distinct from lysosome-related organelles. Cell Metab. 10, (5), 430-435 (2009).
  29. Ghazi, A. Transcriptional networks that mediate signals from reproductive tissues to influence lifespan. Genesis. 51, (1), 1-15 (2013).
  30. Ghazi, A., Henis-Korenblit, S., Kenyon, C. A transcription elongation factor that links signals from the reproductive system to lifespan extension in Caenorhabditis elegans. PLoS Genet. 5, (9), e1000639 (2009).
  31. Amrit, F. R., et al. DAF-16 and TCER-1 Facilitate Adaptation to Germline Loss by Restoring Lipid Homeostasis and Repressing Reproductive Physiology in C. elegans. PLoS Genet. 12, (2), e1005788 (2016).
  32. Wang, M. C., O'Rourke, E. J., Ruvkun, G. Fat metabolism links germline stem cells and longevity in C. elegans. Science. 322, (5903), 957-960 (2008).
  33. McCormick, M., Chen, K., Ramaswamy, P., Kenyon, C. New genes that extend Caenorhabditis elegans' lifespan in response to reproductive signals. Aging Cell. 11, (2), 192-202 (2012).
  34. Kartashov, A. V., Barski, A. BioWardrobe: an integrated platform for analysis of epigenomics and transcriptomics data. Genome Biol. 16, 158 (2015).
  35. Goncalves, A., Tikhonov, A., Brazma, A., Kapushesky, M. A pipeline for RNA-seq data processing and quality assessment. Bioinformatics. 27, (6), 867-869 (2011).

Comments

0 Comments


    Post a Question / Comment / Request

    You must be signed in to post a comment. Please or create an account.

    Usage Statistics