Waiting
Login processing...

Trial ends in Request Full Access Tell Your Colleague About Jove
Click here for the English version

Genetics

אופטימיזציה לרצף וניתוח של הירידה FFPE-בדיקות RNA

Published: June 8, 2020 doi: 10.3791/61060
* These authors contributed equally

Summary

שיטה זו מתארת את השלבים כדי לשפר את האיכות והכמות של נתוני הרצף שניתן להשיג באמצעות דגימות RNA מוטבעות (FFPE) קבועות של שעווה מוטבעת של formalin. אנו מתארים את המתודולוגיה להעריך יותר במדויק את האיכות של הדגימות FFPE-RNA, להכין ספריות ברצף, ולנתח את הנתונים מ FFPE-RNA דגימות.

Abstract

ביטוי גנטי ניתוח על-ידי רצפי RNA (RNA-seq) מאפשר תובנות ייחודיות לתוך דגימות קליניות שעלולות להוביל להבנת המנגנון של הבסיס למחלות שונות, כמו גם התנגדות ו/או מנגנוני הרגישות. עם זאת, רקמות FFPE, המייצגים את השיטה הנפוצה ביותר לשימור מורפולוגיה של רקמות בדגימות קליניות, אינן המקורות הטובים ביותר לניתוח ביטוי גנטי בפרופיל. ה-RNA שהושג מדגימות כאלה הוא מפורק לעתים קרובות, מפוצל, ושונה כימית, אשר מוביל לספריות רצפי משנה מיטביות. בתורו, אלה ליצור נתוני רצף באיכות ירודה שאינם אמינים עבור ניתוח ביטוי גנים גילוי מוטציה. כדי לעשות את המרב מדגימות FFPE ולהשיג את הנתונים הטובים ביותר האפשריים מדגימות באיכות נמוכה, חשוב לנקוט אמצעי זהירות מסוימים תוך תכנון תכנון ניסיוני, הכנת ספריות ברצף ובמהלך ניתוח נתונים. הדבר כולל את השימוש במדדים המתאימים לבקרת איכות מדויקת (QC), המזהה את השיטות הטובות ביותר לשלבים שונים במהלך יצירת הספריות ברצף, והקפד על הספרייה QC. בנוסף, החלת כלי תוכנה נכונה ופרמטרים עבור ניתוח נתונים רצף הוא קריטי על מנת לזהות פריטים בנתוני RNA-seq, לסנן את הזיהום באיכות נמוכה קורא, להעריך אחידות של כיסוי גנים, ולמדוד את הגישה המתוכנת של פרופילי ביטוי גנים בין משכפל ביולוגי. שלבים אלה יכולים להבטיח דיוק גבוה ומהווה התוכסות ליצירת פרופיל של דגימות RNA הטרוגנית מאוד. כאן אנו מתארים את השלבים השונים עבור מדגם QC, הכנה לספרייה ו-QC, רצף וניתוח נתונים שיכולים לסייע להגדיל את כמות הנתונים השימושיים שהתקבלו מ-RNA באיכות נמוכה, כגון זה שהתקבל מרקמות FFPE-RNA.

Introduction

השימוש בגישות הדור הבא איפשר לנו ללקט שפע של מידע מסוגים שונים של דגימות. עם זאת, מדגמים ישנים ומשומרים שנשמרו אינם מעשיים עבור השיטות הנפוצות של יצירת נתוני רצף ולעיתים קרובות דורשות שינויים בפרוטוקולים מבוססים היטב. רקמות ffpe לייצג סוג כזה מדגם כי כבר מנוצל נרחב עבור דגימות קליניות1,2,3. בעוד שימור FFPE שומר מורפולוגיה רקמות, חומצות גרעין ברקמות FFPE בדרך כלל מוצג מגוון רחב של נזק והשפלה, מה שמקשה לאחזר את המידע גנומית שעשוי להוביל תובנות חשובות על מנגנונים מולקולריים בבסיס הפרעות שונות.

ביטוי גנים נתונים שנוצרו על-ידי רצפי RNA הוא לעתים קרובות אינסטרומנטלי בלימוד מחלות ומנגנוני התנגדות ומשלים ניתוח מוטציה DNA. עם זאת, RNA הוא פגיע יותר השפלה, מה שהופך אותו מאתגר יותר להפיק נתונים ביטוי גנים מדויקים מרקמות FFPE. יתרה מזאת, מכיוון שהזמינות הרחבה והזולה של רצפי הרצף התבצעה לאחרונה, דגימות ישנות יותר לא אוחסנו לעתים קרובות בתנאים הנדרשים לשמירה על שלמות ה-RNA. חלק מהנושאים של דגימות FFPE כוללים השפלה של RNA עקב הטבעה של פרפין, שינוי כימי של RNA המוביל פיצול או refractoriness לתהליכים אנזימטיים הנדרש לרצף, ואובדן של זנבות פולי, הגבלת הישימות של oligo-dT כמו פריימר עבור היפוך טראנסקריפט4. אתגר נוסף הוא טיפול/אחסון של דגימות ffpe תחת תנאים מיטביים, אשר עשוי להוביל לירידה נוספת של מולקולות יציב משך כגון RNA ברקמות5. זה רלוונטי במיוחד עבור דגימות ישנות שייתכן שנאספו בזמן כאשר ניתוח ביטוי גנטי על ידי רצפי RNA לא ציפינו לדגימות. כל אלה להוביל לירידה באיכות וכמות של RNA שחולצו זמין ליצירת נתונים רצף שימושי. ההסתברות הנמוכה של הצלחה, בשילוב עם עלות גבוהה של רצף, יש הניאך חוקרים רבים מלנסות ליצור ולנתח את הנתונים ביטוי גנים מדגימות FFPE שימושי פוטנציאלי. כמה מחקרים בשנים האחרונות הפגינו שימושיות של רקמות ffpe עבור ניתוח ביטוי גנטי2,6,7,8,9, אם כי עבור פחות ו/או יותר דוגמאות לאחרונה.

כמחקר היתכנות, השתמשנו RNA שחולצו מתוך דגימות מרקמת הגידול FFPE של שלושה מאגרים רקמת שיורית מ מעקב, אפידמיולוגיה, ותוצאות סוף (הנביא) סרטן הרישומים עבור רצפי RNA וביטוי גנטי ניתוח10. הושגו ממעבדות פתולוגיה קלינית, רקמות ffpe של השחלות הגבוהה נסיובי אדנוקרצינומות אוחסנו מ 7 – 32 שנים בתנאים משתנים לפני החילוץ RNA. כי ברוב המקרים בלוקים אלה אוחסנו באתרים שונים במשך שנים ללא ציפייה של כל ניתוח גנטי רגיש בעתיד, לא הרבה טיפול נלקח כדי לשמר את חומצות גרעין. כך, רוב הדגימות הציגו RNA באיכות ירודה, עם חלק גדול של דגימות מזוהם עם חיידקים. עם זאת, הצלחנו לבצע כימות גנים, למדוד את האחידות ואת ההמשכיות של כיסוי גנים, ולבצע את ניתוח מתאם פירסון בין משכפל ביולוגי כדי למדוד את התוכנות. מבוסס על קבוצה של מפתח חתימה הפאנל הגן, השוונו את הדגימות במחקר שלנו עם הגנום של סרטן אטלס (TCGA) הנתונים ואישר כי כ 60% של דגימות היה ביטוי גנים דומה פרופילים11. בהתבסס על הקורלציה בין תוצאות QC שונות ומטא-נתונים לדוגמה, זיהינו מדדי QC מרכזיים בעלי ערך ניבוי טוב לזיהוי דגימות שסבירות גבוהה יותר להפקת נתונים רצף שמישים11.

כאן נתאר את המתודולוגיה המשמשת להערכת איכות של FFPE-RNA, יצירת ספריות ברצף החל מדגימות RNA שחולצו, וניתוח ביולוגי של נתוני הרצף.

Subscription Required. Please recommend JoVE to your librarian.

Protocol

1. כמות RNA ואיכות הערכה

  1. בחר את דגימות FFPE על פי קריטריונים מוגדרים מראש ולחלץ RNA באמצעות שיטה מתאימה (g., ערכת הפקת חומצות הגרעין של FFPE, טבלת חומרים).
    הערה: ישנן מספר שיטות שונות הזמינות עבור מיצוי ffpe-RNA, כולל שיטות מיקרו לחיתוך חדש שיכול לעבוד עם רקמות מעט מאוד לחלץ באיכות טובה RNA12,13,14.
  2. טיפול מירבית יש לנקוט כדי לשמר את היושרה של RNA בכל שלבי. זה כולל עבודה עם RNase מים חינם deionised, באמצעות RNase פלסטלינה חינם, וניקוי כל המכשירים שבאו במגע עם בלוקים FFPE עם ריאגנטים טיהור RNase.
  3. RNA צריך תמיד להיות מטופל בקפידה ונשמר בקרח, אלא אם צוין אחרת כדי למזער השפלה בעת הטיפול.
  4. אם מספיק חומר זמין, לחלץ RNA מיותר מאזור אחד בבלוק FFPE כדי ליצור משכפל ביולוגי מדגימות רבות ככל האפשר. עבור חלק מדגימות עם תשואה RNA בשפע, לחלק את ה-RNA המחולצים לשניים כדי לעבד כמו משכפל טכני.
  5. אם אפשרי, לאסוף כמות קטנה של מדגם בנפרד לאחר החילוץ עבור QC (כלומר, QC aliquot) כדי למנוע טיפול חוזר ומחזורי הקפאת הפשרה של המדגם, כי סביר להניח להוביל השפלה של RNA.
  6. בדוק את האיכות של ה-RNA (רצוי מ-QC aliquot) על ידי הפעלת אותו על מערכת ה-RNA QC (למשל, Agilent Bioanalyzer מערכת באמצעות שבבי RNA ננו, טבלת חומרים) על פי הוראות היצרן.
  7. ניתוח התפלגות שברי RNA בדגימות (לדוגמה, באמצעות תוכנת המומחה Bioanalyzer 2100) על-ידי חישוב הערכים של DV200 ו-dv100 כאחוז הקטעים הגדולים מ-200 nt (dv200) או 100 nt (dv100) בגודל.
  8. בין DV200 ו-dv100, זהה את המדד הכולל התפשטות גדולה יותר של ערכים עבור ערכת הדגימה הנתונה, ובדוק שלקיבוץ הדגימות בהתאם לרמת הלחות שלהם.
    הערה: עבור ערכות לדוגמה עם מולקולות RNA שלמות יותר (כלומר, גבוהה DV200 ערכים, כל או רובם עם dv200 > 40%), הסבירות שdv200 תהיה מדד QC שימושי. עם זאת, עבור ערכות לדוגמה עם התעתיקים המוחלש יותר (כלומר, ערכי DV200 נמוכים, כולם או רובם עם dv200 < 40%), יש סיכוי גבוה יותר שהdvה100 תהיה שימושית.
  9. בהתבסס על מדדי ה-QC, זהה את הדגימות שיש להן DV100 < 40%. מכיוון שדרגת השפלה זו עשויה להיות מאוד לא לייצר נתוני רצף שימושי11, מומלץ להימנע מעיבוד דגימות כאלה. אם התחליפים עבור דגימות כאלה זמינים, האיכות שלהם יש לבדוק באופן אידיאלי רק לכלול דגימות עם DV100 > 50%.

2. הכנת הספריה ברצף

  1. בהתבסס על איכות הדגימות כפי שמוערך בסעיף 1, זהה שיטה מתאימה ליצירת ספריות ברצף.
    1. עבור ערכות לדוגמה עם השפלה נמוכה מאוד וערכי DV200 גבוהה, להשתמש ברצף mrna (כלומר, לכידת התעתיקים הפוליפונאיליום), ממוקד rna רצף (כלומר, שימוש בבדיקות לכידת עבור גנים ספציפיים), RNA exome ברצף (כלומר, השימוש של בדיקות ללכוד להעשיר את הקידוד ההמרה), או הכולל רצפי rna (כלומר, שימוש בצבעי היסוד אקראית עבור תמלול הפוכה לרצף את אוכלוסיית rna כולו לאחר הסרת rna ריבוזומליים מ עם זאת, חשוב לציין כי תהליך הקיבעון עשוי להחדיר הטיה ב-RNA המחולצים. לפיכך, גישות הלכידה עשויות שלא לפעול היטב בכל המקרים, אפילו עם ערכי DV200 גבוהים.
    2. אם ערכת המדגם כוללת דגימות עם השפלה גבוהה (DV200 < 30%), השתמש בשיטת ההכנה הכוללת של ספריית RNA ולא באחת שתלויה בלכידת אזורים מסוימים של התעתיקים, מכיוון שאזורים ספציפיים אלה עלולים להיות חסרים בדגימות מתדרדרות. השימוש בצבעי יסוד אקראיים לדור של cDNA מוביל ייצוג גבוה יותר של RNA שמיש בספרייה הסופית, ולכן, מתאים יותר לדגימות FFPE-RNA.
    3. לדילול הריבוזומיום עבור ערכות לדוגמה עם השפלה גבוהה, השתמש בשיטות מבוססות RNaseH. אלה הן שיטות שבהן rRNA-DNA בדיקות לאגד rRNA, כפול תקועים מולקולות מתעכלים על ידי RNaseH ושאריות הבדיקות מנוקות על ידי DNase (למשל, נברנה הבאה rRNA מחסור, טבלת חומרים). שיטות אלה פועלות טוב יותר עבור דגימות מושפל יותר מאשר שיטות אחרות8.
  2. ליצירת ספריות ברצף, השתמש בכמויות קלט גבוהות יותר (במידת האפשר) עבור דגימות שבהן משתמשים ב-RNA (DV100 < 60%). בעוד דגימות עם באיכות טובה באופן סביר RNA (DV100 > 60%) עשוי להניב נתונים רצף טוב גם בכמויות הקלט נמוך יותר (הנמוך ביותר נבדק עבור פרוטוקול זה עם FFPE-RNA היה ~ 20 ng), עבור RNA מושפל יותר (DV100 < 60%), עדיף להתחיל עם כמויות קלט גבוה יותר (למשל, > 100 ng).
    הערה: אם נדרש מספיק (לדוגמה, > 500 ng), מומלץ לחסוך לפחות חצי מהדוגמה לצורך חזרה על הכנת הספרייה, במידת הצורך. לקבלת דגימות קלט נמוכות (לדוגמה, < 100 ng), בדרך כלל עדיף להשתמש בסכום כולו וליצור ספריה של גיוון מספיק.
  3. לאחר בחירת ערכת הכנה ספריה מתאימה להפקת סה כ ספריות seq של RNA מדגימות עם השפלה גבוהה (למשל, נברהבאה אולטרה השני RNA ספריית ההכנה עבור המאייר, ראה טבלת חומרים), בצע את ההוראות של היצרן כדי ליצור את הספריות.
    הערה: במהלך הכנת הספרייה, חשוב לדלג על שלב הפיצול של RNA עבור דגימות מתוערות ולהבטיח את השימוש בצבעי היסוד האקראיים לסינתזה הראשונה של cDNA.
  4. לשיפור היעילות והמהירות, במיוחד לדגימות הקלט הנמוך, השתמש בארונות תקשורת מגנטיים מתאימים עם מגנטים קבועים וחזקים לפעולות טיהור ובחירת גודל מבוססי-חרוז (ראה טבלת חומרים).
  5. עבור העשרת ה-DNA של מתאם המתאם, להתאים את מספר מחזורי הגברה בהתבסס על כמות ה-DNA קלט כדי להבטיח ייצוג מרבי תוך הימנעות כפילות מיותרת של מולקולות הספרייה. עבור קלט נמוך FFPE-RNA (< 100 ng), אנו ממליצים על 16 – 18 מחזורי הגברה, בעוד דגימות קלט גבוה (1,000 ng) בדרך כלל לייצר מספיק כמויות הספרייה ב 12 – 14 סיבובים של הגברה.
  6. בעקבות הגברה וניקוי של היצרן, העריכו את איכות הספרייה על-ידי ניתוח ריכוז הספרייה והפצת המולקולה בפלטפורמה מתאימה (לדוגמה, שבב ה-DNA של Agilent, ראה טבלת חומרים). לדגימות עם פסגות פריימר (~ 80 bp) או מתאם-dimer פיקס (~ 128 bp), חזור על הניקוי כדי להסיר את הפסגות האלה.
  7. חשב את גודל הספריה הממוצע עבור כל ספריה (לדוגמה, באמצעות תוכנת המומחה Bioanalyzer 2100).

3. הספריה ברצף QC

  1. ברגע שהוא הציע כי הספריות הם חופשיים של העודפים ומתאמים מתאם, יש ריכוז מספיק עבור רצף הבאים, בקוונטייט עוד יותר על ידי qPCR.
    הערה: בשל הרגישות של הדור אשכול כלפי ריכוז הספרייה, הקוונפיקציה מדויקת היא חיונית כדי למנוע רצפים יקרים ביצועים או העמסת יתר. שיטות PCR (qPCR) בזמן אמת כמותי שימושיות לשיפור צפיפות האשכולות בפלטפורמות המאייר מבלי להביא לקיבוץ באשכולות. השיטה qPCR הוא מדויק יותר ורגיש יותר מאשר השיטות המבוססות על ניתוח איכותי ו/או כמותי של כל מולקולות הספרייה (למשל, Agilent Bioanalyzer), משום שהוא מודד את התבניות כי יש שני רצפי מתאם באחד השני ליצור אשכולות על ה-flowcell. עם זאת, על גודל הספריה להיות ידוע מראש כאשר יש להחיל תיקון גודל על כל הדגימות כך שניתן יהיה להשוות את התוצאות לעקומה רגילה.
    התראה: מעילים וכפפות מעבדה חייבים תמיד להיות שחוקים בעת ביצוע qpcr, ואת ההליך יש לבצע בקבינט אבטחה טיחות בעקבות הוראות היצרן.
    1. הגדרת צלחת 96 עם שלוש משכפל עבור כל דוגמה עבור מניעת שגיאות באמצעות ערכה מתאימה (למשל, KAPA SYBR מהיר qPCR מיקס מומחה לספריות מוארות, חלק מערכת הכמת של הספרייה, ראה טבלת חומרים), יחד עם התקנים, שליטה חיובית (למשל, בקרת phix, ראה טבלת חומרים) ואין בקרת תבנית (ntc). NTC הוא שילוב qPCR ללא ספריית ה-DNA. השליטה החיובית יכולה להיות כל ספריה עם ריכוז ידוע וגודל קטע.
      1. הכינו שש מיליקות של התקנים הבאים בהתאם לפרוטוקול הספק.
    2. לאחר הוספת כל הרכיבים (כלומר, qPCR מיקס, ספריות, תקנים), לכסות את הצלחת עם איטום הסרט ולהשתמש מגב כדי להבטיח את הסרט מאפשר אפילו ומאובטח קשר עם הצלחת.
    3. מערבולת ולסובב את הצלחת ב 1,500 סל ד עבור לפחות 1 דקות. לבדוק חזותית את הצלחת כדי לוודא שאין בועות אוויר בתחתית הבארות.
    4. הגדר את הצלחת על הציקלייר תרמית (e. g. CFX96 Touch מערכת, ראה טבלת חומרים) באמצעות ההגדרות המומלצות של היצרן.
    5. שמור את תיקיית ההפעלה שבה ניתן לגשת אליה לניתוח נתונים.
    6. במהלך ניתוח נתונים, בדוק כי השיפוע הוא ב-3.1-3.6 טווח, יעילות מ 90% כדי 110% ו-R2 (מקדם מתאם שהושג עבור עקומת רגיל) לא פחות מ-0.98.
  2. איגוד: לאחר הריכוז qpcr של ספריות מוכנות רצף מתקבל, הבריכה כמויות שווה של כל הספריות, בהתאם למספר הרצף הקורא הנדרש לכל מדגם ואת הפלט רצף של המכשיר.
  3. קוו של הבריכות: ככמת את בריכות הספרייה שוב על ידי qpcr בעקבות אותו פרוטוקול כפי שמתואר בשלב 3.1.

4. רצפי הרצף

  1. בהתאם לפרמטרים להפעיל, למשוך את ערכות מגיב ברצף ולהפשיר אותם בעקבות המדריך למשתמש. אנא בדוק את אתר האינטרנט של המאייר לקבלת הגרסאות העדכניות ביותר של כל מדריכי המשתמשים לקביעת רצף בכלי המאייר.
  2. ודא הריאגנטים הם לגמרי להפשיר ולמקם את מגש ריאגנטים ב 4 ° c. ההפעלה צריכה להיות מתחילה לא יאוחר מ-2 שעות לאחר שהריאגנטים הופשר. לא לעשות את זה יכול להשפיע על איכות של תוצאות הריצה.
  3. היפוך מחסנית 5x כדי לערבב ריאגנטים ולהקיש בעדינות על הספסל כדי להפחית בועות אוויר.
  4. הגדר את החבילה של התא הפתוח הפתח בצד בטמפרטורת החדר עבור 30 דקות.
  5. בטל את האריזה של תא הזרימה ונקה את משטח הזכוכית של תא הזרימה בעזרת מחיקת אלכוהול ללא מוך. יבש את הזכוכית עם רקמת מעבדה נמוכה.
  6. פתח את יישוםמנהל הניסוי"המאיר". בחר "ליצור גיליון לדוגמה", ואז לבחור ברצף ולחץ "הבא".
  7. צור והעלה את הגיליון לדוגמה המבוסס על קריטריונים ברצף המאיר (לדוגמה, מנהל ניסוי הארה, מדריך תוכנה).
  8. על ההנחיות, לסרוק את ברקוד הערכה מגיב ולהיכנס להגדיר להפעיל את הפרמטרים (למשל, עבור מחזור אחד באינדקס 75 PE הפעלה, הזן 76-8-76).
  9. הספרות ולדלל את בריכת הספרייה מבוסס על המלצה ברצף מדריך למשתמש (למשל, Nexצביה 500 מדריך מערכת מ הארה, ראה טבלת חומרים).
  10. הספרות ולדלל את ספריית הבקרה PhiX (ראה טבלת חומרים) לריכוז המתאים (למשל, 1.8 PM עבור nexצביה).
  11. ערבב ספריית לדוגמה ופקד PhiX כדי לגרום לעוצמת השליטה בפקד של 1% PhiX.
  12. העמיסו דגימה מדולל ומדוללת לתוך מחסנית מגיב במאגר ייעודי.
  13. טען את תא הflowcell את מחסנית המאגר ואת מיכל הדיו הממגיב.
  14. בצע בדיקה אוטומטית וסקור כדי לוודא שהפרמטרים הפועלים יעברו את בדיקת המערכת.
  15. כשהבדיקה האוטומטית תושלם, בחר באפשרות Start (התחל ) כדי להתחיל בהפעלת רצף.

5. ניתוח נתונים והערכת איכות

הערה: זרימת נתונים אופיינית של RNA-seq (איור 1) כוללת עיבוד מקדים ו-qc, יישור לגנום ולאחר יישור qc, גנים וכימות תעתיק, ניתוח מתאם לדוגמה, ניתוח דיפרנציאלי בין קבוצות לדוגמה שונות, תנאי טיפול וניתוח העשרה ושביל גנים.

נתוני RNA-seq עשויים להיות בעלי בעיות איכות שיכולות להשפיע על הדיוק של פרופיל הגנים ולהוביל למסקנות שגויות. לכן, QC הראשונית בדיקות לאיכות רצף, זיהום, רצף הטיה כיסוי, ומקורות אחרים של פריטים חשובים מאוד. החלת צינור הנפט מבוססי RNA-Seq בדומה לזרימת העבודה המתוארת כאן מומלצת לאיתור פריטים ולהחלת סינון או תיקון לפני ניתוח במורד הזרם.

  1. Preprocessing
    הערה: הדבר כולל מדיריבוב, הערכה של איכות קריאה ברצף, תוכן GC, נוכחות של מתאמי רצף, מיוצגים באמצעות k-מרס ו-PCR כפולות קריאות. מידע זה מסייע לזהות שגיאות רצף, חפצי PCR או זיהום.
    1. דיפלקס המאיר מופעל באמצעות כלי התוכנה של המאיר bcl2fastq2 להפקת קבצי fastq גולמיים עבור כל דוגמה המוגדרת בגיליון המדגם. אפשר אי-התאמה אחת בברקודים של אינדקס לדוגמה כדי לסבול שגיאות רצף אם אין התנגשות ברקוד.
    2. הפעל את Fastqc15 כלי תוכנה כדי לבצע בדיקת איכות על קבצי fastqc raw כדי לזהות כל איכות ירודה או חריגות ברצף קריאות.
    3. עבור מתאם ובסיסים באיכות נמוכה זמירה, קצץ את מתאמי הרצף ואת בסיסי איכות נמוכה באמצעותהתאמת16 או trimmomatic17 כלי תוכנה. שמור את הקריאות הגזוז בקבצי fastq של זוג קצה.
    4. מסך זיהום
      1. לרוץ FASTQ_screen18 כדי לזהות זיהום הצלב אפשרי עם מינים אחרים.
      2. הפעל את Minikraken של Kraken219 כדי לזהות את המייונים של מינים מזהם.
  2. יישור להפניית הגנום והיישור של QC
    1. קריאות גזוז ניתן ליישר את רצף הגנום התייחסות (GRCh לבנות hg19 או hg38) באמצעות כוכב תנינים20. החל את קובץ ה-GTF הביאור של הקוד כדי להנחות את יישור התעתיק המשולבים. מומלץ להפעיל כוכב 2-לעבור כדי להגביר את הרגישות הספר הצמתים החדשניים. במעבר השני, כל הקריאות יוספרו מחדש תוך שימוש בגנים ממוארים ובתעתיקים ובצמתים החדשניים מהמסירה הראשונה.
    2. בצע QC שלאחר היישור.
      1. הפעל את21המקכפולים של פיקארד כדי להעריך את מורכבות הספריה על-ידי קביעת כמות הקריאות הייחודיות או הלא-משוכפלות בדגימות.
      2. הפעל את התוכנית הקולקטימטרי של פיקארד לאיסוף אחוזי מיפוי בקידוד, באינטטרונית, באזורי utr ובכיסוי הגוף הגנטי.
      3. הפעל Rseqc22 כדי לקבוע את זוג לקרוא את המרחק הפנימי, לקרוא התפלגות בין exons תקליטורים, 5 ' utr, 3 ' utr, intron, TSS_up_1kb, TSS_up_5kb, TSS_up_10kb, TES_down_1kb, TES_down_5kb, TES_down_10kb, לקרוא את התוכן GC, ההסתעפויות הצומת, ומידע סטרנד הספרייה.
      4. הפעל multi-QC23 כדי ליצור דוח צבור בתבנית HTML.
  3. כימות ג'ין וניתוח תיקון
    1. הפעל Rsem24 לקבל ספירת raw, כמו גם לספור לקרוא מנורמל על גנים ותעתיקים. מדידת ספירת הקריאה כגון RPKM (קריאות לבסיס קילומטר של מודל אקסון לכל מיליון קריאות), fpkm (מקטעים לבסיס של מודל אקסון למיליון קריאות ממופות) ו-TPM (תעתיקים לכל מיליון) הם הערכים הרבים ביותר שדווחו RNA-seq הביטוי גנים. הגנים הביעו מתחת לסף מנוקד (כגון TPM < 1 או ספירה גולמית < 5) ניתנים לסינון.
    2. בצע כימות תעתיק כדי לצבור סעיפים גולמיים של קריאות ממופות לכל רצפי תעתיק באמצעות תוכניות כגון HTSeq-count או תכונות מתאר.
    3. הפעל את ' ניתוח רכיבים ראשיים ' (pca) באמצעות קובץ script של R כדי לקבוע אפקטי אצווה ולהעריך מפת איכות של קבוצת הנתונים הנתונה25. ניתוח מיתאם לדוגמה יכול להתבצע באמצעות המתאם פירסון בין מדדים שונים.
  4. ניתוח ביטוי גנים דיפרנציאלי
    1. ביצוע ניתוח הדיפרנציאל גנטי בין תנאים לדוגמה באמצעות התוכנית edger26,27 ו/או limma-voom28 ושימוש בשיטות נורמליזציה כולל TPM, tmm, deseq, או הסנטר.
    2. מומלץ להריץ לפחות שני כלי תוכנה לניתוח דיפרנציאלי כדי לקרוא לשני הסוגים של רשימות DEGs להשוואה ולקבל את DEGs הסופי כדי לשפר את הרגישות והדיוק של הזיהוי.
  5. מערכת גנטית-העשרה וניתוח מסלול
    1. ביצוע הערכה גנטית לניתוח העשרה (gsea)29, 30 מבוסס30 על דירוג של תעתיקים על פי מדידה של ביטוי מובהק גנים (degs) רשימה כדי לקבוע אם degs להראות משמעותי סטטיסטית, concordant הבדלים בין התנאים הביולוגיים.
    2. לבצע ניתוח פונקציה באמצעות משאבים כגון גן האונטולוגיה31, דוד32,33, או כלי תוכנה זמינים אחרים.

Subscription Required. Please recommend JoVE to your librarian.

Representative Results

המתודולוגיה שתוארה לעיל הוחלה על 67 FFPE דגימות שאוחסנו תחת מגוון של תנאים שונים עבור 7 – 32 שנים (המדגם החציוני זמן אחסון היה 17.5 שנים). תוצאות ערכת הנתונים והניתוח שהוצגו כאן תוארו בעבר ופורסמו בז ואח '11. על בדיקת איכות המדגם כמתואר קודם (כלומר, עקבות למשל באיור 2), DV100 נמצא שימושי יותר מ-dv200 משום שהוא רגיש יותר למדוד במדויק את הפרופורציה של גודל קטעים קטנים יותר עבור דגימות RNA המושפל מאוד.

בערכת הדגימה הנתונה, פחות מ-10% מהדגימות (7 מתוך 67) היו מעל ל-DV200 לנתק מ -30%, כמומלץ על ידי המאייר34. כ -26% מהדגימות (19 מתוך 67) היה DV100 > 60% (כלומר, סבירות גבוהה יותר ליצירת נתונים רצף טוב), 40% (27 מתוך 67) היו בטווח של 40%-60% עבור DV100 (כלומר, מקובל, אבל עם סבירות נמוכה יותר של יצירת נתונים רצף טוב), ו 10% (7 של 67) היו100 DV של < 40% (כלומר, הסבירות נמוכה מאוד של כתוצאה מהנתונים רצף טוב). עבור 14 מתוך 67 דגימות, לתוכנה לא היתה אפשרות לקבוע את ערכי ה-DV. Table 1 מציג תקציר של מדדי QC עבור הדגימות בקטגוריות DV100 שונות. לניתוח QC מפורט ומיתאם נתונים לכל 67 הדגימות, אנא ראה ז'או ואח '11.

בהתחשב ברמה גבוהה של השפלה בערכה לדוגמא, הכנת הספרייה של ה-RNA הכולל שיטת ההכנה, וברצף הספריות הוכנו באמצעות ערכת ההכנה של ספריית RNA הבאה של הספרייה השנייה בשיטת "הכנה לאור" (טבלת חומרים). כדי לשפר את הייצוג של ספריות ברצף למרות הרמה הגבוהה של השפלה מדגם, הכמות המרבית האפשרית של RNA (1,000 ng כאשר הוא זמין) שימש כקלט עבור הכנת הספרייה. בנוסף, השפלה גבוהה של הדגימות FFPE-RNA המחייב את שיטת המחסור rRNA, כי התעתיקים מושפל היו צפויים לא להיות הזנבות פולי עבור לכידת mRNA. בעקבות דלדול ה-RNA של הריבוזומיום באמצעות הכלאה לבדיקות והעיכול ספציפיים של התעתיקים ההוכלא באמצעות RNaseH, התעתיקים הנותרים הומרו ל-cDNA באמצעות צבעי יסוד אקראיים. הבחירה בגודל גם היתה נמנעת עבור ספריות שהוכנו מדגימות קלט נמוכות יותר. לדוגמה, עקבות של ספריות סופיות מוצגות באיור 3.

מאוד מושפל בדגימות FFPE מייצגים אתגר גדול עבור פרופיל ביטוי גנים בדגימות הגידול. לפיכך, החלת שיטות ניתוח נכונות של ביואינפורמטיקה וכלי תוכנה היא קריטית לזיהוי פריטים או חריגות בערכות נתונים כדי להבטיח דיוק גבוה והקפדה על כימות הגנים. כלי התוכנה המשמשים במחקר זה מפורטים בטבלה השלמה. בערכת הדגימה הנתונה, ביצעת הערכת בדיקת איכות וספריות, עם כמה מדדים לדוגמה המוצגים באיור 4. מבט כולל על איכות רצף הקבצים של raw fastq ותוכן מתאם לדוגמה מוצגים באיור 4A ובאיור 4a, בהתאמה. המסך fastqc יכול לעזור לזהות זיהום, כגון זיהום חיידקי ועכבר, בדגימות כפי שמוצג באיור 4C. בערכת מדגם נתון, 41 של 67 דגימות היה 5% – 48% זיהום חיידקי, ו 6 דגימות היה 4% – 11% זיהום העכבר (איור 4C). תוצאות היישור של כוכב (איור 4D) הראו את החלק של הקריאות שמופו לגנום הייחוס, אחוז הקריאות ממופה באופן ייחודי לגנום הייחוס, וחלק מקריאות שלא מופו או ממופות למיקום מרובה. האתר משמש לקביעת מבנה ה-mRNA, האינטרוניק והבסיסים הבינגניים הנמצאים בקבצי היישור (איור 4E). כדי להעריך את אחידות של כיסוי לקרוא על גנים ותעתיקים, השתמשנו בכלי התוכנה פיקארד ליצור מגרש כיסוי הגוף הגנטי, אשר מודד את אחוז הקריאות כי לכסות כל מיקום נוקלאוטיד של כל הגנים מדורגים לתוך סלים מ 5 ′ UTR כדי 3 ′ UTR. איור 4F מראה שלספריות מסוימות היו שלוש ' הטיה ', כאשר קריאות נוספות ממופות קרוב יותר ל-3 ' מאשר לקצה ה-5.

לדוגמאות FFPE יש בדרך כלל שינויים גדולים בפרופילי ביטוי גנים שעלולים להתעורר עקב השפלה משתנה במהלך אחסון לדוגמה, הפקת RNA, או עיבוד לדוגמה. חשוב להשתמש בשיטות סטטיסטיות מתאימות כדי לחשוף את דפוסי הבסיס ולמדוד את הווריאציה ואת הקורלציה בין דגימות. התחלנו את ניתוח הרכיבים העיקריים (PCA) עבור שישה זוגות של משכפל ביולוגי מקבוצת משנה של דגימות FFPE 67. מגרש PCA הראה כי 26% של וריאציה מוחלטת נכבשה על ידי המרכיב העיקרי הראשון ו 19% מהרכיבים השני והשלישי בשילוב (איור 5). בין ששת הזוגות של שכפול, שני זוגות של משכפל היו וריאציות גבוהות יותר (מערכת יחסים מתחת 0.22) מאשר ארבע הדגימות האחרונות (ערכי מתאם בין 0.7-0.8) בעת השוואת ערכי ביטוי גנים בין זוגות שכפול. בגלל הכפלת שנוצרו על ידי חילוץ RNA משני תלתלים רקמה שונים לחתוך מן בלוקים FFPE אותו, הגיל רקמה לא היה גורם בשונות גבוהה כאן, וזה היה סביר להניח על ידי כמות שונה של זיהום חיידקי (1% – 55%) כמו גם תוכן mRNA שונה (2 – 3 הפרש קיפול) בין המשכפלת. האקראיות של השפלה mRNA לאחר החילוץ יכול גם לתרום לשונות גבוהה יותר בין דגימות של מוצא דומה.

Figure 1
איור 1: זרימת עבודה של ניתוח RNaseq. תרשים הזרימה מתאר את שלבי הניתוח לעיבוד מקדים, הערכת איכות, מיפוי להפניה, כימות הגנים וניתוח דיפרנציאלי בין קבוצות לדוגמה שונות. אנא לחץ כאן כדי להציג גירסה גדולה יותר של איור זה.

Figure 2
איור 2: למשל עקבות ביומנתח של שישה דגימות FFPE-RNA שונים. הציר האופקי מציין את המשקל המולקולרי (bp) ואת יחידות הזריחה (FU) ואת הציר האנכי מראה את הריכוז של שברים בגודל שונים. מספרי שלמות ה-RNA (RIN), DV200 (כלומר, אחוז משברי > 200 bp) ו-dv100 (כלומר, אחוז מקטעים > 100 bp) ערכים מצוינים בכל פרופיל. שיא 25 bp בכל פרופיל מציין את סמן המשקל המולקולרי. אנא לחץ כאן כדי להציג גירסה גדולה יותר של איור זה.

Figure 3
איור 3: לדוגמה עקבות ביומנתח של ספריות סופיות שהוכנו מארבע דגימות שונות. הציר האופקי מציין את המשקל המולקולרי (bp) ואת יחידות הזריחה (FU) על הציר האנכי מציין את הריכוז של קטעים בגודל שונים. הנמוך (35 bp או 50 bp) ו העליון (10,380 bp) פסגות סמן מסומנים ירוק וסגול, בהתאמה. אנא לחץ כאן כדי להציג גירסה גדולה יותר של איור זה.

Figure 4
איור 4: לדוגמה דוח מרובה-QC לעיבוד מקדים של תוצאות QC. (A) תרשים קו המציג את אחוזי בסיסי Q30 של כל קריאות הרצף בכל אחת מהדוגמאות. (ב) קביעת רצף של תוכן מתאם בקבצי fastq גולמיים. (ג) מזהמים במסך כדי לבדוק מינים התואמים היטב. (ד) סטטיסטיקת מיפוי הגנום. (ה) התפלגות הקריאה המבוססת על ביאור הגנים של Gencode. (ו) הגן על הגוף/כיסוי התמליל נא לחץ כאן כדי להציג גירסה גדולה יותר של איור זה.

Figure 5
איור 5: ניתוח PCA לדוגמה כדי להציג קונקורדנציה של קבוצה לדוגמה. ניתוח PCA לשכפל ביולוגי. מגרש PCA עם דגימות מותווים בשני ממדים באמצעות התחזיות שלהם על שני הרכיבים העיקריים הראשונים. משכפל ביולוגי מוצג באותו צבע. אנא לחץ כאן כדי להציג גירסה גדולה יותר של איור זה.

מספר דוגמאות קלט חציון עבור lib הכנה (ng) החציון רין חציון DV200 חציון DV100 גודל לב חציון (bp) התפוקה החציוני של Lib (ng) התיכון (nM) זמן אחסון חציון (שנים) קונטמינציה% זיהום ספירת גנים חציון
DV100 < 40% 7 237.6 2.5 6 34 445 24.5 7 22 27.4 14,759
DV100 40-60% 27 1000 2.5 12 51 408 19.8 5.9 18 9.9 10,202
DV100 > 60% 19 1000 2.3 26 73 355 84.9 24 13 3.2 9,993

טבלה 1: סיכום של מדדי QC שהוגדרו לדוגמה. הטבלה מציגה את מדדי ה-QC של הדגימות, מקובצות בהתאם לערכי ה-DV100 שלהם. מספר הדגימות בכל קבוצה מופיע וערכי חציון עבור כל מדד מוצגים.

טבלה משלימה: ניתוח כלי תוכנה, פרמטרים והתייחסות לתוכנה. הטבלה מפרטת את הכלים והפרמטרים של תוכנת הניתוח המשמשים בכל שלב של ניתוח ה-RNA-seq. ההפניות לכלי התוכנה מפורטות בטבלה. אנא לחץ כאן כדי להוריד את הטבלה.

Subscription Required. Please recommend JoVE to your librarian.

Discussion

השיטה המתוארת כאן מתארת את הצעדים העיקריים הנדרשים לקבלת נתוני רצף טובים מדגימות FFPE-RNA. הנקודות העיקריות לשקול עם שיטה זו הם: (1) ודא כי ה-RNA נשמר הטוב ביותר ככל האפשר לאחר החילוץ על ידי מזעור הטיפול לדוגמה, הקפאת והפשרה מחזורים. הפרדת מסדר QC מסייעת רבות. (2) השתמש במדד QC שהוא הטוב ביותר עבור ערכת המדגם הנתונה. ערכי RIN ו-DV200 אינם שימושיים לעתים קרובות עבור דגימות שאינן מועילות, ו-dv100 עשוי להיות מדד הבחירה כדי להעריך את האיכות בערכת דגימה נתונה. (3) לקבלת דוגמאות מסוימות, מומלץ להשתמש בקלט לדוגמה גבוהה. סכומי קלט גבוהים יותר מובילים לגיוון טוב יותר ולשכפול נמוך יותר בספריה הסופית, המובילים לאיכות נתונים משופרת. מכיוון שלא כל RNA ב-FFPE-RNA דגימות הוא שמיש בשל השפלה גבוהה refractoriness לתהליכים אנזימטיים, תופעות אלה מבוטא יותר FFPE-RNA לעומת ה-RNA טריים קפוא. (4) השתמש הטרמה אקראית עבור שעתוק הפוכה צעד בניגוד לשימוש oligo-dT או רצפים ספציפיים כמו התחל. אלא אם כן הסט של הגששים הספציפיים הוא מסוגל לכסות את הרצף הרבה ככל האפשר עבור כל התעתיקים של העניין, התחל אקראית הם הימור בטוח כדי להבטיח את ההמרה של מספר מירבי של תעתיקים (או שברים ממנו) ל-cDNA. כך, סה כ שיטות ההכנה של ספריית RNA שימושיות יותר לדגימות שאינן ממוכבות משיטות mRNA, המסתמכות על נוכחות של זנבות פולי-A. (5) הקוונפיקציה מדויקת של ספריות על ידי PCR בזמן אמת (qPCR) חשוב כדי למנוע ביצועים מסוימים או העמסת יתר של הנצנצים. (6) להעריך את הזיהום הפוטנציאלי של RNA כחלק לפוסט סטנדרטי רצפי RNA-Seq QC פרוטוקולים. זיהום חיידקי, זיהום DNA גנומית נפוצים עבור דגימות FFPE עקב תנאי אחסון והכנה לדוגמה הליכים. דגימות מזוהמות ממינים זרים יכולים לבזבז את רצף הכיסוי, תלוי במידת הזיהום. בנוסף, זיהום פנימי יכול לנבוע מדלדול rRNA לא שלם, המוביל אחוז גבוה של קורא מיפוי Rrna. לא יעיל הסרת DNA גנומית במהלך העיכול DNase יכול להוביל לזיהוי ביטוי חיובי שווא של תעתיקים או הרכבה שגויה דה נובו של התעתיקים. זיהום מתאם שהוצגו במהלך הכנת הספרייה היא גם בעיה נפוצה עבור RNAs מושפל מאוד עם קטעי RNA קצרים מאוד. זיהום יכול להשפיע על הדיוק של הגן והתעתיק של הפרופיל ולהוביל לגילוי שווא. לכן, חשוב לזהות במדויק את מקורות הזיהום ולהסיר את הזיהום, אם אפשר, במהלך המדגם או הכנת הספריה, או לסנן את הקריאות מזהם במהלך עיבוד הנתונים. (7) עיבוד מקדים ובקרת איכות שלאחר היישור חשובים לזיהוי איכות רעה ודגימות תוכן נמוכות של mRNA. יש לסלק את הדגימות. מניתוח נוסף ביטוי גנטי נתונים מדגימות שיוצרות ספירות גנים נמוכות, יש להשתמש בכיסוי המסכן בזהירות. (8) זה מנהג טוב לכלול משכפל ביולוגי כדי למדוד דגימות שונות ומתאם כדי להבטיח את הנתונים הנוזדות.

דוגמאות FFPE מייצגות משאב חשוב מאוד עבור מספר רב של מחלות. היכולת להשיג מידע רצף אמין מדגימות כאלה תסייע הרבה מחקרים שמטרתם להבין את המנגנון המולקולרי מאחורי הפרעות שונות, התנגדות, ורגישות. למרות המגבלות שהוטלו על ידי האיכות הגבוהה ביותר של RNA מופק מדגימות כאלה לעשות לעכב מאמצים כאלה, השלבים המתוארים כאן לעזור להפחית את המגבלות הללו במידה מסוימת ולאפשר לנו להפיק את המרב של FFPE-RNA כדי לקבל מידע אמין ביטוי גנים.

Subscription Required. Please recommend JoVE to your librarian.

Disclosures

עבודה זו ממומנת על ידי המכון הלאומי לסרטן (NCI), המכון הלאומי לבריאות (NIH). המחקר הביו-רפואי של ליידוס, Inc הוא התפעול וקבלן התמיכה הטכנית עבור המעבדה הלאומית פרדריק לחקר הסרטן אשר ממומנת במלואה על ידי NIH. מספר מחברים (YZ, MM, KT, YL, JS, BT) מזוהים עם ליידוס ביו מחקר, Inc., אבל כל המחברים ממומנים במלואה על ידי המכון הלאומי לסרטן כולל משכורות של סופרים וחומרי מחקר. ליידוס מחקר ביורפואי, Inc. לא סיפק משכורת עבור המחברים (YZ, MM, KT, YL, JS, BT) או חומר למחקר, וגם לא היה לו כל תפקיד בעיצוב המחקר, איסוף נתונים, ניתוח, החלטה לפרסם, או הכנת כתב היד.

Acknowledgments

אנו אסירי תודה לד ר דניאל קרריק (חטיבת בקרת סרטן ומדעי האוכלוסין, המכון הלאומי לסרטן) לעזרה מתמשכת, במיוחד לייזום מחקר זה, מתן לנו דגימות, ולהצעות מועילות במהלך ניתוח נתונים. אנו מודים בכנות לכל חברי מתקן הרצף CCR במעבדה הלאומית פרדריק לחקר הסרטן לעזרתם במהלך ההכנה לדוגמה ורצף, במיוחד ברנדה הו לקבלת סיוע במדגם QC, אוקסנה גרמנית עבור הספריה QC, טטיאנה סמירנוף עבור הפעלת הנצנצים. אנחנו גם רוצים להודות Tsai-שן וויי אשלי וולטון ברצף מתקן ביואינפורמטיקה קבוצה לעזרה עם ניתוח נתונים ו-RNA-seq צינור היישום. אנו מודים גם CCBR ו-NCBR לקבלת סיוע עם צינור ניתוח RNaseq ופיתוח שיטות עבודה מומלצות.

Materials

Name Company Catalog Number Comments
2100 Bioanalyzer Agilent G2939BA
Agilent DNA 7500 Kit Agilent 5067-1506
Agilent High Sensitivity DNA Kit Agilent 5067-4626
Agilent RNA 6000 Nano Kit Agilent 5067-1511
AllPrep DNA/RNA FFPE Kit Qiagen 80234
CFX96 Touch System Bio-Rad 1855195
Library Quantification kit v2-Illumina KapaBiosystems KK4824
NEBNext Ultra II Directional RNA Library Prep Kit for Illumina New England Biolabs E7765S https://www.neb.com/protocols/2017/02/07/protocol-for-use-with-ffpe-rna-nebnext-rrna-depletion-kit
NEBNext rRNA Depletion Kit (Human/Mouse/Rat) New England Biolabs E6310L
NextSeq 500 Sequencing System Illumina SY-415-1001 NextSeq 500 System guide: https://support.illumina.com/content/dam/illumina-support/documents/documentation/system_documentation/nextseq/nextseq-500-system-guide-15046563-06.pdf
NextSeq PhiX Control Kit Illumina FC-110-3002
NSQ 500/550 Hi Output KT v2.5 (150 CYS) Illumina 20024907
10X Genomics Magnetic Separator 10X Genomics 120250
Rotator Multimixer VWR 13916-822
C1000 Touch Thermal Cycler Bio-Rad 1851197
Sequencing reagent kit Illumina 20024907
Flow cell package Illumina 20024907
Buffer cartridge and the reagent cartridge Illumina 20024907
Sodium hydroxide solution (0.2N) Millipore Sigma SX0607D-6
TRIS-HCL Buffer 1.0M, pH 7.0 Fisher Scientific 50-151-871

DOWNLOAD MATERIALS LIST

References

  1. Carrick, D. M., et al. Robustness of Next Generation Sequencing on Older Formalin-Fixed Paraffin-Embedded Tissue. PLoS One. 10 (7), 0127353 (2015).
  2. Hedegaard, J., et al. Next-generation sequencing of RNA and DNA isolated from paired fresh-frozen and formalin-fixed paraffin-embedded samples of human cancer and normal tissue. PLoS One. 9 (5), 98187 (2014).
  3. Zhang, P., Lehmann, B. D., Shyr, Y., Guo, Y. The Utilization of Formalin Fixed-Paraffin-Embedded Specimens in High Throughput Genomic Studies. International Journal of Genomics. 2017, 1926304 (2017).
  4. Srinivasan, M., Sedmak, D., Jewell, S. Effect of fixatives and tissue processing on the content and integrity of nucleic acids. American Journal of Pathology. 161 (6), 1961-1971 (2002).
  5. von Ahlfen, S., Missel, A., Bendrat, K., Schlumpberger, M. Determinants of RNA quality from FFPE samples. PLoS One. 2 (12), 1261 (2007).
  6. Esteve-Codina, A., et al. A Comparison of RNA-Seq Results from Paired Formalin-Fixed Paraffin-Embedded and Fresh-Frozen Glioblastoma Tissue Samples. PLoS One. 12 (1), 0170632 (2017).
  7. Vukmirovic, M., et al. Identification and validation of differentially expressed transcripts by RNA-sequencing of formalin-fixed, paraffin-embedded (FFPE) lung tissue from patients with Idiopathic Pulmonary Fibrosis. BMC Pulmonary Medicine. 17 (1), 15 (2017).
  8. Adiconis, X., et al. Comparative analysis of RNA sequencing methods for degraded or low-input samples. Nature Methods. 10 (7), 623-629 (2013).
  9. Sinicropi, D., et al. Whole transcriptome RNA-Seq analysis of breast cancer recurrence risk using formalin-fixed paraffin-embedded tumor tissue. PLoS One. 7 (7), 40092 (2012).
  10. Altekruse, S. F., et al. SEER cancer registry biospecimen research: yesterday and tomorrow. Cancer Epidemiology, Biomarkers & Prevention. 23 (12), 2681-2687 (2014).
  11. Zhao, Y., et al. Robustness of RNA sequencing on older formalin-fixed paraffin-embedded tissue from high-grade ovarian serous adenocarcinomas. PLoS One. 14 (5), 0216050 (2019).
  12. Amini, P., et al. An optimised protocol for isolation of RNA from small sections of laser-capture microdissected FFPE tissue amenable for next-generation sequencing. BMC Molecular Biology. 18 (1), 22 (2017).
  13. Amini, P., Nassiri, S., Ettlin, J., Malbon, A., Markkanen, E. Next-generation RNA sequencing of FFPE subsections reveals highly conserved stromal reprogramming between canine and human mammary carcinoma. Disease Models and Mechanisms. 12 (8), (2019).
  14. Wimmer, I., et al. Systematic evaluation of RNA quality, microarray data reliability and pathway analysis in fresh, fresh frozen and formalin-fixed paraffin-embedded tissue samples. Scientific Reports. 8 (1), 6351 (2018).
  15. Babraham Bioinformatics. , Available from: https://www.bioinformatics.babraham.ac.uk/projects/fastqc/ (2019).
  16. Martin, M. Cutadapt removes adapter sequences from high-throughput sequencing reads. EMBnet.journal. 17 (1), 10-12 (2011).
  17. Bolger, A. M., Lohse, M., Usadel, B. Trimmomatic: a flexible trimmer for Illumina sequence data. Bioinformatics. 30 (15), 2114-2120 (2014).
  18. Babraham Bioinformatics. , Available from: https://www.bioinformatics.babraham.ac.uk/projects/fastq_screen/ (2019).
  19. Wood, D. E., Salzberg, S. L. Kraken: ultrafast metagenomic sequence classification using exact alignments. Genome Biology. 15 (3), 46 (2014).
  20. Dobin, A., et al. STAR: ultrafast universal RNA-seq aligner. Bioinformatics. 29 (1), 15-21 (2013).
  21. Broad Institute. , Available from: http://broadinstitute.github.io/picard/ (2019).
  22. Wang, L., Wang, S., Li, W. RSeQC: quality control of RNA-seq experiments. Bioinformatics. 28 (16), 2184-2185 (2012).
  23. Ewels, P., Magnusson, M., Lundin, S., Kaller, M. MultiQC: summarize analysis results for multiple tools and samples in a single report. Bioinformatics. 32 (19), 3047-3048 (2016).
  24. Li, B., Dewey, C. N. RSEM: accurate transcript quantification from RNA-Seq data with or without a reference genome. BMC Bioinformatics. 12, 323 (2011).
  25. Son, K., Yu, S., Shin, W., Han, K., Kang, K. A Simple Guideline to Assess the Characteristics of RNA-Seq Data. BioMed Research International. 2018, 2906292 (2018).
  26. McCarthy, D. J., Chen, Y., Smyth, G. K. Differential expression analysis of multifactor RNA-Seq experiments with respect to biological variation. Nucleic Acids Research. 40 (10), 4288-4297 (2012).
  27. Robinson, M. D., McCarthy, D. J., Smyth, G. K. edgeR: a Bioconductor package for differential expression analysis of digital gene expression data. Bioinformatics. 26 (1), 139-140 (2010).
  28. Ritchie, M. E., et al. limma powers differential expression analyses for RNA-sequencing and microarray studies. Nucleic Acids Research. 43 (7), 47 (2015).
  29. Subramanian, A., et al. Gene set enrichment analysis: a knowledge-based approach for interpreting genome-wide expression profiles. Proceedings of the National Academy of Sciences of the United States of America U S A. 102 (43), 15545-15550 (2005).
  30. Mootha, V. K., et al. PGC-1alpha-responsive genes involved in oxidative phosphorylation are coordinately downregulated in human diabetes. Nature Genetics. 34 (3), 267-273 (2003).
  31. Ashburner, M., et al. Gene ontology: tool for the unification of biology. The Gene Ontology Consortium. Nature Genetics. 25 (1), 25-29 (2000).
  32. Huang da, W., Sherman, B. T., Lempicki, R. A. Systematic and integrative analysis of large gene lists using DAVID bioinformatics resources. Nature Protocols. 4 (1), 44-57 (2009).
  33. Huang da, W., Sherman, B. T., Lempicki, R. A. Bioinformatics enrichment tools: paths toward the comprehensive functional analysis of large gene lists. Nucleic Acids Research. 37 (1), 1-13 (2009).
  34. Evaluating RNA Quality from FFPE Samples. Illumina. , Available from: https://www.illumina.com/content/dam/illumina-marketing/documents/products/technotes/evaluating-rna-quality-from-ffpe-samples-technical-note-470-2014-001.pdf (2016).

Tags

גנטיקה סוגיה 160 רצפי רנ א formalin-קבוע פרפין מוטבע FFPE רצף הדור הבא NGS RNA-seq ניתוח
אופטימיזציה לרצף וניתוח של הירידה FFPE-בדיקות RNA
Play Video
PDF DOI DOWNLOAD MATERIALS LIST

Cite this Article

Levin, Y., Talsania, K., Tran, B.,More

Levin, Y., Talsania, K., Tran, B., Shetty, J., Zhao, Y., Mehta, M. Optimization for Sequencing and Analysis of Degraded FFPE-RNA Samples. J. Vis. Exp. (160), e61060, doi:10.3791/61060 (2020).

Less
Copy Citation Download Citation Reprints and Permissions
View Video

Get cutting-edge science videos from JoVE sent straight to your inbox every month.

Waiting X
Simple Hit Counter