Waiting
Login processing...

Trial ends in Request Full Access Tell Your Colleague About Jove
Click here for the English version

Genetics

אירוע נדיר איתור שגיאות DNA ו RNA רצף

Published: August 3, 2018 doi: 10.3791/57509
* These authors contributed equally

Summary

הדור הבא רצפי (הגדרות) הוא כלי רב עוצמה עבור אפיון גנומית זה מוגבל על ידי שיעור שגיאה גבוהה של פלטפורמת (~0.5–2.0%). אנו מתארים את השיטות שלנו של רצף שגיאות המאפשרים לנו במחלקותיכם שיעור שגיאה המיתרים, לזהות מוטציות ב- variant אלל שברים כמו שנדיר למצוא 0.0001.

Abstract

שיטות קונבנציונליות הדור הבא רצפי (הגדרות) אפשרו עבור אפיון גנומית עצום עבור למעלה מעשור. באופן ספציפי, המיתרים שימש כדי לנתח את הספקטרום של מוטציות המשובטים בממאירות. אבל הרבה יותר יעיל יותר שיטות מסורתיות סנגר, המיתרים מאבקים עם זיהוי מוטציות המשובטים, subclonal נדיר עקב שלה שגיאה גבוהה בשיעור של ~0.5–2.0%. לפיכך, המיתרים רגיל יש הגבלה של זיהוי מוטציות הן > אלל variant 0.02 נקודות שבר (VAF). בעוד משמעות קלינית מוטציות נדיר בחולים ללא מחלה ידועה עדיין לא ברור, חולים שטופלו ללוקמיה השתפרו באופן משמעותי את תוצאות כאשר מחלה שיורית < 0.0001 מאת cytometry זרימה. על מנת להמתיק את הרקע artefactual של המיתרים, פותחו שיטות רבות. כאן אנו מתארים שיטה עבור שגיאות ה-DNA ו- RNA רצף (ECS), אשר כרוך תיוג מולקולות בודדות של אינדקס 16 bp אקראי עבור תיקון שגיאות וגם אינדקס ספציפי לחולה bp 8 עבור ריבוב. השיטה שלנו יוכלו לזהות ולעקוב המשובטים מוטציות ב- variant אלל שברים (VAFs) בשני סדרי גודל נמוך יותר מהמגבלה זיהוי של המיתרים ונדירים כמו 0.0001 VAF.

Introduction

כפי שאנו גיל, מחשיפה מוטגנים ושגיאות סטוכסטי במהלך חלוקת התא כתוצאה הצטברות של סטיות סומאטית הגנום, וזאת ביסוד בפתוגנזה מהותי של שינוי ממאיר, מחלות נוירו-התפתחותית, רפואת ילדים הפרעות והזדקנות נורמלית1,2. מוטציות סומאטית עם פוטנציאל נהיגה המחלה הם סמנים אבחון ו prognostic חשוב זיהוי מוקדם, הסיכון ניהול3,4,5. על מנת להבין טוב יותר את clonogenesis הפיזיולוגיות, אשר להודיע קליניים ומחקר החלטות, כימות מדויק ואפיון של מוטציות אלו ישנה חשיבות רבה. הדור הבא רצפי (הגדרות) הנמצא בשימוש כיום ללמוד מוטציות המשובטים בדגימות DNA הטרוגניות; עם זאת, המיתרים מוגבל לזיהוי מוטציות ב > אלל variant 0.02 נקודות שבר (VAF) — בשל שיעור השגיאה מובנית של 0.5 – 2.0% רצף פלטפורמות6,7,8. כתוצאה מכך, מעקב אבחונית, prognostically משמעותית גרסאות הסומטית-VAF התחתונה אינה יכולה להיות מושגת באמצעות הגדרות סטנדרטית.

לאחרונה, פותחו שיטות שונות כדי לעקוף את שיעור שגיאה של המיתרים8,9,10,11. שיטות אלה לנצל תיוג מולקולרית, המאפשר תיקון שגיאות לאחר רצף. כל מולקולה או מקטע גנומי בספריה רצף מתויג עם אקראי ייחודי מולקולרית המזהה (UMI) הייחודיים את המולקולה. UMIs נבנות על ידי צירופים של מחרוזת אקראי נוקלאוטידים (N 8-16). ברקוד מדגם ספציפי השני גם משולב שזרימת העבודה המאפשר ריבוב הדגימות מרובים לתוך הרצף המיתרים אותו לרוץ. PCR-הגברה מבוצעת על ספריית תגים מולקולרי, לאחר מכן נשלחת הספרייה עבור רצף. במהלך הכנת ספריה, צפוי כי שגיאות יהיה אקראי הציג את מקטע גנומי במהלך הגברה PCR ורצף8. להסרת רצף אקראי שגיאות, רצף raw קריאות מקובצות לפי אומי. ממצאים רצף אינן צפויות להיות נוכח קריאות כל עם UMI אותו במיקום גנומי זהה בשל אופיו סטוכסטי של מבוא, ואילו להיות מוגבר, וסודרו ב קריאות כל המשתפים את UMI אותו בנאמנות חלופה אמיתית. הממצאים הם bioinformatically הוסר. כאן, אנו מתארים שלוש שיטות של שגיאות רצף (ECS) ממוטבים במעבדה דנ א לזהות משתנים נוקלאוטיד יחיד (SNVs) ואת ההכנסה קטן-מחיקות (Indels), ולכל RNA להקל על כימות של ביטוי גנים להלן הגדרות הסף שגיאה.

השיטה הראשונה מתארת דרך לחפש אירוע נדיר סומאטית באמצעות גנים ספציפיים תחל עוצב על ידי החוקרים. לפני הכנת ספריה, חוקרים עליך לעצב תחל למקד את שברי ריבית. השתמשנו את Primer3 אפליקציה (http://bioinfo.ut.ee/primer3-0.4.0/). Amplicons של 200 – 250 bp הינם אידיאליים עבור תגובת שרשרת פולימראזית (PCR). כמו אלה, לאחר UMIs כבר שילבו, ליצור חופפים קריאות סוף-לזווג עם 150 bp לזווג-end קריאות. התנאים עיצוב פריימר אופטימלית כדי לשמש הם: גודל פריימר מזערי = 19; גודל אופטימלי פריימר = 25; גודל מרבי פריימר = 30; Tm מינימום = 64 ° C; Tm אופטימום = 70 מעלות צלזיוס; Tm מרבי = 74 מעלות צלזיוס; ההפרש המרבי Tm = 5 ° C; תוכן GC מינימום = 45; מרבית התוכן GC = 80; מספר כדי להחזיר = 20; סוף יציבות מירבית 3' = 100.

שיטה 2, נתאר שיטת שילוב פרוטוקול ה-ECS-DNA עם כימיה אילומינה סקר SNVs המשובטים, כמו שנדיר למצוא 0.0001 VAF באמצעות לוחות הגן זמינים מסחרית הכוללים מאות amplicons קטן Indels. יש להשתמש TruSight מיאלואידית רצף הפאנל (אילומינה) עבור הניסוי שלנו ואנו עיצב לוח מורחבת לכלול גנים נוספים עניין למחלות מיאלואידית רפואת ילדים. הלוחות הללו לא הציעו מזהי מולקולרי ייחודי (UMIs) שתאפשר תיקון שגיאות, אז הוספנו משלנו אסטרטגיה מתאם הפאנלים. ECS אמור לעבוד באותה מידה טוב עם כל יתר החלוניות להעשרת עבור גנים הקשורים מחלות שונות. בעקבות הדי בידוד כימות עוקבות רקמות או דגימה של עניין, מומלץ לקיים לפחות 500 ng מלאי דנ א לכל דגימה. אנחנו עושים באופן שגרתי ספריה רצף יחיד באמצעות 250 ננוגרם של ה-DNA, כדי לתפוס כמו שבר גנומית ייחודי הרבה ככל האפשר עבור במורד הנהר קורא מניעת כפילויות וחישוב VAF. ספריה רצף שכפל אופציונלי יכול להתבצע עם ה-250 הנותרים ng של ה-DNA. . אנחנו תמיד עושים שתי ספריות שכפל לכל דגימות, שאנו מחשיבים רק את האירועים שזוהו באופן עצמאי בשני משכפל כמו תוצאות חיוביות נכון. אנחנו גם ליישם מודל גנומית שגיאה בינומי עמדה ספציפית כדי להגביר את הדיוק של variant מתקשר4,13.

לבסוף, אנו מתארים שיטה צימוד ECS כדי רצפי RNA על כימות התעתיק באמצעות לוחות QIAseq ממוקד RNA מדף (Qiagen). UMIs הדרוש עבור מניעת כפילויות תיקון שגיאות שילבו את ערכות ו חוקרים יכול להפוך ספריות בעקבות ההמלצות של היצרן. Bioinformatically, חוקרים אפשר לעקוב הצבר שתואר ECS-ה-dna אשר יוסברו בפירוט בסעיף פרוטוקול.

Protocol

1. יישוב רצף שגיאות עבור ה-DNA

  1. PCR הגברה של קטעים גנומית של עניין.
    1. להשתמש על אמינות גבוהה DNA פולימראז כדי להגביר את amplicons (חומרים טבלה, פריט 1). להגביר את תגובת ה-PCR עם התנאים הבאים ב הצנטרפוגה תרמי: 30 s ב 98 ° C; 18-40 מחזורי 10 s ב 98 ° C, 30 s ב 66 ° C, ו- 30 s ב-72 מעלות; 2 דקות ב-72 מעלות; . תחזיק על 4 מעלות צלזיוס.
    2. לטהר את המוצרים PCR עם חרוזים פאראמגנטיים (טבלת חומרים, פריט 2). הוסף את התגובה PCR החרוזים על יחס 1: 1.8 (PCR התגובה נפח: חרוז נפח) לפי הפרוטוקול של היצרן. Elute עם µL 20 של ddH2O.
    3. לכמת את הריכוז של ה-DNA (טבלת חומרים, פריט 3) כדי לקבוע ריכוז סופי של ה-DNA.
    4. להפעיל את aliquot של ה-DNA על 2% agarose ג'ל (טבלת חומרים, פריט 4) כדי לאשר את הגודל של amplicons.
      הערה: לחלופין, חוקרים יכולים לבחור לבצע ניתוח Bioanalyzer על המוצרים PCR כדי לקבוע את הגודל של שברי גנומית מוגבר, כמו גם הריכוז של המוצרים.
  2. קביעת רצף מתאם חישול
    1. להשיג i7 מתאמי (טבלת חומרים, פריט 5). להשתמש בהם כפי שהם מסופקים עבור והשלבים.
    2. לרכוש מתאמים i5 16 צפון מסחרית עם הרצף oligo הבא (חומרים טבלה פריט 6): ACACTCTTTCCCTACACGACGCTCTTCCGATCT AATGATACGGCGACCACCGAGATCTACAC(N1:25252525)(N1)(N1)(N1)(N1)(N1)(N1)(N1)(N1)(N1)(N1)(N1)(N1)(N1)(N1) (N1)
      הערה: מתאמי i5 של 16 צפון להחליף את המתאמים i5 רגיל והם מתאמים עם מחרוזת של 16 אקראי-נוקלאוטיד כדי להקל על ה-ECS.
    3. להפוך את הפתרון עובד מתאם i5 16 צפון: µL 40 של 100 מיקרומטר 16 צפון i5 מתאם מניות, 10 µL טה מאגר ו 10 µL של 500 פתרון NaCl מיקרומטר.
    4. µL 7.5 aliquot של הפתרון עובד i5 מוכן בשלב 1.2.3 לתוך בארות PCR נפרדים.
    5. להוסיף 5 µL של מתאם i7 מדגם ספציפי לתוך ולס המתאימות.
    6. דגירה ב 95 מעלות צלזיוס במשך 5 דקות ואז צנני מאת 1 ° C לכל 30 s עד 4 ° C ב הצנטרפוגה תרמי.
    7. . תחזיק על 4 מעלות צלזיוס.
  3. סיום-תיקון & דה-עוקב של ספריות
    הערה: במקביל עם מתאם חישול, אחד ניתן לבצע דה-עוקב ותיקון קצה amplicons ה-PCR מ 1.1 שלב. לאחר השלמת שלבים אלה, מתבצעת מצדו של מתאמי annealed מ 1.2 שלב סוף תוקן ועל דא-זנב amplicons ה-PCR. בעקבות מתאם מצדו, הושלמה בניית ספריה ECS.
    1. בגין עם לכל היותר 1 µg של הפעלת ה-DNA (מינימום ~ 200 ng)
    2. מבצע סוף-תיקון וזנב דה amplicons (חומרים טבלה, פריט 7).
      1. הוסף µL 3.0 של סיום ההכנה אנזים מיקס µL 6.5 סוף תיקון המאגר.
      2. דגירה לערבב למשך 30 דקות ב- 20 ° C, ואז במשך 30 דקות ב 65 ° C ולהחזיק ב 4 º C.
    3. מבצע מצדו המתאמים annealed (טבלת חומרים, פריט 8).
      1. הוסף µL 2.5 המתאמים annealed שלב 2, 15 µL של בלאנט/ת א ליגאז Mastermix ו- µL 1 של שיפור מצדו.
      2. דגירה לערבב למשך 15 דקות ב- 20 ° C, אז למשך 15 דקות ב 37 º C.
    4. תנקה את ספריות עם beads מגנטי (חומרים טבלה פריט 2): להוסיף התגובה PCR חרוזים על יחס 1: 0.75 ששונתה (PCR התגובה נפח: נפח חרוז מגנטי):
      1. פיפטה 62.6 µL של פתרון חרוז מגנטי לתוך µL 83.5 מוצרי ה-PCR מ שלב 1.2.7.
      2. להעביר את התערובת צינור 1.5 מ ל איגוד נמוכה.
      3. לערבב ביסודיות על ידי pipetting למעלה ולמטה לפחות 10 פעמים.
      4. להשאיר את התערובת לעמוד בטמפרטורת החדר למשך 5 דקות.
      5. מקם את הצינורית על גבי מחזיק מגנטי. תקופת דגירה של 2 דקות בטמפרטורת החדר או עד תגובת שיקוע ברור.
      6. הסר את תגובת שיקוע.
      7. לשטוף את החרוזים עם 200 µL של 70% אתנול.
      8. תקופת דגירה של אתנול הסר ס' 30.
      9. חזור על שלב שטיפת אתנול פעם אחת.
      10. מילה נהדרת את החרוזים.
      11. Elute עם µL 20 של ddH2O.
        הערה: שינוי זה בתגובה PCR חרוז מגנטי יחס מעדיפים יסיר שברי DNA כי הם קטנים יותר מאשר 200 bp.
  4. כמת על ידי droplet PCR דיגיטלי
    הערה: מדויקות מוטציה כימות מחייבת שמירה קפדנית של מספר מולקולות של כל ספריה הנטענים על הרצפים (sequencer). כדי להשיג זאת, לכימות מספר מולקולות עבור ספריות נפרדות לכל יחידת האחסון מתבצע באמצעות פלטפורמת ה-PCR (ddPCR) QX200 דיגיטלי droplet – PCR כמותי היא אופציה חלופית. בעקבות ניתוח ddPCR, המדידה יציינו את מספר מולקולות לכל µL לכל ספריה.
    1. לדלל ECS ספריות 1:1,000 על ידי דילול מצטבר לפי פקטור של 10 רצועת-המבחנות.
    2. להכין את mastermix הבאה ddPCR צינור 1.5 mL: µL 10 של ה-PCR מיקס (טבלת חומרים, פריט 9), µL 0.2 של פריימר P5, µL 0.2 של P7 פריימר, 5 µL של ECS מוצר ניקו למעלה מ שלב 1.4.1., ו- 4.5 µL של ddH2O.
    3. µL 20 aliquot של mastermix לתוך כל מדגם טוב לוודא שאין כפולות של 8.
      1. µL 70 aliquot של droplet דור שמן (טבלת חומרים, פריט 10) לתוך כל באר נפט. מכסים את הקלטת עם אטם גומי.
    4. להפוך טיפות באמצעות הגנרטור droplet (טבלת חומרים, פריט 11).
    5. באמצעות פיפטה רב-ערוצי, לטעון את טיפות שנוצר בשלב 1.4.4 לתוך צלחת PCR להבטיח כי pipetting של המדגם נעשית לאט במשך תקופה של 5 שניות כדי למנוע הטיה ה-DNA.
    6. להגביר את האות ב טיפות מחזורים 40 ב הצנטרפוגה תרמי באמצעות התנאים הבאים: 5 דקות ב 95 מעלות צלזיוס; 40 מחזורים של 30 s ב 95 ° C, 1 דקות ב 63 ° C; 5 דקות ב 4 ° C, 5 דקות ב 90 מעלות צלזיוס; ולאחר מכן החזק ב 4 º C.
    7. להכין ddPCR תבנית droplet קורא המכונה (טבלת חומרים, פריט 11). להבטיח מפרט עבור פרמטרי כימות מוחלטת ולשימוש QX200 ddPCR אווה גרין Supermix.
    8. לאחר ניתוח ddPCR תושלם, הקפד להגדיר את הסף מחלוקת זהה בכל הדוגמאות.
    9. באמצעות מדידה ריכוז מקורא Droplet QX200, aliquot אמצעי האחסון המתאים כדי להציג את המספר הרצוי של מולקולות צעדיו הבאים.
  5. PCR הגברה של הספריות עבור רצף
    1. להכין את mastermix הבאים עבור מספר מולקולות הרצוי משלב 1.4.9: 25 µL של Q5 Mastermix (חומרים טבלה, פריט 1), µL 2.5 של P5 פריימר (10 מיקרומטר), 2.5 µL של פריימר P7 (10 מיקרומטר), X µL של ה-DNA, µL 20-X של ddH2O.
    2. להגביר את הספריות של צעד 1.5.1 הצנטרפוגה תרמי שימוש בתנאים הבאים: 30 s ב 98 ° C; 20 מחזורים של 10 s ב 98 ° C, 30 s ב 63 ° C, 30 s ב-72 מעלות; 2 דקות ב-72 מעלות; ולאחר מכן החזק ב 4 º C.
    3. תנקה את ספריות עם beads מגנטי (טבלת חומרים, פריט 2): להוסיף התגובה PCR מגנטי חרוזים ב ששונה יחס 1: 0.75 (PCR התגובה נפח: נפח מגנטי חרוז).
      1. פיפטה 37.5 µL של פתרון חרוז מגנטי לתוך המוצרים PCR µL 50 מ שלב 1.5.2.
      2. להעביר את התערובת צינור 1.5 מ ל איגוד נמוכה.
      3. לערבב ביסודיות על ידי pipetting למעלה ולמטה לפחות 10 פעמים.
      4. להשאיר את התערובת לעמוד בטמפרטורת החדר למשך 5 דקות.
      5. מקם את הצינורית על גבי מחזיק מגנטי. תקופת דגירה של 2 דקות בטמפרטורת החדר או עד תגובת שיקוע ברור.
      6. הסר את תגובת שיקוע.
      7. לשטוף את החרוזים עם 200 µL של 70% אתנול.
      8. תקופת דגירה של אתנול הסר ס' 30.
      9. חזור על שלב שטיפת אתנול פעם אחת.
      10. מילה נהדרת את החרוזים.
      11. Elute עם µL 20 של ddH2O.
    4. להפעיל את aliquot של ה-DNA על ג'ל agarose 2% כדי לאשר את הגודל של amplicons.
    5. לכמת את הריכוז של ה-DNA (טבלת חומרים, פריט 3) כדי לקבוע ריכוז של ספריות ה-ECS נפרדים.
    6. מאגר של הספריות בכמויות equimolar.
      הערה: לדוגמה, החוקרים יכולים מאגר ספריות שמונה equimolar קבוצה4 עם 4 מיליון החל מולקולות עבור רצף באמצעות פלטפורמה רצף אשר פלטי עד 400 מיליון קריאות. . שמרני, מומלץ לשימוש ממוצע של 10 קריאות raw תיקון השגיאות לכל מולקולות. זה יתפוס 360 מיליון קריאות (4 מיליון מולקולות * ספריות 8 * 10 קורא עבור תיקון שגיאות). עם 4 מיליון מולקולות ייחודיות לכל ספריה, חוקרים מצפה לקבל קונצנזוס רשע תיאורטית לקרוא סיקור 7042 x לכל אמפליקון (amplicons 4 מיליון/568 מהחלונית ' ' גנים).
    7. לכמת את הריכוז של ה-DNA (טבלת חומרים, פריט 3) כדי לקבוע ריכוז של ספריית ה-ECS במאגר.
    8. שלח את ספריית ה-ECS במאגר בערך 4 nM.
    9. לספק את הגדרות רצף הבאות אילומינה רצף פלטפורמות (MiSeq, HiSeq או NextSeq): 2 x 144 לזווג-סוף קורא, 8 מחזורים אינדקס 1 16 מחזורים אינדקס 2.

2. גנים לוחות עם שגיאות רצף ה-DNA

  1. הכלאה של oligos של לוחות הגן
    הערה: בשלב זה, אחד יהיה לבנות רצף ספריות באמצעות פרוטוקול אילומינה TruSight או TruSeq ששונה כדי לשלב את UMIs (חומרים טבלה, פריט 17).
    1. Hybridize oligos על גבי מקטע גנומי ע פ הפרוטוקול של היצרן. שימוש 250 ng של DNA (או כל הסכום הרצוי של הפעלת חומר).
    2. הסר oligos לא מאוגד ע פ הפרוטוקול של היצרן.
    3. לבצע הרחבה-מצדו ע פ הפרוטוקול של היצרן.
      הערה: שינויים בפרוטוקול של היצרן מתחילים מתחת.
  2. התאגדות של מתאמי i5 ו- i7 באמצעות PCR
    1. להכין את mastermix ה-PCR על-ידי pipetting של ריאגנטים הבאים לתוך שפופרת של גודל אמצעי האחסון המתאים: 37.5 µL של Q5 Mastermix (חומרים טבלה, פריט 1), 6 µL של 10 מיקרומטר 16 צפון i5 מתאמי (שיטת מפורט ב 1, צעד 1.2.2), µL 6 של מתאמי i7 (שימוש שונה i7 מתאמים עבור דגימות נפרדים עבור ריבוב), ו- µL 22 של סיומת-מצדו פתרון עם חרוזים מהשלב 2.1.3.
      הערה: Mastermix Q5 מחליף את mastermix פולימראז שסופקו על-ידי אילומינה. פולימראז ש5 מגביר את מקטע גנומי עם איכות גבוהה יותר ועם פחות שגיאות הציג.
    2. להפעיל תוכנית ה-PCR הצנטרפוגה תרמי באמצעות הפרמטרים הבאים: 30 s ב 98 ° C, 4-6 מחזורים של 10 s ב 98 ° C, 30 s ב 66 ° C, 30 s ב-72 מעלות; 2 דקות-72 מעלות צלזיוס, ולאחר מכן הקש על 4 מעלות צלזיוס.
      הערה: מספר מחזורים תלוי גודל החלונית. מהניסיון שלנו, ה-PCR מחזור-4 מספיקה אם הפאנל ג'ין יש כ-1,500 זוגות שונים של גן מסוים oligos, ואילו פאנל עם 500-600 זוגות oligos דורש 6 מחזורים של ה-PCR.
    3. תנקה את תגובות PCR עם beads מגנטי (טבלת חומרים, פריט 2): הוספת התגובה PCR beads מגנטי בתגובה PCR 1 שונה: 0.75 יחס חרוז מגנטי:
      1. פיפטה 56.25 µL של פתרון חרוז מגנטי לתוך µL 75 מוצרי ה-PCR מ שלב 2.2.2.
      2. להעביר את התערובת צינור 1.5 מ ל איגוד נמוכה.
      3. לערבב ביסודיות על ידי pipetting למעלה ולמטה לפחות 10 פעמים.
      4. להשאיר את התערובת לעמוד בטמפרטורת החדר למשך 5 דקות.
      5. מקם את הצינורית על גבי מחזיק מגנטי. תקופת דגירה של 2 דקות בטמפרטורת החדר או עד תגובת שיקוע ברור.
      6. הסר את תגובת שיקוע.
      7. לשטוף את החרוזים עם 200 µL של 70% אתנול.
      8. תקופת דגירה של אתנול הסר ס' 30.
      9. חזור על שלב שטיפת אתנול פעם אחת.
      10. מילה נהדרת את החרוזים.
      11. Elute עם µL 20 של ddH2O.
  3. לכמת ספריות באמצעות פלטפורמה ddPCR QX200.
    1. בצע את שלב 1.4 בשיטה 1.
      הערה: 4 מיליון מולקולות היו מנורמל לכל ספריה לדוגמה4 בתוצאה נציג (איור 2) על מנת לקבל ממוצע תיאורטי של מולקולות 7,042 אינדקס ייחודי (4 מיליון מחולק oligos גנים ספציפיים 568).
  4. להגביר, לנרמל את ספריות עבור רצף.
    1. להגביר את המספר הרצוי של מולקולות תוך שימוש את mastermix הבאים עבור ה-PCR הסופי בהיקף של 50 µL: 25 µL של Q5 Mastermix, 2 µL של P5 פריימר (1 מיקרומטר), 2 µL של פריימר P7 (1 מיקרומטר), ו µL 21 של מולקולות ה-DNA.
    2. להפעיל תוכנית ה-PCR הצנטרפוגה תרמי באמצעות הפרמטר הבא: 30 s ב 98 ° C; 16 מחזורים של 10 s ב 98 ° C, 30 s ב 66 ° C, 30 s ב-72 מעלות; 2 דקות ב-72 מעלות; ולאחר מכן החזק ב 4 º C.
    3. תנקה את רצף ספריות באמצעות beads מגנטי (טבלת חומרים, פריט 2): הוספת התגובה PCR beads מגנטי בתגובה PCR 1 שונה: 0.75 יחס חרוז מגנטי:
      1. פיפטה 37.5 µL של פתרון חרוז מגנטי לתוך המוצרים PCR µL 50 מ שלב 2.4.2.
      2. להעביר את התערובת צינור 1.5 מ ל איגוד נמוכה.
      3. לערבב ביסודיות על ידי pipetting למעלה ולמטה לפחות 10 פעמים.
      4. להשאיר את התערובת לעמוד בטמפרטורת החדר למשך 5 דקות.
      5. מקם את הצינורית על גבי מחזיק מגנטי. תקופת דגירה של 2 דקות בטמפרטורת החדר או עד תגובת שיקוע ברור.
      6. הסר את תגובת שיקוע.
      7. לשטוף את החרוזים עם 200 µL של 70% אתנול.
      8. תקופת דגירה של אתנול הסר ס' 30.
      9. חזור על שלב שטיפת אתנול פעם אחת.
      10. מילה נהדרת את החרוזים.
      11. Elute עם µL 20 של ddH2O.
    4. להפעיל את aliquot של ה-DNA eluted (µL ~ 3) ב- 2% agarose ג'ל כדי לאשר לגודל amplicons.
    5. לכמת את הריכוז של ה-DNA (טבלת חומרים, פריט 3) כדי לקבוע ריכוז של ספריות ה-ECS נפרדים.
    6. מאגר של הספריות בכמויות equimolar. עיין שיטה 1 צעד 1.5.6. ודיון גם פרטים נוספים על איגום.
    7. שלח את ספריית ה-ECS במאגר בערך 4 nM.
    8. לספק את הגדרות רצף הבאות אילומינה רצף פלטפורמות (MiSeq, HiSeq או NextSeq): 2 x 144 לזווג-סוף קורא, 8 מחזורים אינדקס 1 16 מחזורים אינדקס 2.
  5. ECS Bioinformatic עיבוד וניתוח
    1. להשיג את קריאות מדגם demultiplexed של הרצפים (sequencer) או לבצע demultiplexing הקריאות רצף גולמיים לתוך מדגמים שונים באמצעות i7 מתאם רצפים bioinformatically עם סקריפט מותאם אישית.
    2. חתוך את נוקלאוטידים 30 של כל קריאה demultiplexed כדי להסיר oligo רצפים מהחלונית ' ' גנים.
    3. יישר קריאות המשתפים את UMIs אותם אחד לשני להקים משפחות קריאה.
      הערה: חוקרים יכולים להשתמש UMI-aware תוכנה כמו MAGERI13 כדי לחלץ משפחות קריאה. אין מרחק hamming הורשה בתוך הרצף UMI בניסוי זה כדי להגדיל את ייחודה של השיטה.
    4. מבצעים מניעת כפילויות תיקון שגיאות באמצעות פרמטרים המומלצות הבאות.
      1. שימוש ≥5 לקרוא לקרוא זוגות של אותה משפחה. מינימום של 3 זוגות קריאה מומלצת.
      2. משווים נוקלאוטיד בכל תנוחה בין כל קריאות באותה משפחה לקרוא ולהפיק נוקלאוטיד הסכמה אם יש לפחות 90% קונקורדנציה בין הקריאות עבור נוקלאוטיד מסוים. להזעיק המיקום נוקלאוטיד של N אם יש פחות מ- 90% הסכם.
      3. למחוק את קריאות הסכמה שיש > 10% של המספר הכולל של נוקלאוטידים קונצנזוס להיקרא כמו ש
    5. יישר כל קריאות הסכמה יתרת באופן מקומי כדי הגנום האנושי הפניה או hg19 או hg38 באמצעות aligner(s) המועדף של החוקר Bowtie2 ו BWA.
    6. תהליך מיושר קריאות Mpileup באמצעות פרמטרים – BQ0-d 10,000,000,000,000 להסיר את כיסוי ספי כדי להבטיח פלט הגדולה מביניהן הייתה נכונה ללא קשר VAF.
    7. לסנן עמדות עם פחות מ- 1000 קונצנזוס x לקרוא את הסיקור.
      הערה: החוקרת קובעת את הכיסוי המינימלי לכל תפקיד נוקלאוטיד באופן שרירותי, מומלץ לקיים קונצנזוס x 500 לפחות לקרוא את הסיקור לניתוח במורד הזרם.
    8. השתמש התפלגות בינומית להתקשר גרסאות נוקלאוטיד יחיד (SNPs) יתרת נתונים מ שלב 2.5.7 עם הפרמטרים הבאים. הנתון הסטטיסטי בינומי יהיה מבוסס על מודל שגיאה ספציפית עמדה גנומית. לכל תפקיד גנומית היא המודל באופן עצמאי לאחר סיכום את שיעור שגיאה של כל דוגמאות לעמדה מסוימת. בעקבות הדוגמה:
      ההסתברות של נוקלאוטיד פרופיל במיקום גנומית נתון, p
      ∑ ∑ Variant RF2 RFs סה
      = 26/255505
      = 0.000101759
      ההסתברות הבינומית של variant 24 RFs מחוץ RFs הכולל 35911, P(X ≥ x) מדגם K
      = 1 - binomial(24, 35911, 0.000101759)
      = 2.26485E-13
      הערה: לכל תפקיד גנומית שאילתה, יהיו שלושה שינויים mutational אפשרי (קרי,A > T, A > C, A > G), שכל אחד מהם יוצג כ רקע החפץ. סומאטית אירועים שונה באופן מהותי מן הרקע לאחר תיקון Bonferroni נשמרות. בדוגמה המוצגת בטבלה1, מספר ניסויי בת 11, ומכאן Bonferroni תיקן p-ערך ≤0.00454545 (0.05/11) נדרש לקרוא לאירוע כמו סטטיסטית משמעותית.
    9. אירועים סומאטית נדרשים להיות נוכח בשני משכפל מן הדגימה זהה; אחרת, רואים אותם תוצאות חיוביות שגויות.

Table 1
טבלה 1: דוגמה הממחיש את הדרך לבניית מודל שגיאה בינומי עמדה ספציפית.

3. השגיאה תתוקן רצף של RNA

  1. בנוסף, הערכת מוטציות ברמת ה-DNA לשלב ECS עם לוחות רצפי RNA יישוב שונים כדי לזהות שפע נדיר או נמוך התעתיק ברמת ה-RNA. על ידי שילוב ECS עם הפאנלים מדף של רצפי Qiagen RNA, הפגנו כימות דיגיטלי של ביטוי גנים תחפש ברישומים. עם כמה כמו עשרה עותקים ללא צורך נורמליזציה נגד גן משק בית. UMIs הדרוש תיקון השגיאות משולבים לתוך החלונית ' '.
    1. מבצע החילוץ-RNA הכולל (טבלת חומרים, פריט 20).
    2. לבצע את ההכנה ספריית ECS-RNA לפי הפרוטוקול של היצרן (טבלת חומרים, פריט 19).
    3. לבצע ביואינפורמטיקה צינור לפי שלב 2.5.1–2.5.6. 2 שיטת המתוארים בסעיף הקודם. לאחר שלב 2.5.6, מספר הקריאות קונצנזוס מיושר לפי ג'ין מייצג את רמת הביטוי של הגן ללא צורך ג'ין אורך נורמליזציה.

Representative Results

עם Targeted Error-Corrected רצף עבור ה-DNA, ערכנו הוכחה של עיקרון הניסוי דילול מוטציה החולה DNA ב- DNA גנומי מסחרי. החולה היתה מוטציה ב- GATA1 (chrX:48650264, C > G) עם VAF המקורי של 0.19. נדגים באיור 1 כי ECS היא כמותית לרמה של 1:10,000 עבור משתנה נוקלאוטיד יחיד.

Figure 1
איור 1: סדרת דילול GATA1 SNV הוכחת כי ECS היא כמותית לרמה של 1:10,000. אנא לחץ כאן כדי להציג גירסה גדולה יותר של הדמות הזאת.

אנו גם מראים כי ECS-הדנ א מזהה בצורה אמינה מוטציות נדירות המשובטים ב גנים שהדו-שיח למבוגרים לוקמיה מיאלואידית חריפה (AML) אנשים קשישים בריאים4. השגנו דוגמאות המעיל באפי 20 אנשים בריאים במחקר בריאות של האחות הפקידה בערך ~ 10 שנים בנפרד. אנחנו מיושם הפרוטוקול פאנל ה-ECS-DNA על דגימות אלה. עבור ניסוי זה, אנו הותאם אילומינה TruSight מיאלואידית רצף לוח המורכב amplicons 568 (מידע נוסף על רשימת גנים ב- https://www.illumina.com/products/by-type/clinical-research-products/trusight-myeloid.html), רציף ספריות 80 מאנשים 20 (אוספים 2 בנקודות זמן שונות, משכפל 2 לכל אדם בכל פעם הצבע) באמצעות פלטפורמה אילומינה NextSeq, אשר נוצר ממוצע הקריאות לזווג-end 47.7 מיליון ו ממוצע של 3.4 מיליון שגיאות רצפי הקונצנזוס לכל ספריה4. הכיסוי נוקלאוטיד מתכוון לכל ספריה היה בערך 6000 x (3.4 מיליונים מחולק 568). עבור כל דגימה, אנחנו נבנה פרופיל שגיאה ספציפית מיקום באמצעות ספריות ברצף שאינם מגיעים באותה דגימת זרע. מצאנו 109 מוטציות סומאטית המשובטים שהיו קיימים שני ושכפול של נקודת זמן אוסף אחד לפחות. מוטציות אלה יש VAF החל 0.0003 – 0.1451. אנחנו נבחר מוטציות 21 עם ייצוגים הקוסמית ידוע, ואומת כל 21 מוטציות בגן אחד או שניים אוסף זמן כרשם באמצעות ddPCR (n = 34, איור 2, הותאם צעיר. ואח 20164).

Figure 2
איור 2: מוטציות המזוהה על-ידי ה-ECS אומתו באמצעות ddPCR עם VAFs מאוד concordant. (n = 34, שונה צעיר. ואח 20164). אנא לחץ כאן כדי להציג גירסה גדולה יותר של הדמות הזאת.

לגבי רמת ביטוי שגיאות באמצעות פרוטוקול ה-ECS-RNA, אנחנו אישית פאנל הגן באמצעות הכימיה QIAseq המורכב 416 הגנים הידועים להיות מזוהה עם סוגים שונים של סרטן (הותאם מהחלונית QIAseq Transcriptome סרטן אנושי), ואנחנו מוגבר של אקסון לרוב ביטוי של גנים נתון (ג'ין רשימה 1 חומר משלים). ריצפנו את ספריות באמצעות פלטפורמה אילומינה MiSeq בתבנית לזווג-סוף נתן ממוצע של 8.3 מיליון קורא לכל ספריית, והצלחנו לתפוס ממוצע של רצפי הקונצנזוס שגיאות 0.417 מיליון. הראינו כי רמת ביטוי של התעתיק שפע נמוך (< התעתיק 1,000 ספירת 50 ng של RNA סה כ) הוא מאוד לשחזור בין משכפל (נקודת נתונים n = 300, איור 3). אימות על-ידי ddPCR (בשישה גנים הנבחר של מעלה בדרגות שונות של הביטוי) הראו כי רמת ביטוי של גנים כראוי נכבש על ידי פרוטוקול ה-ECS ללא צורך נורמליזציה.

Figure 3
איור 3: העליון, המתאם של התעתיק נחשב על ידי ה-ECS-RNA בין בית באותה דגימת זרע (n = 300). התחתון, התעתיק ספירות המזוהה על-ידי ה-ECS אומתו על ידי ddPCR (n = 6). אנא לחץ כאן כדי להציג גירסה גדולה יותר של הדמות הזאת.

Discussion

. הנה, נדגים מחבילת פרוטוקולים של רצף שגיאות ניתן ליישם בקלות ללמוד מוטציות עם VAFs נמוך במחלות שונות. הגורם החשוב ביותר הוא שילוב של UMIs עם כל מולקולה לפני רצף הם מאפשרות תיקון השגיאות הקריאות raw. השיטות המתוארות כאן מאפשרים לשלב UMIs מותאם אישית לוחות הגן זמינים מסחרית והן בעיצוב עצמי oligos גנים ספציפיים.

תקן הגדרות פרוטוקול מונע זיהוי מוטציות עם VAF מתחת 2% שיעור שגיאה רצף, זה מגביל את היישום של המיתרים במחקרים בו הגילוי של גרסאות נדיר הוא קריטי. על ידי עקיפת התעריף הסטנדרטי של שגיאה המיתרים, ECS מאפשר זיהוי רגיש גרסאות אלה raw. למשל, זיהוי של מוטציות פתוגניים כאשר מוטציות אלה נובעים קודם (ולכן יש VAF נמוך) הכרחי ליידע את התערבות מוקדמת של מחלת ה-14,15. במחקר לוקמיה, הגילוי של ממסר מינימלי (תאים לוקמיה שיורית שלאחר הטיפול) מודיע ריבוד סיכון ומחלות יכול לשמש כדי ליידע את אפשרויות הטיפול בצורה בינארית זרימת cytometric הערכות לא יכולה. בנוסף, ה-ECS ישימה לזהות חומצת גרעין הגידול במחזור, כדי להעריך את פוטנציאל גרורתי בחולים גידולים מוצקים על-ידי הערכת העדר/הנוכחות, כמו גם את הנטל וריאנט של מוטציות מסוימות הם מאפייני העיקרית הגידול16.

כפי שמתואר בטבלה1, הכוח של באמצעות מודל המבוסס על התפלגות בינומית שגיאה ספציפית עמדה להתקשר גרסאות תלויה במידה רבה מספר ספריות ברצף, כמו גם את העומק של רצף ששימשו לבניית המודל שגיאה. החוסן של המודל שגיאה עולה עם מספר גבוה יותר של דוגמאות ועומק רצף נוסף. מומלץ להשתמש לפחות 10 דגימות ברצף עם ממוצע של שגיאות קריאה סיקור x 3000 לדגימה לבנות פרופיל של שגיאה עבור כל דגימה. הגישה מיקום ספציפי היא דומה MAGERI, אך במקום להשתמש שיעור שגיאה צבירה עבור כל סוגי שונים החלפת 6 (A > C/T > G, A > G/T > C, A > T/T > A, C > A/G > T, C > G/G > C C > T/G > A)13, אנחנו מודל כל החלפת באופן עצמאי בבית בכל תנוחה. למשל, שיעור שגיאה של C > T במיקום גנומית נתון שונה ממיקום אחר. הגישה שלנו גם לוקח בחשבון את אפקט רצפי אצווה, כמו קצב החלפת בסיס שנצפתה ריצה רצף אחת עשויים להיות שונים מאלה עוד ריצה. לכן חשוב ליצור מודל לכל תפקיד לכל סוגי החלפת במיוחד כאשר דגימות שונות רצף הרצפים הם איחדו לבנות את המודל.

שיקול חשוב בעת תכנון ניסוי ECS הוא הסף זיהוי הרצוי. היופי של מחקרים המיתרים היא כי הם ניתן בקלות לשנות מבחינת גנים/מטרות של הריבית, זיהוי סף (שמכתיבה עומק של רצף) ומספר של יחידים שאילתה. לדוגמה, אם החוקרים מעוניינים למצוא מוטציות נדירות amplicons שני עם סף גילוי של 0.0001, הם יכול בריכה מקסימאלית 75 דוגמאות רצף יחיד להפעיל אותו באמצעות הכימיה MiSeq V2 אשר פלטי עד 15 מיליון קריאות (2 amplicons * 10,000 מולקולות * 10 קורא עבור תיקון השגיאות * דוגמאות 75 = 15 מיליון רצף פעולות הקריאה). חוקרים יכולים להשתנות מספר מולקולות נכנס רצף או מספר דוגמאות במאגר רצף יחיד להפעיל כדי להתאים את סף גילוי. במחקרים שלנו, כיוונו למצוא מוטציות עם סף גילוי של 0.0001 VAF (1:10, 000) שימוש בלוח ג'ין אילומינה. אנו משתמשים באופן שגרתי 250 ng של הקמת ה-DNA על מנת להבטיח כי מספיקות מולקולות נלכדים על מנת להשיג את סף גילוי הנ ל. חוקרים יכולים לבחור להתחיל עם כמות נמוכה יותר של ה-DNA (50 ng מומלץ) אם המגבלה זיהוי הרצוי > 0.001 VAF.

כפי UMIs יצורפו אל האינדקסים i5, רצף הגדרות יש תועלת בהתאם. לדוגמה, השתמשנו 16 N UMIs, בהגדרות רצף היו סוף לזווג 2 x 144 קריאות, 8 מחזורים של אינדקס 1 ו- 16 מחזורים של אינדקס 2 לעומת המחזורים 8 הרגיל של אינדקס 2. הגידול במחזור אינדקס 2 יפוצה על ידי ירידה במספר הכולל של מחזורי המוקצים את הקריאות. אם החוקרים להשתמש 12N UMIs10,17, צריך לשנות את ההגדרות 12 מחזורים של אינדקס 2.

שיטה זו מבוססת-UMI רצף ממוטבת כדי לתקן שגיאות רצף. זה נשאר שיוצרת בהתמודדות עם ה-PCR jackpotting, וזו בעיה עבור כל שיטה המבוססת על הגברה. ביצענו סיבובים של רצף שלאחר ובדיקת פוסט-ביואינפורמטיקה באמצעות ddPCR, אנחנו בקושי לזהות מידע מוטעה עקב PCR jackpotting. למרות זאת, מומלץ כי החוקרים לערוך את הניסויים באמצעות פולימראז דיוק גבוה כדי להבטיח הגברה נמוכה שגיאות.

Disclosures

המחברים אין לחשוף.

Acknowledgments

אנו מודים משתתפי המחקר האונקולוגי קבוצה AAML1531 של הילדים, האחיות של בריאות עיון על תרומתם בצורה של דגימות החולה. עבודה זו מומן על ידי מכוני הבריאות הלאומיים (UM1 CA186107, RO1 CA49449, RO1 CA149445), גילוי מכון וושינגטון אוניברסיטת של הילדים ו סנט לואיס לילדים חולים (MC-II-2015-461), וקרן אלי סת מתיוס לוקמיה.

Materials

Name Company Catalog Number Comments
Q5 High Fidelity Hot Start Master Mix New England BioLabs M0492S
Agencourt AMPure XP Beckman Coulter A63880
Qubit dsDNA HS Assay Kit Thermo Fisher Scientific Q32854
SYBR Safe DNA Gel Stain Thermo Fisher Scientific S33102
Truseq Custom Amplicon Index Kit Illumina FC-130-1003
UMI i5 adapter sequences Integrated DNA Technologies -
NEBNext Ultra End Repair/dA-Tailing Module New England BioLabs E7442S
NEBNext Ultra II Ligation Module New England BioLabs E7595S
QX200 ddPCR EvaGreen Supermix Bio-Rad 1864034
QX200 Droplet Generation Oil for EvaGreen Bio-Rad 1864005
QX200 Droplet Digital PCR System Bio-Rad 1864001
ddPCR 96-Well Plates Bio-Rad 12001925
DG8 Cartridges for QX200/QX100 Droplet Generator Bio-Rad 1864008
DG8 Gaskets for QX200/QX100 Droplet Generator Bio-Rad 1863009
Bioanalyzer Agilent Genomics G2939BA
TapeStation Agilent Genomics G2991AA
TruSight Myeloid Sequencing Panel Illumina FC-130-1010
Bowtie 2 Johns Hopkins University -
Customized QIAseq Targeted RNA Panel Qiagen -
Rneasy Plus Mini Kit (50) Qiagen 74134

DOWNLOAD MATERIALS LIST

References

  1. Hoang, M. L., et al. Genome-wide quantification of rare somatic mutations in normal tissues using massively parallel sequencing. Proceedings of the National Academy of Sciences USA. 113, 9846-9851 (2016).
  2. O'Roak, B. J., et al. Sporadic autism exomes reveal a highly interconnected protein network of de novo mutations. Nature. 485, 246-250 (2012).
  3. Young, A. L., et al. Quantifying ultra-rare pre-leukemic clones via targeted error-corrected sequencing. Leukemia. 29 (7), 1608-1611 (2015).
  4. Young, A. L., Challen, G. A., Birmann, B. M., Druley, T. E. Clonal hematopoiesis harbouring AML-associated mutations is ubiquitous in healthy adults. NatureCommunications. 7, 12484 (2016).
  5. Patel, J. P., et al. Prognostic relevance of integrated genetic profiling in acute myeloid leukemia. New England Journal of Medicine. 366, 1079-1089 (2012).
  6. Shendure, J., Ji, H. Next-generation DNA sequencing. Nature Biotechnology. 26 (10), 1135-1145 (2008).
  7. Kohlmann, A., et al. Monitoring of residual disease by next-generation deep-sequencing of RUNX1 mutations can identify acute myeloid leukemia patients with resistant disease. Leukemia. 28, 129-137 (2014).
  8. Luthra, R., et al. Next-generation sequencing-based multigene mutational screening for acute myeloid leukemia using MiSeq: applicability for diagnostics and disease monitoring. Haematologica. 99, 465-473 (2014).
  9. Kinde, I., Wu, J., Papadopoulos, N., Kinzler, K. W., Vogelstein, B. Detection and quantification of rare mutations with massively parallel sequencing. Proceedings of the National Academy of Sciences USA. 108 (23), 9530-9535 (2011).
  10. Schmitt, M., et al. Detection of ultra-rare mutations by next-generation sequencing. Proceedings of the National Academy of Sciences USA. 109 (36), 14508-14513 (2012).
  11. Vander Heiden, J. A., et al. pRESTO: a toolkit for processing high-throughput sequencing raw reads of lymphocyte receptor repertoires. Bioinformatics. 30 (13), 1930-1932 (2014).
  12. Newman, A. M., et al. Integrated digital error suppression for improved detection of circulating tumor DNA. NatureBiotechnology. 34, 547-555 (2016).
  13. Shugay, M., et al. MAGERI: Computational pipeline for molecular-barcoded targeted resequencing. PLOSComputationalBiology. 13 (5), e1005480 (2017).
  14. Wong, T. N., et al. Role of TP53 mutations in the origin and evolution of therapy-related acute myeloid leukaemia. Nature. 518, 552-555 (2014).
  15. Krimmel, J. D., et al. Ultra-deep sequencing detects ovarian cancer cells in peritoneal fluid and reveals somatic TP53 mutations in noncancerous tissues. Proceedings of the National Academy of Sciences USA. 113 (21), 6005-6010 (2016).
  16. Phallen, J., et al. Direct detection of early-stage cancers using circulating tumor DNA. ScienceTranslationalMedicine. 9, eaan2415 (2017).
  17. Egorov, E. S., et al. Quantitative profiling of immune repertoires for minor lymphocyte counts using unique molecular identifiers. The Journal of Immunology. 194 (12), 6155-6163 (2015).

Tags

גנטיקה גיליון 138 איתור אירוע נדיר רצף שגיאות ביואינפורמטיקה גנומיקה גילוי מוקדם תיוג מולקולרית
אירוע נדיר איתור שגיאות DNA ו RNA רצף
Play Video
PDF DOI DOWNLOAD MATERIALS LIST

Cite this Article

Wong, W. H., Tong, R. S., Young, A.More

Wong, W. H., Tong, R. S., Young, A. L., Druley, T. E. Rare Event Detection Using Error-corrected DNA and RNA Sequencing. J. Vis. Exp. (138), e57509, doi:10.3791/57509 (2018).

Less
Copy Citation Download Citation Reprints and Permissions
View Video

Get cutting-edge science videos from JoVE sent straight to your inbox every month.

Waiting X
Simple Hit Counter