Waiting
Login processing...

Trial ends in Request Full Access Tell Your Colleague About Jove
Click here for the English version

Immunology and Infection

ExCYT: ממשק משתמש גרפי עבור התייעלות ניתוח של נתוני Cytometry גבוהה-ממדי

Published: January 16, 2019 doi: 10.3791/57473

Summary

ExCYT הוא MATLAB מבוסס גרפי וממשקי משתמש (GUI) המאפשר למשתמשים לנתח את הנתונים cytometry זרימה שלהם דרך כלל המועסקים בשיטות אנליטיות עבור נתונים גבוהה-ממדי כולל הפחתת dimensionality באמצעות t-סנה, מגוון אוטומטיות וידניות קיבוץ באשכולות שיטות heatmaps, זרימה גבוהה-ממדי הרומן חלקות.

Abstract

עם כניסתו של זרימה cytometers מסוגל מדידת מספר גדל והולך של פרמטרים, המדענים ממשיכים לפתח לוחות גדולים יותר לחקור phenotypically מאפייני דוגמאות הסלולר שלהם. עם זאת, הפיתוחים הטכנולוגיים האלה תשואה גבוהה-ממדי בערכות נתונים הפכו להיות יותר ויותר קשה לנתח באופן אובייקטיבי בתוך תוכניות המגביל מבוססות ידנית מסורתית. כדאי לנתח, להציג נתונים, מדענים משתפים פעולה עם bioinformaticians עם מומחיות בניתוח נתונים גבוהה-ממדי כדי לנתח את הנתונים שלהם cytometry זרימה. בעוד ששיטות אלה הוכחו להיות חשוב מאוד ללמוד cytometry זרימה, הם טרם ניתן לשלב בחבילה פשוטה, קלה לשימוש עבור המדענים חסרי התמחות חישובית או תכנות. כדי לטפל צורך זה, פיתחנו ExCYT, MATLAB מבוסס גרפי וממשקי משתמש (GUI) המייעל את הניתוח של נתוני cytometry זרימה גבוהה-ממדי על-ידי יישום שיטות אנליטיות הנפוצות עבור נתונים גבוהה-ממדי כולל הפחתת dimensionality על ידי t-סנה, מגוון רחב של שיטות קיבוץ באשכולות אוטומטיות וידניות, heatmaps זרימה גבוהה-ממדי הרומן חלקות. בנוסף, ExCYT מספק אפשרויות המגביל המסורתי של אוכלוסיות נבחרות עניין נוסף t-סנה, קיבוץ באשכולות ניתוח, כמו גם את היכולת להחיל גייטס ישירות על t-סנה חלקות. התוכנה מספקת את היתרון הנוסף של עבודה עם גם פיצוי כספי או הקבצים FCS uncompensated. בכל מקרה שבו נדרש פיצוי שלאחר הרכישה, המשתמש יכול לבחור לספק התוכנית ספרייה של כתמי יחיד דוגמה וללא רבב. התוכנית מזהה אירועים חיוביים של כל הערוצים ומשתמש בחר נתונים לחישוב המטריצה פיצוי באופן יותר אובייקטיבי. לסיכום, ExCYT מספק קו צינור ניתוח מקיף לקחת נתונים cytometry זרימה בצורה של FCS הקבצים ולאפשר כל אדם, ללא קשר אימונים חישובית, להשתמש הגישות אלגוריתמית האחרון בהבנת הנתונים שלהם.

Introduction

ההתקדמות cytometry זרימה, כמו גם כניסתו של cytometry המוני אפשרה רופאים ומדענים לזהות במהירות ולאפיין phenotypically דגימות ביולוגית, קלינית מעניין עם רמות חדשות של רזולוציה, יצירת גדול ערכות גבוהה-ממדי נתונים המהווים מידע עשיר1,2,3. בעוד בשיטות המקובלות לניתוח נתונים cytometry זרימה כגון gating ידני כבר יותר ישירה עבור ניסויים בהם קיימות בכמה חוטים או הסמנים יש אוכלוסיות ניכרת באופן חזותי, גישה זו יכול להיכשל ליצור תוצאות לשחזור בעת ניתוח ערכות נתונים-ממדים או אלה עם סמנים מכתים על הספקטרום. לדוגמה, במחקר רב מוסדיים, היכן התוך תאית מכתים (ICS) מבחני היו המבוצעת כדי להעריך את הפארמצבטית של quantitating תגובות תא T אנטיגן ספציפי, למרות דיוק inter-laboratory טוב, ניתוח, במיוחד gating, הציג מקור לא מבוטל של השתנות4. יתר על כן, תהליך ידני gating אוכלוסייה של אינטרסים, מלבד היותו סובייקטיבית הוא מאוד זמן רב, עבודה אינטנסיבית. עם זאת, הבעיה של ניתוח ערכות נתונים גבוהה-מימדי בצורה איתנה, יעיל ומתוזמן אינה אחד חדש מחקר למדעים. מחקרים ביטוי גנים לעיתים קרובות ליצור ערכות נתונים מאוד גבוהים-ממדי (לעיתים קרובות גודל מאות גנים) איפה הטפסים ידנית של ניתוח יהיה פשוט באמצעות חישוב. על מנת להתמודד עם הניתוח של ערכות נתונים אלה, יש כבר הרבה עבודה בפיתוח bioinformatic כלים לניתוח נתונים של ביטוי גנים5. גישות אלה אלגוריתמית רק לאחרונה שאומצו בניתוח נתונים cytometry מספר הפרמטרים גדל, הוכיחו להיות בעל ערך לצורך הניתוח של אלה6,גבוהה ערכות נתונים תלת-ממדי7.

למרות הדור של יישום מגוון רחב של חבילות תוכנה מאפשרות להחיל גישות אלה bioinformatic גבוהה-ממדי על הנתונים שלהם cytometry זרימה והאלגוריתמים, שיטות אנליטיות אלה עדיין נשארים בעיקר שאינם בשימוש. בעוד שיכול להיות מגוון גורמים מוגבל של אימוץ נרחב של גישות אלה נתונים cytometry8, מכשול גדול אנחנו חושדים להשתמש גישות אלה על ידי מדענים, חוסר הידע חישובית. למעשה, רבים של אלה חבילות תוכנה (קרי, flowCore, flowMeans ו OpenCyto) נכתבות ניתן ליישם תכנות כגון R עדיין דורשים ידע בתכנות מהותית. חבילות תוכנה כגון FlowJo מצאו בקרב מדענים בשל הפשטות של השימוש, הטבע 'הכנס-הפעל', כמו גם תאימות עם מערכת ההפעלה במחשב. על מנת לספק מגוון רחב של שיטות אנליטיות מקובל ובעל ערך על תיכנות לא מוכר המדען, פיתחנו ExCYT, ממשק משתמש גרפי (GUI) שניתן בקלות להתקין ב- PC/Mac שמושכת הרבה בטכניקות האחרונות הפחתת dimensionality להמחשת אינטואיטיבי, מגוון שיטות קיבוץ באשכולות המצוטטים בספרות, יחד עם תכונות הרומן לחקור את הפלט של אלה כולל קיבוץ באשכולות אלגוריתמים עם heatmaps, רומן מתווה בקופסה זרימה גבוהה-ממדי.

ExCYT הוא ממשק משתמש גרפי שנבנה ב- MATLAB, ולכן ניתן גם להפעיל בתוך MATLAB ישירות או מתקין מסופק זה יכול לשמש כדי להתקין את התוכנה על כל PC/mac. התוכנה זמינה במלון https://github.com/sidhomj/ExCYT. אנו מציגים פרוטוקול מפורט כיצד לייבא נתונים, לעבד אותו מראש, לערוך רדוקציה dimensionality t-סנה, נתוני אשכול, מיון & לסנן אשכולות בהתבסס על העדפות משתמשים, הצגת מידע על האשכולות עניין באמצעות heatmaps ו הרומן זרימה גבוהה-ממדי/תיבת חלקות (איור 1). צירים ב- t-סנה חלקות שרירותית ובלתי ביחידות שרירותי, וככזה כפי שמוצג לא תמיד הדמויות לפשטות של המשתמש בממשק. צביעה של נקודות נתונים ב- "Heatmaps t-סנה" היא כחול צהוב המבוססת על האות של סמן המצוין. בקיבוץ באשכולות פתרונות, הצבע של נקודת הנתונים מבוסס שרירותי על מספר האשכולות. כל החלקים של זרימת העבודה יכולה לצאת לפועל שבלוח יחיד GUI (איור 2 & טבלה 1). לבסוף, אנו נדגים את השימוש ExCYT על נתונים שפורסמו בעבר לחקור את הנוף המערכת החיסונית של קרצינומה של תאי הכליה בספרות, נותחו גם בשיטות דומות. ניתן למצוא את ערכת הנתונים לדוגמה שהשתמשנו כדי ליצור את הדמויות בכתב היד יחד עם פרוטוקול למטה ב https://premium.cytobank.org/cytobank/projects/875, בעת רישום חשבון.

Subscription Required. Please recommend JoVE to your librarian.

Protocol

1. איסוף והכנת Cytometry נתונים

  1. במקום כל כתמי יחיד בתוך תיקיה על-ידי עצמם ותווית בשם ערוץ (על ידי fluorophore, לא סמן).

2. הנתונים היבוא & עיבוד קדם

  1. כדי להשהות או לשמור לאורך צינור ניתוח זה, השתמש בלחצן שמירת סביבת עבודה בפינה השמאלית התחתונה של התוכנית כדי להציל את סביבת העבודה כמו '. מחצלת ' קובץ אותו ניתן לטעון מאוחר יותר באמצעות לחצן עומס סביבת עבודה . אין להפעיל יותר ממופע אחד של התוכנית במועד. לכן, בעת טעינת סביבת עבודה חדשה של, הקפד לבדוק אין מופע אחר של ExCYT פועל.
  2. כדי להתחיל ניתוח צינור, ראשית בחר סוג cytometry (Flow Cytometry או מסה Cytometry – CYTOF), תחת המספר בחר קובץ בחירת הפרמטרים של אירועים כדי לדגום הקובץ (לשימוש זו דוגמה 2,000). לאחר הנתונים יובאו בהצלחה, תיבת דו-שיח תופיע כעת שתודיע למשתמש כי הנתונים יובא בהצלחה.
  3. לחצו על כפתור Auto-פיצוי לבצע צעד אוטומטי אופציונלי-פיצוי, כפי שנעשה על ידי באגוול & אדמס9. בחר את הספריה שמכילה את כתמי יחיד. בחר את הדגימה מוכתם בתוך הדיאלוג ממשק המשתמש.
    1. במקום שער קדימה/צד-פיזור על כל הדגימות בספריה זו שישמש כדי לבחור אירועים לחישוב המטריצה פיצוי. מומלץ להשתמש המדגם מוכתם למטרה זו. בשלב זה, אלגוריתם יושם לקבוע ספי עקביבמאיון ה 99 המדגם מוכתם להגדיר אירועים חיוביים בכל אחד הכתמים יחיד לחישוב המטריצה פיצוי . כאשר הוא סיים, תיבת דו-שיח ליידע את המשתמש כי בוצעה הפיצוי.
  4. בשלב הבא, לחץ על האוכלוסייה שער ובחר באוכלוסיות של תאים מעניינים, כמו האמנה לזרום cytometry ניתוחים. כאשר אוכלוסיית תאים נבחר, הזן מספר האחוז של ניתוח אירועים במורד הזרם (באירועים זה 10,000).
  5. בשלב הבא, בחר את הערוצים מספר שישמש עבור ניתוח בתיבת הרשימה בבקצה השמאלי של תיבת מראש עיבוד (השתמש הערוצים ספציפי בדוגמה).

3. t-סנה ניתוח

  1. לחץ על לחצן t-סנה כדי לקבל את התוכנית להתחיל התחלה כדי לחשב את ערכת הנתונים dimensionality מופחת להמחשת בחלון מתחת ללחצן t-סנה. כדי לשמור תמונה של t-סנה, הקש על להציל את התמונה TSNE. על מכונה עם 8 CPU @ 3.4 GHz ו- GM 8 RAM שלב זה צריך לקחת כ 2 דקות לאירועים 10,000, 10 דקות לאירועים 50,000 ו-20 דקות לאירועים 100,000.
  2. כדי ליצור heatmap אל-סנה ', כפי שניתן לראות מספר CYTOF פרסומים10,11, בחר באפשרות מתוך התפריט הנפתח סמן ספציפיים t-סנה (השתמש את סמני ספציפי CD64 או CD3 כמוצג בדוגמה). דמות יופיע מציג ייצוג heatmap של העלילה t-סנה שניתן לשמור לדור איור.
  3. בחר תחומי עניין ב- t-סנה החלקות על-ידי המשתמש עבור נוסף במורד הזרם ניתוחים באמצעות לחצן שער t-סנה .

4. אשכול ניתוח

  1. כדי להתחיל קיבוץ באשכולות ניתוח, בחר אפשרות מתוך הרשימה שיטת אשכולות (בדוגמה זו לנו DBSCAN עם מקדם מרחק של 5 בדיאלוג התיבה בצד ימין של תיבת הרשימה). לחץ על לחצן אשכול .
  2. השתמש באחת האפשרויות הבאות עבור אוטומטית אלגוריתמים קיבוץ באשכולות המופיעים בחלונית ' 'פרמטרים קיבוץ באשכולות אוטומטיות' ':
    1. KMEANS קשה (על t-סנה): להחיל k-אמצעי קיבוץ באשכולות על הנתונים מופחת 2-ממדי t-סנה ודורש מספר אשכולות שיסופק אלגוריתם12.
    2. KMEANS קשה (על נתונים HD): להחיל k-אמצעי קיבוץ באשכולות בנתונים המקוריים גבוהה-ממדי שניתן האלגוריתם t-סנה. שוב, המספר של אשכולות צריך להינתן בעזרת אלגוריתם.
    3. DBSCAN: להחיל את השיטה קיבוץ באשכולות של קיבוץ באשכולות, נקראת צפיפות מבוסס שירות האשכולות המרחבי של יישומים עם רעש13 אשכולות הנתונים מופחת 2-ממדי t-סנה ודורש גורם שאינו-ממדי המרחק קובע את גודל כללי אשכולות. סוג זה של אלגוריתם קיבוץ באשכולות הוא גם מתאים לאשכול ההפחתה t-סנה כפי שהוא מסוגל לאשכול spheroidal אשכול כי קיימים לעתים קרובות בייצוג t מופחתת-סנה. בנוסף, בשל העובדה כי היא פועלת על הנתונים 2-ממדי, זה לאחד האלגוריתמים האשכולות מהר יותר.
    4. קיבוץ באשכולות היררכי: השיטה המקובלת קיבוץ באשכולות הירארכי חלות על הנתונים גבוהה-ממדי שבו המטריצה כולה מרחק אוקלידי מחושבת בין כל האירועים לפני מתן האלגוריתם פקטור המרחק קובע את גודל האשכול.
    5. רשת גרף- בסיס: להחיל פעולת שירות האשכולות כבר הציג לאחרונה לתוך ניתוח נתונים cytometry זרימה כאשר יש subpopulations נדיר המשתמש שרוצה לזהות11,14. שיטה זו מתבססת על הראשון יוצר גרף הקובע את החיבורים בין כל האירועים ב הנתונים. שלב זה כולל מתן פרמטר ראשונית ליצירת התרשים, שהוא מספר השכנים k-הקרוב. פרמטר זה שולט בדרך כלל בגודל של האשכולות. בשלב זה, תיבת דו-שיח אחרת יצוץ שמבקשת מהמשתמש להעסיק אחד של 5 אשכולות אלגוריתמים שהוחל על הגרף. אלה כוללות אפשרויות 3 כדי למקסם את המודולריות של הגרף, השיטה דנון ספקטרלי קיבוץ באשכולות אלגוריתם14,15,16,17,18. אם אחד לא רוצה פתרון בדרך כלל מהר יותר קיבוץ באשכולות, אנו ממליצים קיבוץ באשכולות ספקטרלי או את מהר חמדן מודולריות למיקסום. בעוד השיטות למיקסום מודולריות יחד עם שיטת דנון לקבוע את מספר אופטימלי של אשכולות, קיבוץ באשכולות ספקטרלי דורש מספר אשכולות תינתן לתוכנית.
    6. עצמית מאורגן מפה: מעסיקים של רשת עצבית מלאכותית כדי אשכול הנתונים גבוהה-ממדי.
    7. GMM – למיקסום ציפייה: ליצור מודל תערובת גאוסיאנית בטכניקה ציפייה מקסום (EM) כדי אשכול הנתונים גבוהה-ממדי. 19 זה סוג של שיטת האשכולות גם דורש מהמשתמש קלט מספר אשכולות.
    8. היסק בייסיאניות הווריאציה עבור GMM: ליצור מודל תערובת לפי עקומת גאוס אבל בניגוד EM, זה אפשרות לקבוע אוטומטית את מספר ה ק' רכיבי התערובת20 בזמן התוכנית לדרוש מספר אשכולות תינתן (גדול יותר צפוי מספר אשכולות), האלגוריתם יקבע המספר האופטימלי בכוחות עצמו.
  3. ללמוד תחום מסוים של העלילה t-סנה, לחץ על לחצן בחר אשכול באופן ידני כדי לצייר קבוצת אשכולות על-ידי המשתמש. ראוי לציין, אשכולות יכול לשתף חברים (קרי, כל אירוע יכול להשתייך רק לאשכול 1).

5. אשכול סינון

  1. ולתקשר של אשכולות מזוהה גם באופן ידני או באמצעות אחת השיטות אוטומטי המתואר לעיל ניתן לסנן באמצעות כדלקמן.
    1. כדי למיין אשכולות (בחלונית ' מסנן אשכול ) על ידי כל אחד הסמנים שנמדד בניסוי, בחרו אפשרות מהתפריט הנפתח מיון . כדי לקבוע אם הצו הוא בסדר עולה או יורד, לחץ על הלחצן סדר עולה/יורד בצד ימין של התפריט הנפתח מיון . זה לעדכן את רשימת אשכולות בתיבת הרשימה 'אשכולות (סינון)', סדר יורד של אשכול החציוני הבעת את הטוש אותם. האחוז מסומן בתיבת הרשימה 'אשכולות (סינון)' מציין את אחוז האוכלוסייה המייצג את האשכול הזה.
    2. כדי להגדיר ערך סף המינימום עבור מקבץ מסוים על פני ערוץ מסוים, בחרו אפשרות מהתפריט הנפתח הסף (בדוגמה זו לנו סמן CD65 ואת ערכת סף-0.75). הקלד ערך בתיבה מספריים מתחת לגרף או השתמש במחוון-כדי לקבוע סף. ברגע סף מוגדר, הקש להוסיף מעל הסף או להוסיף מתחת לסף כדי לציין את הכיוון של הסף. לאחר שהמכסה הוגדר, הוא יוצג בתיבה ספי שליד החלונית ' 'אשכול מסנן' ' איפה את הסמן את ערך הסף, הכיוון יפורטו כך שהמשתמש מודע איזה ספי כעת מוחלים. לבסוף העלילה t-סנה יעדכן על ידי טשטוש החוצה אשכולות שאינם עונים על הדרישות של הסינון, תיבת הרשימה 'אשכולות (סינון)' יעדכן להראות אשכולות העונים על הדרישות סינון.
    3. כדי להגדיר סף המינימום עבור התדירות של אשכול, הזן של ניתוק מספריים האשכול תדירות סף (%) התיבה בלוח של מסנן אשכול (בשדה זו דוגמה לשימוש 1%).

6. אשכול ויזואליזציה ואנליזה

  1. כדי לבחור אשכולות על ניתוח נוסף ופריטים חזותיים, בחר אשכולות אשכולות (סינון) הרשימה ולחץ על לחצן א' בחר כדי להעביר אותם אל הרשימה לנתח את האשכול .
  2. כדי ליצור heatmaps של אשכולות, בחר האשכולות עניין בתיבת הרשימה אשכול לנתח ולחץ על לחצן HeatMap של אשכולות . בעת לחיצה על לחצן זה, דמות יופיע המכיל מפת חום יחד עם dendrograms על הצירים אשכול ופרמטר. Dendrogram בציר האנכי יקבץ אשכולות על-ידי אלו קשורים קשר הדוק בזמן dendrogram האופקי ציר יקבץ סמני הקשורות משותפת. כדי לשמור heatmap, הקש קובץ | ייצוא ההתקנה | ייצוא-
  3. כדי ליצור 'גבוהה ממדי התיבה מגרש' או 'גבוהה ממדי לזרום מגרש', בחר האשכולות עניין בתיבת הרשימה אשכול לנתח ולחץ על לחצן גבוהה מגרש תיבת תלת-ממדי או לחצן גבוהה ממדי לזרום עלילה . חלקות אלה ניתן להשתמש כדי להעריך באופן חזותי את ההפצה של נתן ערוצים של אשכולות שונים על פני כל הממדים.
  4. כדי להציג אשכולות ב זרימה 2D מסורתיות חלקות, בחר את השינוי (ליניארי, log10, arcsinh), ערוץ מגרש זרימה קונבנציונאלי החלונית, הקש עלילה זרימה קונבנציונאלי.

Subscription Required. Please recommend JoVE to your librarian.

Representative Results

על מנת לבדוק את השימושיות של ExCYT, ניתחנו את ערכת נתונים אצר בהוצאת שוורייה. ואח שכותרתו "המערכת החיסונית אטלס של ברור כליות קרצינומה של תאים' איפה הקבוצה נערך ניתוח CyTOF עם לוח המערכת החיסונית מקיף על גידול דגימות שנלקחו 73 חולים11. שני לוחות נפרדים, לוח מיאלואידית, הלימפה, שימשו phenotypically לאפיין את microenvironment הגידול. מטרת המחקר שלנו היתה לסכם את התוצאות של t-סנה שלהם אשכול ניתוח, מראה כי ExCYT יכול לשמש כדי להגיע לאותן המסקנות, כמו גם להראות נוספים שיטות הדמיה וניתוח אשכול.

בכתב היד המקורי, הקבוצה תיאר 22 אשכולות T cell המזוהה על-ידי הפאנל הלימפה ואשכולות תא 17 המזוהה על-ידי הפאנל מיאלואידית. איור 3 & 4 איור של הפרסום, הקבוצה מציגה heatmaps של אשכולות, t-סנה מגרשים עם פתרונות קיבוץ באשכולות מקודדות לפי צבעים, t-סנה heatmaps ב subpanels A, B & C. על מנת לבצע את הניתוח, לנו את הנתונים באופן ידני מגודרת המתקבל Cytobank שנדגמו 2,000 אירועים מ כל קובץ או לקח את הקובץ כולו, אם זה היה פחות מ-2,000 אירועים, בעקבות ניתוח צינור מאויר בכתב היד המקורי. בשלב זה, אנחנו שנדגמו סך של 100,000 אירועים באמצעות פרמטר תת-דגימה פוסט-חסימה שלנו, נערך ניתוח t-סנה, נעשה שימוש מגוון שיטות קיבוץ באשכולות לחקור את הנתונים בדרכים שונות.

ראשית, בדקנו לוח מיאלואידית לפי הצינור ניתוח זהה של כתב היד המקורי על-ידי השלמת הניתוח t-סנה ויצירת heatmaps סמנים שונים (איור 3 א). בעוד כתב היד המקורי מנורמל של heatmaps t-סנה כדיהאחוזון ה 99. של כל סמן , ExCYT לא עושה זה סוג של נורמליזציה עבור heatmaps שלה. עם זאת, דומה הפצות ביטוי שיתוף סמן נצפו כמתואר בכתב היד המקורי. אנחנו מכן להחיל שיטה מבוססת רשת גרף של קיבוץ באשכולות את הנתונים על-ידי יצירת הגרף עם 100 k-הקרוב השכנים ואישכול הגרף באמצעות אופטימיזציה המודולריות של הגרף באמצעות יישום מהיר-חמדן בתוך ExCYT, שבו מצאנו 19 תת אוכלוסיות של תאי (איור 3B). כאשר משווים את heatmap של אלה אשכולות שנוצרו על-ידי ExCYT עם heatmap פורסם בכתב היד המקורי, ציינו כי הצלחנו לזהות אשכולות דומה של התאים מיאלואידית (איור 3C). ראוי לציין, כתב היד המקורי מזוהה והציבה שני תת אוכלוסיות של התאים מיאלואידית זיהינו בניתוח שלנו, שהוגדרו על-ידי ד ר הלעintCD68intCD64intCD36+CD11b+ (אשכול 13) ודר הלע-+ CD4+CD68+CD64+CD36 CD11b (אשכול 18). הדמיה על ידי תיבת גבוהה-ממדי מגרש של אלה שתי האוכלוסיות גילה הבדלים משמעותיים סטטיסטית (מאן-ויטני) מששת סמני שהוזכרו (איור 1D).

בשלב הבא, ניתחנו את הפאנל הלימפה עם גישה קיבוץ באשכולות קונבנציונאלי הירארכי מהר יותר. גישה זו הניבה הפצות דומים סמן דרך heatmaps t-סנה (איור 4A). יתר על כן, קיבוץ באשכולות של הנתונים באמצעות הירארכי קיבוץ באשכולות (איור 4B), הפגינו אשכולות דומה של תאי הלימפה (איור 4C). ראוי לציין, זיהינו גם האוכלוסייה הייחודי תא T רגולטורי של כתב היד המקורי הגדיר CD4+CD25+Foxp3+CTLA-4+CD127 (אשכול 17) באמצעות עלילה זרימה גבוהה-ממדי שלנו (איור 4D).

לבסוף, רצינו להעסיק שיטה בתוך ExCYT להעריך באופן כמותי ובמהירות אגודות שיתוף בין סמנים. התחלנו על-ידי שימוש באלגוריתם קיבוץ באשכולות k קשה-פירושו להניח אשכולות 5000 על הנתונים t דו מימדי-סנה (איור 4E). . אז השתמשנו הביטוי החציוני של הקריטריונים של כל האשכולות האלה כדי ליצור heatmap של אלה אשכולות (איור 4F). מאז אלה heatmaps אשכול שורות, כמו גם העמודות דומות, שיטה זו של בהסתרה את הנתונים על-ידי החלת רשת קנס של אשכולות ולאחר מכן יצירת heatmap מאפשר לנו לאסוף את שיוכי שיתוף בקלות, כגון האגודה שותפה של טים-3, PD-1, CD38, ו 4-1BB.

Figure 1
איור 1: צינור ExCYT & תכונות. (א) ExCYT מתחילה על ידי ייבוא נתונים גולמיים של FCS, החלת פיצוי אופציונלי, gating תת-דגימה אקראית לפני ניתוח במורד הזרם. פעולה זו מבטיחה כל האירועים שעוברים ניתוח הרלוונטיים הניסוי שעוברים ניתוח. t-סנה dimensionality הפחתת מבוצעת ואז לדמיין כל האירועים, t-סנה heatmaps יכול להיווצר להמחיש הפצות פנוטיפי. לבסוף, מגוון רחב של אלגוריתמים קיבוץ באשכולות יכול להיות מיושם על t-סנה טרנספורמציה או נתונים גולמיים גבוהה-ממדי. (B) כולל קביעת סף ומיון הרומן מאפשרות למשתמשים למיין במהירות דרך ואולי מאות אשכולות כדי למצוא עניין. (ג) Heatmaps של אשכולות יכולים להיווצר לבחון אשכולות מרובים איך להשוות אחד את השני כמו גם סמנים אשר שותף לקשר. (ד) חלקות הרומן בקופסה זרימה גבוהה-ממדי ניתן להפיק כל צורה של הגב-gating אשכולות על הנתונים המקורי תוך כדי להעריך את טיב הנתונים גבוהה-ממדי. אנא לחץ כאן כדי להציג גירסה גדולה יותר של הדמות הזאת.

Figure 2
איור 2: ממשק משתמש גרפי ExCYT: ExCYT ממשק המשתמש הגרפי מאפשר ייעול עבודה זרימת עבודה מצד השמאל ימין של הפאנל כפי שהמשתמש מייבא את הנתונים שלהם, מבצעת צמצום dimensionality t-סנה, קיבוץ באשכולות, ואת אשכול הסופי ניתוח והדמיה. אנא לחץ כאן כדי להציג גירסה גדולה יותר של הדמות הזאת.

Figure 3
איור 3: החוק הביוגנטי של תאים מיאלואידים תת אוכלוסיות מ. שוורייה et al. (א) heatmaps t-סנה אסימון של מגרש מיאלואידית לוח (B) t-סנה מיאלואידית לוח צבע מקודד על ידי רשת-גרף קיבוץ באשכולות אלגוריתם Heatmap (C) של אשכולות המזוהה על-ידי קיבוץ באשכולות פתרון בלוח מיאלואידית השוואתי (D) גבוהה תיבת ממדי מגרש השוואת מנוגדים מיאלואידית subpopulations (אשכולות 13 ו 18) הפניה בכתב היד המקורי אנא לחץ כאן כדי להציג גירסה גדולה יותר של הדמות הזאת.

Figure 4
איור 4: החוק הביוגנטי של הלימפה תת אוכלוסיות של. שוורייה et al. (א) heatmaps t-סנה אסימון של החלונית הלימפה (B) t-סנה מגרש של הלימפה לוח צבע מקודד על ידי אלגוריתם קיבוץ באשכולות הירארכי Heatmap (C) של אשכולות המזוהה על-ידי קיבוץ באשכולות פתרון על לוח הלימפה (D) ממדי זרימה גבוהה העלילה של תא T רגולטורי מזוהה האוכלוסייה (אשכול 17) בכתב היד המקורי (E) שירות האשכולות פתרון קשה 5,000 אשכול k-אמצעי ניתוח נתונים t-סנה (נ) Heatmap של אשכולות המזוהה על-ידי פתרון קיבוץ באשכולות k-אמצעי על הלימפה לוח מראה סמן שיתוף האסוציאציות. אנא לחץ כאן כדי להציג גירסה גדולה יותר של הדמות הזאת.

לא. תיאור שם (GUI)
1 בחר סוג Cytometry נה
2 תת-דגימה אקראית של נתונים גולמיים נה
3 בחר קבצים עבור ניתוח בחר קבצים
4 Auto-פיצוי של הנתונים הגולמיים בהתבסס על מדריך מהכתמים יחיד, מספק לתוכנה Auto-פיצויים
5 Gating כדי לבחור אירועים עבור t-סנה וניתוח קיבוץ באשכולות שער האוכלוסייה
6 תת-דגימה אקראית של מגודרת נתונים (מספר מוחלט) נה
7 תת-דגימה אקראית של מגודרת נתונים (אחוז מאוכלוסיית מגודרת) נה
8 בחירת ערוצי לניתוח נה
9 רוץ צמצום dimensionality t-סנה t-סנה
10 t-סנה חלון נה
11 שמירת סביבת עבודה שמירת סביבת עבודה
12 לטעון את סביבת העבודה לטעון את סביבת העבודה
13 ליצור t-סנה heatmap על סמן בחירה נה
14 שער t-סנה מחדש לעשות ניתוח t-סנה מאוכלוסיית בחר שער t-סנה
15 שמור חלון t-סנה כתמונה שמירת תמונה TSNE
16 בחר קיבוץ באשכולות אלגוריתם קיבוץ באשכולות שיטה
17 לאחר הזנת פרמטר קיבוץ באשכולות כי נתנו אלגוריתם נה
18 ניתוח האשכולות אשכול
19 לצייר אשכולות באופן ידני לבחור ידנית את אשכול
20 נקה כל אשכולות לבצע ניתוח האשכולות נקה אשכולות
21 הצג אשכולות בתנאים הנוכחיים של מסנן אשכולות (סינון)
22 להסיר אשכולות בחר מן הרשימה אשכול לנתח הסר <...
23 בהוספת אשכול לתיבת אשכול לנתח בחר ->
24 ליצור heatmap המקובלת של כל האירועים בניתוח HeatMap של אירועים
25 מיון אשכולות על ידי בחר סמן מיון
26 קביעת הסף על-ידי סמן בחירה סף
27 ליצור heatmap המקובלת של אשכולות בחירה מתוך הרשימה אשכול לנתח HeatMap של אשכולות
28 היפוך סדר מיון מיון בסדר יורד
29 נקה כל ספי נקה כל ספי
30 הגדרת תדירות סף עבור אשכולות אשכול תדירות סף (%)
31 רשימת פעיל 'אשכולות (סינון)' הרשימה הנוכחית ספי ספי
32 מגרש גבוה תיבת תלת-ממדי מגרש גבוה תיבת תלת-ממדי
33 זרימה גבוהה ממדי מגרש זרימה גבוהה ממדי מגרש
34 הציר האופקי פרמטר עבור זרימת קונבנציונאלי מגרש נה
35 הציר האנכי פרמטר עבור זרימת קונבנציונאלי מגרש נה
36 השינוי נתונים עבור זרימת קונבנציונאלי עלילה על ציר אופקי נה
37 השינוי נתונים עבור זרימת קונבנציונאלי עלילה על ציר אנכי נה
38 צור זרימה קונבנציונאלי מגרש מגרש זרימה קונבנציונלי
39 הצג אשכולות לניתוח נה

טבלה 1: סקירה של כל פונקציות נוכח ExCYT GUI

שם חבילת/תוכנה ExCYT CYT FCS אקספרס flowCore openCyto FlowMeans
סוג תוכנית Matlab Matlab יישום עצמאי R R R
מחיר למשתמש חינם חינם 1,000 דולר חינם חינם חינם
ממשק משתמש גרפי כן כן כן לא לא לא
טכניקות הפחתת dimensionality t-סנה t-סנה, PCA t-סנה, PCA, ספייד אף אחד אף אחד אף אחד
קיבוץ באשכולות אלגוריתמים . זה אומר K
DBSCAN
קיבוץ באשכולות היררכי
מפת עצמי מאורגנת
רשת מרובים-גרף המבוסס על שיטות
GMM - EM
GMM - הווריאציה היסק בייסיאני
. זה אומר K
GMM - EM
רשת יחיד-גרף המבוסס על שיטה (Phenograph)
. זה אומר K אף אחד אוטומציה של חסימה בזרימת עבודה ידנית . זה אומר K
יכולת מיון/סינון אשכולות כן לא לא לא לא לא
זרימה גבוהה ממדי חלקות כן לא לא לא לא לא

טבלה 2: סקירה של פתרונות ניתוחי Cytometry זרימה תוכנה בסיוע

Subscription Required. Please recommend JoVE to your librarian.

Discussion

כאן אנו מציגים ExCYT, ממשק משתמש גרפי הרומן פועל אלגוריתמים מבוססי-MATLAB כדי לייעל את ניתוח של נתוני cytometry גבוהה-ממדי, המאפשר לאנשים ללא רקע לתיכנות ליישם את המילה האחרונה נתונים גבוהה-ממדי ניתוח אלגוריתמים. הזמינות של תוכנה זו על הקהילה המדעית רחבה יותר יאפשר למדענים לחקור את הנתונים שלהם cytometry זרימה זרימת עבודה אינטואיטיבי וישיר. דרך ביצוע הפחתה dimensionality t-סנה, החלת שיטת האשכולות, להיות מסוגל מיון/סינון דרך אלה אשכולות במהירות, ולעשות heatmaps גמיש, ניתן להתאמה אישית, זרימה גבוהה-ממדי/תיבת חלקות, מדענים יוכלו לא רק מבין subpopulations באופן ייחודי מוגדר בדגימות שלהם אבל יהיה מסוגל ליצור פריטים חזותיים הנמצאים אינטואיטיבי ומובן בקלות על-ידי עמיתיהם.

אמנם התוכנית היא גמישה בטיפול של מגוון סוגי נתונים (קונבנציונלי cytometry לעומת מסת cytometry זרימה), ישנם מספר שיקולים עבור השירות האופטימלי של התוכנית. הראשון מביניהם הוא לגבי איכות נתונים, במיוחד של נתונים cytometry זרימה. פיצוי נאות והרזולוציה של חופפים ספקטרום הפליטה היא בעלת חשיבות עליונה. נתונים מדובבים לקוי יכול לגרום בשוגג שווא שיתוף אגודות של סמנים, היווצרות אשכולות שאינם אמת משמעות ביולוגית. לכן, רצוי מאוד כי נתוני הקלט היא של איכות הצליל לפני שתמשיך עם t-סנה ניתוח, ניתוח נוסף במורד הזרם. יתר על כן, השימוש האלגוריתם פיצוי אוטומטי מיושם ExCYT דורש כתמי ברור יחיד עבור כל הערוצים כדי לחשב במדויק את הפרמטרים פיצוי.

שיקול חשוב נוסף לשימוש של ExCYT כאשר שרשור FCS קבצים מרובים לתוך ניתוח אחד (כפי הפגינו בכתב היד), הם חייבים להיות דומות על פני כל הערוצים. ראשית, פירוש כי באותו הפאנל צריך לשמש ברחבי כל דגימות , לא להיסחף בין דוגמאות על פני כל הערוצים. לדוגמה, אם מישהו היה לקרוא שתי דגימות בימים נפרדים CD8 ויטראז'ים ב FITC על שתי ימים אך המתח של cytometer הוגדר אחרת ביום אחד וכתוצאה מכך אוכלוסייה CD8 שהוסטו מעט, היתה אחת להפיק אשכולות שווא בניתוח במורד הזרם , כמו שינוי זה נוצר כפונקציה של וריאציה כלי, לא בשל חשיבות ביולוגית. בעוד גירסאות עתידיות של ExCYT עשוי להיות מסוגל לנרמל את דגימות שלהם כתמי יחיד, בשלב זה, שיקול דעת זהיר להתבצע FCS קבצים שניתן יהיה להשוות לזו לפני ייבואן לתוך ExCYT.

בסופו של דבר, התהליך של קיבוץ באשכולות הוא לא זה הוא מוחלט/נוקשה. פרמטרים והאלגוריתמים קיבוץ באשכולות שונים יכולים ליצור פתרונות קיבוץ באשכולות שונים. אם הפתרון של האלגוריתם מתאים מיועד למשתמש לקבוע על-ידי סינתזה ההבנה שלהם של הביולוגיה עם הפתרון קיבוץ באשכולות. לדוגמה, כאשר הבנת הסביבה המערכת החיסונית של גידולים, אחד עשוי להיות מעוניין מאקרוסקופית אשכולות (קרי, T תאים vs B תאים לעומת התאים מיאלואידית) בזמן אחר עשוי להיות מעוניין subpopulations של אשכולות מאקרוסקופית. הרזולוציה של האשכולות נקבעת על-ידי המשתמש ולכן, יחידה קיבוץ באשכולות הפתרון הוא 'הנכון'. זהו אחד היתרונות העיקריים של שימוש החלקות זרימה גבוהה ממדי הזמינות ב- ExCYT. היכולת להמחיש את ההפצה של אשכול נתון על פני כל ערוצי יכול לעזור למשתמש לקבוע אם הם להיות מגובשים לא רק מבחינה ביולוגית רלוונטית דרך, אבל בצורה רלוונטית השאלה המדעית הנשאלת לניסוי. אמנם מטרתנו לספק שפע של שיטות המשמשות בספרות לנתונים cytometry זרימה גבוהה-ממדי האשכול תוך מתן שיטות נוספות של קיבוץ באשכולות, אנו ממליצים על שימוש שיטות כמו k-פירושו DBSCAN לחקור את הנתונים באמצעות במהירות איטראציה אשכול מספר ואת גודל יותר לכיוון רשת-גרף וגישות מעורבות-gaussian מודל עבור גישות עמידים יותר אבל אורכת זמן רב.

לאור שיקולים אלה, ExCYT עדיין כלי גמיש מאוד יקר עבור חקר נתונים גבוהה cytometry תלת-ממדי, והוא מציע תכונות ייחודיות/הבחנה יותר חבילות זמינות אחרות זמינים לבצע סוג זה של ניתוח (טבלה 2) . ראשית, ExCYT מבדילה את עצמה מעל רוב לזרום cytometry ניתוח הגישות ניצול dimensionality הפחתת ואישכול אלגוריתמים על פי יכולתה לשמש ללא כל ידע ב- scripting/תכנות. בנוסף, בעזרת אלגוריתמים קיבוץ באשכולות רבים ציינו ברחבי הספרות, אנו מאמינים שאנו מספקים את רוב האפשרויות עבור נתוני האשכולות. לבסוף, שלנו תכונה ייחודית של אשכול סינון ומיון יחד עם תצוגה באמצעות הרומן זרימה גבוהה ממדי חלקות, מאפשר למשתמשים לחקור את מאפייני אשכולות שלהם במהירות וביעילות, ביצוע התהליך של 'גילוי' נדיר subpopulations פשוטה ויעילה.

Subscription Required. Please recommend JoVE to your librarian.

Disclosures

המחברים אין לחשוף.

Acknowledgments

המחברים לא תודות לך

Materials

Name Company Catalog Number Comments
Desktop SuperMicro Custom Build Computer used to run analysis
MATLAB Mathworks N/A Software used to develop ExCYT

DOWNLOAD MATERIALS LIST

References

  1. Benoist, C., Hacohen, N. Flow cytometry, amped up. Science. 332 (6030), 677-678 (2011).
  2. Ornatsky, O., et al. Highly multiparametric analysis by mass cytometry. Journal of immunological methods. 361 (1), 1-20 (2010).
  3. Tanner, S. D., et al. Flow cytometer with mass spectrometer detection for massively multiplexed single-cell biomarker assay. Pure and Applied Chemistry. 80 (12), 2627-2641 (2008).
  4. Maecker, H. T., et al. Standardization of cytokine flow cytometry assays. BMC immunology. 6 (1), 13 (2005).
  5. Brazma, A., Vilo, J. Gene expression data analysis. FEBS letters. 480 (1), 17-24 (2000).
  6. Pyne, S., et al. Automated high-dimensional flow cytometric data analysis. Proceedings of the National Academy of Sciences. 106 (21), 8519-8524 (2009).
  7. Ge, Y., Sealfon, S. C. flowPeaks: a fast unsupervised clustering for flow cytometry data via K-means and density peak finding. Bioinformatics. 28 (15), 2052-2058 (2012).
  8. Venkatesh, V. Determinants of perceived ease of use: Integrating control, intrinsic motivation, and emotion into the technology acceptance model. Information systems research. 11 (4), 342-365 (2000).
  9. Bagwell, C. B., Adams, E. G. Fluorescence spectral overlap compensation for any number of flow cytometry parameters. Annals of the New York Academy of Sciences. 677 (1), 167-184 (1993).
  10. Lavin, Y., et al. Innate immune landscape in early lung adenocarcinoma by paired single-cell analyses. Cell. 169 (4), 750-765 (2017).
  11. Chevrier, S., et al. An immune atlas of clear cell renal cell carcinoma. Cell. 169 (4), 736-749 (2017).
  12. Hartigan, J. A., Wong, M. A. Algorithm AS 136: A k-means clustering algorithm. Journal of the Royal Statistical Society. Series C (Applied Statistics). 28 (1), 100-108 (1979).
  13. Ester, M., Kriegel, H. P., Sander, J., Xu, X. Density-based spatial clustering of applications with noise. International Conference Knowledge Discovery and Data Mining. 240, (1996).
  14. Levine, J. H., et al. Data-driven phenotypic dissection of AML reveals progenitor-like cells that correlate with prognosis. Cell. 162 (1), 184-197 (2015).
  15. Blondel, V. D., Guillaume, J. L., Lambiotte, R., Lefebvre, E. Fast unfolding of communities in large networks. Journal of statistical mechanics: theory and experiment. 2008 (10), P10008 (2008).
  16. Le Martelot, E., Hankin, C. Fast multi-scale detection of relevant communities in large-scale networks. The Computer Journal. 56 (9), 1136-1150 (2013).
  17. Newman, M. E. Fast algorithm for detecting community structure in networks. Physical review E. 69 (6), 066133 (2004).
  18. Hespanha, J. P. An efficient matlab algorithm for graph partitioning. , University of California. 1-8 (2004).
  19. Moon, T. K. The expectation-maximization algorithm. IEEE Signal processing. 13 (6), 47-60 (1996).
  20. Bishop, C. M. Pattern recognition and machine learning. , Springer. (2006).

Tags

הכחשה גיליון 143 Flow Cytometry ניתוח גבוהה-ממדי t-סנה קיבוץ באשכולות חום מפות הפחתת Dimensionality
ExCYT: ממשק משתמש גרפי עבור התייעלות ניתוח של נתוני Cytometry גבוהה-ממדי
Play Video
PDF DOI DOWNLOAD MATERIALS LIST

Cite this Article

Sidhom, J. W., Theodros, D., Murter, More

Sidhom, J. W., Theodros, D., Murter, B., Zarif, J. C., Ganguly, S., Pardoll, D. M., Baras, A. ExCYT: A Graphical User Interface for Streamlining Analysis of High-Dimensional Cytometry Data. J. Vis. Exp. (143), e57473, doi:10.3791/57473 (2019).

Less
Copy Citation Download Citation Reprints and Permissions
View Video

Get cutting-edge science videos from JoVE sent straight to your inbox every month.

Waiting X
Simple Hit Counter