January 2nd, 2011
ניתוח חזותי (VA) היא גישה חדשה לניתוח נתונים באופן אינטראקטיבי. בסרטון הזה, אנו דנים את הבעיה עומס הנתונים שהובאו על ידי תפוקה גבוהה ניסויים ביולוגיים, ולהציע VA כפתרון לבעיה כזו. הסרטון מדגים ניתוח בתוך ובין מערכי נתונים החיסונית באמצעות כלי VA נקרא המחזה.
הקלה על ניתוח נתונים אימונולוגיים בטכניקות אנליטיות חזותיות. בעוד שהיכולת לאסוף ולאחסן נתונים התקדמה במהירות, היכולת לעבד ולנתח אותם בהשוואה התקדמה מעט. כתוצאה מכך, מערכי נתונים גדולים קיימים לעתים קרובות במעבדות ביו-רפואיות, שאינן מנותחות ביעילות או ביעילות.
עם פוטנציאל זה מידע עשיר ורב עוצמה הולך לאיבוד בתהום של מערכות אחסון. ניתוח חזותי או VA התגלה כדרך חדשה לנתח מערכי נתונים מורכבים גדולים. טכניקות VA מבוססות על הדמיות המאפשרות לאנליסטים להשתמש באינטליגנציה החזותית שלהם כדי לזהות דפוסים בנתונים כגון מגמות כלליות או חריגות.
הדמיות מהירות אלה מאפשרות היווצרות מהירה של השערות תוך כדי חקירת נתונים. הגמישות של כלי VA מאפשרת לאנליסט גם להגדיל, להסתעף ולבנות קשרים בין מערכי נתונים מרובים תוך בחינת הקשרים ביניהם. באמצעות יישום VA על מקורות נתונים משולבים, המשתמש יכול לחשוף ממצאים חדשים וחשובים.
ניתוח הורים הוא גישת VA אחת שבה מומחה לכלי VA וטכנאי המכונה גם מומחה תחום עובדים יחד שמומחה התחום שואל שאלות רלוונטיות מבחינה ביולוגית על הנתונים. לאחר מכן, מומחה כלי ה-VA יוצר הדמיות שעשויות לעזור לחשוף דפוסים שעוזרים לענות על שאלה זו או להוביל לחקירה נוספת. ניתן לחזור על תהליך זה כדי לבנות הדמיות שונות המספקות תובנות.
יצאנו לבדוק את ההתאמה של גישת VA לניתוח זוגי למערך נתונים ביו-רפואי מורכב גדול. בניסויי פיילוט ראשוניים, הערכנו כמה מכלי ה-VA הקיימים לבעיה הנוכחית. בחרנו בתוכנת Tableau by Tableau ככלי המתאים ביותר למשימה העומדת על הפרק.
קריטריוני הבחירה בניסויי פיילוט אלה התבססו על פרמטרים סובייקטיביים כגון ידידותיות למשתמש, שימושיות כוללת, כמו גם מאפיינים טכניים אובייקטיביים כגון מגוון טכניקות אינטראקציה ותכונות הדמיה. יש לנו כאן מערך נתונים בגיליון אלקטרוני של Microsoft Excel האופייני למעבדה העובדת בתחום המחלות הזיהומיות. קבוצה זו מכילה נתוני מזהה נושא על שונות ברצפי DNA גנטיים.
במקרה זה NF kappa BIA פולימורפיזמים של נוקלאוטידים בודדים או SNS לנבדק, כמו גם הריכוז הנצפה של מספר מולקולות ביולוגיות במקרה זה, ציטוקינים המיוצרים על ידי תאי חיסון של הנבדק לאחר גירוי של תאי החיסון עם גירויים ספציפיים. כעת נגלול מטה לגיליון האלקטרוני. כדי לתת לך תחושה של נפח מערך הנתונים הזה, אנו מעוניינים לברר אם יש קשר כללי בין הגנוטיפ שהוא החיתוכים השונים של, במקרה זה, הגן NF Kappa BIA, לבין תגובת הציטוקינים שנצפתה.
לאחר הגירוי, נחבר כעת את מערך הנתונים ל-Tableau, ונוודא שאנו מייבאים את טבלת ה-NF kappa BIA. אתה יכול לראות בצד שמאל ש- tableau מחובר לטבלה הנכונה והפריד אוטומטית את משתני העמודה למה ש- Tableau קורא, ממדים ומדידות. ממדים הם פשוט העמודות המסווגות את הנתונים ומודדות את הערכים הכמותיים בעמודה זו.
לצורך הדמיה זו, כעת נשרטט את רמות ריכוז הגירוי מול ריכוז תגובת הציטוקינים שנצפה. כעת אנו ממוצעים את הערכים של רמות ריכוז הציטוקינים. סדר רמות הריכוז שגוי, אבל זה די קל לנקוט בזה במהירות.
לאחר מכן נוכל להחליף את התצוגה כך שתתאים למסך ולאפשר הדמיה קלה יותר של הנתונים. מכיוון שאנו רוצים לחקור כיצד להבדיל בין הגנוטיפים השונים, כל שעלינו לעשות הוא להפיל את ממד הגנוטיפ לקטע הצבע הזה. ההדמיה נפרדת באופן אוטומטי ומיידי על סמך גנוטיפ.
כעת, אנו יכולים לנסות פורמטי תצוגה שונים. לדוגמה, גרף קו עשוי לחשוף טוב יותר דפוס שאנו רוצים ללכוד. ברור שיש הרבה אפשרויות אחרות.
הביולוגים בניתוח הזוגי הזה מציעים שנתחיל בחקירת הקשרים של הייצור של אחד מסמני הציטוקינים שנקרא QNF alpha לאחר גירוי עם מגיב שנקרא 3M oh oh two. כדי לעשות זאת, עלינו לסנן את ממד הסמן, TNF אלפא וממד הגירוי 3M oh oh two. כדי להפוך את תהליך הסינון לגמיש יותר, אנו יכולים לבחור באפשרות הצג סינון מהיר הן עבור מידות הסמן והן עבור ממדי הגירוי, ולוודא שמדובר ברשימת ערכים יחידה.
הדמיה זו מראה בבירור הבדל עם ייצור אלפא TNF לאחר רמות שונות של שלושה גירויים MO oh two מופרדים על ידי גנוטיפ בצבעים שונים, אנו יכולים לבחור כל שילוב אחר של ערכי סמן וגירוי מסנן, וההדמיה תשתנה בהתאם. בדומה לאקסל, יכולנו לבנות הדמיות שונות בכרטיסיות נפרדות. למטרות הצגה, אנו יכולים גם ליצור תצוגת סיכום של ניתוחים מרובים.
במקרה זה, חקרנו ייצור של TNF Alpha במספר נבדקים עם גנוטיפ חיתוך NF Kappa BIAS שונה. בהדגמה זו, הפקנו בהצלחה סדרה של הדמיות עוצמתיות תוך כדקה ו-30 שניות באמצעות גישת VA לניתוח זוגי. קבוצה דומה של הדמיות דורשת בדרך כלל 30 דקות לחוקר ביו-רפואי כדי ליצור ב-Excel.
דוגמה קודמת הייתה ניתוח דו-ממדי פשוט. הכוח האמיתי של VA הוא היכולת לדמיין מספר ממדים בו זמנית. לדוגמה, Tableau תומכת בניתוח בין ערכות נתונים באמצעות צירופים לוגיים של ערכי מפתח.
להלן שני גליונות אלקטרוניים הממוקמים באותה חוברת עבודה. מערך הנתונים הראשון הוא אחד מדוגמת ההדגמה הקודמת, והשני הוא מערך נתונים של תאים שנותחו בטכניקה הנקראת זרימה ציטומטרית לייצור ציטוקינים מרובים באותו תא. במקביל, מדד הנקרא poly functional degree או PFD, אתה יכול לתת שם לגיליון כך שיהיה קל יותר לזהות אותם בשלב הייבוא.
זה מאפשר ל-Tableau לחבר את שני הגיליונות האלקטרוניים. לאחר בחירת האפשרות טבלאות מרובות, תוכל להשתמש בתכונה הוסף טבלה חדשה כדי לצרף את שתי הטבלאות. תכונה זו מוסיפה את הגיליון האלקטרוני השני לראשון ומשתמשת במשפטי ההצטרפות כדי לשלב את ערכות הנתונים באמצעות מפתחות זהים כגון סוג תא, שלב רמת ריכוז וגירוי קבוצתי ומזהה נושא.
שים לב שהממדים מופרדים לפי שם הגיליון האלקטרוני. זה מאפשר לנו להשתמש בממדים שלא היו חלק מההצהרה המשותפת ההגיונית. ההגדרה לפונקציונליות פולי, למשל, היא אחוז התאים המייצרים יותר מציטוקין אחד.
לדוגמה, תא שמייצר שני ציטוקינים כ-PFD של שניים ותא שמייצר שלושה ציטוקינים כ-PFD של שלושה. כאן אנו יוצרים שדה מחושב אחד כדי לשלב ערכים אלה למדד אחד שנוכל להשתמש בו בתצוגה חזותית. עכשיו אנחנו יכולים להתחיל לבנות את ההדמיה.
ראשית, אנו משרטטים את ריכוז רמות הציטוקינים כנגד PFDs על פני שתיים, וכמו בהדגמה הקודמת לוקחים את הערך הממוצע של PFDs גדול מ-2. אנו גם מסדרים את תוויות הריכוז מנמוך לגבוה על ידי הגדרתו ידנית. מכיוון שמידע גנוטיפ זמין רק עבור חלק מהקבוצה הזו, אנחנו צריכים לסנן את שורות הנתונים שאינן מכילות מידע גנוטיפ.
בדיוק כמו קודם, אנו יכולים להפיל במהירות את הגנוטיפ לתוך תווית הצבע, מה שמאפשר לנו להבדיל גם בין כל גנוטיפ שונה. לאחר מכן נוכל להחליף את התצוגה כך שתתאים למסך ולאפשר הדמיה קלה יותר של הנתונים. אנו יכולים גם לשנות את גרף העמודות שתיים.
לדוגמה, גרף קו שבדק זאת מספק תחושה טובה כיצד תגובת CYT ותגובת PFP משתנה בהתאם לדפוסים הספציפיים לכל גנוטיפ. אתה מיד מבחין של-NF kappa b SNP עם גנוטיפ GG יש דפוס תגובה שונה בהשוואה לגנוטיפים האחרים. אנו יכולים לחקור זאת עוד יותר על ידי חקירת ההשפעה של גירויים שונים על דפוס זה.
שימו לב שלאחר הוספת LPS בממד הגירוי, שלושת הגנוטיפים העיקריים מציגים רמת PFD דומה בכל הריכוזים, אך עם 3M MO oh שני גירויים בלבד, הגנוטיפ GG מראה חדות ב-PFD מריכוז נמוך לגבוה של גירוי. ממצא זה מאפשר לנו ליצור השערה לבדיקה בניסויים עתידיים, כלומר שסוג הגירוי משפיע על PFD. בשתי ההדגמות האחרונות, ראינו את היצירה המהירה של ויזואליזציה כדי לזהות דפוסים בעלי משמעות פוטנציאלית הן בתוך מערכי נתונים והן ביניהם.
ניתן להרחיב במהירות את כוחו של ניתוח חזותי למערכי נתונים גדולים, להגדיל את ממדי הניתוח בהתאם ליישום, לשלב מידע על פני מערכי נתונים עצומים. לדוגמה, עם מאגרי הנתונים הרבים שנוצרו במחקרי עוקבה, VA היא גישה ניתנת להעברה שניתן ליישם על כל תחום עם כמות גדולה של סוגים רבים ושונים של נתונים, כולל מערכי נתונים מבוססי קטגוריות ומספריות. גישת VA מציעה שני יתרונות עיקריים.
אחד, יצירת השערות גמישות. המשתמש יכול ליצור השערות לגבי הנתונים במקום הנגזרים מהממצאים הנוכחיים, וליצור במהירות הדמיות חדשות הבוחנות את ההשערה לחיסכון כפול בזמן. השימושיות והיעילות של כלי UVA הם היתרון העיקרי שלהם על פני כלי הדמיית מידע מסורתיים.
המאמץ הכרוך בדרך כלל בגרפים בשיטות מסורתיות עשוי להימשך מספר ימי עבודה כדי להשלים את מה שהושג בקלות עם שעתיים עד שלוש בפלטפורמת VA כגון Tableau. ברור שהן וסביר להניח שיהיו פלטפורמות יישומים אחרות שלכל אחת מהן יתרונות וחסרונות ספציפיים. היתרון הנוסף הניגש למשימה זו עם ניתוח פרה מוסיף בבירור לתועלת הכוללת של גישה מבוססת VA לניתוח נתונים רב-ממדיים מורכבים.
View the full transcript and gain access to thousands of scientific videos
הסרטון הזה דן באתגרים של ניתוח מערכי נתונים אימונולוגיים גדולים ומציג אנליזה ויזואלית (VA) כפתרון. טכניקות אנליזה ויזואלית מנצלות ויזואליזציות כדי לעזור למנתחים לזהות דפוסים ומגמות בנתונים מורכבים.