Waiting
Login processing...

Trial ends in Request Full Access Tell Your Colleague About Jove
Click here for the English version

Immunology and Infection

اكسسيت: واجهة مستخدم رسومية لتبسيط تحليل البيانات الخلوي عالية ثلاثي الأبعاد

Published: January 16, 2019 doi: 10.3791/57473

Summary

اكسسيت هو أساس MATLAB واجهة المستخدم الرسومية (GUI) التي تسمح للمستخدمين لتحليل البيانات التدفق الخلوي عبر عادة تستخدم التقنيات التحليلية للبيانات عالية ثلاثي الأبعاد، بما في ذلك الحد من أبعاد عبر تي-SNE، مجموعة متنوعة من التلقائية واليدوية تجميع أساليب heatmaps وتدفق عالية ثلاثي الأبعاد رواية المؤامرات.

Abstract

مع ظهور تدفق سيتوميتيرس قادرة على قياس عدد متزايد من المعلمات، تواصل العلماء تطوير لوحات أكبر phenotypically استكشاف خصائص العينات الخلوية الخاصة بهم. بيد أن هذه التطورات التكنولوجية تسفر عن عالية ثلاثي الأبعاد مجموعات البيانات التي أصبحت متزايدة الصعوبة لتحليل موضوعي ضمن البرامج النابضة التقليدية المستندة إلى دليل. من أجل تحسين تحليل وتقديم البيانات، شريك العلماء مع بيوينفورماتيسيانس ذوي الخبرة في تحليل البيانات عالية ثلاثي الأبعاد لتحليل البيانات التدفق الخلوي. بينما أظهرت هذه الطرق تكون قيمة للغاية في دراسة التدفق الخلوي، أنها لم تدمج في مجموعة واضحة وسهلة الاستخدام للعلماء الذين يفتقرون إلى الخبرة الحاسوبية أو برمجة. ولتلبية هذه الحاجة، قمنا بتطوير اكسسيت، أساس MATLAB واجهة المستخدم الرسومية (GUI) أن يبسط تحليل البيانات الخلوي تدفق عالية ثلاثي الأبعاد بتنفيذ العاملين لحسابهم عادة التقنيات التحليلية للبيانات عالية ثلاثي الأبعاد بما في ذلك أبعاد الحد من تي-SNE، مجموعة متنوعة من أساليب التجميع الآلي واليدوي و heatmaps وتدفق عالية ثلاثي الأبعاد رواية المؤامرات. بالإضافة إلى ذلك، يوفر اكسسيت خيارات النابضة التقليدية من السكان تحديد الاهتمام لمزيد من تي-SNE وتجميع التحليل، فضلا عن القدرة على تطبيق البوابات مباشرة في مؤامرات تي-SNE. ويوفر البرنامج ميزة إضافية للعمل مع أي تعويض أو دون تعويض FCS الملفات. في حالة ما إذا التعويض بعد اكتساب مطلوب، يمكن للمستخدم اختيار لتقديم البرنامج دليل للبقع واحد ونموذج أونستينيد. البرنامج بالكشف عن الأحداث الإيجابية في جميع القنوات ويستخدم هذه البيانات حدد لحساب مصفوفة التعويض أكثر موضوعية. وباختصار، يوفر اكسسيت خط أنابيب تحليل شامل أخذ بيانات التدفق الخلوي في شكل ملفات FCS والسماح لأي فرد، بغض النظر عن التدريب الحسابي، واستخدام أحدث نهج حسابي في فهم البيانات الخاصة بهم.

Introduction

قد أتاح التقدم في التدفق الخلوي، فضلا عن ظهور الخلوي الشامل الأطباء والعلماء سرعة تحديد وتوصيف phenotypically عينات مثيرة للاهتمام من الناحية البيولوجية وسريريا مع مستويات جديدة من القرار، إنشاء كبير عالية ثلاثي الأبعاد مجموعات البيانات التي هي معلومات غنية1،2،3. بينما الطرق التقليدية لتحليل بيانات التدفق الخلوي مثل النابضة اليدوي كان أكثر وضوحاً للتجارب حيث هناك علامات قليلة وتلك العلامات السكان بصريا ملموسا، وهذا النهج يمكن أن تفشل لتوليد النتائج استنساخه عند تحليل مجموعات البيانات أعلى ثلاثي الأبعاد أو تلك مع علامات تلطيخ على طائفة. على سبيل المثال، في دراسة متعددة المؤسسات، حيثما كان ذلك داخل الخلوية تلطيخ (ICS) فحوصات يجري أجريت لتقييم إمكانية تكرار نتائج من كوانتيتاتينج الردود محددة مستضد T الخلية، على الرغم من دقة المختبرات الجيدة، والتحليل، لا سيما وعرض النابضة، مصدرا هاما لتقلب4. وعلاوة على ذلك، عملية يدوياً النابضة سكان مصالح، إلى جانب كونها ذاتية جداً مكثفة تستغرق وقتاً طويلاً للغاية وحزب العمل. ومع ذلك، مشكلة تحليل مجموعات البيانات عالية ثلاثي الأبعاد بطريقة قوية وفعالة وفي الوقت المناسب ليس واحدة جديدة لبحوث العلوم. غالباً ما تولد دراسات التعبير الجيني الغاية السامية الأبعاد مجموعات البيانات (غالباً ما يقارب مئات جينات) التي يكون فيها أشكال التحليل اليدوي ببساطة غير مجدية. من أجل التصدي لتحليل مجموعات البيانات هذه، كان هناك الكثير من العمل في وضع بيوينفورماتيك أدوات لتحليل البيانات التعبير الجيني5. هذه نهج حسابي فقط مؤخرا اعتمدت في تحليل البيانات الخلوي كما زاد عدد المعلمات وأثبتت أنها لا تقدر بثمن في تحليل هذه مجموعات بيانات الأبعاد عالية6،7.

وعلى الرغم من استحداث وتطبيق مجموعة متنوعة من خوارزميات وحزم البرمجيات التي تسمح للعلماء تطبيق هذه النهج bioinformatic عالية ثلاثي الأبعاد للبيانات التدفق الخلوي، لا تزال هذه التقنيات التحليلية غير المستخدمة إلى حد كبير. بينما قد يكون هناك مجموعة متنوعة من العوامل التي حدت من اعتماد هذه النهج لقياس البيانات8على نطاق واسع، عائقا رئيسيا أننا نشتبه في استخدام هذه النهج من العلماء، وهو الافتقار إلى المعرفة الحسابية. في الواقع، العديد من حزم البرامج هذه (أي، فلووكوري، فلووميانس، وأوبينسيتو) مكتوبة التي ستنفذ في البرمجة لغات مثل البحث والتطوير التي لا تزال تتطلب معرفة البرمجة الفنية. حزم برامج مثل فلوجو قد وجدت لصالح بين العلماء بسبب البساطة في الاستخدام وطبيعة 'n-التوصيل'، فضلا عن التوافق مع نظام تشغيل جهاز الكمبيوتر. وبغية توفير مجموعة متنوعة التقنيات التحليلية المقبولة وقيما لبرمجة عالم غير مألوف، قمنا بتطوير اكسسيت، واجهة المستخدم الرسومية (GUI) التي يمكن تثبيتها بسهولة على جهاز كمبيوتر/ماك أن تسحب العديد من أحدث التقنيات بما في ذلك الحد من أبعاد للتصور بديهية، ومجموعة متنوعة من أساليب التجميع المشار إليها في الأدب، جنبا إلى جنب مع ميزات جديدة لاستكشاف الإخراج من هذه تجميع الخوارزميات مع قطع تدفق عالية ثلاثي الأبعاد/مربع heatmaps والرواية.

اكسسيت واجهة مستخدم رسومية التي بنيت في MATLAB وذلك يمكن أما تشغيل داخل MATLAB مباشرة أو مثبت المقدمة التي يمكن استخدامها لتثبيت البرنامج على أي جهاز كمبيوتر/ماك. البرنامج غير متوفر في https://github.com/sidhomj/ExCYT. نقدم بروتوكول مفصل لكيفية استيراد البيانات، قبل العملية، وإجراء الحد من أبعاد تي-SNE، كتلة البيانات، فرز وتصفية مجموعات استناداً إلى تفضيلات المستخدم، وعرض معلومات حول مجموعات المصالح عبر heatmaps ورواية قطع تدفق عالية ثلاثي الأبعاد/مربع (رقم 1). المحاور في مؤامرات تي-SNE التعسفي وفي وحدات التعسفي والصفة كما هو موضح ليس دائماً في الأرقام المتعلقة ببساطة للمستخدم واجهة. تلوين نقاط البيانات في "Heatmaps تي-SNE" من الأزرق إلى الأصفر استناداً إلى إشارة العلامة المشار إليها. في تجميع الحلول، يستند لون نقطة البيانات التعسفي في عدد الكتلة. يمكن أن تنفذ جميع أجزاء من سير العمل في لوحة واحدة واجهة المستخدم الرسومية (الشكل 2 & 1 الجدول). وأخيراً، سوف نظهر باستخدام اكسسيت على البيانات المنشورة سابقا استكشاف المناظر الطبيعية محصنة من سرطان الخلايا الكلوية في الأدب، حلل أيضا مع أساليب مماثلة. يمكن الاطلاع على dataset عينة أننا المستخدمة لإنشاء الأرقام في هذه المخطوطة إلى جانب البروتوكول أدناه في https://premium.cytobank.org/cytobank/projects/875، عند تسجيل حساب.

Subscription Required. Please recommend JoVE to your librarian.

Protocol

1-جمع وإعداد البيانات الخلوي

  1. وضع جميع البقع واحدة في مجلد بأنفسهم وتسمية باسم القناة (فلوروفوري، لا علامة).

2. بيانات استيراد ومعالجة مسبقة

  1. للإيقاف المؤقت أو حفظ في جميع أنحاء هذا الأنبوب التحليل، استخدم الزر حفظ مساحة العمل في أسفل يسار البرنامج لحفظ مساحة العمل '. حصيرة ' ملف يمكن تحميله في وقت لاحق عن طريق زر تحميل مساحة العمل . عدم تشغيل أكثر من مثيل واحد من البرنامج في وقت واحد. لذلك، عند تحميل مساحة عمل جديدة، تأكد من تحقق من وجود لا مثيل آخر من اكسسيت قيد التشغيل.
  2. للبدء بتحليل خطوط الأنابيب، حدد أولاً نوع الخلوي (التدفق الخلوي أو كتلة الخلوي – سيتوف)، ظل عدد الأحداث عينة من الملف (لاستخدام هذا المثال 2,000) تحديد معايير اختيار ملف . بمجرد استيراد البيانات بنجاح، سوف يطفو مربع حوار إعلام المستخدم أن البيانات قد تم استيرادها بنجاح.
  3. اضغط على زر التعويض التلقائي لإجراء خطوة تعويض تلقائي اختياري، كما فعل باجويل & آدمز9. حدد الدليل الذي يحتوي على بقع واحدة. حدد عينة أونستينيد ضمن حوار واجهة المستخدم.
    1. وضع بوابة للأمام/الجانب-مبعثر في أي من العينات في هذا الدليل الذي سيتم استخدامه لتحديد الأحداث لحساب مصفوفة التعويض. يوصي باستخدام نموذج أونستاينيد لهذا الغرض. عند هذه النقطة، تم تنفيذ خوارزمية تحديد عتبات متسقة المئويال 99 من عينة أونستينيد لتعريف الأحداث الإيجابية في كل من البقع واحدة لحساب مصفوفة التعويض. عند الانتهاء من هذا، مربع حوار سيتم إعلام المستخدم أن التعويض الذي تم أداؤه.
  4. المقبل، اضغط سكان بوابة وحدد السكان في خلايا اهتمام، كما الاتفاقية في التدفق الخلوي التحليلات. عندما يتم تحديد سكان خلايا، أدخل عدد من النسبة المئوية لتحليل أحداث المصب (في هذه الأحداث 10,000).
  5. بعد ذلك، حدد عدد القنوات لاستخدامها لتحليل في مربع القائمة الموجود في أقصى اليمين من المربع ما قبل المعالجة (استخدام قنوات محددة هو موضح في المثال).

3. تحليل تي-SNE

  1. اضغط على زر تي-SNE ليكون البرنامج ابدأ ابدأ لحساب مجموعة البيانات أبعاد مخفضة للتصور في الإطار أدناه الزر SNE تي. لحفظ الصورة من تي-SNE، اضغط حفظ صورة تسن. على جهاز مع 8 @ 3.4 غيغاهرتز وجنرال موتورز 8 ذاكرة الوصول العشوائي هذه الخطوة ينبغي أن تأخذ حوالي 2 دقيقة لإحداث 10,000، 10 دقائق لإحداث 50,000، و 20 دقيقة عن أحداث 100,000 وحدة المعالجة المركزية.
  2. لإنشاء heatmap SNE 'ر'، كما رأينا في عدة سيتوف منشورات10،11، حدد خياراً من القائمة المنبثقة الخاصة بعلامة t-SNE (استخدام علامات محددة CD64 أو CD3 كما هو موضح في المثال). هذا رقم سوف يطفو على عرض تمثيل heatmap تي-SNE قطعة الأرض التي يمكن حفظها لتوليد الشكل.
  3. حدد مجالات الاهتمام في قطع تي-SNE المستخدم لمزيد من التحليلات المتلقين للمعلومات باستخدام زر البوابة تي-SNE .

4. تحليل المجموعة

  1. للبدء في تجميع التحليل، حدد خياراً في listbox أسلوب التجميع (في هذا المثال لنا دبسكان مع عامل مسافة 5 في الحوار المربع إلى يمين مربع القائمة). اضغط على الزر المجموعة .
  2. استخدم أحد الخيارات التالية خوارزميات التجميع الآلي الموجودة في لوحة '"المعلمات التجميع الآلي"':
    1. كميانس الثابت (في تي-SNE): تطبيق كوسائل تجميع البيانات انخفاض تي-SNE 2-الأبعاد وتتطلب عدد الكتل التي ستقدم إلى خوارزمية12.
    2. كمينس الثابت (بشأن بيانات عالية الدقة): تطبيق كوسائل تجميع للبيانات عالية ثلاثي الأبعاد الأصلية التي أعطيت إلى خوارزمية SNE تي. مرة أخرى، يحتاج عدد الكتل التي ستقدم إلى الخوارزمية.
    3. دبسكان: تطبيق أسلوب التجميع لتجميع، دعا القائم على كثافة التجميع المكاني للتطبيقات مع الضوضاء13 أن مجموعات البيانات انخفاض تي-SNE 2-الأبعاد ويتطلب عامل مسافة غير الأبعاد التي تحدد الحجم العام مجموعات. هذا النوع من خوارزمية التجميع مناسبة تماما للكتلة الحد t SNE كما أنها قادرة على التجمعات غير كروي التي غالباً ما تكون موجودة في تمثيل مخفض تي-SNE. بالإضافة إلى ذلك، يرجع ذلك إلى حقيقة أن تعمل على البيانات ثنائي الأبعاد، أنها واحدة من خوارزميات التجميع أسرع.
    4. التجميع الهرمي: تطبيق طريقة المجموعات الهرمية التقليدية للبيانات عالية ثلاثي الأبعاد حيث يتم حساب المصفوفة مسافة إقليدية كامل بين جميع الأحداث قبل توفير الخوارزمية عامل مسافة التي يقوم بتعيين حجم الكتلة.
    5. شبكة الرسم البياني- على أساس: تطبيق أسلوب تجميع التي أدخلت في الآونة الأخيرة إلى تحليل بيانات التدفق الخلوي عندما يكون هناك الفئات السكانية الفرعية النادرة التي يريد المستخدم للكشف عن11،14. ويعتمد هذا الأسلوب على الأولى إنشاء رسم بياني يحدد الصلات القائمة بين جميع الأحداث في البيانات. تتكون هذه الخطوة توفير معلمة أولى لإنشاء الرسم البياني، وهو عدد ك أقرب الجيران. ويحكم هذه المعلمة عموما حجم المجموعات. عند هذه النقطة، ينبثق مربع حوار آخر يطلب من المستخدم باستخدام واحدة من 5 مجموعات الخوارزميات التي يتم تطبيقها على الرسم البياني. وتشمل هذه الخيارات 3 إلى أقصى حد نمطية الرسم البياني وطريقة دانون طيفية تجميع خوارزمية14،15،16،،من1718. إذا كان أحد يريد حل عموما أسرع المجموعات، نوصي بتجميع الطيفية أو تعظيم نمطية الجشع سريعة. بينما أساليب "تعظيم نمطية" جنبا إلى جنب مع أسلوب دانون تحديد العدد الأمثل للمجموعات، "المجموعات الطيفية" يتطلب عدد الكتل للبرنامج.
    6. تنظيم ذاتي الخريطة: وتستخدم شبكة العصبية اصطناعية لكتلة البيانات عالية ثلاثي الأبعاد.
    7. بروموشن-"تعظيم التوقعات": إنشاء "نموذج الخليط الضبابي" باستخدام تقنية توقع تعظيم (م) إلى الكتلة البيانات عالية ثلاثي الأبعاد. 19 يتطلب هذا النوع من أسلوب التجميع أيضا للمستخدم بإدخال عدد الكتل.
    8. الاستدلال بايزي التغييري بروموشن: إنشاء "نموذج خليط ضبابي" ولكن خلافا لطب الطوارئ، فإنه تلقائياً تحديد عدد ك مكونات المخلوط20 حين يتطلب البرنامج عدد من المجموعات إيلاء (أكبر من عدد المجموعات المتوقع)، الخوارزمية تحديد العدد الأمثل بمفردها.
  3. دراسة منطقة معينة من الأرض تي-SNE، اضغط على زر تحديد الكتلة يدوياً رسم مجموعة من المجموعات المعرفة من قبل المستخدم. من المذكرة، لا يمكن مشاركة مجموعات الأعضاء (أي، كل حدث يمكن أن تنتمي فقط إلى المجموعة 1).

5-الكتلة الترشيح

  1. التفاخر المجموعات المحددة أما يدوياً أو عن طريق أحد الأساليب الآلية المذكورة أعلاه يمكن أن تكون التصفية عن طريق ما يلي.
    1. لفرز مجموعات (في لوحة كتلة عامل التصفية ) أي من علامات قياس في التجربة، حدد خياراً من القائمة المنبثقة الفرز . لتعيين ما إذا كان الترتيب تصاعدي أو تنازلي، اضغط على زر تصاعدي/تنازلي الحق في فرز القائمة المنبثقة. وهذا تحديث قائمة المجموعات في listbox 'مجموعات (ترشيح)' وإعادة ترتيبها بترتيب تنازلي للكتلة الوسطية في التعبير عن تلك العلامة. النسبة المئوية تتم الإشارة إليها في listbox 'مجموعات (ترشيح)' يشير إلى النسبة المئوية من السكان أن هذه المجموعة تمثل.
    2. لتعيين قيمة حد أدنى لمجموعة معينة عبر قناة معينة، حدد خياراً من القائمة المنبثقة عتبة (في هذا المثال لنا بعلامة CD65 ومجموعة عتبة في 0.75). اكتب قيمة في المربع العددي الموجود أسفل الرسم البياني أو استخدم شريط الانزلاق لتعيين عتبة. بمجرد تعيين عتبة، اضغط على إضافة أعلاه العتبة أو إضافة عتبة أدناه لتحديد اتجاه عتبة. بمجرد تم تعيين هذا الحد الأدنى، سيتم سرد في المربع العتبات بجوار لوحة '"كتلة عامل التصفية"' حيث العلامة وقيمة العتبة، والاتجاه سيتم سرد ذلك المستخدم علم بالعتبات التي يجري تطبيقها. أخيرا، سيتم تحديث المؤامرة تي-SNE بطمس خارج الكتل التي لا تفي بمتطلبات الترشيح وسيتم تحديث مربع القائمة 'مجموعات (ترشيح)' لإظهار الكتل التي تفي بمتطلبات الترشيح.
    3. لتعيين حد أدنى لتردد كتلة، أدخل وقف عددية في الكتلة تردد العتبة (%) مربع في لوحة "كتلة عامل التصفية" (في هذا المثال استخدام 1%).

6-الكتلة التحليل والتصور

  1. لتحديد مجموعات للمزيد من التحليل والتصور، حدد مجموعات في listbox مجموعات (الترشيح) واضغط الزر à حدد لنقلها إلى listbox تحليل الكتلة .
  2. لإنشاء heatmaps المجموعات، حدد مجموعات المصالح في listbox تحليل الكتلة واضغط على زر HeatMap من المجموعات . عند الضغط على هذا الزر، يطفو شكل الذي يحتوي على مخطط حرارة جنبا إلى جنب مع ديندروجرامس على محاور الكتلة والمعلمة. ديندروجرام على المحور الرأسي سوف تجميع مجموعات من تلك التي ترتبط ارتباطاً وثيقا مع ديندروجرام على الخط الأفقي المحور سوف مجموعة العلامات التي ترتبط المشترك. لحفظ heatmap، اضغط الملف | تصدير الإعداد | تصدير-
  3. لإنشاء 'عالية الأبعاد مربع مؤامرة' أو 'عالية الأبعاد تتدفق الأرض'، حدد مجموعات المصالح في listbox تحليل الكتلة واضغط أما ارتفاع ارسم مربع الأبعاد أو الزر عالية الأبعاد تتدفق الأرض . يمكن استخدام هذه المؤامرات لتقييم التوزيع بصريا نظراً للقنوات من مختلف المجموعات عبر جميع الأبعاد.
  4. لإظهار مجموعات في قطع تدفق 2D التقليدية، حدد التحويل (الخطي، log10، أركسينه) والقناة في لوحة رسم تدفق التقليدية والصحافة "مؤامرة التدفق التقليدي"-

Subscription Required. Please recommend JoVE to your librarian.

Representative Results

من أجل اختبار قابليتها للاستخدام اكسسيت، قمنا بتحليل مجموعة بيانات المنسق نشرتها تشيفرير et al. ، تحت عنوان '"مأمن أطلس من واضحة خلية سرطان الكلي"' حيث أجرى الفريق تحليل سيتوف مع فريق حصانة واسعة النطاق بشأن الورم العينات المأخوذة من 73 11من المرضى. فريقين منفصلين، لوحة النقوي واللمفاوية، استخدمت لوصف فينوتيبيكالي وورم المكروية. وكان هدف دراستنا تلخيص نتائج بهم تي-SNE والمجموعة تحليل، يبين أن اكسسيت يمكن أن تستخدم للتوصل إلى نفس النتائج، فضلا عن إظهار أساليب إضافية للتحليل والتصور والكتلة.

في المخطوطة الأصلية، وصف الفريق 17 خلية الكتل التي حددها الفريق النقوي ومجموعات الخلايا T 22 التي حددها الفريق اللمفاوية. في الشكل 3 و 4 الرقم المنشور، يظهر المجموعة heatmaps الكتل، تي-SNE المؤامرات مع حلول التجميع المرمزة باللون، و heatmaps SNE تي في سوببانيلس ألف، باء، وجيم بغية إجراء التحليل، الحصول على البيانات يدوياً مسور من سيتوبانك وأخذ عينات من كل ملف أحداث 2,000 أو أخذ الملف بأكمله إذا كان أقل من 2,000 الأحداث، بعد تحليل خط الأنابيب يتضح في المخطوطة الأصلية. عند هذه النقطة، نحن عينات مجموعة أحداث 100,000 عبر لدينا معلمة subsampling النابضة بعد، أجرى تحليل t-SNE، واستخدام مجموعة متنوعة من أساليب التجميع لاستكشاف البيانات بطرق مختلفة.

أولاً، قمنا بفحص لوحة النقوي باتباع خط الأنابيب التحليل نفسه كالمخطوط الأصلي باستكمال تحليل t-SNE وإنشاء heatmaps علامات مختلفة (الشكل 3A). اكسسيت بينما المخطوط الأصلي تطبيع heatmaps تي-SNE إلى المئينال 99 لكل علامة، لا تفعل هذا النوع من التطبيع لما heatmaps. ومع ذلك، لوحظت توزيعات مماثلة للمشارك التعبير العلامة كما هو موضح في المخطوطة الأصلية. ثم قمنا بتطبيق أسلوب المستندة إلى "شبكة الرسم البياني" لتجميع البيانات بإنشاء الرسم البياني مع 100 ك أقرب الجيران وتجميع الرسم البياني عن طريق الاستفادة المثلى من نمطية الرسم البياني باستخدام التنفيذ السريع الجشع داخل اكسسيت، حيث وجدنا 19 الفرعية من سكان خلايا (الشكل 3B). عند مقارنة heatmap من هذه المجموعات التي تم إنشاؤها بواسطة اكسسيت مع heatmap نشر في المخطوطة الأصلية، لاحظنا أن كنا قادرين على تحديد مجموعات مماثلة من الخلايا النقوي (الشكل 3). من المذكرة، حددت المخطوط الأصلي ويتناقض السكان الفرعية اثنين النقوي الخلايا التي حددناها في تحليلنا حدده الدكتور هلاintintCD68 CD64intCD36+CD11b+ (الفئة 13) وهلا-الدكتور+ CD4+CD68+CD64+CD36 CD11b (المجموعة 18). وكشف التصور بالأرض مربع عالية ثلاثي الأبعاد لهؤلاء السكان هما فروق معتد بها إحصائيا (مان-ويتني) في علامات الستة المذكورة (الشكل 1).

وبعد ذلك، قمنا بتحليل الفريق اللمفاوية مع نهج المجموعات التقليدية أكثر وأسرع من التسلسل الهرمي. هذا النهج حقق توزيعات علامة مماثلة عن طريق تي-SNE heatmaps (الشكل 4 أ). وعلاوة على ذلك، تجميع (الشكل 4 باء)، أظهر تجميع البيانات عن طريق التسلسل الهرمي مجموعات مماثلة من الخلايا اللمفاوية (الشكل 4). من المذكرة، حددنا أيضا السكان الخلايا T التنظيمية الفريدة من المخطوطة الأصلية ويعرف CD4+CD25+Foxp3+كتلاً-4+CD127 (الفئة 17) عبر أرضنا تدفق عالية ثلاثي الأبعاد (الشكل 4).

وأخيراً، أردنا أن تستخدم أسلوب داخل اكسسيت بسرعة كما وكيفا تقييم الجمعيات المشارك بين علامات. وبدأنا باستخدام خوارزمية تجميع الثابت k-وسائل إرساء 5,000 مجموعات البيانات SNE t ثنائي الأبعاد (4E الشكل). ثم استخدمنا التعبير الوسيط لجميع العلامات لجميع هذه المجموعات لإنشاء heatmap من هذه المجموعات (4F الشكل). منذ heatmaps هذه المجموعة الصفوف، فضلا عن أعمدة متشابهة، هذا الأسلوب لتلخيص البيانات من تطبيق غرامة شبكة من المجموعات ومن ثم خلق heatmap يسمح لنا بالتقاط الجمعيات المشارك بسهولة، مثل الرابطة المشارك تيم-3، PD-1، CD38، و 4-1BB.

Figure 1
رقم 1: خط أنابيب اكسسيت والميزات. (أ) اكسسيت ويبدأ باستيراد البيانات الخام FCS وتطبيق التعويض الاختياري والنابضة والاختزال العشوائي قبل تحليل المتلقين للمعلومات. وهذا ما يضمن كافة الأحداث ويجري تحليل ذات صلة بالتجربة يجري تحليلها. ثم يتم تنفيذ الحد من أبعاد تي-SNE لتصور كل الأحداث، ويمكن أن تتولد heatmaps تي-SNE لتصور توزيعات المظهرية. أخيرا، يمكن تطبيق مجموعة متنوعة من خوارزميات التجميع على التحول تي-SNE أو البيانات الخام عالية ثلاثي الأبعاد. (ب) رواية ميزات الفرز والعتبة تسمح للمستخدمين بفرز بسرعة عن طريق ربما مئات مجموعات للعثور على تلك التي تهم. (ج) يمكن إنشاء Heatmaps مجموعات لدراسة كيف عدة كتل مقارنة مع بعضها البعض فضلا عن علامات التي شاركت المنتسبين. (د) يمكن أن تتولد قطع تدفق عالية ثلاثي الأبعاد رواية/مربع كما شكلاً من أشكال العودة النابضة مجموعات البيانات الأصلية بينما يقدر طبيعة عالية ثلاثي الأبعاد للبيانات. الرجاء انقر هنا لمشاهدة نسخة أكبر من هذا الرقم-

Figure 2
رقم 2: واجهة المستخدم الرسومية اكسسيت: اكسسيت واجهة المستخدم الرسومية يسمح تبسيط العمل تدفق العمل من اليسار إلى اليمين للوحة حسب المستخدم باستيراد البيانات الخاصة بهم، يجري تخفيض أبعاد تي-SNE والتكتيل، وتحليل مجموعة نهائية والتصور. الرجاء انقر هنا لمشاهدة نسخة أكبر من هذا الرقم-

Figure 3
الشكل 3: خلاصة النقوي السكان الفرعية من تشيفرير et al. (أ) الرمز المميز تي-SNE heatmaps ارسم لوحة النقوي (ب) تي-SNE لون الفريق النقوي مشفرة بواسطة خوارزمية الرسم البياني شبكة تجميع Heatmap (ج) للمجموعات المحددة بتجميع الحل على لوحة النقوي النسبية (د) عالية ارسم مربع الأبعاد مقارنة المتناقضة النقوي الفئات السكانية الفرعية (مجموعات 13 و 18) المشار إليه في المخطوط الأصلي الرجاء انقر هنا لمشاهدة نسخة أكبر من هذا الرقم-

Figure 4
الشكل 4: خلاصة اللمفاوية السكان الفرعية من تشيفرير et al. (أ) رمز تي-SNE heatmaps ارسم لوحة اللمفاوية تي-SNE (ب) للون الفريق اللمفاوية مشفرة بواسطة خوارزمية التجميع الهرمي Heatmap (ج) للمجموعات المحددة بتجميع الحل على لوحة اللمفاوية (د) عالية التدفق الأبعاد مؤامرة سكان خلية T التنظيمية المحددة (المجموعة 17) في المخطوط الأصلي (ه) تجميع الحل الثابت 5,000 المجموعة كوسائل تحليل البيانات تي-SNE Heatmap (و) المجموعات التي حددتها كوسائل حل المجموعات اللمفاوية لوحة عرض العلامة المشارك الجمعيات. الرجاء انقر هنا لمشاهدة نسخة أكبر من هذا الرقم-

لا. الوصف اسم (في واجهة المستخدم الرسومية)
1 حدد نوع الخلوي نا
2 الاختزال عشوائية من البيانات الخام نا
3 حدد ملفات لتحليل حدد الملف (الملفات)
4 التعويض التلقائي للبيانات الأولية استناداً إلى دليل واحد البقع المقدمة إلى البرامج التعويض عن السيارات
5 النابضة لتحديد أحداث تي-SNE وتحليل المجموعات بوابة السكان
6 الاختزال العشوائي لبوابات بيانات (عدد مطلق) نا
7 الاختزال العشوائي لبوابات البيانات (% من السكان المبوب) نا
8 تحديد قنوات للتحليل نا
9 تشغيل الحد من أبعاد تي-SNE تي-SNE
10 نافذة تي-SNE نا
11 حفظ مساحة العمل حفظ مساحة العمل
12 تحميل مساحة العمل تحميل مساحة العمل
13 إنشاء heatmap تي-SNE على علامة تحديد نا
14 بوابة تي-SNE إلى إعادة القيام بتحليل t-SNE لتحديد السكان بوابة تي-SNE
15 حفظ SNE تي نافذة كالصورة حفظ الصورة تسن
16 حدد خوارزمية التجميع أسلوب التجميع
17 أدخل "المعلمة التكتل" لإعطاء خوارزمية نا
18 تحليل الكتلة الكتلة
19 رسم المجموعات يدوياً حدد المجموعة يدوياً
20 مسح "كافة المجموعات" إلى إعادة تحليل الكتلة مجموعات واضحة
21 إظهار مجموعات تحت شروط عامل التصفية الحالي مجموعات (ترشيح)
22 إزالة مجموعات مختارة من "تحليل الكتلة" listbox إزالة <-
23 إضافة مجموعة إلى "تحليل الكتلة" listbox --> حدد
24 إنشاء heatmap التقليدية لكافة الأحداث في التحليل HeatMap أحداث
25 حدد مجموعات الفرز حسب العلامة الفرز
26 تعيين العتبة بتحديد علامة عتبة
27 إنشاء heatmap التقليدية لمجموعات مختارة من "تحليل الكتلة" listbox HeatMap كتل
28 عكس ترتيب الفرز تصاعدي/تنازلي
29 مسح جميع العتبات مسح جميع العتبات
30 عتبة التردد تعيين الكتل المجموعة تردد العتبة (%)
31 قائمة عتبات الحالية النشطة في listbox 'مجموعات (ترشيح)' عتبات
32 ارسم مربع الأبعاد عالية ارسم مربع الأبعاد عالية
33 ارسم ارتفاع تدفق الأبعاد ارسم ارتفاع تدفق الأبعاد
34 المعلمة المحور الأفقي للأرض تدفق التقليدية نا
35 المعلمة المحور الرأسي للأرض تدفق التقليدية نا
36 تحويل البيانات لمؤامرة التدفق التقليدي على المحور الأفقي نا
37 تحويل البيانات لمؤامرة التدفق التقليدي على المحور الرأسي نا
38 إنشاء تدفق التقليدية الأرض ارسم تدفق التقليدية
39 إظهار مجموعات للتحليل نا

الجدول 1: نظرة عامة على جميع الوظائف الموجودة في اكسسيت واجهة المستخدم الرسومية

اسم حزمة البرامج/ اكسسيت سيت Express السفح فلووكوري أوبينسيتو فلووميانس
نوع البرنامج Matlab Matlab تطبيق مستقل R R R
السعر للمستخدم مجاناً مجاناً 1,000 دولار مجاناً مجاناً مجاناً
واجهة المستخدم الرسومية نعم نعم نعم لا لا لا
تقنيات الحد من أبعاد تي-SNE t-SNE، محكمة التحكيم الدائمة مجرفة تي-SNE، محكمة التحكيم الدائمة، لا شيء لا شيء لا شيء
خوارزميات التجميع كالوسائل
دبسكان
تجميع التسلسل الهرمي
خريطة التنظيم الذاتي
رسم شبكة متعددة على أساس أساليب
بروموشن-م
بروموشن-التغييري بايزي الاستدلال
كالوسائل
بروموشن-م
رسم شبكة واحدة على أساس أسلوب (فينوجراف)
كالوسائل لا شيء أتمتة سير العمل النابضة اليدوي كالوسائل
القدرة على فرز/تصفية المجموعات نعم لا لا لا لا لا
قطع تدفق الأبعاد عالية نعم لا لا لا لا لا

الجدول 2: نظرة عامة على تدفق ساعدت برامج التحليل الخلوي الحلول

Subscription Required. Please recommend JoVE to your librarian.

Discussion

نقدم هنا اكسسيت، واجهة مستخدم رسومية رواية تشغيل خوارزميات MATLAB المستندة إلى تبسيط تحليل البيانات الخلوي عالية ثلاثي الأبعاد، والسماح للأفراد بأي خلفية في البرمجة لتنفيذ الأحدث بيانات عالية ثلاثي الأبعاد تحليل الخوارزميات. توفر هذه البرامج للمجتمع العلمي الأوسع نطاقا سيسمح العلماء لاستكشاف البيانات التدفق الخلوي في سير العمل بديهية وواضحة. من خلال إجراء تخفيض أبعاد t SNE، وتطبيق أسلوب تجميع، القدرة على فرز/تصفية من خلال هذه المجموعات بسرعة، وجعل heatmaps مرنة وقابلة للتخصيص وقطع تدفق عالية ثلاثي الأبعاد/مربع، والعلماء سوف تكون قادرة ليس فقط أفهم الفئات السكانية الفرعية محددة بشكل فريد في العينات الخاصة بهم ولكن سوف تكون قادرة على خلق تصورات بديهية وفهمها بسهولة من قبل زملائهم.

في حين أن البرنامج يتسم بالمرونة في التعامل مع مجموعة متنوعة من أنواع البيانات (التقليدية التدفق الخلوي مقابل أسلحة الخلوي)، هناك بعض الاعتبارات للأداة المثلى للبرنامج. وأول هذه فيما يتعلق بنوعية البيانات، على وجه التحديد لبيانات التدفق الخلوي. التعويض المناسب والقرار من تداخل الأطياف الانبعاثات من الأهمية بمكان. يمكن أن يؤدي تعويض ضعف البيانات عن غير قصد إلى الجمعيات المشارك كاذبة من علامات وتشكيل التكتلات التي ليست ذات الأهمية البيولوجية الحقيقية. ولذلك، من المستحسن جداً أن يتم إدخال البيانات من جودة الصوت قبل الشروع في تحليل t-SNE وكذلك تحليل المتلقين للمعلومات. وعلاوة على ذلك، يتطلب استخدام خوارزمية التعويض التلقائي نفذت في اكسسيت البقع واحدة واضحة لكل القنوات من أجل حساب دقة معايير التعويض.

ثمة اعتبار هام آخر للاستخدام من اكسسيت عندما concatenating FCS ملفات متعددة إلى تحليل واحد (كما هو موضح في هذه المخطوطة)، يجب أن تكون قابلة للمقارنة عبر كل القنوات. أولاً، وهذا يعني أن الفريق نفسه يحتاج إلى أن تستخدم في جميع العينات ، و أن هناك لا الانجراف بين العينات عبر جميع القنوات. على سبيل المثال، إذا كان للمرء أن يقرأ عينتين في أيام منفصلة وتم تعيين CD8 الملون في فيتك في أيام لكن الجهد سيتوميتير بشكل مختلف في يوم واحد أسفرت عن عدد سكان CD8 المزاحة قليلاً، واحدة يمكن أن تولد مجموعات كاذبة في تحليل المتلقين للمعلومات ، كما تم إنشاء هذا التحول كدالة لتباين الصك وليس بسبب الأهمية البيولوجية. بينما قد تكون الإصدارات المستقبلية من اكسسيت قادرة على تطبيع عينات لتلك البقع واحد، عند هذه النقطة، دراسة متأنية يجب بذل أن ملفات FCS يمكن مقارنتها ببعضها البعض قبل استيرادها إلى اكسسيت.

وأخيراً، عملية تجميع ليس هو مطلق/جامدة. خوارزميات التجميع مختلفة ومعلمات يمكن أن تولد الحلول المجموعات المختلفة. ما إذا كان الحل الخوارزمية المناسبة للمستخدم لتحديد بتوليف فهمهم لعلم الأحياء مع الحل التجميع. على سبيل المثال، عندما فهم البيئة المناعي للأورام، واحدة قد تكون مهتمة في مجموعات العيانية (أي تي الخلايا مقابل ب الخلايا مقابل النقوي الخلايا) بينما أخرى قد تكون مهتمة في الفئات السكانية الفرعية مجموعات العيانية. القرار المجموعات يحدده المستخدم، وبالتالي، لا يوجد واحد تجميع الحل 'صحيح'. وهذا أحد المزايا الرئيسية لاستخدام قطع تدفق الأبعاد العالية المتوفرة في اكسسيت. القدرة على تصور توزيع مجموعة معينة عبر جميع القنوات يمكن أن تساعد المستخدم تحديد ما إذا كان قد تجمع في ليس فقط الناحية البيولوجية ذات الصلة الطريقة ولكن بطريقة تكون ذات صلة بالسؤال العلمي في التجربة. في حين يتمثل هدفنا في توفير مجموعة كبيرة أساليب المستخدمة في الأدب لكتلة بيانات الخلوي تدفق عالية ثلاثي الأبعاد مع توفير أساليب إضافية للتكتل، نوصي باستخدام أساليب مثل وسائل k ودبسكان لاستكشاف البيانات عبر بسرعة التكرار في عدد الكتلة والحجم والتحرك نحو الشبكة--الرسم البياني والنهج نموذج مختلط الضبابي لاتباع نهج أكثر قوة ولكن أكثر استهلاكاً للوقت.

ونظرا لهذه الاعتبارات، اكسسيت لا تزال أداة مرنة والقيمة العالية لاستكشاف البيانات الخلوي الأبعاد عالية، ويوفر ميزات فريدة من نوعها أو التفريق من الحزم المتوفرة الأخرى المتاحة لإجراء هذا النوع من التحليل (الجدول 2) . أولاً، اكسسيت يميز نفسه على مدى معظم التدفق الخلوي تحليل النهج الاستفادة من الحد من أبعاد وتجميع الخوارزميات بقدرتها على استخدامها من دون أي معرفة البرمجة البرمجة. بالإضافة إلى ذلك، بتجميع العديد من خوارزميات التجميع المشار إليها في جميع أنحاء الأدب، نعتقد أننا توفير معظم الخيارات لتجميع البيانات. وأخيراً، لدينا ميزة فريدة من نوعها للترشيح الكتلة والفرز إلى جانب العرض عن طريق قطع تدفق الأبعاد عالية الرواية، يسمح للمستخدمين لاستكشاف خصائص تلك المجموعات بسرعة وكفاءة، مما يجعل عملية 'اكتشاف' نادرة الفئات السكانية الفرعية بسيطة وفعالة.

Subscription Required. Please recommend JoVE to your librarian.

Disclosures

الكتاب ليس لها علاقة بالكشف عن.

Acknowledgments

المؤلفين قد لا شكر وتقدير.

Materials

Name Company Catalog Number Comments
Desktop SuperMicro Custom Build Computer used to run analysis
MATLAB Mathworks N/A Software used to develop ExCYT

DOWNLOAD MATERIALS LIST

References

  1. Benoist, C., Hacohen, N. Flow cytometry, amped up. Science. 332 (6030), 677-678 (2011).
  2. Ornatsky, O., et al. Highly multiparametric analysis by mass cytometry. Journal of immunological methods. 361 (1), 1-20 (2010).
  3. Tanner, S. D., et al. Flow cytometer with mass spectrometer detection for massively multiplexed single-cell biomarker assay. Pure and Applied Chemistry. 80 (12), 2627-2641 (2008).
  4. Maecker, H. T., et al. Standardization of cytokine flow cytometry assays. BMC immunology. 6 (1), 13 (2005).
  5. Brazma, A., Vilo, J. Gene expression data analysis. FEBS letters. 480 (1), 17-24 (2000).
  6. Pyne, S., et al. Automated high-dimensional flow cytometric data analysis. Proceedings of the National Academy of Sciences. 106 (21), 8519-8524 (2009).
  7. Ge, Y., Sealfon, S. C. flowPeaks: a fast unsupervised clustering for flow cytometry data via K-means and density peak finding. Bioinformatics. 28 (15), 2052-2058 (2012).
  8. Venkatesh, V. Determinants of perceived ease of use: Integrating control, intrinsic motivation, and emotion into the technology acceptance model. Information systems research. 11 (4), 342-365 (2000).
  9. Bagwell, C. B., Adams, E. G. Fluorescence spectral overlap compensation for any number of flow cytometry parameters. Annals of the New York Academy of Sciences. 677 (1), 167-184 (1993).
  10. Lavin, Y., et al. Innate immune landscape in early lung adenocarcinoma by paired single-cell analyses. Cell. 169 (4), 750-765 (2017).
  11. Chevrier, S., et al. An immune atlas of clear cell renal cell carcinoma. Cell. 169 (4), 736-749 (2017).
  12. Hartigan, J. A., Wong, M. A. Algorithm AS 136: A k-means clustering algorithm. Journal of the Royal Statistical Society. Series C (Applied Statistics). 28 (1), 100-108 (1979).
  13. Ester, M., Kriegel, H. P., Sander, J., Xu, X. Density-based spatial clustering of applications with noise. International Conference Knowledge Discovery and Data Mining. 240, (1996).
  14. Levine, J. H., et al. Data-driven phenotypic dissection of AML reveals progenitor-like cells that correlate with prognosis. Cell. 162 (1), 184-197 (2015).
  15. Blondel, V. D., Guillaume, J. L., Lambiotte, R., Lefebvre, E. Fast unfolding of communities in large networks. Journal of statistical mechanics: theory and experiment. 2008 (10), P10008 (2008).
  16. Le Martelot, E., Hankin, C. Fast multi-scale detection of relevant communities in large-scale networks. The Computer Journal. 56 (9), 1136-1150 (2013).
  17. Newman, M. E. Fast algorithm for detecting community structure in networks. Physical review E. 69 (6), 066133 (2004).
  18. Hespanha, J. P. An efficient matlab algorithm for graph partitioning. , University of California. 1-8 (2004).
  19. Moon, T. K. The expectation-maximization algorithm. IEEE Signal processing. 13 (6), 47-60 (1996).
  20. Bishop, C. M. Pattern recognition and machine learning. , Springer. (2006).

Tags

تراجع، العدد 143، التدفق الخلوي، تحليل عالية ثلاثي الأبعاد، تي-SNE، تجميع، الحرارة خرائط، "الحد من أبعاد"
اكسسيت: واجهة مستخدم رسومية لتبسيط تحليل البيانات الخلوي عالية ثلاثي الأبعاد
Play Video
PDF DOI DOWNLOAD MATERIALS LIST

Cite this Article

Sidhom, J. W., Theodros, D., Murter, More

Sidhom, J. W., Theodros, D., Murter, B., Zarif, J. C., Ganguly, S., Pardoll, D. M., Baras, A. ExCYT: A Graphical User Interface for Streamlining Analysis of High-Dimensional Cytometry Data. J. Vis. Exp. (143), e57473, doi:10.3791/57473 (2019).

Less
Copy Citation Download Citation Reprints and Permissions
View Video

Get cutting-edge science videos from JoVE sent straight to your inbox every month.

Waiting X
Simple Hit Counter