January 2nd, 2011
تحليلات بصرية (VA) هو نهج جديد من تحليل البيانات بشكل تفاعلي. في هذا الفيديو ، نناقش مشكلة الزائد البيانات الناتجة عن الإنتاجية العالية التجارب البيولوجية ، واقتراح VA كحل لمشكلة من هذا القبيل. شريط الفيديو يظهر تحليل داخل وبين مجموعات البيانات المناعية باستخدام أداة تسمى VA تابلوه.
تسهيل تحليل البيانات المناعية بتقنيات التحليل البصري. في حين أن القدرة على جمع البيانات وتخزينها قد تقدمت بسرعة ، فإن القدرة على معالجتها وتحليلها بالمقارنة لم تحرز تقدما يذكر. نتيجة لذلك ، غالبا ما توجد مجموعات بيانات كبيرة في مختبرات الطب الحيوي ، والتي لا يتم تحليلها بشكل فعال أو فعال.
مع هذا ، تضيع المعلومات الغنية والقوية المحتملة في هاوية أنظمة التخزين. ظهرت التحليلات المرئية أو VA كطريقة جديدة لتحليل مجموعات البيانات المعقدة الكبيرة. تعتمد تقنيات VA على التصورات التي تسمح للمحللين باستخدام ذكائهم المرئي لاكتشاف الأنماط في البيانات مثل الاتجاهات العامة أو القيم المتطرفة.
تسمح هذه التصورات السريعة بالتكوين السريع للفرضيات أثناء استكشاف البيانات. تسمح مرونة أدوات VA للمحلل بالتكبير والتنقل لأسفل وبناء الاتصالات عبر مجموعات بيانات متعددة أثناء استكشاف علاقاتهم. من خلال تطبيق VA على مصادر البيانات المتكاملة ، يمكن للمستخدم الكشف عن نتائج جديدة ومهمة.
التحليل الأصلي هو أحد أساليب VA حيث يعمل خبير أداة VA وتقني يعرف أيضا باسم خبير المجال معا بحيث يطرح خبير المجال أسئلة ذات صلة بيولوجيا حول البيانات. يقوم خبير أداة VA بعد ذلك بإنشاء تصورات قد تساعد في الكشف عن الأنماط التي تساعد في الإجابة على هذا السؤال أو تؤدي إلى مزيد من الاستكشاف. يمكن تكرار هذه العملية لبناء تصورات مختلفة توفر البصيرة.
شرعنا في اختبار مدى ملاءمة نهج VA للتحليل المزدوج لمجموعة بيانات طبية حيوية معقدة كبيرة. في التجارب التجريبية الأولية ، قمنا بتقييم العديد من أدوات VA الحالية للمشكلة الحالية. اخترنا برنامج Tableau by Tableau كأداة أنسب للمهمة المطروحة.
استندت معايير الاختيار في هذه التجارب التجريبية إلى معلمات ذاتية مثل سهولة الاستخدام وسهولة الاستخدام الإجمالية ، بالإضافة إلى الميزات التقنية الموضوعية مثل مجموعة من تقنيات التفاعل وميزات التصور. لدينا هنا مجموعة بيانات في جدول بيانات Microsoft Excel نموذجي لمختبر يعمل في مجال الأمراض المعدية. تحتوي هذه المجموعة على بيانات معرف الموضوع حول التباين في تسلسل الحمض النووي الجيني.
في هذه الحالة NF kappa BIA تعدد أشكال النوكليوتيدات المفردة أو SNS للموضوع ، بالإضافة إلى التركيز الملحوظ للعديد من الجزيئات البيولوجية في هذه الحالة ، السيتوكينات التي تنتجها الخلايا المناعية للموضوع بعد تحفيز الخلايا المناعية بمحفزات محددة. سنمرر الآن لأسفل إلى جدول البيانات. لإعطائك فكرة عن حجم مجموعة البيانات هذه ، نحن مهتمون بمعرفة ما إذا كانت هناك علاقة عامة بين النمط الجيني الذي يمثل القصاصات المختلفة ، في هذه الحالة ، لجين NF Kappa BIA ، واستجابة السيتوكين التي تمت ملاحظتها.
بعد التحفيز ، سنقوم الآن بتوصيل مجموعة البيانات ب Tableau ، مع التأكد من استيراد جدول NF kappa BIA. يمكنك أن ترى على الجانب الأيسر أن اللوحة متصلة بالجدول الصحيح وتفصل تلقائيا متغيرات العمود إلى ما تسميه Tableau وأبعاده ومقاييسه. الأبعاد هي ببساطة الأعمدة التي تصنف البيانات وتقيس القيم الكمية في هذا العمود.
في هذا التصور ، سنرسم الآن مستويات تركيز التحفيز مقابل تركيز استجابة السيتوكين المرصود. نحن الآن متوسط قيم مستويات تركيز السيتوكين. ترتيب مستويات التركيز خاطئ, ولكن من السهل جدا اللجوء إلى هذا بسرعة.
ثم يمكننا تبديل العرض ليناسب الشاشة والسماح بتصور أسهل للبيانات. نظرا لأننا نريد التحقيق في كيفية التمييز بين الأنماط الجينية المختلفة ، فكل ما علينا فعله هو إسقاط بعد النمط الجيني في قسم الألوان هذا. ينفصل التصور تلقائيا وعلى الفور بناء على النمط الجيني.
الآن ، يمكننا تجربة تنسيقات عرض مختلفة. على سبيل المثال ، قد يكشف الرسم البياني الخطي بشكل أفضل عن نمط نريد التقاطه. من الواضح أن هناك العديد من الخيارات الأخرى.
يقترح علماء الأحياء في هذا التحليل المزدوج أننا نبدأ باستكشاف علاقات إنتاج إحدى علامات السيتوكين المسماة QNF alpha بعد التحفيز باستخدام كاشف يسمى 3M oh oh two. للقيام بذلك ، نحتاج إلى تصفية بعد العلامة ، TNF alpha وبعد التحفيز 3M oh oh two. لجعل عملية التصفية أكثر مرونة ، يمكننا اختيار خيار إظهار التصفية السريعة لكل من أبعاد العلامة والتحفيز ، مع التأكد من أنها قائمة قيم واحدة.
يظهر هذا التصور بوضوح اختلافا مع إنتاج ألفا عامل نخر الورم بعد مستويات مختلفة من ثلاثة MO oh اثنين من التحفيز مفصولة بالنمط الجيني بألوان مختلفة ، يمكننا اختيار أي مجموعة أخرى من قيم مرشح العلامة والتحفيز ، وسيتغير التصور وفقا لذلك. على غرار Excel ، يمكننا إنشاء تصورات مختلفة في علامات تبويب منفصلة. لأغراض العرض التقديمي ، يمكننا أيضا إنشاء عرض موجز للتحليلات المتعددة.
في هذه الحالة ، قمنا بالتحقيق في إنتاج TNF Alpha عبر العديد من الموضوعات ذات النمط الجيني NF Kappa BIAS الجيني المختلف. في هذا العرض التوضيحي ، نجحنا في إنتاج سلسلة من التصورات القوية في حوالي دقيقة و 30 ثانية باستخدام نهج VA للتحليل المزدوج. تتطلب مجموعة مماثلة من التصورات عادة باحثا في الطب الحيوي 30 دقيقة لإنشائه في Excel.
كان المثال السابق تحليلا بسيطا ثنائي الأبعاد. القوة الحقيقية ل VA هي القدرة على تصور أبعاد متعددة في نفس الوقت. على سبيل المثال ، يدعم Tableau التحليل بين مجموعات البيانات من خلال الصلات المنطقية للقيم الرئيسية.
فيما يلي جدولين بيانيين موضوعين في المصنف نفسه. مجموعة البيانات الأولى هي واحدة من المثال التوضيحي السابق ، والأخرى عبارة عن مجموعة بيانات من الخلايا التي تم تحليلها بواسطة تقنية تسمى قياس التدفق الخلوي لإنتاج سيتوكينات متعددة في نفس الخلية. في الوقت نفسه ، مقياس يسمى درجة وظائف poly أو PFD ، يمكنك تسمية الورقة بحيث يسهل التعرف عليها أثناء مرحلة الاستيراد.
هذا يسمح ل Tableau بتوصيل جدولي البيانات. بعد اختيار خيار الجداول المتعددة ، يمكنك استخدام ميزة إضافة جدول جديد للانضمام إلى الجدولين. تضيف هذه الميزة جدول البيانات الثاني إلى الأول وتستخدم عبارات الانضمام لدمج مجموعات البيانات باستخدام مفاتيح متطابقة مثل نوع الخلية ومرحلة مستوى التركيز ومحفز المجموعة ومعرف الموضوع.
لاحظ أن الأبعاد مفصولة باسم جدول البيانات. هذا يسمح لنا باستخدام الأبعاد التي لم تكن جزءا من البيان المشترك المنطقي. تعريف وظيفة بولي ، على سبيل المثال ، هو النسبة المئوية للخلايا التي تنتج أكثر من سيتوكين واحد.
على سبيل المثال ، خلية تصنع اثنين من السيتوكينات على شكل PFD لاثنين وخلية تصنع ثلاثة سيتوكينات في صورة PFD لثلاثة. هنا نقوم بإنشاء حقل محسوب واحد لدمج هذه القيم في مقياس واحد يمكننا استخدامه في العرض المرئي. الآن يمكننا البدء في بناء التصور.
أولا ، نرسم تركيز مستويات السيتوكين مقابل PFDs على اثنين ، ومثل العرض التوضيحي الأخير ، نأخذ متوسط قيمة PFDs أكبر من اثنين. نقوم أيضا بترتيب ملصقات التركيز من منخفضة إلى عالية عن طريق ضبطها يدويا. نظرا لأن معلومات النمط الجيني متاحة فقط للبعض في هذه المجموعة ، نحتاج إلى تصفية صفوف البيانات التي لا تحتوي على معلومات النمط الجيني.
تماما كما كان من قبل ، يمكننا إسقاط النمط الجيني بسرعة في ملصق اللون ، مما يسمح لنا بالتمييز بين كل نمط وراثي مختلف أيضا. ثم يمكننا تبديل العرض ليناسب الشاشة والسماح بتصور أسهل للبيانات. يمكننا أيضا تغيير التمثيل البياني الشريطي اثنين.
على سبيل المثال ، يوفر الرسم البياني الخطي الذي اختبر هذا إحساسا جيدا بكيفية اختلاف استجابة CYT واستجابة PFP وفقا للأنماط المحددة لكل نمط جيني. تلاحظ على الفور أن NF kappa b SNP مع النمط الجيني GG له نمط استجابة مختلف مقارنة بالأنماط الجينية الأخرى. يمكننا استكشاف هذا بشكل أكبر من خلال التحقيق في تأثير المحفزات المختلفة على هذا النمط.
لاحظ أنه بعد إضافة LPS في بعد التحفيز ، تظهر الأنماط الجينية الرئيسية الثلاثة مستوى PFD مماثلا في جميع التركيزات ، ولكن مع 3M MO oh اثنين من المحفزات فقط ، يظهر النمط الجيني GG حادا في PFD من تركيز منخفض إلى عالي من التحفيز. تسمح لنا هذه النتيجة بتوليد فرضية لاختبارها في التجارب المستقبلية ، وهي أن نوع التحفيز يؤثر على PFD. في المظاهرتين الأخيرتين ، رأينا التوليد السريع للتصور لاكتشاف الأنماط ذات المغزى المحتملة داخل مجموعات البيانات وفيما بينها.
يمكن توسيع قوة التحليلات المرئية بسرعة لتشمل مجموعات البيانات الكبيرة ، وتوسيع نطاق أبعاد التحليل اعتمادا على التطبيق ، ودمج المعلومات عبر مجموعات البيانات الضخمة. على سبيل المثال ، مع العديد من صوامع البيانات التي تم إنشاؤها في الدراسات الجماعية ، يعد VA نهجا قابلا للتحويل بدرجة كبيرة يمكن تطبيقه على أي مجال يحتوي على كمية كبيرة من العديد من أنواع البيانات المختلفة ، بما في ذلك مجموعات البيانات الفئوية والعددية. يقدم نهج VA ميزتين رئيسيتين.
واحد ، توليد فرضية مرنة. يمكن للمستخدم إنشاء فرضيات حول البيانات الموجودة على الفور المستمدة من النتائج الحالية ، وإنشاء تصورات جديدة بسرعة تستكشف الفرضية لتوفير الوقت مرتين. تعد قابلية استخدام أدوات UVA وكفاءتها ميزتها الرئيسية على أدوات تصور المعلومات التقليدية.
قد يستغرق الجهد المبذول عادة في الرسوم البيانية باستخدام الطرق التقليدية عدة أيام عمل لإكمال ما يتم إنجازه بسهولة من ساعتين إلى ثلاث ساعات على منصة VA مثل Tableau. من الواضح أنها ومن المحتمل أن تكون منصات تطبيقات أخرى لكل منها مزايا وعيوب محددة. تضيف الفائدة الإضافية التي تقترب من هذه المهمة من خلال تحليل الفقرة بوضوح إلى الفائدة الإجمالية للنهج القائم على VA لتحليل البيانات المعقدة متعددة الأبعاد.
View the full transcript and gain access to thousands of scientific videos
يناقش هذا الفيديو تحديات تحليل مجموعات البيانات المناعية الكبيرة ويقدم تحليلات بصرية (VA) كحل. تستفيد تقنيات التحليلات البصرية من التصوريات لمساعدة المحللين على تحديد الأنماط والاتجاهات في البيانات المعقدة.