Journal
/
/
المساعدة في اختيار المؤشرات الحيوية بواسطة حجم تأثير التحليل التمييزي الخطي (LEfSe) في بيانات الميكروبيوم
Assisted Selection of Biomarkers by Linear Discriminant Analysis Effect Size (LEfSe) in Microbiome Data
JoVE Journal
Genetics
A subscription to JoVE is required to view this content.  Sign in or start your free trial.
JoVE Journal Genetics
Assisted Selection of Biomarkers by Linear Discriminant Analysis Effect Size (LEfSe) in Microbiome Data

المساعدة في اختيار المؤشرات الحيوية بواسطة حجم تأثير التحليل التمييزي الخطي (LEfSe) في بيانات الميكروبيوم

English

Automatically Generated

Please note that all translations are automatically generated. Click here for the English version.

15,923 Views

04:57 min

May 16, 2022

DOI:

04:57 min
May 16, 2022

15861 Views

Transcript

Automatically generated

يمكن أن يحل تطبيق حجم تأثير التحليل التمييزي الخطي مشكلة العثور على مؤشرات حيوية جيدة مع اختلافات إحصائية بين المجموعات البيولوجية. يوفر حجم تأثير التحليل التمييزي الخطي طريقة ملائمة لتحديد المؤشرات الحيوية الجينومية لتوصيف الاختلافات الإحصائية بين المجموعات البيولوجية. تأكد من توخي الحذر مع كل خطوة من خطوات الإجراء ، لأن نتيجة كل خطوة سابقة قد تؤثر على الخطوة اللاحقة.

بعد إنشاء ملف إدخال حجم تأثير التحليل التمييزي الخطي ، قم بتشغيل الأوامر كما هو موضح لاستبعاد إمكانية تعارض التبعيات وإنشاء بيئة conda لحجم تأثير التحليل التمييزي الخطي. استخدم الأوامر كما هو موضح لتنشيط البيئة التي تم إنشاؤها وتثبيت حجم تأثير التحليل التمييزي الخطي باستخدام مخبز bioBakery القناة. لتنسيق البيانات لحجم تأثير التحليل التمييزي الخطي، قم بتشغيل الأمر لتنسيق الملف الأصلي إلى تنسيق حجم تأثير التحليل التمييزي الخطي الداخلي.

لحساب حجم تأثير التحليل التمييزي الخطي، قم بتشغيل الأمر لإجراء تحليل تمييزي خطي وإنشاء ملف البيانات الناتج. بعد التحليل ، استخدم الأوامر كما هو موضح لرسم حجم تأثير المؤشرات الحيوية في ملف PDF ورسم شجرة الأنواع لعرض المؤشرات الحيوية في cladogram. لرسم اختلافات علامة حيوية واحدة بين المجموعات المختلفة ، استخدم الأمر كما هو موضح.

يمكن أيضا رسم جميع الميزات باستخدام الأمر إذا رغبت في ذلك. لتحليل LEfSe عبر الإنترنت باستخدام خادم Galaxy ، انتقل إلى الخادم. لتحميل الملفات ذات الصلة، انقر لأعلى واختر الملف المحلي لتحديد الملفات.

ثم حدد تنسيقا جدوليا وانقر فوق ابدأ. لتنسيق البيانات الخاصة بحجم تأثير التحليل التمييزي الخطي، انقر فوق LEfSe وتنسيق البيانات ل LEfSe، وحدد الصفوف المحددة للفئة، ثم انقر فوق تنفيذ. لحساب حجم تأثير التحليل التمييزي الخطي، انقر فوق LEfSe وحجم تأثير LDA.

حدد قيم المعلمات وفقا لمتطلبات التحليل، وانقر فوق تنفيذ. لرسم نتائج حجم تأثير التحليل التمييزي الخطي، انقر فوق LEfSe و Plot LEfSe Results وانقر فوق تنفيذ. لرسم cladogram، حدد قيم المعلمات المناسبة وانقر فوق رسم Cladogram وتنفيذ.

لرسم ميزة واحدة، حدد قيم المعلمات المناسبة وانقر فوق رسم ميزة واحدة وتنفيذ. لرسم المعالم التفاضلية، حدد قيم المعلمات المناسبة وانقر فوق رسم الميزات التفاضلية وزر التنفيذ. هنا ، يتم عرض درجات تحليل التمييز الخطي للمجتمعات الميكروبية ذات الاختلافات الكبيرة في كل مجموعة ، والتي يتم تحديدها من خلال تحليل تسلسل جين الحمض النووي الريبوسومي S-ribosomal 16 لثلاث عينات.

في هذا الشكل ، يمكن ملاحظة المؤشرات الحيوية ذات الاختلافات الكبيرة في أشجار الأنواع بين مستويات التصنيف المختلفة. تمثل الدوائر التي تشع من الداخل إلى الخارج مستويات التصنيف من فصيلة إلى أخرى ، حيث يمثل قطر كل دائرة نوع مستوى وفرة كل تصنيف. تظهر الأنواع التي لا توجد بها اختلافات كبيرة باللون الأصفر ، ويتم تلوين المؤشرات الحيوية للأنواع المختلفة بشكل كبير لتتناسب مع المجموعات المقابلة.

يتم سرد أسماء الأنواع المقابلة للمؤشرات الحيوية الموضحة في المؤامرة هنا. هنا ، يتم عرض ممثل لمخطط شريط الوفرة لعلامة حيوية واحدة تظهر الاختلافات بين المجموعات المختلفة وفقا لنتائج حجم تأثير التحليل التمييزي الخطي. يمثل الخط الصلب متوسط الوفرة النسبية ، ويمثل الخط المنقط الوفرة النسبية المتوسطة ، ويمثل كل عمود الوفرة النسبية لكل عينة في مجموعات مختلفة.

ويمكن أيضا إجراء تحليل للمكونات الرئيسية، حيث يرتبط تعليم الأبعاد ارتباطا مباشرا ببعد البيانات، كما أن نظام الإحداثيات المتوقع متعامد. مع زيادة الطلب على تحليل البيانات عالية الأبعاد ، ستساعد هذه الطريقة في استكشاف ميزات المؤشرات الحيوية ذات الاهتمام.

Summary

Automatically generated

LEfSe (حجم تأثير LDA) هو أداة لتعدين المؤشرات الحيوية عالية الأبعاد لتحديد السمات الجينومية (مثل الجينات والمسارات والتصنيفات) التي تميز بشكل كبير مجموعتين أو أكثر في بيانات الميكروبيوم.

Related Videos

Read Article