Method Article

إنشاء النماذج وتصورها باستخدام إطار عمل التعلم الآلي المستند إلى MIME

DOI:

10.3791/68553

July 22nd, 2025

In This Article

Summary

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

Mime هو إطار حساب مرن لإنشاء نموذج تكامل قائم على التعلم الآلي بأداء أنيق. هنا ، نقدم إجراء مفصلا خطوة بخطوة لتطوير نماذج تنبؤية بدقة عالية ، والاستفادة من مجموعات البيانات المعقدة لتحديد الجينات الهامة المرتبطة بتطور المرض ، ونتائج المرضى ، والاستجابة العلاجية.

Abstract

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

عززت تقنية التسلسل عالية الإنتاجية المنتشرة بشكل كبير فهمنا لعلم الأحياء وعدم تجانس السرطان. أصبحت خوارزميات التعلم الآلي على بيانات النسخ حيوية للتنبؤ بتشخيص المريض والاستجابات السريرية. على الرغم من التقدم في خوارزميات التعلم الآلي ، إلا أن النظام الأساسي مفتوح المصدر الذي يتضمن خوارزميات التعلم الآلي الأكثر تطورا على بيانات النسخ لا يزال غائبا. لمعالجة هذه الفجوة ، قمنا بتطوير Mime ، وهو إطار عمل متعدد الاستخدامات للتعلم الآلي لتعزيز بناء وتصور النماذج التنبؤية للخصائص السريرية والتوقيعات الجينية. من خلال دمج مجموعات البيانات المتنوعة واستخدام تقنيات اختيار الميزات الأكثر تقدما ، يعالج Mime التحديات الحرجة في التنبؤات السريرية. يوفر ثلاث وظائف رئيسية ، بما في ذلك بناء النموذج واختيار الميزات وتصور البيانات. يشمل بناء النموذج مجموعة من خوارزميات التعلم الآلي ، بما في ذلك على سبيل المثال لا الحصر أشجار القرار ، وآلات ناقلات الدعم ، وطرق المجموعة ، مما يسمح للباحثين باختيار النهج الأنسب لتحليلهم المحدد. يستخدم تحديد الميزة خوارزميات متقدمة مثل التخلص من الميزات المتكررة وانحدار LASSO لتبسيط مجموعة البيانات والتركيز على الميزات الأكثر إفادة. يدعم إطار العمل ضبط المعلمات القابلة للتخصيص من خلال طرق التحقق المتبادل، وتحسين أداء النموذج مع التخفيف من مخاطر الإفراط في التجهيز. تمكن أدوات التصور المدمجة في Mime الباحثين من تفسير نتائج النموذج بشكل فعال ، مما يوفر تمثيلات رسومية لأهمية الميزة ومقاييس الأداء التنبؤية. في هذه المخطوطة ، نقدم برنامجا تعليميا مفصلا حول الإجراءات التدريجية لإطار التعلم الآلي متعدد الاستخدامات.

Introduction

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

أثر الاعتماد الواسع النطاق لتقنيات التسلسل عالية الإنتاجية بشكل كبير على فهمنا لعلم الأحياء وعدم تجانس السرطان1. لم يعمق هذا التقدم الرائد في التكنولوجيا الحيوية معرفتنا العلمية فحسب ، بل أحدث أيضا ثورة في مجال البحث الطبي. من خلال تمكين العلماء من تسلسل كميات كبيرة من المواد الوراثية بسرعة ودقة ، أدى التسلسل عالي الإنتاجية إلى تسريع اكتشاف جينات وطفرات ومسارات بيولوجية جديدة. حددت مجموعة متزايدة من الأبحاث التوقيعات الجزيئية المحددة المرتبطة بتطور المرض ، وتشخيص المريض ، والاستجابة العلاجية من بيانات التسلسل2،3،4. توف....

Access restricted. Please log in or start a trial to view this content.

Protocol

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

ملاحظة: يتم تشغيل جميع البرامج التعليمية لهذه الدراسة على نظام Linux الأساسي باستخدام برنامج R. يتم سرد إصدار حزمة R المستخدمة في هذا البروتوكول في جدول المواد. يتم عرض كل خطوة ضرورية للتحليل أدناه ويمكن أيضا الحصول على بروتوكول مفصل على GitHub (https://github.com/l-magnificence/Mime). يمكن للمستخدمين الذين يواجهون مشكلات مع Mime زيارة صفحة مشكلة GitHub (https://github.com/l-magnificence/Mime/issues) لتقديم ملاحظات.

1. إعداد التمثيل الصامت ومجموعة بيانات المثال

  1. قم بتثبيت إصدار التطوير من Mime من GitHub باستخدام الكود أدناه:
    devtools::install_githu....

Access restricted. Please log in or start a trial to view this content.

Results

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

تم استخدام genelist و Example.cogroup بما في ذلك مجموعة تدريب واحدة ومجموعة تحقق واحدة لبناء نماذج تنبؤية من خلال دمج 10 خوارزميات للتعلم الآلي في Mime. من بين 117 نموذجا للتنبؤ تم إنشاؤه بواسطة Mime ، كان نموذج StepCox [إلى الأمام] + plsRcox المشترك (SPCOM) أعلى مؤشر C بين جميع المجموعات ، مما يشير إلى أدائه المتميز (الشكل 1 أ). تم تقسيم المرضى إلى مجموعات عالية الخطورة ومنخفضة الخطورة وفقا لمتوسط درجة المخاطر التي تم حسابها بواسطة SPCOM. ومن المثير للاهتمام أن المرضى الذين لديهم درجات عالي.......

Access restricted. Please log in or start a trial to view this content.

Discussion

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

في هذه الدراسة ، نقدم وصفا مفصلا لكيفية استخدام حزمة Mime لتطوير نماذج تنبؤية قوية وقوية للتعلم الآلي لبيانات النسخ. في الدراسات السابقة ، غالبا ما كافح الباحثون في اختيار خوارزمية النموذج التنبؤي المناسبة بناء على الخصائص المحددة لبيانات التسلسلالخاصة بهم 13،14. بالإضافة إلى ذلك ، بالنسبة للباحثين الذين ليس لديهم خلفية في علوم الكمبيوتر ، هناك صعوبة معينة في استقرار بيئة التعلم الآلي ، واختيار المعلمات المناسبة ، ونشر النماذج في.......

Access restricted. Please log in or start a trial to view this content.

Disclosures

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

لم يتم الإعلان عن أي تضارب في المصالح.

Acknowledgements

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

نشكر جميع المشاركين والمحققين المشاركين في إنتاج البيانات.

....

Access restricted. Please log in or start a trial to view this content.

Materials

List of materials used in this article
NameCompanyCatalog NumberComments
اسم الباقةالإصداربرمجيات
aplot0.1.10استوديو R
بارت2.9.4استوديو R
بوروتا8.0.0استوديو R
فئة السرطان1.38.0استوديو R
الاقحام6.0-89استوديو R
Ckmeans.1d.dp4.3.5استوديو R
قارن ج1.3.2استوديو R
خريطة الحرارة المعقدة2.15.1استوديو R
التراكيب2.0-4استوديو R
البيانات.جدول1.14.0استوديو R
doParallel1.0.16استوديو R
DPLYR1.1.3استوديو R
ه 10711.7-7استوديو R
فورستورستر1.1.0استوديو R
مستقبل1.21.0استوديو R
جي بي إم2.1.8.1استوديو R
جي جي بريك0.1.1استوديو R
ggplot23.4.1استوديو R
ggpubr0.4.0استوديو R
جي جي جي سي آي2.9استوديو R
جي إل ايم نت4.1-2استوديو R
شبكة4.1.3استوديو R
gridExtra2.3استوديو R
جي سي إي إي1.54.0استوديو R
جي إس في إيه1.40.1استوديو R
Hmisc5.1-1استوديو R
ك.ك.إن إن1.3.1استوديو R
الحياكة1.42استوديو R
ماغريتر2.7.2استوديو R
مصفوفة1.5-4استوديو R
ميتا5.2-0استوديو R
أدوات متفرقة0.6-28استوديو R
ميكس أوميكس6.18.1استوديو R
أدوات مختلطة1.2.0استوديو R
pbapply1.4-3استوديو R
الثابتة والمتنقلة1.7.7استوديو R
بروك1.18.0استوديو R
R4.1.3استوديو R
randomForestSRC4.6-14استوديو R
قارئ1.4.0استوديو R
الوصفات0.1.17استوديو R
إعادة الشكل21.4.4استوديو R
آر مارك داون2.8استوديو R
ROCit2.1.1استوديو R
ROCR1.0-11استوديو R
ميزان1.2.1استوديو R
عصفور1.0.3استوديو R
سترينجر1.5.0استوديو R
سوبر بي1.12استوديو R
بقاء3.3-1استوديو R
البقاء على قيد الحياةROC1.0.3استوديو R
SurvivalSVM0.0.5استوديو R
إس إيه3.40.0استوديو R
اختبار3.1.0استوديو R
تيبل3.2.1استوديو R
تيدير1.3.0استوديو R
Tidyverse1.3.1استوديو R
برنامج UpSetR1.4.0استوديو R
فيريديس0.6.1استوديو R

References

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,
  1. Reuter, J. A., Spacek, D. V., Snyder, M. P. High-throughput sequencing technologies. Mol Cell. 58 (4), 586-597 (2015).
  2. Adam, G., et al. Machine learning approaches to drug response prediction: challenges and recent progress. NPJ Precision Oncol. 4....

Access restricted. Please log in or start a trial to view this content.

Reprints and Permissions

Request permission to reuse the text or figures of this JoVE article

Request Permission

Tags

Machine Learning FrameworkPredictive Model ConstructionFeature SelectionData VisualizationTranscriptional SequencingPrognosis ModelingTherapeutic Response PredictionSurvival AnalysisCore Gene IdentificationModel Performance Metrics

Related Articles