إطار عمل متعدد الوسائط للحفاظ على الخصوصية قابل للتفسير لتصنيف آفات الجلد

Amrita Koul; N. P. Singh

doi:10.3791/71472

Research Article

إطار عمل متعدد الوسائط للحفاظ على الخصوصية قابل للتفسير لتصنيف آفات الجلد

DOI:

10.3791/71472

⸱

June 12th, 2026

Amrita Koul¹ , N. P. Singh¹

¹Department of Computer Science and Engineering, School of Engineering and Technology, MVN University, Palwal

Summary

$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

يهدف العمل المقترح إلى تطوير وتقييم ترتيب نسيج متعدد الوسائط قابل للتفسير ويحافظ على الخصوصية لتصنيف آفات الجلد بدقة من خلال دمج ميزات التعلم العميق، والبيانات الوصفية السريرية، وتقنيات الذكاء الاصطناعي القابلة للتفسير لتحسين دقة التشخيص، والشفافية، ودعم اتخاذ القرار السريري الموثوق للكشف المبكر عن سرطان الجلد.

Abstract

$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

من بين الأمراض الجلدية، يعد سرطان الجلد من أكثر الأمراض تهديدا للحياة. التشخيص المبكر والدقيق مهم لتحسين توقعات المريض. ومع ذلك، تواجه الطرق التشخيصية التقليدية المعتمدة على الذكاء الاصطناعي عدة تحديات، منها مخاوف الخصوصية، ومحدودية التفسير، وعدم توازن طبقي حاد في مجموعات بيانات آفات الجلد متعددة الفئات. لتجاوز هذه التحديات، تقترح الورقة المقترحة نموذجا مصنفا متعدد الوسائط وواعا للخصوصية وقابل للتفسير لتصنيف آفات جلدية، يجمع بين نماذج التعلم العميق المعقدة ونهج النمذجة الجماعية مع طرق الذكاء الاصطناعي القابلة للتفسير. يتم إجراء التقييم التجريبي باستخدام بيانات HAM10000 معيارية متاحة للجمهور حول تصنيف آفات الجلد متعددة الفئات يمكن الوصول إليها عبر Kaggle Hub، موزعة على سبع فئات آفات ذات دلالة سريرية (akiec، bcc، bkl، df، mel، NV، VSC). لموازنة البيانات، تستخدم تقنية موازنة الطبقات لتعزيز الطبقات الأقلية. تستخدم EfficientNet B4 وDenseNet201 وMobileNetv2 لاستخراج تمثيلات الميزات العميقة، ثم يتم دمجها مع بيانات وصفية سريرية بارزة لإنشاء فضاء ميزات متعدد الوسائط قوي. تستخدم هذه الميزات متعددة الوسائط لتدريب XGBoost وLightGBM ومصنف الأعصاب العميقة (DNC) التي أدت إلى دقة تصنيف بلغت 92٪، 90٪ و94٪ على التوالي. يتم تطبيق استراتيجية المجموعات المكدسة لدمج مخرجات XGBoost وLightGBM وDeep Neural Classifier (DNC)، مما يؤدي إلى تحسين الدقة بنسبة 96٪. توفر تقنيات تفسير النماذج تفسيرات على مستوى الميزات تزيد من الشفافية. أثبتت النتائج التجريبية عملية الإطار المقترح من حيث الكفاءة مع التصنيف العملي لآفات الجلد ذات الصلة السريرية.

Introduction

$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

يمثل سرطان الجلد عبئا صحيا عالميا كبيرا، مع زيادة معدلات الإصابة المبلغ عنها حول العالم¹. يعتبر الإشعاع الاصطناعي عاملا مساهما رئيسيا في سرطان الجلد، مما يؤدي إلى طفرات جينية تؤدي إلى تكاثر الخلايا غير المنضبط وتطور الأورام في خلايا الجلد ^1,2_.تتكون سرطانات الجلد من مجموعة من الأمراض، بما في ذلك الميلانوما، وسرطان الخلايا الحرشفية، وسرطان الخلايا القاعدية (BCC). تختلف الأسباب، والعرض السريري، والعوامل التنبؤية لهذه الحالات جميعها^3. أصبحت أمراض الجلد عقبة في التشخيص الطبي بسبب التشابه على مستوى البكسلات⁴. في عام 2022، كان هناك 331,722 حالة ميلانوما تقديرية (58,667 وفاة) و1.2 مليون حالة NMSC (69,416 وفاة) عالميا. بلغت معدلات الإصابة الموحدة بالعمر (ASR) ذروة معدل الوفاة في أوقيانوسيا (29.78 لكل 100,000)، وأمريكا الشمالية (16.3)، وأوروبا (10.43). ومع ذلك، كانت نسبة الوفيات إلى الإصابة الأعلى في أفريقيا (0.35) وآسيا (0.30) مقارنة بأمريكا الشمالية وأوقيانوسيا (0.02 في كلتيهما)، مما قد يعكس توقعات أسوأ¹. في طب الجلدية، اعتمد تشخيص ومراقبة آفات الجلد بشكل أساسي على الفحص البصري والتقييمات غير الجراحية الأخرى. لا تستخدم الطرق الغازية لأنها قد تضر بالآفات وتمنع أداء المتابعة السريرية لنمو الآفة⁵. يمكن أن تكون الآفات الجلدية من أنواع مختلفة: الميلانوما (MEL)، الورم الجلدي العصبي (DF)، التقرنية الأكتينية وسرطان الظهارة (AKIEC)، سرطان الخلايا القاعدية (BCC)، الكيراتوز الحميد (BKL)، النيفيوز الميلانوسي (NV)، والآفات الوعائية (VASC)، كما هو معرف في مجموعة البيانات HAM10000⁵. التحديات الرئيسية في تصنيف الصور الجلدية هي وجود الشعر، الأحبار، علامات المسطرة، البقع الملونة، الوميزان، القطرات، فقاعات الزيت، الأوعية الدموية، المناطق مفرطة التصبغ، و/أو آفات التهابية⁶. كانت هناك دراسات سابقة حول اختيار السمات والتعلم العميق للتصوير الطبي وتصنيف آفات الجلد⁷^،⁸.

تم أيضا دراسة الأساليب القائمة على الرؤية الحاسوبية لتشخيص سرطان الجلد ودمج الميزات اليدوية والعميقة^{، إلى} جانب استراتيجيات دمج الميزات^{لتحسين أداء} التصنيف. تؤكد التطورات الأخيرة بشكل أكبر على دمج التعلم الآلي في أنظمة الرعاية الصحية وأطر معالجة البيانات الطبية الآمنة^11,12_.استخدام الذكاء الاصطناعي للرعاية الصحية المدعوم بالخوارزميات الحاسوبية المتقدمة لديه القدرة على تقديم برامج رعاية متكاملة شخصية وفعالة، مفيدة بشكل خاص للمرضى في بيئات الرعاية البعيدة والمنزلية¹³. من خلال استخدام مجموعات بيانات واسعة من صور المنظار الجلدي، يمكن تدريب نماذج التعلم العميق—وخاصة الشبكات العصبية الالتفاوتية (CNNs)—على تحديد وتصنيف آفات الجلد المختلفة بدقة. تظهر عدة تقنيات نتائج قوية في تقسيم آفات الجلد، بما في ذلك الشبكات الالتفافية الكاملة (FCNs)، وCNNs، وشبكات CNN العميقة (DCNNs)، والشبكات المتبقية الالفافية الكاملة (FCRNs)، وبنى U-Net. الشبكات العصبية العميقة (DNN) ليست سهلة التفسير بسبب تعقيد بنيتها المعقدة، لذا فإن عملية اتخاذ القرار فيها يصعب فهمها^14,15. أظهرت التطورات الحديثة في تحليل الصور الطبية أن الشبكات العصبية الالفافية العميقة (CNNs) تحسن بشكل كبير من الكفاءة في مهام تصنيف آفات الجلد. أظهرت عدة دراسات على مجموعات بيانات الديرموسكوب مثل HAM10000 أن البنى المعتمدة على CNN، بما في ذلك ResNet وDenseNet وEfficientNet، تحقق أداء تصنيفا قويا متعدد الفئات من خلال تعلم تمثيلات الميزات الهرمية من صور الآفات. لقد حسنت أساليب دمج الميزات الهجينة، حيث يتم دمج عدة أعمدة فقراء للشبكة النووية النووية، دقة تشخيصية إضافية من خلال دمج التمثيلات العميقة المكملة¹⁶. علاوة على ذلك، بحثت الدراسات الحديثة في نماذج محول CNN الهجينة في تحليل الصور الطبية. لقد ثبت أن النماذج التي تحتوي على مستخرجات ميزات محول الرؤية وCNN تحقق نتائج أفضل في مهام تصنيف آفات الجلد لأنها أكثر قدرة على استخراج محتوى الملمس المحلي وكذلك العلاقات السياقية العالمية¹⁷. كما تعتبر هذه التصاميم الهجينة متطورة في التصوير الطبي لأنها تمتلك قدرة تعليمية متوازنة على التمثيل.

في مجالات أخرى من الطب، تم استخدام استراتيجيات دمج الميزات على نطاق واسع خارج طب الجلدية. كما تم تطبيق أنظمة هجينة قائمة على CNN في تحليل الصور النسيجة المرضية لتحقيق تصنيف أفضل لسرطان الرئة والقولون مع تمثيلات ميزات محسنة وديناميكيات التعلم المكاني¹⁶. وبالمثل، في طب العيون، أظهر استخدام نماذج التعلم العميق المدربة على تمثيلات الميزات المدمجة تطبيقا ناجحا في مراحل تصوير قاع الشبكية السكري، مع متانة ودقة تصنيف أفضل في مهمة تصحيح متعددة الفئات¹⁸. تشير طرق الاندماج متعدد الوسائط في هذه المجالات إلى أن تمثيلات الميزات غير المتجانسة تعطي تعميما وتصنيفا أفضل، خاصة في البيانات الطبية غير^{المتوازنة 19}.

على الرغم من أن هذه التحسينات قد تم إجراؤها، إلا أن الممارسات الحالية عادة ما تقتصر على كونها متعددة الوسائط، وغير متكاملة، وغير كافية لمعالجة مشكلة عدم التوازن الطبقي، وغير مفيدة في اتخاذ القرار السريري. لتجاوز هذه القضايا، تقدم هذه الورقة نموذجا قابلا للتفسير لتصنيف آفات الجلد يركز على الخصوصية ويدمج طريقتي تفسير النموذجين. يمكن استخدام هذه الطرق لشرح توقعات النموذج، وإظهار الميزات الأكثر أهمية وتسليط الضوء على مجالات مهمة في صور التنظير الجلدي، مما يعزز الوضوح والثقة في الإجراءات السريرية، وبالتالي يحسن الشفافية السريرية، ويبني الثقة، ويدعم التطبيق الآمن لأنظمة الذكاء الاصطناعي في الممارسة السريرية. هناك اختلال كبير في مجموعة البيانات HAM10000، حيث أن بعض الفئات تحتوي على عينات أقل بكثير من غيرها. لتجاوز هذه المشكلة، تستخدم تقنية أخذ العينات الزائدة للأقليات الاصطناعية (المعروفة أيضا بتوازن الفئات) لتوليد عينات تركيبية للفئات الممثلة تمثيلا ناقصا. توازن تقنيات توازن الطبقات بين مجموعة البيانات، مما يمكن النموذج من التعلم بشكل أفضل من أنواع الآفات الأقلية، وزيادة الحساسية، والسماح بتوقع أكثر موثوقية لفئات سرطان الجلد ذات الأهمية السريرية والأقل تكرارا. يتم دمج الميزات العميقة ل EfficientNet-B4 وDenseNet201 وMobileNetV2 مع البيانات الوصفية السريرية لتشكيل تمثيل أكثر إفادة لكل آفة جلدية. تساعدنا هذه الميزة المزدوجة على استخراج الأنماط البصرية لصور التنظير الجلدي ومعلومات المرضى الأخرى لتحليل أكثر تعمقا. ثم يتم تدريب الميزات على مصنفات مختلفة، بما في ذلك XGBoost وLightGBM وشبكة عصبية عميقة، لتعزيز قدرة وقوة نموذج تصنيف آفات الجلد. يستخدم مجموعة النماذج مع تقنية التكديس لتعزيز النموذج. هذا نموذج مركب يستفيد من نقاط قوة نماذج متعددة للتعلم والاستفادة من توقعات جميع النماذج في المجموعة مع التخفيف من حدودها.

Access restricted. Please log in or start a trial to view this content.

Protocol

$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

استخدمت هذه الدراسة مجموعات بيانات تنظير الجلد المتاحة للجمهور ومجهولة الهوية بالكامل ولم تتضمن مشاركة بشرية مباشرة؛ لذلك، لم تكن موافقة لجنة الأخلاقيات مطلوبة. يحتوي جدول المواد على تفاصيل جميع المواد أو الأدوات المستخدمة في هذه الدراسة. يتضمن الجدول 1 تفاصيل بيئة الأجهزة والبرمجيات، مثل نوع المعالج، الذاكرة، نظام التشغيل، وأطر البرمجيات. يتضمن الجدول 2 تفاصيل الدقة حسب الفئة، والاستدعاء، ودرجة F1، والدعم لكل فئة من أنواع آفات الجلد.

سير العمل العام لإطار تصنيف آفات الجلد متعدد الوسائط المقترح

الخطة العامة لهذا البحث هي إنشاء مخطط دقيق ومفهوم لتصنيف متعدد الآفات الجلدية. يبدأ سير العمل بجمع البيانات ومعالجتها المسبقة لمجموعة البيانات HAM10000، ثم ينتقل إلى استخراج الميزات باستخدام بنى التعلم العميق وإدراج بيانات وصفية سريرية. بعد ذلك، يتم تدريب وتحسين عدة مصنفات تعلم آلة، وتجمع نتائجها في استراتيجية جماعية. وأخيرا، تفسر تنبؤات النموذج باستخدام تقنيات القابلية للتفسير، ويتم تقييم فعالية النموذج لاستخدامه في دعم اتخاذ القرار السريري في العالم الحقيقي.

لتحسين دقة التنبؤ للنظام المقترح، يستخدم خط أنابيب تعلم آلي متعدد الوسائط، يجمع بين الميزات القائمة على الصور والبيانات الوصفية السريرية (كما هو موضح في الشكل 1). يمكن للنموذج تلخيص المخرجات البصرية لصور التنظير الجلدية مع المعلومات المتعلقة بالمريض لتحديد أنماط أكثر تفصيلا تتعلق بآفات الجلد المختلفة. مع هذا التركيب، يمكن للنظام أن يقدم توقعات أفضل، وهذا سيحدث في النهاية. تحسين جودة وفائدة تصنيف آفات الجلد. يتم استخراج ثلاث ميزات عميقة ملتفة مدربة مسبقا بمساعدة الشبكات العصبية (EfficientNet-B4، DenseNet201، وMobileNetV2): وهي قادرة على التقاط أنماط متكاملة من صور التنظير الجلدي. تتعلم هذه الهياكل أنماطا عالية المستوى في شكل آفات الجلد، مثل التغيرات في اللون والملمس، وطريقة بنائها. ثم تجمع وحدة دمج الميزات الميزات العميقة مع الميزات السريرية والبيانات الديموغرافية لتكوين ميزة متعددة الوسائط غنية. ثم يتم تقسيم البيانات المدمجة إلى بيانات تدريب، وتحقق من الصحة، وبيانات اختبار لضمان اختبار النماذج المناسب. بعد ذلك، يستخدم وحدة دمج الميزات لدمج الميزات العميقة مع الميزات السريرية والديموغرافيا لإنتاج ميزة متعددة الوسائط غنية. ثم يتم تقسيم هذه البيانات إلى بيانات تدريب، اختبار، وبيانات تحقق لاختبار النموذج. تستخدم استراتيجية المجموعات لتعزيز دقة التنبؤ بشكل أكبر. يتم ذلك عن طريق حساب نتائج عدة نماذج والوصول إلى التنبؤ النهائي باستخدام تلك الاحتمالات المتوسطة لتعزيز التعميم وتقليل التباين الذي كان من الممكن أن تسببه النماذج الفردية. بالإضافة إلى ذلك، يتم دمج طرق التفسير، مثل تقنيات تفسير النماذج، لشرح كيفية اتخاذ النموذج قراراته بشكل أوسع. توفر طريقة تفسير النموذج تفسيرات على مستوى الميزات من خلال قياس مساهمة المتغيرات المدخلة، بينما تحدد طريقة قابلية تفسير النموذج المجالات المهمة داخل الصور الجلدية على مستوى البكسل تؤثر على التنبؤ. تقدم تقنيات تفسير النموذج تفسيرات على مستوى الميزة من خلال قياس مساهمة كل متغير إدخال، بينما تبرز تقنيات تفسير النموذج المناطق المهمة على مستوى البكسل داخل صور الديرموسكوب التي تؤثر على التوقع. مجتمعة، تجعل هذه التقنيات النماذج أكثر قابلية للتفسير وتساعد الأطباء على التعرف على طريقة اتخاذ النظام للقرارات. ونتيجة لذلك، يوفر خط الإنتاج المقترح نظاما مفهوما وواعا للخصوصية، مما يزيد من الشفافية والثقة ويتيح تشخيصا أكثر موثوقية لسرطان الجلد في بيئة رعاية صحية واقعية.

وصف مجموعة البيانات مع التحضير

في هذه الورقة، تستخدم مجموعة البيانات HAM10000 (الإنسان ضد الآلة مع 10,000 صورة تدريبية) كمجموعة بيانات رئيسية لتصنيف آفات الجلد متعددة الفئات. تحتوي مجموعة البيانات على أكثر من 10,000 صورة جلدية تم جمعها من مصادر طبية مختلفة. المصادر السريرية والمجموعات السكانية، مما يجعلها واحدة من أكثر مجموعات البيانات المعيارية استخداما في تحليل الصور الجلدية. كل صورة في مجموعة البيانات مصحوبة ببيانات وصفية سريرية مهمة، بما في ذلك معرفات الصور، والملصقات التشخيصية، وعمر المريض، وجنسه، والموقع التشريحي للآفة. تغطي مجموعة البيانات سبع فئات تشخيصية: القرنية القطبية (AKIEC)، سرطان الخلايا القاعدية (BCC)، القرنية الحميدة (BKL)، الديرماتوفيبروما (DF)، النيفيوس الميلانوسي (NV)، الآفات الوعائية (Vasc)، والميلانوما (MEL).

معالجة البيانات الوصفية السريرية

شملت الميزات المساعدة التي أضيفت إلى خط التصنيف بيانات وصفية سريرية، مثل العمر والجنس وموقع الآفة في المريض. كانت هناك قيم مفقودة أو غير معروفة، تم التعامل معها من خلال نهج معالجة مسبقة حتمية. في حالة متغير العمر (العددي)، تم استخدام العمر الوسيط المحسوب على مجموعة التدريب لحساب القيم المفقودة. سبب اختيار التخمين الوسيط هو مقاومته للبيانات الشاذة والبيانات المنحرفة التي تنتشر في البيانات السريرية. بالنسبة للجنس وموقع الآفة (المتغيرات التصنيفية)، لم تستبعد القيم المفقودة أو غير المحددة؛ تم تعيينهم في فئة خاصة تسمى 'مجهول'. تحافظ الطريقة على جميع العينات المتاحة، ويكون النموذج حرا في تحديد ما إذا كان الاختفاء نفسه تنبؤيا. ثم تم تطبيق ترميز الوحدة الساخنة على المتغيرات التصنيفية لتمكينها من التوافق مع نماذج التعلم الآلي. جميع المعالجة المسبقة، مثل التعيين، الترميز، وما إلى ذلك، كانت تجرى فقط على مجموعة التدريب، وتم إجراء نفس التحويلات على مجموعات التحقق والتجارب لتجنب فقدان البيانات. لم يتم استبعاد أي عينات فقط بسبب نقص البيانات الوصفية السريرية، وهذا ضمن الاستفادة القصوى من البيانات، ووجود اتساق منهجي.

الشكل 1: نظام متعدد الوسائط لتصنيف آفات الجلد. يجمع نهج الدراسة بين ميزات صور التنظير الجلدية وبيانات المرضى الوصفية لتصنيف آفات الجلد باستخدام نماذج التعلم العميق الجماعية. يشمل الإطار المعالجة المسبقة، واستخراج الميزات، والدمج متعدد الوسائط، والتصنيف، مما يسمح بتحسين الأداء التشخيصي وقابلية التفسير. يرجى الضغط هنا لعرض نسخة أكبر من هذا الشكل.

يعرض سير العمل خط التصنيف المقترح، بناء على صور تنظير الجلد والبيانات الوصفية السريرية لمجموعة بيانات آفات الجلد HAM10000. تستخدم EfficientNet-B4 وDenseNet201 وMobileNetV2 لمعالجة واستخراج الميزات العميقة في الصور. يتم ترميز البيانات الوصفية السريرية، ويستخدم دمج الميزات لدمج ميزات الصورة مع البيانات الوصفية السريرية. لمعالجة مشكلة عدم توازن الطبقات، تستخدم تقنية توازن الفئات في فضاء الميزات متعددة الوسائط المدمجة بدلا من الصور الخام أو تدفقات الميزات الفردية، حيث تحافظ العينات التركيبية على مزيج من الخصائص البصرية والسريرية ولا تنتج عينات غير واقعية. ثم يتم تدريب الميزات المدمجة على مصنفات مثل XGBoost وLightGBM ومصنف عصبي عميق.

الشكل 2: أمثلة على صور الديرموسكوب من سبع مجموعات تشخيصية مختلفة من مجموعة بيانات HAM10000. تظهر الصور الميزات البصرية النموذجية المستخدمة في التصنيف الآلي. (أ) الكيراتوز الأكتينية (akiec)، تظهر أسطحا خشنة مع تصبغ غير منتظم. (ب) سرطان الخلايا القاعدية (BCC)، ذو أشكال غير منتظمة وأوعية دموية غير منتظمة. (ج) آفات شبيهة بالقرنية الحميدة (bkl)، تظهر سمات قرنية ذات أسطح بنية فاتحة. (د) ديرماتوفيبروما (df)، بمظهر مركزي يشبه الندبة وتصبغ. (ه) نيفيات ميلانوسيتية (nv)، والخلمات الحميدة والمتماثلة نسبيا. (و) آفات وعائية (وعائية)، تظهر مظهرا بنفسجيا مائل إلى الأحمر بسبب الأوعية الدموية. (G) الميلانوما (mel)، الذي يظهر كآفة غير منتظمة الشكل، غير متماثلة، ومتعددة الصبغات. يرجى الضغط هنا لعرض نسخة أكبر من هذا الشكل.

تكشف هذه الصور الجلدية عن التباين البصري لآفات الجلد، التي لها اختلافات في التصبغ والملمس والشكل الشكلي للبنية. تشكل هذه الاختلافات تحديا كبيرا لأنظمة التصنيف الآلي وتؤكد أهمية أنظمة التعلم العميق. تقنيات استخراج الميزات التي تكون حساسة لكشف أنماط تشخيصية دقيقة. بعد وصف مجموعة البيانات، يوضح الشكل 2 الفئات السبع للآفات الجلدية المدرجة في مجموعة بيانات HAM10000، والتي تدرس عادة في أبحاث التصوير التشخيصي الجلدي. تشمل هذه الفئات السرطانات الأكتينية (akiec)، سرطان الخلايا القاعدية (BCC)، القرنية الحميدة (bkl)، الديرماتوفيبروما (df)، النفث الخلوي الميلانوسي (nv)، الآفات الوعائية (الأوعية الدموية)، والميلانوما (mel)²¹. جميع هذه الأنواع من الآفات لها خصائص بصرية فريدة، كما هو موضح في الشكل 3، والتي تشمل التفاوت في أنماط التصبغ، وملمس السطح، وتوزيع الألوان، والشذوذات على طول حدود الآفات. تختلف الخصائص البصرية لجميع هذه الآفات، وتتميز بتنوع أنماط التصبغ، وملمس السطح، وتوزيع الألوان، والشذوذات على أطراف الآفات. هذه خصائص مهمة يأخذها أطباء الجلد في الاعتبار عند إجراء الفحص السريري، ولذلك يجب نمذجة نماذج التعلم الآلي بشكل جيد للحصول على التصنيف الصحيح. على الرغم من أن هذه هي الخصائص المميزة، إلا أن العديد من هذه الآفات تبدو متطابقة تقريبا، مما يصعب التمييز بينها عند النظر فقط إلى صور الجلدية. التمييز بين أنواع معينة من الآفات عادة ما يكون دقيقا جدا لكنه ذو صلة سريرية، مما يجعل من الصعب تصنيفها تلقائيا. لهذا السبب من الضروري إنشاء نماذج ذكاء اصطناعي قوية قادرة على التدريب على تعلم صور بصرية دقيقة وفروق دقيقة في الآفات بين فئات الآفات. لن تعزز هذه الخصائص فقط بالوصف المناسب، مما يؤدي إلى تحسين مهارات التمييز لدى النموذج مع أنواع مختلفة من الآفات، بل سيساعد أيضا في تشخيص بعض الحالات الخطرة، مثل الميلانوما، في وقت مبكر. وأخيرا، يمكن أن يعزز دقة التشخيص، ويعلم الأطباء باتخاذ قرارات تؤدي إلى نتائج أفضل للمرضى، ويساعد في اتخاذ قرارات أفضل.

الشكل 3: توزيع آفات الجلد حسب الفئة في مجموعة البيانات HAM10000. يوضح الشكل توزيع الفئات السبع للآفات التي تم تناولها في هذه الدراسة: القرنية الأكتينية (akiec)، سرطان الخلايا القاعدية (BCC)، آفات شبيهة بالقرنية الحميدة (bkl)، الجلدية الدماغية (df)، الآفات الصبغية الوعائية (vasc)، والميلانوما (mel). يوضح هذا الرسم البياني اختلال التوازن الطبقي في فئات الآفات. يرجى الضغط هنا لعرض نسخة أكبر من هذا الشكل.

يظهر تحليل مجموعة البيانات وجود خلل في فئات أنواع الآفات المختلفة. النوع الأكثر شيوعا من نيفي الميلانوسي (nv)، مع حوالي 6,705 عينات، هو النوع الأكثر شيوعا، يليه الميلانوما (1,113) والقرنية الحميدة (1,099). على العكس، هناك بعض أشكال الآفات ذات الأهمية السريرية التي تقل تمثيلا بشكل ملحوظ، مثل الجلدية الورمية (115) والآفات الوعائية (142). يشكل هذا التفاوت تهديدا لنماذج التعلم الآلي لأنها قد تكون متحيزة لصالح الفئات الأغلبية ولا تكون قادرة على اكتشاف آفات غير عادية لكنها ذات أهمية سريرية. للتعامل مع هذه المشكلة وتحسين تدريب النموذج على أداء النموذج بالنسبة لجميع الفئات، هناك حاجة إلى معالجة مسبقة متقدمة. هناك حاجة إلى استراتيجيات. تشمل هذه تقنيات مثل تعزيز البيانات المستهدف وموازنة الفئات. يمكن موازنة البيانات باستخدام التقنية (تقنية موازنة الفئات وتعديل وزن الطبقات) التي تشجع النموذج على اكتشاف اتجاهات جوهرية في الفئات الممثلة تمثيلا ناقصا. تم ضبط المعاملات الفائقة المستخدمة في XGBoost وLightGBM بشكل أساسي على تكويناتها الافتراضية، مع تعديلات طفيفة بناء على تجارب أولية. بالنسبة للمصنف العصبي العميق، تم اختيار معلمات معمارية وتدريبية مثل عدد الطبقات، الخلايا العصبية، معدل التعلم، حجم الدفعة، وعدد الفترات تجريبية باستخدام بيانات التحقق. تم توفير المجموعة الكاملة من المعاملات الفائقة في الجدول 3. بشكل عام، عدد الصور الجلدية المستخدمة في هذه الدراسة هو 10,015 صورة إجمالا. وهذا يوفر مجموعة ضخمة من البيانات التي يمكن تدريبها واختبارها، وهو معيار ممل لكنه مجز أيضا. تقييم فعالية نظام تصنيف آفات الجلد المقترح.

معالجة البيانات المسبقة

تجهز خط أنابيب المعالجة المسبقة مجموعة البيانات HAM10000 للتعلم متعدد الوسائط من خلال توحيد الصور، واستخراج الميزات العميقة، ودمج البيانات الوصفية السريرية، ومعالجة اختلال التوازن بين الفئات.

توحيد الصورة: تم تغيير حجم جميع صور التنظير الجلدي إلى 224 × 224 بكسل وتم تطبيعها باستخدام تطبيع درجة z.

المعادلة 1 (1)

حيث أمثل الصورة الخام، μ يرمز إلى المتوسط بالبكسل، و σ هو الانحراف المعياري.

استخراج الميزات العميقة: تم استخراج الميزات العميقة المكملة باستخدام ثلاث شبكات عصبية الالتفافية مدربة مسبقا: Efficient-Net B4، DenseNet201، بالإضافة إلى MobileNetV2. تقوم كل شبكة بتعيين الصورة المعادرة إلى متجه ميزة.

المعادلة 2 (2)

تم دمج الميزات المستخرجة لتشكيل تمثيل موحد:

F_Fusion=F_EffB4 ||ف_كثيف ||F_MobV2 (3)

(حيث || تعني التسلسل)

دمج البيانات الوصفية السريرية: تم تنظيف السمات السريرية، بما في ذلك العمر والجنس بالإضافة إلى تحديد مكان الآفات، وترميز المسميات، وتطبيعه باستخدام الحد الأدنى لتحديد المقياس:

المعادلة 4 (4)

تم دمج متجه البيانات الوصفية_{المعالجة M السريري}مع ميزات الصورة لبناء المدخل متعدد الوسائط النهائي:

F_مجتمعة =_{F دمج}M_سريري (5)

تقسيم مجموعات البيانات: تم تطبيق تقسيم طبقي للحفاظ على توزيع الفئات

_قطار D،_اختبار D=انقسام (F_متوافق، 0.8) (6)

التعامل مع عدم توازن الطبقات: تعاني مجموعة البيانات HAM10000 من اختلال شديد في الفئات، حيث تسود عينات "النيفوس" (NV) كعينات ممثلة تمثيلا ناقصا في مجموعات أقلية أخرى، مثل DF مع VASC. ولتقليل هذه المشكلة، تم استخدام "تقنية أخذ العينات الزائدة للأقليات الاصطناعية" (تقنية توازن الفئات). باستخدام عينات صناعية جديدة تم إنتاجها كالتالي:

x_new=x_i+ λ(x_zi- x_i) (7)

المعادلة 8

حيث x_i عينة فئة أقلية، x_zi هو أحد أقرب جيرانها، وλ هي قيمة عشوائية مأخوذة من توزيع منتظم بين 0 و1. العينة التركيبية، كما هو موضح في الشكل 4، تولد على طول المقطع الخطي الذي يربط x تحت i.وxent يربط x_i و_{x zi}.

الشكل 4: توزيع الفئة في مجموعة البيانات HAM10000 قبل وبعد تطبيق تقنية موازنة الفئات. (أ) قبل موازنة الفئات، مع عدم توازن بين فئات الآفات. (ب) بعد موازنة الفئات في فضاء الميزات المجمعة، حيث يكون تمثيل جميع الفئات متساويا لتجنب التحيز في عملية تدريب المصنفين. يرجى الضغط هنا لعرض نسخة أكبر من هذا الشكل.

لمعالجة مشكلة عدم توازن الطبقات في مجموعة البيانات HAM10000، يتم تطبيق تقنية العينة الزائدة للأقلية الاصطناعية (تقنية توازن الفئات). تقنية موازنة الطبقات تولد عينات تركيبية للفئات الأقلية عن طريق الاستيفاء بين نقاط البيانات الموجودة، مما يساعد على زيادة تمثيل فئات الآفات الممثلة تمثيلا ناقصا. النتيجة النهائية لإنتاج المزيد من الأمثلة لهذه الفئات الأقلية هي مجموعة بيانات أكثر توازنا بشكل عام، بالنسبة لجميع أنواع الآفات السبعة. هذا التمثيل المتوازن سيمكن نماذج التصنيف من التعلم بشكل أفضل مع كل فئة وتقليل التحيز مع الفئات الأغلبية. وبالتالي، فإن النموذج أكثر عدلا في التصنيف وحساس، خاصة فيما يتعلق بالآفات الجلدية النادرة ولكن المهمة سريريا.

إطار عمل تعليمي للحفاظ على الخصوصية

يقترح النظام المقترح نظاما متعدد الوسائط لتصنيف الآفات الآلي على الجلد يكون واعيا للخصوصية وقابلا للتفسير. الهدف النهائي للنظام هو تعزيز أداء التشخيص وفي الوقت نفسه، حماية المعلومات الحساسة للمرضى طوال عملية التدريب. خصوصية المرضى ضرورة أساسية في الممارسة الطبية لأن قوانين خصوصية بيانات الرعاية الصحية والاعتبارات الأخلاقية مهمة للغاية في بيئات الرعاية الصحية. لذا، سيشمل النموذج المقترح نموذج تعلم لامركزي يعتمد على أفكار التعلم الفيدرالي. في هذا البيئة اللامركزية، يتم تدريب النماذج على مجموعة من العملاء الموزعين بدلا من تجميع جميع بيانات المرضى في موقع مركزي. يقوم جميع العملاء المشاركين بتدريب النموذج محليا على بياناتهم الخاصة، ولا تغادر بيانات المرضى الخام البيئة المحلية. كبديل لنقل السجلات الطبية الحساسة، يتم إرسال تحديثات النموذج أو المعلمات إلى خادم مركزي ليتم تجميعها. يتيح هذا النهج التعاوني للتعلم المؤسسات أو مصادر البيانات المختلفة المساهمة في تدريب النماذج دون المساس بخصوصية البيانات.

لتكن w_t^(k) هي معلمات النموذج للعميل kth في التكرار t، ولتكن n_k هو حجم العينة في ذلك العميل. يتم حساب تحديث النموذج العالمي كما يلي:

المعادلة 8 (8)

تضمن هذه الاستراتيجية التجميعية أن يساهم العملاء ذوو مجموعات البيانات الأكبر بشكل متناسب أكثر في النموذج العالمي، مع السماح للعملاء الصغار بالمشاركة في عملية التعلم. من خلال تمكين التدريب التعاوني دون تبادل بيانات المرضى الخام، يحافظ الإطار المقترح على الخصوصية مع الاستفادة من المعرفة الموزعة عبر مجموعات البيانات.

الإعداد التجريبي الموحد

تم تصميم نظام تعلم اتحادي محاكى مع مجموعة بيانات HAM10000 لتأكيد كفاءة الإطار الواعي بالخصوصية المقدم. تم تقسيم البيانات إلى ثلاثة عملاء لمحاكاة بيئة متعددة المؤسسات واقعية مع بيانات غير موزعة (غير IID). كل عميل لديه مزيج مختلف من فئات الآفات، وهذا يمثل تباينا في العالم بين المراكز السريرية. تم تشغيل خط أنابيب استخراج الميزات متعدد الوسائط المماثل (EfficientNet-B4، DenseNet201، MobileNet V2، والبيانات الوصفية السريرية) محليا على كل عميل. في تدريبهم، قام العملاء بتحديث نماذجهم المحلية بأنفسهم، وكانت المعلمات التي تعلمها تتبادل فقط مع الخادم المركزي لتجميعها خوارزمية FedAvg. تمت مقارنة المقايضة بين الدقة التنبؤية والخصوصية بين النموذج الموحد ونهج التدريب المركزي لقياس أداء كل منهما. تظهر نتائج الاختبار المشار إليها في الشكل 5 أن النموذج الموحد يمكنه الأداء التنافسي، مع انخفاض طفيف فقط في الدقة مقارنة بالتعلم المركزي، وتحسن كبير في خصوصية البيانات.

الشكل 5: توزيع مجموعة البيانات HAM10000 على مستوى العميل. يظهر هذا توزيع بيانات آفات الجلد بين العملاء، مما يوضح التنوع في توزيع البيانات. هذا يوضح تباين البيانات بين العملاء، وهو جانب حاسم من جوانب التعلم الفيدرالي. يرجى الضغط هنا لعرض نسخة أكبر من هذا الشكل.

تم تقسيم التوزيعات غير المتجانسة (غير IID) للعملاء الذين تشكلوا في HAM10000 إلى ثلاث مجموعات لنمذجة الحالات السريرية الواقعية. توزيع فئات الآفات المختلفة داخل كل عميل مختلف، خاصة فئة النفوس (nv)، التي لا تتوزع بالتساوي بين المرضى. هذا الترتيب يعكس الصعوبات الواقعية للتعلم الفيدرالي، حيث لا توزع البيانات في المؤسسات بشكل متساو.

مقارنة الأداء: التعلم المركزي مقابل التعلم الفيدرالي

لتقييم فعالية إطار التعلم الموحد المقترح، تم إجراء تحليل مقارن بين استراتيجيات التدريب المركزي والاتحادي باستخدام مجموعة بيانات HAM10000، كما هو موضح في الشكل 6. في الإعداد المركزي، تم تجميع جميع عينات البيانات في مجموعة تدريب واحدة. حقق أفضل نموذج مركزي أداء، وهو الفرقة المكدسة، دقة إجمالية بلغت 96٪. على النقيض من ذلك، وزع الإعداد الموحد مجموعة البيانات عبر ثلاثة عملاء مع بيانات غير متطابقة (غير IID)، حيث قام كل عميل بتدريب النموذج محليا ومشاركة معلمات النموذج فقط باستخدام FedAvg. حقق النموذج الموحد دقة إجمالية تقارب 94٪، مما يعادل فارق أداء قدره 2٪ مقارنة بالنهج المركزي، كما هو موضح في الجدول 4. من المتوقع أن يكون هذا الانخفاض الهامشي بسبب التحسين اللامركزي وتوزيع البيانات المتجانس بين العملاء.

على الرغم من حدوث هذا التغيير الصغير، إلا أن النموذج الفيدرالي كان جيدا في التنبؤ. في التدريب المركزي، يظهر السلوك حسب الفئة أن غالبية الفئات، مثل نيفوس (nv) (درجة F1 = 1.00)، تبقى مستقرة، بينما الفئات الأقلية، مثل درماتوفيبروما (df) (درجة F1 ≈ 0.65–0.66)، أكثر حساسية لاختلال التوزيع، مما قد يؤثر على الأداء الفيدرالي أكثر. ومن الجدير بالذكر أن الهيكل الفيدرالي يقلل من فرص كشف معلومات المرضى الحساسة لأنه لا يتطلب مشاركة البيانات الطبية الخام بين العملاء.

الشكل 6: مقارنة التعلم الموحد مع التعلم المركزي. يقارن هذا الشكل نماذج التعلم باستخدام مقاييس الأداء مثل الدقة، والدقة، والاسترجاع، ودرجة F1. هذا يوضح قدرة التعلم الفيدرالي على تحقيق أداء يقارن بنهج التعلم التقليدي مع الحفاظ على الخصوصية. يرجى الضغط هنا لعرض نسخة أكبر من هذا الشكل.

تشير نتائج الجدول 4 إلى أن نموذج التعلم الموحد قادر على أن يكون تنافسيا، وأن انخفاض الدقة يكون فقط بمقدار طفيف يقارب 2٪ مقارنة بالنموذج المركزي. يمكن تفسير هذا الانخفاض الطفيف من خلال التحسين اللامركزي وتوزيع البيانات غير الداخلي (IID). ومع ذلك، يتمتع النموذج الفيدرالي بميزة كبيرة فيما يتعلق بحماية الخصوصية، حيث لا يتم مشاركة المعلومات الحساسة للمرضى بين العملاء. لتوفير مقارنة عادلة بين النموذج الموحد ونموذج المجموعات المركزية المكدسة، تم اختبار النموذج الموحد بنفس البنية التحتية والمعاملات الفائقة. الجانب الذي يناقش في هذه الدراسة للحفاظ على الخصوصية هو جانب مفاهيمي ويهدف إلى تسليط الضوء على إمكانية دمج تقنيات مثل التعلم الموحد في الأعمال المستقبلية. لا يتم إجراء أي تحقق تجريبي لآليات حفظ الخصوصية في التنفيذ الحالي.

دمج الميزات متعددة الوسائط

عادة ما يشمل تشخيص الآفات الجلدية مراقبة الجلد والتاريخ الطبي السريري. في معظم الحالات، لا يقتصر أطباء الجلدية على النظر في صور المنظار الجلدية فقط من خلال وضعها في مقارنتها بمعلومات المريض (العمر، الجنس، وموقع الآفات) لاتخاذ أحكامهم التشخيصية. يعتمد النظام المقترح على إلهام هذا العمل السريري ويدمج نهجا متعدد الوسائط لتعلم دمج البيانات القائمة على الصور والبيانات السريرية. يتم تدريب CNNs على ميزات عميقة في صورة التنظير الجلدية الموجودة مسبقا. تتعرف هذه الشبكات على تصاميم بصرية معقدة، بما في ذلك تغيرات الألوان، وأشكال الآفات، والشذوذات الهيكلية، وميزات النسيج. ومع ذلك، قد لا تكون ميزات الصور كافية لالتقاط الوضع السريري للآفة. وبالتالي يتم تضمين البيانات الوصفية السريرية المتعلقة بكل صورة أيضا في التعلم. سيتم إنشاء وحدة دمج ميزات تدمج ميزات الصورة العميقة مع السمات السريرية المعالجة والمعلومات الديموغرافية. يشكل هذا التمثيل المركب تمثيلا متكاملا متعدد الوسائط يتكون من معلومات بصرية وسياقية لكل آفة. يمكن للنموذج دمج عدة مصادر بيانات للحصول على أنماط مكملة تعزز القدرة الشاملة على التصنيف. يتيح التمثيل متعدد الوسائط للنظام التمييز بشكل أكثر فعالية بين الآفات المتشابهة بصريا بالإضافة إلى أخذ المؤشرات السريرية في الاعتبار. النموذج أكثر معنى وفعالية سريريا لأنه تقريب أقرب لكيفية دراسة أطباء الجلد للآفات في الممارسة السريرية.

التعلم الجماعي المكدس
يستخدم الإطار المقترح استراتيجية التعلم الجماعي المكدس لتحسين القدرة التنبؤية للنظام بشكل أكبر. التعلم الجماعي هو طريقة مركبة للتنبؤ تستخدم نموذجين أو أكثر للتنبؤ لتعزيز التعميم وتقليل أخطاء التنبؤ التي قد تحدث مع نماذج واحدة. يتم تدريب المتعلمين الأساسيين المتعدد بشكل مستقل على تمثيل الميزات متعددة الوسائط بدلا من استخدام مصنف واحد. جميع المتعلمين الأساسيين يقدمون تقديرا لمدى احتمال أن تكون عينة معينة من فئة آفة معينة. ثم يتم تجميع هذه التنبؤات الاحتمالية على مستوى فوقي. يتم تعيين وزن لكل متعلم أساسي لإظهار أهميته النسبية للتوقع النهائي. تستخدم دالة تفعيل سوفتماكس لحساب الناتج المجمع لتوليد احتمالات فئة مطبعة. طريقة المجموعات المكدسة لها عدد من الفوائد. أولا، يقلل من تباين التنبؤ الناتج عن دمج نماذج مختلفة وبالتالي يعزز أداء التعميم. ثانيا، يعزز القوة لأن النماذج المختلفة تصف اتجاهات مختلفة في البيانات. ثالثا، يعزز التعلم الجماعي تصنيف فئات الآفات الأقلية، خاصة في البيانات الطبية، حيث لا تكون بعض الحالات ذات الاهتمام السريري شائعة بنفس القدر.

تكامل ذكاء اصطناعي قابل للتفسير

يجب أن تقدم أنظمة الذكاء الاصطناعي الطبي أيضا تفسيرات واضحة لاختياراتها، رغم أن دقة التنبؤ العالية أمر بالغ الأهمية. لوضع الثقة في أنظمة الذكاء الاصطناعي وأن يكونوا فعالين في ممارستها، يجب أن يكون الأطباء قادرين على فهم كيف يتناسب النموذج مع التشخيص الذي ينتجه. ولتلبية هذه الحاجة، يدمج الإطار المقترح طرق الذكاء الاصطناعي القابل للتفسير (XAI)، كما هو موضح في الشكل 7.

الشكل 7: مصفوفات الالتباس لنماذج التصنيف المختلفة لتصنيف آفات الجلد متعددة الفئات. (أ) XGBoost، (ب) LightGBM، (ج) المصنف العصبي العميق، و(د) نموذج المجموعات المكدسة. تظهر كل مصفوفة ارتباك العلاقة بين الفئة الحقيقية (الصفوف) والفئة المتوقعة (الأعمدة) لجميع أنواع آفات الجلد السبعة: akiec، bcc، bkl، df، mel، NV، وvasc. نماذج XGBoost وLightGBM تؤدي أداء جيدا لفئات nv وbkl، رغم وجود بعض الالتباس بين mel و nv. يحسن المصنف العصبي العميق تصنيف bkl و df ويقلل من الارتباك خارج الاتجاه القطري. يظهر نموذج المجموعات المكدسة أكبر قدر من الاتساق في التصنيف، حيث يصبح القطر أكثر هيمنة. يرجى الضغط هنا لعرض نسخة أكبر من هذا الشكل.

يشمل النظام نهجين شائعين للتفسير (تقنية قابلية تفسير النموذج (تفسيرات شابلي الإضافية) وتقنية تفسير النموذج (تفسيرات محلية غير معتمدة على النموذج)) لإعطاء نظرة عميقة عما يتنبأ به النموذج. تشرح طريقة قابلية تفسير النموذج الميزات على مستوى الميزات من خلال قياس مدى مساهمة كل ميزة مدخلة في التنبؤ العام. يساعد في تحديد المتغيرات السريرية/الخصائص البصرية التي لها أكبر تأثير على نتيجة التصنيف. وهذا يمكن الباحثين والأطباء من رؤية السلوك العام للنموذج عبر مجموعة البيانات. أما تقنية تفسير النموذج، فهي تتعامل مع التفسيرات المحلية للتنبؤات الفردية. يركز على المناطق في صورة التنظير الجلدية التي لها أكبر تأثير على قرار النموذج. تمكن هذه التفسيرات البصرية على مستوى البكسل الأطباء من فحص مناطق الآفة التي أثرت على التصنيف بصريا. يوفر الإطار المقترح قابلية تفسير عالمية ومحلية؛ يتم تحقيق ذلك من خلال دمج تقنية قابلية تفسير النموذج. تعزز آلية التفسير المزدوج الشفافية وتمكن الأطباء من تقييم ما إذا كان النموذج يستهدف أنماطا طبية ذات دلالة طبية.

إمكانات دعم اتخاذ القرار السريري

التعلم الذي يحافظ على الخصوصية، ودمج الميزات متعددة الوسائط، ونمذجة المجموعات، والذكاء الاصطناعي القابل للتفسير هي مكونات رئيسية لنظام متكامل وقوي لتصنيف آفات الجلد تلقائيا. من الناحية المثالية، يجب ألا يكون النظام فقط يتمتع بقوة تنبؤية عالية، بل أيضا شفافا وآمنا، وهما عاملان رئيسيان في الأنظمة الطبية، كما هو موضح في الشكل 8.

الشكل 8: منحنيات خصائص تشغيل المستقبل (ROC) لنموذج المجموعة المكدسة. (A–C) يظهر هذا منحنيات ROC لأنواع آفات الجلد السبعة، مع معدل الإيجابية الحقيقية (الحساسية) ومعدل الإيجابية الكاذبة (خصوصية 1). تمثل المساحة تحت المنحنى (AUC) أداء نموذج المجموعات المكدسة في التمييز بين الفئات. يرجى الضغط هنا لعرض نسخة أكبر من هذا الشكل.

يوفر هذا النظام توقعات قابلة للتفسير وحماية للخصوصية. وبالتالي، فهو نظام مفيد لأنظمة تشخيص الأمراض الجلدية الأخرى. يتيح هذا النظام للممارسين الصحيين/أطباء الجلدية تقييم الشكوك في الآفات وتحسين دقة التشخيص، ونتيجة لذلك، يساعد الممارسين/أطباء الجلدية على تشخيص المرضى في مرحلة مبكرة عندما قد يكون لديهم مرض أكثر خطورة (مثل الميلانوما). في جوهره، كما هو موضح في الشكل 9، يسعى هذا النظام إلى تطبيق تقنيات استخدام أنظمة الذكاء الاصطناعي عالية التقنية وتطبيق التطبيقات الواقعية، لمساعدة أطباء الجلدية على تشخيص المرضى بدقة أكبر وبثقة أكبر مع ضمان خصوصية وأمان المرضى وراحتهم.

الشكل 9: نتائج التفسير باستخدام تقنيات تفسير النموذج لتصنيف آفات الجلد متعددة الفئات. (أ) مخطط SHAP يظهر مساهمات الميزات التي تؤثر على تنبؤات الآفات الحميدة والخبيثة. (ب) شرح LIME لتوقع BCC، يوضح الميزات التي تساهم إيجابيا وسلبيا في نتيجة التصنيف. (ج) شرح LIME لتوقع akiec، مع تسليط الضوء على أكثر الميزات تأثيرا في عملية اتخاذ القرار في النموذج. تظهر هذه التصورات القابلة للتفسير المناطق والميزات المستخرجة التي تؤثر بشكل كبير على توقعات النموذج، مما يحسن الشفافية وفهم عملية التصنيف في تقييم آفات الجلد. يرجى الضغط هنا لعرض نسخة أكبر من هذا الشكل.

استراتيجية التقييم

لتجنب تحيز العينة والحفاظ على توزيع الفئة الأصلي عبر جميع فئات آفات الجلد، تم تقسيم مجموعة البيانات إلى تقسيم قطار واختبار بنسبة 80:20. ثم تم تقسيم مجموعة التدريب بنسبة 90:10 train : validate، لضبط المعاملات الفائقة وتحسين النموذج. لم تستخدم مجموعة الاختبار في عملية التدريب في أي مرحلة، وتم تطبيقها فقط في نهاية عملية التدريب كاختبار نهائي لتجنب تسرب البيانات وضمان تقييم أداء غير متحيز. تمت معالجة جميع النماذج مسبقا وتدريبها في بيئات متساوية، وتم تقسيم البيانات وتعزيزها بنفس الطريقة، وطبقت بروتوكولات التقييم واتباعها بنفس الطريقة، مما سمح بمقارنات عادلة وقابلة للتكرار. تم تقييم النماذج بدقة بناء على الدقة، والدقة، والاستدعاء، ودرجة F1، وAUC، مع تحليل مفصل للنتائج حسب الفئة لتحديد مدى قوتها لكل من الفئات الرئيسية والأقلية من الآفات. ستساعد هذه الأداة الموحدة للتحقق في زيادة موثوقية وشفافية وقابلية التعميم للنهج المقترح، وتجاوز التناقضات المحتملة في تقارير الأداء.

Access restricted. Please log in or start a trial to view this content.

Results

$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

تم تقييم أربع طرق تصنيف (XGBoost، LightGBM، مصنف عصبي عميق، ونموذج مجموعة مكدسة) لتصنيف آفات الجلد متعددة الفئات. حققت النماذج دقة إجمالية بلغت 92٪، 90٪، 94٪، و96٪ على التوالي، مما يثبت أن c

الأداء حسب الفئة

يتم تقديم تقييم تفصيلي حسب الفئة، يشمل الدقة، والاستدعاء، ودرجة F1 لكل فئة آفة. بالنسبة لفئة أكيك (الدعم = 65)، حققت المجموعة المكدسة دقة بلغت 0.72، واستدعاء 0.73، ودرجة F1 بلغت 0.72، مع تحسن طفيف مقارنة ب XGBoo...

Access restricted. Please log in or start a trial to view this content.

Discussion

$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

يحدد البروتوكول الحالي خط أنابيب قابل للتكرار لإنشاء إطار عمل متعدد الوسائط وحساس للخصوصية قابل للتفسير لتصنيف آفات الجلد تلقائيا. يتبع البروتوكول نمطا منهجيا لتعزيز الأداء التشخيصي من خلال شفافية النماذج، ويجمع بين تحليل الصور بالمنظار الجلدي مع البيانات الوصفية السريرية وطرق التعلم الآلي القابلة للتفسير. مجموعة بيانات آفات الجلد HAM10000 متاحة للجمهور وتسمح بالتقييم الموحد وتسهل إمكانية تكرار المزيد من الأبحاث في مجال أبحاث الصور الجلدية¹⁶. تعد خطوة معالجة الصور...

Access restricted. Please log in or start a trial to view this content.

Disclosures

$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

المؤلفون ليس لديهم ما يكشفون عنه. ليس لدينا تضارب مصالح. يصرح المؤلفون بأن أدوات الذكاء الاصطناعي كانت تستخدم فقط لتحرير وتنسيق اللغة. تم تطوير والتحقق من جميع المحتوى العلمي والتحليلات والتفسيرات من قبل المؤلفين.

Acknowledgements

$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

يشكر المؤلفون جامعة MVN في بالوال على تقديم الإرشاد الأكاديمي والدعم البحثي. كما يقر المؤلفون بمجموعة بيانات آفات الجلد HAM10000 المتاحة للجمهور، والتي استخدمت في التقييم التجريبي لهذه الدراسة.

Access restricted. Please log in or start a trial to view this content.

Materials

```html

List of materials used in this article
Name	Company	Catalog Number	Comments
بنية DenseNet201 CNN	IBM	https://arxiv.org/abs/1608.06993	نموذج التعلم العميق لتصنيف الصور
بنية EfficientNet-B4 CNN	Google	https://arxiv.org/abs/1905.11946	نموذج التعلم العميق لتصنيف الصور
منصة Google Colaboratory	Google	https://colab.research.google.com	بيئة حسابية قائمة على السحابة
مجموعة بيانات HAM10000 لآفات الجلد	Harvard Dataverse	https://doi.org/10.7910/DVN/DBW86T	مجموعة بيانات للصور الجلدية
واجهة برمجة التطبيقات Keras للتعلم العميق	Google	الإصدار 2.x	واجهة برمجة التطبيقات للشبكات العصبية
مكتبة قابلية التفسير LIME	مشروع LIME	الإصدار 0.x	تقنية قابلية تفسير النموذج
بنية MobileNetV2 CNN	Google	https://arxiv.org/abs/1801.04381	نموذج التعلم العميق لتصنيف الصور
مكتبة التصور Matplotlib	فريق تطوير Matplotlib	الإصدار 3.x	يستخدم لإنشاء الرسوم البيانية وتصور الأداء
GPU من NVIDIA	NVIDIA	سلسلة RTX	أجهزة الحوسبة لتدريب النماذج
مكتبة الحوسبة العددية NumPy	مطورو NumPy	الإصدار 1.x	برنامج تحليل البيانات
مكتبة معالجة الصور OpenCV	مؤسسة OpenCV	الإصدار 4.x	مكتبة معالجة الصور
مكتبة تحليل البيانات Pandas	فريق تطوير Pandas	الإصدار 1.x	برنامج تحليل البيانات
بيئة برمجة Python	مؤسسة برمجيات Python	الإصدار 3.9+	برنامج تحليل البيانات
مكتبة قابلية التفسير SHAP	مشروع SHAP	الإصدار 0.x	تقنية قابلية تفسير النموذج
تقنية SMOTE لزيادة العينات	مشروع imbalanced-learn	الإصدار 0.x	تقنية موازنة الفئات للتعامل مع مجموعات البيانات غير المتوازنة
مكتبة التعلم الآلي Scikit-learn	مشروع scikit-learn	الإصدار 1.x	مكتبة التعلم الآلي
إطار التعلم العميق TensorFlow	Google	الإصدار 2.x	إطار عمل التعلم العميق

```

Reprints and Permissions

Request permission to reuse the text or figures of this JoVE article

Request Permission

إطار عمل متعدد الوسائط للحفاظ على الخصوصية قابل للتفسير لتصنيف آفات الجلد

In This Article

Summary

Abstract

Introduction

Protocol

Results

Discussion

Disclosures

Acknowledgements

Materials

Reprints and Permissions

Tags

Related Articles