$$\rightleftharpoonup{xx}$$
$$\longleftharp{xx}$$,
$$\longrightharp{xx}$$,
استخدمت هذه الدراسة مجموعات بيانات تنظير الجلد المتاحة للجمهور ومجهولة الهوية بالكامل ولم تتضمن مشاركة بشرية مباشرة؛ لذلك، لم تكن موافقة لجنة الأخلاقيات مطلوبة. يحتوي جدول المواد على تفاصيل جميع المواد أو الأدوات المستخدمة في هذه الدراسة. يتضمن الجدول 1 تفاصيل بيئة الأجهزة والبرمجيات، مثل نوع المعالج، الذاكرة، نظام التشغيل، وأطر البرمجيات. يتضمن الجدول 2 تفاصيل الدقة حسب الفئة، والاستدعاء، ودرجة F1، والدعم لكل فئة من أنواع آفات الجلد.
سير العمل العام لإطار تصنيف آفات الجلد متعدد الوسائط المقترح
الخطة العامة لهذا البحث هي إنشاء مخطط دقيق ومفهوم لتصنيف متعدد الآفات الجلدية. يبدأ سير العمل بجمع البيانات ومعالجتها المسبقة لمجموعة البيانات HAM10000، ثم ينتقل إلى استخراج الميزات باستخدام بنى التعلم العميق وإدراج بيانات وصفية سريرية. بعد ذلك، يتم تدريب وتحسين عدة مصنفات تعلم آلة، وتجمع نتائجها في استراتيجية جماعية. وأخيرا، تفسر تنبؤات النموذج باستخدام تقنيات القابلية للتفسير، ويتم تقييم فعالية النموذج لاستخدامه في دعم اتخاذ القرار السريري في العالم الحقيقي.
لتحسين دقة التنبؤ للنظام المقترح، يستخدم خط أنابيب تعلم آلي متعدد الوسائط، يجمع بين الميزات القائمة على الصور والبيانات الوصفية السريرية (كما هو موضح في الشكل 1). يمكن للنموذج تلخيص المخرجات البصرية لصور التنظير الجلدية مع المعلومات المتعلقة بالمريض لتحديد أنماط أكثر تفصيلا تتعلق بآفات الجلد المختلفة. مع هذا التركيب، يمكن للنظام أن يقدم توقعات أفضل، وهذا سيحدث في النهاية. تحسين جودة وفائدة تصنيف آفات الجلد. يتم استخراج ثلاث ميزات عميقة ملتفة مدربة مسبقا بمساعدة الشبكات العصبية (EfficientNet-B4، DenseNet201، وMobileNetV2): وهي قادرة على التقاط أنماط متكاملة من صور التنظير الجلدي. تتعلم هذه الهياكل أنماطا عالية المستوى في شكل آفات الجلد، مثل التغيرات في اللون والملمس، وطريقة بنائها. ثم تجمع وحدة دمج الميزات الميزات العميقة مع الميزات السريرية والبيانات الديموغرافية لتكوين ميزة متعددة الوسائط غنية. ثم يتم تقسيم البيانات المدمجة إلى بيانات تدريب، وتحقق من الصحة، وبيانات اختبار لضمان اختبار النماذج المناسب. بعد ذلك، يستخدم وحدة دمج الميزات لدمج الميزات العميقة مع الميزات السريرية والديموغرافيا لإنتاج ميزة متعددة الوسائط غنية. ثم يتم تقسيم هذه البيانات إلى بيانات تدريب، اختبار، وبيانات تحقق لاختبار النموذج. تستخدم استراتيجية المجموعات لتعزيز دقة التنبؤ بشكل أكبر. يتم ذلك عن طريق حساب نتائج عدة نماذج والوصول إلى التنبؤ النهائي باستخدام تلك الاحتمالات المتوسطة لتعزيز التعميم وتقليل التباين الذي كان من الممكن أن تسببه النماذج الفردية. بالإضافة إلى ذلك، يتم دمج طرق التفسير، مثل تقنيات تفسير النماذج، لشرح كيفية اتخاذ النموذج قراراته بشكل أوسع. توفر طريقة تفسير النموذج تفسيرات على مستوى الميزات من خلال قياس مساهمة المتغيرات المدخلة، بينما تحدد طريقة قابلية تفسير النموذج المجالات المهمة داخل الصور الجلدية على مستوى البكسل تؤثر على التنبؤ. تقدم تقنيات تفسير النموذج تفسيرات على مستوى الميزة من خلال قياس مساهمة كل متغير إدخال، بينما تبرز تقنيات تفسير النموذج المناطق المهمة على مستوى البكسل داخل صور الديرموسكوب التي تؤثر على التوقع. مجتمعة، تجعل هذه التقنيات النماذج أكثر قابلية للتفسير وتساعد الأطباء على التعرف على طريقة اتخاذ النظام للقرارات. ونتيجة لذلك، يوفر خط الإنتاج المقترح نظاما مفهوما وواعا للخصوصية، مما يزيد من الشفافية والثقة ويتيح تشخيصا أكثر موثوقية لسرطان الجلد في بيئة رعاية صحية واقعية.
وصف مجموعة البيانات مع التحضير
في هذه الورقة، تستخدم مجموعة البيانات HAM10000 (الإنسان ضد الآلة مع 10,000 صورة تدريبية) كمجموعة بيانات رئيسية لتصنيف آفات الجلد متعددة الفئات. تحتوي مجموعة البيانات على أكثر من 10,000 صورة جلدية تم جمعها من مصادر طبية مختلفة. المصادر السريرية والمجموعات السكانية، مما يجعلها واحدة من أكثر مجموعات البيانات المعيارية استخداما في تحليل الصور الجلدية. كل صورة في مجموعة البيانات مصحوبة ببيانات وصفية سريرية مهمة، بما في ذلك معرفات الصور، والملصقات التشخيصية، وعمر المريض، وجنسه، والموقع التشريحي للآفة. تغطي مجموعة البيانات سبع فئات تشخيصية: القرنية القطبية (AKIEC)، سرطان الخلايا القاعدية (BCC)، القرنية الحميدة (BKL)، الديرماتوفيبروما (DF)، النيفيوس الميلانوسي (NV)، الآفات الوعائية (Vasc)، والميلانوما (MEL).
معالجة البيانات الوصفية السريرية
شملت الميزات المساعدة التي أضيفت إلى خط التصنيف بيانات وصفية سريرية، مثل العمر والجنس وموقع الآفة في المريض. كانت هناك قيم مفقودة أو غير معروفة، تم التعامل معها من خلال نهج معالجة مسبقة حتمية. في حالة متغير العمر (العددي)، تم استخدام العمر الوسيط المحسوب على مجموعة التدريب لحساب القيم المفقودة. سبب اختيار التخمين الوسيط هو مقاومته للبيانات الشاذة والبيانات المنحرفة التي تنتشر في البيانات السريرية. بالنسبة للجنس وموقع الآفة (المتغيرات التصنيفية)، لم تستبعد القيم المفقودة أو غير المحددة؛ تم تعيينهم في فئة خاصة تسمى 'مجهول'. تحافظ الطريقة على جميع العينات المتاحة، ويكون النموذج حرا في تحديد ما إذا كان الاختفاء نفسه تنبؤيا. ثم تم تطبيق ترميز الوحدة الساخنة على المتغيرات التصنيفية لتمكينها من التوافق مع نماذج التعلم الآلي. جميع المعالجة المسبقة، مثل التعيين، الترميز، وما إلى ذلك، كانت تجرى فقط على مجموعة التدريب، وتم إجراء نفس التحويلات على مجموعات التحقق والتجارب لتجنب فقدان البيانات. لم يتم استبعاد أي عينات فقط بسبب نقص البيانات الوصفية السريرية، وهذا ضمن الاستفادة القصوى من البيانات، ووجود اتساق منهجي.

الشكل 1: نظام متعدد الوسائط لتصنيف آفات الجلد. يجمع نهج الدراسة بين ميزات صور التنظير الجلدية وبيانات المرضى الوصفية لتصنيف آفات الجلد باستخدام نماذج التعلم العميق الجماعية. يشمل الإطار المعالجة المسبقة، واستخراج الميزات، والدمج متعدد الوسائط، والتصنيف، مما يسمح بتحسين الأداء التشخيصي وقابلية التفسير. يرجى الضغط هنا لعرض نسخة أكبر من هذا الشكل.
يعرض سير العمل خط التصنيف المقترح، بناء على صور تنظير الجلد والبيانات الوصفية السريرية لمجموعة بيانات آفات الجلد HAM10000. تستخدم EfficientNet-B4 وDenseNet201 وMobileNetV2 لمعالجة واستخراج الميزات العميقة في الصور. يتم ترميز البيانات الوصفية السريرية، ويستخدم دمج الميزات لدمج ميزات الصورة مع البيانات الوصفية السريرية. لمعالجة مشكلة عدم توازن الطبقات، تستخدم تقنية توازن الفئات في فضاء الميزات متعددة الوسائط المدمجة بدلا من الصور الخام أو تدفقات الميزات الفردية، حيث تحافظ العينات التركيبية على مزيج من الخصائص البصرية والسريرية ولا تنتج عينات غير واقعية. ثم يتم تدريب الميزات المدمجة على مصنفات مثل XGBoost وLightGBM ومصنف عصبي عميق.

الشكل 2: أمثلة على صور الديرموسكوب من سبع مجموعات تشخيصية مختلفة من مجموعة بيانات HAM10000. تظهر الصور الميزات البصرية النموذجية المستخدمة في التصنيف الآلي. (أ) الكيراتوز الأكتينية (akiec)، تظهر أسطحا خشنة مع تصبغ غير منتظم. (ب) سرطان الخلايا القاعدية (BCC)، ذو أشكال غير منتظمة وأوعية دموية غير منتظمة. (ج) آفات شبيهة بالقرنية الحميدة (bkl)، تظهر سمات قرنية ذات أسطح بنية فاتحة. (د) ديرماتوفيبروما (df)، بمظهر مركزي يشبه الندبة وتصبغ. (ه) نيفيات ميلانوسيتية (nv)، والخلمات الحميدة والمتماثلة نسبيا. (و) آفات وعائية (وعائية)، تظهر مظهرا بنفسجيا مائل إلى الأحمر بسبب الأوعية الدموية. (G) الميلانوما (mel)، الذي يظهر كآفة غير منتظمة الشكل، غير متماثلة، ومتعددة الصبغات. يرجى الضغط هنا لعرض نسخة أكبر من هذا الشكل.
تكشف هذه الصور الجلدية عن التباين البصري لآفات الجلد، التي لها اختلافات في التصبغ والملمس والشكل الشكلي للبنية. تشكل هذه الاختلافات تحديا كبيرا لأنظمة التصنيف الآلي وتؤكد أهمية أنظمة التعلم العميق. تقنيات استخراج الميزات التي تكون حساسة لكشف أنماط تشخيصية دقيقة. بعد وصف مجموعة البيانات، يوضح الشكل 2 الفئات السبع للآفات الجلدية المدرجة في مجموعة بيانات HAM10000، والتي تدرس عادة في أبحاث التصوير التشخيصي الجلدي. تشمل هذه الفئات السرطانات الأكتينية (akiec)، سرطان الخلايا القاعدية (BCC)، القرنية الحميدة (bkl)، الديرماتوفيبروما (df)، النفث الخلوي الميلانوسي (nv)، الآفات الوعائية (الأوعية الدموية)، والميلانوما (mel)21. جميع هذه الأنواع من الآفات لها خصائص بصرية فريدة، كما هو موضح في الشكل 3، والتي تشمل التفاوت في أنماط التصبغ، وملمس السطح، وتوزيع الألوان، والشذوذات على طول حدود الآفات. تختلف الخصائص البصرية لجميع هذه الآفات، وتتميز بتنوع أنماط التصبغ، وملمس السطح، وتوزيع الألوان، والشذوذات على أطراف الآفات. هذه خصائص مهمة يأخذها أطباء الجلد في الاعتبار عند إجراء الفحص السريري، ولذلك يجب نمذجة نماذج التعلم الآلي بشكل جيد للحصول على التصنيف الصحيح. على الرغم من أن هذه هي الخصائص المميزة، إلا أن العديد من هذه الآفات تبدو متطابقة تقريبا، مما يصعب التمييز بينها عند النظر فقط إلى صور الجلدية. التمييز بين أنواع معينة من الآفات عادة ما يكون دقيقا جدا لكنه ذو صلة سريرية، مما يجعل من الصعب تصنيفها تلقائيا. لهذا السبب من الضروري إنشاء نماذج ذكاء اصطناعي قوية قادرة على التدريب على تعلم صور بصرية دقيقة وفروق دقيقة في الآفات بين فئات الآفات. لن تعزز هذه الخصائص فقط بالوصف المناسب، مما يؤدي إلى تحسين مهارات التمييز لدى النموذج مع أنواع مختلفة من الآفات، بل سيساعد أيضا في تشخيص بعض الحالات الخطرة، مثل الميلانوما، في وقت مبكر. وأخيرا، يمكن أن يعزز دقة التشخيص، ويعلم الأطباء باتخاذ قرارات تؤدي إلى نتائج أفضل للمرضى، ويساعد في اتخاذ قرارات أفضل.

الشكل 3: توزيع آفات الجلد حسب الفئة في مجموعة البيانات HAM10000. يوضح الشكل توزيع الفئات السبع للآفات التي تم تناولها في هذه الدراسة: القرنية الأكتينية (akiec)، سرطان الخلايا القاعدية (BCC)، آفات شبيهة بالقرنية الحميدة (bkl)، الجلدية الدماغية (df)، الآفات الصبغية الوعائية (vasc)، والميلانوما (mel). يوضح هذا الرسم البياني اختلال التوازن الطبقي في فئات الآفات. يرجى الضغط هنا لعرض نسخة أكبر من هذا الشكل.
يظهر تحليل مجموعة البيانات وجود خلل في فئات أنواع الآفات المختلفة. النوع الأكثر شيوعا من نيفي الميلانوسي (nv)، مع حوالي 6,705 عينات، هو النوع الأكثر شيوعا، يليه الميلانوما (1,113) والقرنية الحميدة (1,099). على العكس، هناك بعض أشكال الآفات ذات الأهمية السريرية التي تقل تمثيلا بشكل ملحوظ، مثل الجلدية الورمية (115) والآفات الوعائية (142). يشكل هذا التفاوت تهديدا لنماذج التعلم الآلي لأنها قد تكون متحيزة لصالح الفئات الأغلبية ولا تكون قادرة على اكتشاف آفات غير عادية لكنها ذات أهمية سريرية. للتعامل مع هذه المشكلة وتحسين تدريب النموذج على أداء النموذج بالنسبة لجميع الفئات، هناك حاجة إلى معالجة مسبقة متقدمة. هناك حاجة إلى استراتيجيات. تشمل هذه تقنيات مثل تعزيز البيانات المستهدف وموازنة الفئات. يمكن موازنة البيانات باستخدام التقنية (تقنية موازنة الفئات وتعديل وزن الطبقات) التي تشجع النموذج على اكتشاف اتجاهات جوهرية في الفئات الممثلة تمثيلا ناقصا. تم ضبط المعاملات الفائقة المستخدمة في XGBoost وLightGBM بشكل أساسي على تكويناتها الافتراضية، مع تعديلات طفيفة بناء على تجارب أولية. بالنسبة للمصنف العصبي العميق، تم اختيار معلمات معمارية وتدريبية مثل عدد الطبقات، الخلايا العصبية، معدل التعلم، حجم الدفعة، وعدد الفترات تجريبية باستخدام بيانات التحقق. تم توفير المجموعة الكاملة من المعاملات الفائقة في الجدول 3. بشكل عام، عدد الصور الجلدية المستخدمة في هذه الدراسة هو 10,015 صورة إجمالا. وهذا يوفر مجموعة ضخمة من البيانات التي يمكن تدريبها واختبارها، وهو معيار ممل لكنه مجز أيضا. تقييم فعالية نظام تصنيف آفات الجلد المقترح.
معالجة البيانات المسبقة
تجهز خط أنابيب المعالجة المسبقة مجموعة البيانات HAM10000 للتعلم متعدد الوسائط من خلال توحيد الصور، واستخراج الميزات العميقة، ودمج البيانات الوصفية السريرية، ومعالجة اختلال التوازن بين الفئات.
توحيد الصورة: تم تغيير حجم جميع صور التنظير الجلدي إلى 224 × 224 بكسل وتم تطبيعها باستخدام تطبيع درجة z.
(1)
حيث أمثل الصورة الخام، μ يرمز إلى المتوسط بالبكسل، و σ هو الانحراف المعياري.
استخراج الميزات العميقة: تم استخراج الميزات العميقة المكملة باستخدام ثلاث شبكات عصبية الالتفافية مدربة مسبقا: Efficient-Net B4، DenseNet201، بالإضافة إلى MobileNetV2. تقوم كل شبكة بتعيين الصورة المعادرة إلى متجه ميزة.
(2)
تم دمج الميزات المستخرجة لتشكيل تمثيل موحد:
FFusion=FEffB4 ||فكثيف ||FMobV2 (3)
(حيث || تعني التسلسل)
دمج البيانات الوصفية السريرية: تم تنظيف السمات السريرية، بما في ذلك العمر والجنس بالإضافة إلى تحديد مكان الآفات، وترميز المسميات، وتطبيعه باستخدام الحد الأدنى لتحديد المقياس:
(4)
تم دمج متجه البيانات الوصفيةالمعالجة M السريري مع ميزات الصورة لبناء المدخل متعدد الوسائط النهائي:
Fمجتمعة =F دمجMسريري (5)
تقسيم مجموعات البيانات: تم تطبيق تقسيم طبقي للحفاظ على توزيع الفئات
قطار D،اختبار D=انقسام (Fمتوافق، 0.8) (6)
التعامل مع عدم توازن الطبقات: تعاني مجموعة البيانات HAM10000 من اختلال شديد في الفئات، حيث تسود عينات "النيفوس" (NV) كعينات ممثلة تمثيلا ناقصا في مجموعات أقلية أخرى، مثل DF مع VASC. ولتقليل هذه المشكلة، تم استخدام "تقنية أخذ العينات الزائدة للأقليات الاصطناعية" (تقنية توازن الفئات). باستخدام عينات صناعية جديدة تم إنتاجها كالتالي:
xnew=xi + λ(xzi - xi) (7)

حيث xi عينة فئة أقلية، xzi هو أحد أقرب جيرانها، وλ هي قيمة عشوائية مأخوذة من توزيع منتظم بين 0 و1. العينة التركيبية، كما هو موضح في الشكل 4، تولد على طول المقطع الخطي الذي يربط x تحت i.وxent يربط xi وx zi.

الشكل 4: توزيع الفئة في مجموعة البيانات HAM10000 قبل وبعد تطبيق تقنية موازنة الفئات. (أ) قبل موازنة الفئات، مع عدم توازن بين فئات الآفات. (ب) بعد موازنة الفئات في فضاء الميزات المجمعة، حيث يكون تمثيل جميع الفئات متساويا لتجنب التحيز في عملية تدريب المصنفين. يرجى الضغط هنا لعرض نسخة أكبر من هذا الشكل.
لمعالجة مشكلة عدم توازن الطبقات في مجموعة البيانات HAM10000، يتم تطبيق تقنية العينة الزائدة للأقلية الاصطناعية (تقنية توازن الفئات). تقنية موازنة الطبقات تولد عينات تركيبية للفئات الأقلية عن طريق الاستيفاء بين نقاط البيانات الموجودة، مما يساعد على زيادة تمثيل فئات الآفات الممثلة تمثيلا ناقصا. النتيجة النهائية لإنتاج المزيد من الأمثلة لهذه الفئات الأقلية هي مجموعة بيانات أكثر توازنا بشكل عام، بالنسبة لجميع أنواع الآفات السبعة. هذا التمثيل المتوازن سيمكن نماذج التصنيف من التعلم بشكل أفضل مع كل فئة وتقليل التحيز مع الفئات الأغلبية. وبالتالي، فإن النموذج أكثر عدلا في التصنيف وحساس، خاصة فيما يتعلق بالآفات الجلدية النادرة ولكن المهمة سريريا.
إطار عمل تعليمي للحفاظ على الخصوصية
يقترح النظام المقترح نظاما متعدد الوسائط لتصنيف الآفات الآلي على الجلد يكون واعيا للخصوصية وقابلا للتفسير. الهدف النهائي للنظام هو تعزيز أداء التشخيص وفي الوقت نفسه، حماية المعلومات الحساسة للمرضى طوال عملية التدريب. خصوصية المرضى ضرورة أساسية في الممارسة الطبية لأن قوانين خصوصية بيانات الرعاية الصحية والاعتبارات الأخلاقية مهمة للغاية في بيئات الرعاية الصحية. لذا، سيشمل النموذج المقترح نموذج تعلم لامركزي يعتمد على أفكار التعلم الفيدرالي. في هذا البيئة اللامركزية، يتم تدريب النماذج على مجموعة من العملاء الموزعين بدلا من تجميع جميع بيانات المرضى في موقع مركزي. يقوم جميع العملاء المشاركين بتدريب النموذج محليا على بياناتهم الخاصة، ولا تغادر بيانات المرضى الخام البيئة المحلية. كبديل لنقل السجلات الطبية الحساسة، يتم إرسال تحديثات النموذج أو المعلمات إلى خادم مركزي ليتم تجميعها. يتيح هذا النهج التعاوني للتعلم المؤسسات أو مصادر البيانات المختلفة المساهمة في تدريب النماذج دون المساس بخصوصية البيانات.
لتكن wt(k) هي معلمات النموذج للعميل kth في التكرار t، ولتكن nk هو حجم العينة في ذلك العميل. يتم حساب تحديث النموذج العالمي كما يلي:
(8)
تضمن هذه الاستراتيجية التجميعية أن يساهم العملاء ذوو مجموعات البيانات الأكبر بشكل متناسب أكثر في النموذج العالمي، مع السماح للعملاء الصغار بالمشاركة في عملية التعلم. من خلال تمكين التدريب التعاوني دون تبادل بيانات المرضى الخام، يحافظ الإطار المقترح على الخصوصية مع الاستفادة من المعرفة الموزعة عبر مجموعات البيانات.
الإعداد التجريبي الموحد
تم تصميم نظام تعلم اتحادي محاكى مع مجموعة بيانات HAM10000 لتأكيد كفاءة الإطار الواعي بالخصوصية المقدم. تم تقسيم البيانات إلى ثلاثة عملاء لمحاكاة بيئة متعددة المؤسسات واقعية مع بيانات غير موزعة (غير IID). كل عميل لديه مزيج مختلف من فئات الآفات، وهذا يمثل تباينا في العالم بين المراكز السريرية. تم تشغيل خط أنابيب استخراج الميزات متعدد الوسائط المماثل (EfficientNet-B4، DenseNet201، MobileNet V2، والبيانات الوصفية السريرية) محليا على كل عميل. في تدريبهم، قام العملاء بتحديث نماذجهم المحلية بأنفسهم، وكانت المعلمات التي تعلمها تتبادل فقط مع الخادم المركزي لتجميعها خوارزمية FedAvg. تمت مقارنة المقايضة بين الدقة التنبؤية والخصوصية بين النموذج الموحد ونهج التدريب المركزي لقياس أداء كل منهما. تظهر نتائج الاختبار المشار إليها في الشكل 5 أن النموذج الموحد يمكنه الأداء التنافسي، مع انخفاض طفيف فقط في الدقة مقارنة بالتعلم المركزي، وتحسن كبير في خصوصية البيانات.

الشكل 5: توزيع مجموعة البيانات HAM10000 على مستوى العميل. يظهر هذا توزيع بيانات آفات الجلد بين العملاء، مما يوضح التنوع في توزيع البيانات. هذا يوضح تباين البيانات بين العملاء، وهو جانب حاسم من جوانب التعلم الفيدرالي. يرجى الضغط هنا لعرض نسخة أكبر من هذا الشكل.
تم تقسيم التوزيعات غير المتجانسة (غير IID) للعملاء الذين تشكلوا في HAM10000 إلى ثلاث مجموعات لنمذجة الحالات السريرية الواقعية. توزيع فئات الآفات المختلفة داخل كل عميل مختلف، خاصة فئة النفوس (nv)، التي لا تتوزع بالتساوي بين المرضى. هذا الترتيب يعكس الصعوبات الواقعية للتعلم الفيدرالي، حيث لا توزع البيانات في المؤسسات بشكل متساو.
مقارنة الأداء: التعلم المركزي مقابل التعلم الفيدرالي
لتقييم فعالية إطار التعلم الموحد المقترح، تم إجراء تحليل مقارن بين استراتيجيات التدريب المركزي والاتحادي باستخدام مجموعة بيانات HAM10000، كما هو موضح في الشكل 6. في الإعداد المركزي، تم تجميع جميع عينات البيانات في مجموعة تدريب واحدة. حقق أفضل نموذج مركزي أداء، وهو الفرقة المكدسة، دقة إجمالية بلغت 96٪. على النقيض من ذلك، وزع الإعداد الموحد مجموعة البيانات عبر ثلاثة عملاء مع بيانات غير متطابقة (غير IID)، حيث قام كل عميل بتدريب النموذج محليا ومشاركة معلمات النموذج فقط باستخدام FedAvg. حقق النموذج الموحد دقة إجمالية تقارب 94٪، مما يعادل فارق أداء قدره 2٪ مقارنة بالنهج المركزي، كما هو موضح في الجدول 4. من المتوقع أن يكون هذا الانخفاض الهامشي بسبب التحسين اللامركزي وتوزيع البيانات المتجانس بين العملاء.
على الرغم من حدوث هذا التغيير الصغير، إلا أن النموذج الفيدرالي كان جيدا في التنبؤ. في التدريب المركزي، يظهر السلوك حسب الفئة أن غالبية الفئات، مثل نيفوس (nv) (درجة F1 = 1.00)، تبقى مستقرة، بينما الفئات الأقلية، مثل درماتوفيبروما (df) (درجة F1 ≈ 0.65–0.66)، أكثر حساسية لاختلال التوزيع، مما قد يؤثر على الأداء الفيدرالي أكثر. ومن الجدير بالذكر أن الهيكل الفيدرالي يقلل من فرص كشف معلومات المرضى الحساسة لأنه لا يتطلب مشاركة البيانات الطبية الخام بين العملاء.

الشكل 6: مقارنة التعلم الموحد مع التعلم المركزي. يقارن هذا الشكل نماذج التعلم باستخدام مقاييس الأداء مثل الدقة، والدقة، والاسترجاع، ودرجة F1. هذا يوضح قدرة التعلم الفيدرالي على تحقيق أداء يقارن بنهج التعلم التقليدي مع الحفاظ على الخصوصية. يرجى الضغط هنا لعرض نسخة أكبر من هذا الشكل.
تشير نتائج الجدول 4 إلى أن نموذج التعلم الموحد قادر على أن يكون تنافسيا، وأن انخفاض الدقة يكون فقط بمقدار طفيف يقارب 2٪ مقارنة بالنموذج المركزي. يمكن تفسير هذا الانخفاض الطفيف من خلال التحسين اللامركزي وتوزيع البيانات غير الداخلي (IID). ومع ذلك، يتمتع النموذج الفيدرالي بميزة كبيرة فيما يتعلق بحماية الخصوصية، حيث لا يتم مشاركة المعلومات الحساسة للمرضى بين العملاء. لتوفير مقارنة عادلة بين النموذج الموحد ونموذج المجموعات المركزية المكدسة، تم اختبار النموذج الموحد بنفس البنية التحتية والمعاملات الفائقة. الجانب الذي يناقش في هذه الدراسة للحفاظ على الخصوصية هو جانب مفاهيمي ويهدف إلى تسليط الضوء على إمكانية دمج تقنيات مثل التعلم الموحد في الأعمال المستقبلية. لا يتم إجراء أي تحقق تجريبي لآليات حفظ الخصوصية في التنفيذ الحالي.
دمج الميزات متعددة الوسائط
عادة ما يشمل تشخيص الآفات الجلدية مراقبة الجلد والتاريخ الطبي السريري. في معظم الحالات، لا يقتصر أطباء الجلدية على النظر في صور المنظار الجلدية فقط من خلال وضعها في مقارنتها بمعلومات المريض (العمر، الجنس، وموقع الآفات) لاتخاذ أحكامهم التشخيصية. يعتمد النظام المقترح على إلهام هذا العمل السريري ويدمج نهجا متعدد الوسائط لتعلم دمج البيانات القائمة على الصور والبيانات السريرية. يتم تدريب CNNs على ميزات عميقة في صورة التنظير الجلدية الموجودة مسبقا. تتعرف هذه الشبكات على تصاميم بصرية معقدة، بما في ذلك تغيرات الألوان، وأشكال الآفات، والشذوذات الهيكلية، وميزات النسيج. ومع ذلك، قد لا تكون ميزات الصور كافية لالتقاط الوضع السريري للآفة. وبالتالي يتم تضمين البيانات الوصفية السريرية المتعلقة بكل صورة أيضا في التعلم. سيتم إنشاء وحدة دمج ميزات تدمج ميزات الصورة العميقة مع السمات السريرية المعالجة والمعلومات الديموغرافية. يشكل هذا التمثيل المركب تمثيلا متكاملا متعدد الوسائط يتكون من معلومات بصرية وسياقية لكل آفة. يمكن للنموذج دمج عدة مصادر بيانات للحصول على أنماط مكملة تعزز القدرة الشاملة على التصنيف. يتيح التمثيل متعدد الوسائط للنظام التمييز بشكل أكثر فعالية بين الآفات المتشابهة بصريا بالإضافة إلى أخذ المؤشرات السريرية في الاعتبار. النموذج أكثر معنى وفعالية سريريا لأنه تقريب أقرب لكيفية دراسة أطباء الجلد للآفات في الممارسة السريرية.
التعلم الجماعي المكدس
يستخدم الإطار المقترح استراتيجية التعلم الجماعي المكدس لتحسين القدرة التنبؤية للنظام بشكل أكبر. التعلم الجماعي هو طريقة مركبة للتنبؤ تستخدم نموذجين أو أكثر للتنبؤ لتعزيز التعميم وتقليل أخطاء التنبؤ التي قد تحدث مع نماذج واحدة. يتم تدريب المتعلمين الأساسيين المتعدد بشكل مستقل على تمثيل الميزات متعددة الوسائط بدلا من استخدام مصنف واحد. جميع المتعلمين الأساسيين يقدمون تقديرا لمدى احتمال أن تكون عينة معينة من فئة آفة معينة. ثم يتم تجميع هذه التنبؤات الاحتمالية على مستوى فوقي. يتم تعيين وزن لكل متعلم أساسي لإظهار أهميته النسبية للتوقع النهائي. تستخدم دالة تفعيل سوفتماكس لحساب الناتج المجمع لتوليد احتمالات فئة مطبعة. طريقة المجموعات المكدسة لها عدد من الفوائد. أولا، يقلل من تباين التنبؤ الناتج عن دمج نماذج مختلفة وبالتالي يعزز أداء التعميم. ثانيا، يعزز القوة لأن النماذج المختلفة تصف اتجاهات مختلفة في البيانات. ثالثا، يعزز التعلم الجماعي تصنيف فئات الآفات الأقلية، خاصة في البيانات الطبية، حيث لا تكون بعض الحالات ذات الاهتمام السريري شائعة بنفس القدر.
تكامل ذكاء اصطناعي قابل للتفسير
يجب أن تقدم أنظمة الذكاء الاصطناعي الطبي أيضا تفسيرات واضحة لاختياراتها، رغم أن دقة التنبؤ العالية أمر بالغ الأهمية. لوضع الثقة في أنظمة الذكاء الاصطناعي وأن يكونوا فعالين في ممارستها، يجب أن يكون الأطباء قادرين على فهم كيف يتناسب النموذج مع التشخيص الذي ينتجه. ولتلبية هذه الحاجة، يدمج الإطار المقترح طرق الذكاء الاصطناعي القابل للتفسير (XAI)، كما هو موضح في الشكل 7.

الشكل 7: مصفوفات الالتباس لنماذج التصنيف المختلفة لتصنيف آفات الجلد متعددة الفئات. (أ) XGBoost، (ب) LightGBM، (ج) المصنف العصبي العميق، و(د) نموذج المجموعات المكدسة. تظهر كل مصفوفة ارتباك العلاقة بين الفئة الحقيقية (الصفوف) والفئة المتوقعة (الأعمدة) لجميع أنواع آفات الجلد السبعة: akiec، bcc، bkl، df، mel، NV، وvasc. نماذج XGBoost وLightGBM تؤدي أداء جيدا لفئات nv وbkl، رغم وجود بعض الالتباس بين mel و nv. يحسن المصنف العصبي العميق تصنيف bkl و df ويقلل من الارتباك خارج الاتجاه القطري. يظهر نموذج المجموعات المكدسة أكبر قدر من الاتساق في التصنيف، حيث يصبح القطر أكثر هيمنة. يرجى الضغط هنا لعرض نسخة أكبر من هذا الشكل.
يشمل النظام نهجين شائعين للتفسير (تقنية قابلية تفسير النموذج (تفسيرات شابلي الإضافية) وتقنية تفسير النموذج (تفسيرات محلية غير معتمدة على النموذج)) لإعطاء نظرة عميقة عما يتنبأ به النموذج. تشرح طريقة قابلية تفسير النموذج الميزات على مستوى الميزات من خلال قياس مدى مساهمة كل ميزة مدخلة في التنبؤ العام. يساعد في تحديد المتغيرات السريرية/الخصائص البصرية التي لها أكبر تأثير على نتيجة التصنيف. وهذا يمكن الباحثين والأطباء من رؤية السلوك العام للنموذج عبر مجموعة البيانات. أما تقنية تفسير النموذج، فهي تتعامل مع التفسيرات المحلية للتنبؤات الفردية. يركز على المناطق في صورة التنظير الجلدية التي لها أكبر تأثير على قرار النموذج. تمكن هذه التفسيرات البصرية على مستوى البكسل الأطباء من فحص مناطق الآفة التي أثرت على التصنيف بصريا. يوفر الإطار المقترح قابلية تفسير عالمية ومحلية؛ يتم تحقيق ذلك من خلال دمج تقنية قابلية تفسير النموذج. تعزز آلية التفسير المزدوج الشفافية وتمكن الأطباء من تقييم ما إذا كان النموذج يستهدف أنماطا طبية ذات دلالة طبية.
إمكانات دعم اتخاذ القرار السريري
التعلم الذي يحافظ على الخصوصية، ودمج الميزات متعددة الوسائط، ونمذجة المجموعات، والذكاء الاصطناعي القابل للتفسير هي مكونات رئيسية لنظام متكامل وقوي لتصنيف آفات الجلد تلقائيا. من الناحية المثالية، يجب ألا يكون النظام فقط يتمتع بقوة تنبؤية عالية، بل أيضا شفافا وآمنا، وهما عاملان رئيسيان في الأنظمة الطبية، كما هو موضح في الشكل 8.

الشكل 8: منحنيات خصائص تشغيل المستقبل (ROC) لنموذج المجموعة المكدسة. (A–C) يظهر هذا منحنيات ROC لأنواع آفات الجلد السبعة، مع معدل الإيجابية الحقيقية (الحساسية) ومعدل الإيجابية الكاذبة (خصوصية 1). تمثل المساحة تحت المنحنى (AUC) أداء نموذج المجموعات المكدسة في التمييز بين الفئات. يرجى الضغط هنا لعرض نسخة أكبر من هذا الشكل.
يوفر هذا النظام توقعات قابلة للتفسير وحماية للخصوصية. وبالتالي، فهو نظام مفيد لأنظمة تشخيص الأمراض الجلدية الأخرى. يتيح هذا النظام للممارسين الصحيين/أطباء الجلدية تقييم الشكوك في الآفات وتحسين دقة التشخيص، ونتيجة لذلك، يساعد الممارسين/أطباء الجلدية على تشخيص المرضى في مرحلة مبكرة عندما قد يكون لديهم مرض أكثر خطورة (مثل الميلانوما). في جوهره، كما هو موضح في الشكل 9، يسعى هذا النظام إلى تطبيق تقنيات استخدام أنظمة الذكاء الاصطناعي عالية التقنية وتطبيق التطبيقات الواقعية، لمساعدة أطباء الجلدية على تشخيص المرضى بدقة أكبر وبثقة أكبر مع ضمان خصوصية وأمان المرضى وراحتهم.

الشكل 9: نتائج التفسير باستخدام تقنيات تفسير النموذج لتصنيف آفات الجلد متعددة الفئات. (أ) مخطط SHAP يظهر مساهمات الميزات التي تؤثر على تنبؤات الآفات الحميدة والخبيثة. (ب) شرح LIME لتوقع BCC، يوضح الميزات التي تساهم إيجابيا وسلبيا في نتيجة التصنيف. (ج) شرح LIME لتوقع akiec، مع تسليط الضوء على أكثر الميزات تأثيرا في عملية اتخاذ القرار في النموذج. تظهر هذه التصورات القابلة للتفسير المناطق والميزات المستخرجة التي تؤثر بشكل كبير على توقعات النموذج، مما يحسن الشفافية وفهم عملية التصنيف في تقييم آفات الجلد. يرجى الضغط هنا لعرض نسخة أكبر من هذا الشكل.
استراتيجية التقييم
لتجنب تحيز العينة والحفاظ على توزيع الفئة الأصلي عبر جميع فئات آفات الجلد، تم تقسيم مجموعة البيانات إلى تقسيم قطار واختبار بنسبة 80:20. ثم تم تقسيم مجموعة التدريب بنسبة 90:10 train : validate، لضبط المعاملات الفائقة وتحسين النموذج. لم تستخدم مجموعة الاختبار في عملية التدريب في أي مرحلة، وتم تطبيقها فقط في نهاية عملية التدريب كاختبار نهائي لتجنب تسرب البيانات وضمان تقييم أداء غير متحيز. تمت معالجة جميع النماذج مسبقا وتدريبها في بيئات متساوية، وتم تقسيم البيانات وتعزيزها بنفس الطريقة، وطبقت بروتوكولات التقييم واتباعها بنفس الطريقة، مما سمح بمقارنات عادلة وقابلة للتكرار. تم تقييم النماذج بدقة بناء على الدقة، والدقة، والاستدعاء، ودرجة F1، وAUC، مع تحليل مفصل للنتائج حسب الفئة لتحديد مدى قوتها لكل من الفئات الرئيسية والأقلية من الآفات. ستساعد هذه الأداة الموحدة للتحقق في زيادة موثوقية وشفافية وقابلية التعميم للنهج المقترح، وتجاوز التناقضات المحتملة في تقارير الأداء.