Method Article

شبكة عصبية عميقة من طرف إلى طرف لاكتشاف الأجسام البارزة في البيئات المعقدة

DOI:

10.3791/65554

December 15th, 2023

In This Article

Summary

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

ويصف هذا البروتوكول خوارزمية جديدة للكشف عن الأجسام البارزة من طرف إلى طرف. إنه يستفيد من الشبكات العصبية العميقة لتعزيز دقة اكتشاف الأشياء البارزة ضمن السياقات البيئية المعقدة.

Abstract

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

برز اكتشاف الأجسام البارزة كمجال اهتمام مزدهر في مجال رؤية الكمبيوتر. ومع ذلك ، تظهر الخوارزميات السائدة دقة متناقصة عند تكليفها باكتشاف الأشياء البارزة داخل بيئات معقدة ومتعددة الأوجه. في ضوء هذا القلق الملح ، تقدم هذه المقالة شبكة عصبية عميقة من طرف إلى طرف تهدف إلى اكتشاف الأشياء البارزة داخل البيئات المعقدة. تقدم الدراسة شبكة عصبية عميقة من طرف إلى طرف تهدف إلى اكتشاف الأشياء البارزة داخل البيئات المعقدة. تتألف الشبكة المقترحة من مكونين مترابطين ، وهما شبكة تلافيفية كاملة متعددة المقاييس على مستوى البكسل وشبكة فك تشفير عميقة ، وتدمج دلالات سياقية لإنتاج تباين مرئي عبر خرائط المعالم متعددة المقاييس مع استخدام ميزات الصورة العميقة والضحلة لتحسين دقة تحديد حدود الكائن. ويعزز تكامل نموذج الحقل العشوائي الشرطي المتصل بالكامل من التماسك المكاني وتحديد الكنتور للخرائط البارزة. يتم تقييم الخوارزمية المقترحة على نطاق واسع مقابل 10 خوارزميات معاصرة في قواعد بيانات SOD و ECSSD. تظهر نتائج التقييم أن الخوارزمية المقترحة تتفوق على الأساليب الأخرى من حيث الدقة والدقة ، وبالتالي تثبت فعاليتها في اكتشاف الأشياء البارزة في البيئات المعقدة.

Introduction

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

يحاكي اكتشاف الأجسام البارزة الانتباه البصري البشري ، ويحدد بسرعة مناطق الصورة الرئيسية مع قمع معلومات الخلفية. تستخدم هذه التقنية على نطاق واسع كأداة للمعالجة المسبقة في مهام مثل اقتصاص الصور1 والتجزئة الدلالية2 وتحرير الصور3. إنه يبسط المهام مثل استبدال الخلفية واستخراج المقدمة ، مما يحسن كفاءة التحرير والدقة. بالإضافة إلى ذلك ، فإنه يساعد في التجزئة الدلالية من خلال تعزيز توطين الهدف. إن إمكانات اكتشاف الأجسام البارزة لتعزيز الكفاءة الحسابية والحفاظ على الذاكرة تؤكد على آفاق البحث والتطبيق الهامة.

على مر السنين ، تطور اكتشاف الأشياء البارزة من الخوارزميات التقليدية ا....

Access restricted. Please log in or start a trial to view this content.

Protocol

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

1. الإعداد التجريبي والإجراءات

  1. قم بتحميل طراز VGG16 المدرب مسبقا.
    ملاحظة: الخطوة الأولى هي تحميل طراز VGG16 المدرب مسبقا من مكتبة Keras6.
    1. لتحميل نموذج VGG16 مدرب مسبقا في Python باستخدام مكتبات التعلم العميق الشائعة مثل PyTorch (انظر جدول المواد) ، اتبع الخطوات العامة التالية:
      1. استيراد الشعلة. استيراد نماذج torchvision.models كنماذج.
      2. قم بتحميل طراز VGG16 المدرب مسبقا. vgg16_model = models.vgg16 (تم تدريبه مسبقا = صحيح).
      3. تأكد من أن ملخص طراز VGG16 هو "طباعة (vgg16_model)".
  2. تحديد نماذج DCL و DEDN....

Access restricted. Please log in or start a trial to view this content.

Results

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

تقدم هذه الدراسة شبكة عصبية عميقة من طرف إلى طرف تتكون من شبكتين متكاملتين: شبكة تلافيفية كاملة متعددة المقاييس على مستوى البكسل وشبكة فك تشفير عميقة. تدمج الشبكة الأولى الدلالات السياقية لاشتقاق التناقضات البصرية من خرائط المعالم متعددة المقاييس ، ومعالجة التحدي المتمثل في الحقول المستقبلة الثابتة في الشبكات العصبية العميقة عبر طبقات مختلفة. تستخدم الشبكة الثانية ميزات الصورة العميقة والضحلة للتخفيف من مشكلة الحدود غير الواضحة في الكائنات المستهدفة. أخيرا ، يتم تطبيق نموذج حقل عشوائي شرطي متصل بالكامل (CRF) لتحسين التما.......

Access restricted. Please log in or start a trial to view this content.

Discussion

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

يقدم المقال شبكة عصبية عميقة من طرف إلى طرف مصممة خصيصا للكشف عن الأشياء البارزة في البيئات المعقدة. تتكون الشبكة من مكونين مترابطين: شبكة تلافيفية كاملة متعددة المقاييس على مستوى البكسل (DCL) وشبكة فك تشفير عميقة (DEDN). تعمل هذه المكونات بشكل تآزري ، حيث تتضمن الدلالات السياقية لتوليد تباينات مرئية داخل خرائط المعالم متعددة المقاييس. بالإضافة إلى ذلك ، فإنها تستفيد من ميزات الصورة العميقة والضحلة لتحسين دقة ترسيم حدود الكائن. ويعزز تكامل نموذج الحقل العشوائي الشرطي المتصل بالكامل من الاتساق المكاني لخرائط البروز وترسيم.......

Access restricted. Please log in or start a trial to view this content.

Disclosures

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

ليس لدى المؤلفين ما يكشفون عنه.

Acknowledgements

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

يتم دعم هذا العمل من قبل مؤسسة تمويل مشروع البحث العلمي الرئيسي لمؤسسات التعليم العالي في مقاطعة خنان لعام 2024 (رقم المشروع: 24A520053). يتم دعم هذه الدراسة أيضا من خلال بناء دورة توضيحية متخصصة في الإنشاء والتكامل في مقاطعة خنان.

....

Access restricted. Please log in or start a trial to view this content.

Materials

List of materials used in this article
NameCompanyCatalog NumberComments
MatlabMathWorksMatlab R2016aتوفر واجهة برمجة MATLAB أدوات تطوير لتحسين جودة الكود وقابلية الصيانة وزيادة الأداء.
يوفر أدوات لبناء التطبيقات باستخدام واجهات رسومية مخصصة.
يوفر أدوات للجمع بين الخوارزميات المستندة إلى MATLAB والتطبيقات واللغات الخارجية
Processor معالج IntelGen 11th Intel(R) Core (TM) i5-1135G7 @ 2.40GHz64-bit Win11
PycharmJetBrainsPyCharm 3.0PyCharm عبارة عن Python IDE (بيئة تطوير متكاملة)
قائمة ب python المطلوبة:
modulesmatplotlib
skimage
torch
os
time
pydensecrf
opencv
glob
PIL
torchvision
numpy
tkinter
PyTorch  فيسبوكPyTorch 1.4 PyTorch هي مكتبة تعلم آلي مفتوحة المصدر من Python ، تعتمد على Torch ، وتستخدم لمعالجة اللغة الطبيعية والتطبيقات الأخرى. يمكن اعتبار PyTorch إضافة لدعم GPU numpy ، ولكن يمكن أيضا اعتباره شبكة عصبية عميقة قوية مع مشتقات تلقائية .

References

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,
  1. Wang, W. G., Shen, J. B., Ling, H. B. A deep network solution for attention and aesthetics aware photo cropping. IEEE Transactions on Pattern Analysis and Machine Intelligence. 41 (7), 1531-1544 (2018).
  2. Wang, W. G., Sun, G. L., Gool, L. V. Looking beyond single images for weakly supervised semantic segmentation learning.

Access restricted. Please log in or start a trial to view this content.

Reprints and Permissions

Request permission to reuse the text or figures of this JoVE article

Request Permission

Tags

Salient Object DetectionDeep Neural NetworkComplex EnvironmentsConvolutional Neural NetworkEncoder Decoder NetworkConditional Random FieldImage SegmentationSOD DatabaseVGG16 BackbonePyTorch Models

Related Articles