End-to-end diep neuraal netwerk voor detectie van opvallende objecten in complexe omgevingen

Yu Wang; Zhiteng Wang

doi:10.3791/65554

Method Article

End-to-end diep neuraal netwerk voor detectie van opvallende objecten in complexe omgevingen

DOI:

10.3791/65554

⸱

December 15th, 2023

Yu Wang¹ , Zhiteng Wang²

¹Zhengzhou University of Economics and Business, ²The 713 Research Institute of CSSC

Summary

$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

Het huidige protocol beschrijft een nieuw end-to-end algoritme voor het detecteren van opvallende objecten. Het maakt gebruik van diepe neurale netwerken om de precisie van de detectie van opvallende objecten binnen ingewikkelde omgevingscontexten te verbeteren.

Abstract

$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

Opvallende objectdetectie is naar voren gekomen als een ontluikend interessegebied op het gebied van computervisie. De heersende algoritmen vertonen echter verminderde precisie wanneer ze belast zijn met het detecteren van opvallende objecten in ingewikkelde en veelzijdige omgevingen. In het licht van deze dringende zorg presenteert dit artikel een end-to-end diep neuraal netwerk dat tot doel heeft opvallende objecten in complexe omgevingen te detecteren. De studie introduceert een end-to-end diep neuraal netwerk dat tot doel heeft opvallende objecten in complexe omgevingen te detecteren. Het voorgestelde netwerk, dat bestaat uit twee onderling verbonden componenten, namelijk een volledig convolutioneel netwerk op meerdere schalen op pixelniveau en een netwerk van diepe encoder-decoders, integreert contextuele semantiek om visueel contrast te produceren tussen functiekaarten met meerdere schalen, terwijl diepe en ondiepe beeldkenmerken worden gebruikt om de nauwkeurigheid van de identificatie van objectgrenzen te verbeteren. De integratie van een volledig verbonden CRF-model (Conditional Random Field) verbetert de ruimtelijke samenhang en contourafbakening van opvallende kaarten verder. Het voorgestelde algoritme wordt uitgebreid geëvalueerd aan de hand van 10 hedendaagse algoritmen op de SOD- en ECSSD-databases. De evaluatieresultaten tonen aan dat het voorgestelde algoritme beter presteert dan andere benaderingen in termen van precisie en nauwkeurigheid, waardoor de doeltreffendheid ervan bij de detectie van opvallende objecten in complexe omgevingen wordt vastgesteld.

Introduction

$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

Opvallende objectdetectie bootst de menselijke visuele aandacht na, identificeert snel belangrijke beeldgebieden en onderdrukt achtergrondinformatie. Deze techniek wordt veel gebruikt als hulpmiddel voor voorbewerking bij taken zoals het bijsnijden van afbeeldingen¹, semantische segmentatie² en het bewerken van afbeeldingen³. Het stroomlijnt taken zoals het vervangen van achtergronden en het extraheren van de voorgrond, waardoor de efficiëntie en precisie van het bewerken worden verbeterd. Bovendien helpt het bij semantische segmentatie door de lokalisatie van het doel te verbeteren. Het potentiee....

Access restricted. Please log in or start a trial to view this content.

Protocol

$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

1. Experimentele opzet en procedure

Laad het vooraf getrainde VGG16-model.
OPMERKING: De eerste stap is het laden van het vooraf getrainde VGG16-model uit de Keras-bibliotheek⁶.
1. Volg deze algemene stappen om een vooraf getraind VGG16-model in Python te laden met behulp van populaire deep learning-bibliotheken zoals PyTorch (zie Materiaaltabel):
  1. Zaklamp importeren. Importeer torchvision.models als modellen.
  2. Laad het vooraf getrainde VGG16-model. vgg16_model = modellen.vgg16(voorgetraind=Waar).
  3. Zorg ervoor dat de samenvatting van....

Access restricted. Please log in or start a trial to view this content.

Results

$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

Deze studie introduceert een end-to-end diep neuraal netwerk dat bestaat uit twee complementaire netwerken: een multi-scale volledig convolutioneel netwerk op pixelniveau en een diep encoder-decodernetwerk. Het eerste netwerk integreert contextuele semantiek om visuele contrasten af te leiden uit functiekaarten op meerdere schalen, waarmee de uitdaging van vaste receptieve velden in diepe neurale netwerken over verschillende lagen wordt aangepakt. Het tweede netwerk maakt gebruik van zowel diepe als ondiepe beeldfuncties.......

Access restricted. Please log in or start a trial to view this content.

Discussion

$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

Het artikel introduceert een end-to-end diep neuraal netwerk dat speciaal is ontworpen voor de detectie van opvallende objecten in complexe omgevingen. Het netwerk bestaat uit twee onderling verbonden componenten: een multiscale volledig convolutioneel netwerk op pixelniveau (DCL) en een deep encoder-decoder network (DEDN). Deze componenten werken synergetisch en bevatten contextuele semantiek om visuele contrasten te genereren binnen multiscale feature maps. Bovendien maken ze gebruik van zowel diepe als ondiepe beeldke.......

Access restricted. Please log in or start a trial to view this content.

Disclosures

$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

De auteurs hebben niets te onthullen.

Acknowledgements

$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

Dit werk wordt ondersteund door 2024 Henan Provincial Higher Education Institutions Key Scientific Research Project Funding Program Establishment (Projectnummer: 24A520053). Deze studie wordt ook ondersteund door Specialized Creation and Integration Characteristics Demonstration Course Construction in de provincie Henan.

....

Access restricted. Please log in or start a trial to view this content.

Materials

List of materials used in this article
Name	Company	Catalog Number	Comments
Matlab	MathWorks	Matlab R2016a	MATLAB's programming interface provides development tools for improving code quality maintainability and maximizing performance. It provides tools for building applications using custom graphical interfaces. It provides tools for combining MATLAB-based algorithms with external applications and languages
Processor	Intel	11th Gen Intel(R) Core (TM) i5-1135G7 @ 2.40GHz	64-bit Win11 processor
Pycharm	JetBrains	PyCharm 3.0	PyCharm is a Python IDE (Integrated Development Environment) a list of required python: modulesmatplotlib skimage torch os time pydensecrf opencv glob PIL torchvision numpy tkinter
PyTorch	Facebook	PyTorch 1.4	PyTorch is an open source Python machine learning library , based on Torch , used for natural language processing and other applications.PyTorch can be viewed both as the addition of GPU support numpy , but also can be viewed as a powerful deep neural network with automatic derivatives .

References

$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

Wang, W. G., Shen, J. B., Ling, H. B. A deep network solution for attention and aesthetics aware photo cropping. IEEE Transactions on Pattern Analysis and Machine Intelligence. 41 (7), 1531-1544 (2018).
Wang, W. G., Sun, G. L., Gool, L. V. Looking beyond single images for weakly supervised semantic segmentation learning.

Access restricted. Please log in or start a trial to view this content.

Reprints and Permissions

Request permission to reuse the text or figures of this JoVE article

Request Permission

End-to-end diep neuraal netwerk voor detectie van opvallende objecten in complexe omgevingen

In This Article

Summary

Abstract

Introduction

Protocol

Results

Discussion

Disclosures

Acknowledgements

Materials

References

Reprints and Permissions

Tags

Related Articles