Method Article

End-to-end diep neuraal netwerk voor detectie van opvallende objecten in complexe omgevingen

DOI:

10.3791/65554

December 15th, 2023

In This Article

Summary

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

Het huidige protocol beschrijft een nieuw end-to-end algoritme voor het detecteren van opvallende objecten. Het maakt gebruik van diepe neurale netwerken om de precisie van de detectie van opvallende objecten binnen ingewikkelde omgevingscontexten te verbeteren.

Abstract

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

Opvallende objectdetectie is naar voren gekomen als een ontluikend interessegebied op het gebied van computervisie. De heersende algoritmen vertonen echter verminderde precisie wanneer ze belast zijn met het detecteren van opvallende objecten in ingewikkelde en veelzijdige omgevingen. In het licht van deze dringende zorg presenteert dit artikel een end-to-end diep neuraal netwerk dat tot doel heeft opvallende objecten in complexe omgevingen te detecteren. De studie introduceert een end-to-end diep neuraal netwerk dat tot doel heeft opvallende objecten in complexe omgevingen te detecteren. Het voorgestelde netwerk, dat bestaat uit twee onderling verbonden componenten, namelijk een volledig convolutioneel netwerk op meerdere schalen op pixelniveau en een netwerk van diepe encoder-decoders, integreert contextuele semantiek om visueel contrast te produceren tussen functiekaarten met meerdere schalen, terwijl diepe en ondiepe beeldkenmerken worden gebruikt om de nauwkeurigheid van de identificatie van objectgrenzen te verbeteren. De integratie van een volledig verbonden CRF-model (Conditional Random Field) verbetert de ruimtelijke samenhang en contourafbakening van opvallende kaarten verder. Het voorgestelde algoritme wordt uitgebreid geëvalueerd aan de hand van 10 hedendaagse algoritmen op de SOD- en ECSSD-databases. De evaluatieresultaten tonen aan dat het voorgestelde algoritme beter presteert dan andere benaderingen in termen van precisie en nauwkeurigheid, waardoor de doeltreffendheid ervan bij de detectie van opvallende objecten in complexe omgevingen wordt vastgesteld.

Introduction

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

Opvallende objectdetectie bootst de menselijke visuele aandacht na, identificeert snel belangrijke beeldgebieden en onderdrukt achtergrondinformatie. Deze techniek wordt veel gebruikt als hulpmiddel voor voorbewerking bij taken zoals het bijsnijden van afbeeldingen1, semantische segmentatie2 en het bewerken van afbeeldingen3. Het stroomlijnt taken zoals het vervangen van achtergronden en het extraheren van de voorgrond, waardoor de efficiëntie en precisie van het bewerken worden verbeterd. Bovendien helpt het bij semantische segmentatie door de lokalisatie van het doel te verbeteren. Het potentiee....

Access restricted. Please log in or start a trial to view this content.

Protocol

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

1. Experimentele opzet en procedure

  1. Laad het vooraf getrainde VGG16-model.
    OPMERKING: De eerste stap is het laden van het vooraf getrainde VGG16-model uit de Keras-bibliotheek6.
    1. Volg deze algemene stappen om een vooraf getraind VGG16-model in Python te laden met behulp van populaire deep learning-bibliotheken zoals PyTorch (zie Materiaaltabel):
      1. Zaklamp importeren. Importeer torchvision.models als modellen.
      2. Laad het vooraf getrainde VGG16-model. vgg16_model = modellen.vgg16(voorgetraind=Waar).
      3. Zorg ervoor dat de samenvatting van....

Access restricted. Please log in or start a trial to view this content.

Results

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

Deze studie introduceert een end-to-end diep neuraal netwerk dat bestaat uit twee complementaire netwerken: een multi-scale volledig convolutioneel netwerk op pixelniveau en een diep encoder-decodernetwerk. Het eerste netwerk integreert contextuele semantiek om visuele contrasten af te leiden uit functiekaarten op meerdere schalen, waarmee de uitdaging van vaste receptieve velden in diepe neurale netwerken over verschillende lagen wordt aangepakt. Het tweede netwerk maakt gebruik van zowel diepe als ondiepe beeldfuncties.......

Access restricted. Please log in or start a trial to view this content.

Discussion

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

Het artikel introduceert een end-to-end diep neuraal netwerk dat speciaal is ontworpen voor de detectie van opvallende objecten in complexe omgevingen. Het netwerk bestaat uit twee onderling verbonden componenten: een multiscale volledig convolutioneel netwerk op pixelniveau (DCL) en een deep encoder-decoder network (DEDN). Deze componenten werken synergetisch en bevatten contextuele semantiek om visuele contrasten te genereren binnen multiscale feature maps. Bovendien maken ze gebruik van zowel diepe als ondiepe beeldke.......

Access restricted. Please log in or start a trial to view this content.

Disclosures

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

De auteurs hebben niets te onthullen.

Acknowledgements

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

Dit werk wordt ondersteund door 2024 Henan Provincial Higher Education Institutions Key Scientific Research Project Funding Program Establishment (Projectnummer: 24A520053). Deze studie wordt ook ondersteund door Specialized Creation and Integration Characteristics Demonstration Course Construction in de provincie Henan.

....

Access restricted. Please log in or start a trial to view this content.

Materials

List of materials used in this article
NameCompanyCatalog NumberComments
MatlabMathWorksMatlab R2016aMATLAB's programming interface provides development tools for improving code quality maintainability and maximizing performance.
It provides tools for building applications using custom graphical interfaces.
It provides tools for combining MATLAB-based algorithms with external applications and languages
Processor Intel11th Gen Intel(R) Core (TM) i5-1135G7 @ 2.40GHz64-bit Win11 processor 
PycharmJetBrainsPyCharm 3.0PyCharm is a Python IDE (Integrated Development Environment)
a list of required python:
modulesmatplotlib
skimage
torch
os
time
pydensecrf
opencv
glob
PIL
torchvision
numpy
tkinter
PyTorch FacebookPyTorch 1.4 PyTorch is an open source Python machine learning library , based on Torch , used for natural language processing and other applications.PyTorch can be viewed both as the addition of GPU support numpy , but also can be viewed as a powerful deep neural network with automatic derivatives .

References

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,
  1. Wang, W. G., Shen, J. B., Ling, H. B. A deep network solution for attention and aesthetics aware photo cropping. IEEE Transactions on Pattern Analysis and Machine Intelligence. 41 (7), 1531-1544 (2018).
  2. Wang, W. G., Sun, G. L., Gool, L. V. Looking beyond single images for weakly supervised semantic segmentation learning.

Access restricted. Please log in or start a trial to view this content.

Reprints and Permissions

Request permission to reuse the text or figures of this JoVE article

Request Permission

Tags

Salient Object DetectionDeep Neural NetworkComplex EnvironmentsConvolutional Neural NetworkEncoder Decoder NetworkConditional Random FieldImage SegmentationSOD DatabaseVGG16 BackbonePyTorch Models

Related Articles