Method Article

Karmaşık ortamlarda göze çarpan nesne algılama için uçtan uca derin sinir ağı

DOI:

10.3791/65554

December 15th, 2023

In This Article

Summary

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

Mevcut protokol, yeni bir uçtan uca göze çarpan nesne algılama algoritmasını açıklamaktadır. Karmaşık çevresel bağlamlarda göze çarpan nesne algılamanın hassasiyetini artırmak için derin sinir ağlarından yararlanır.

Abstract

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

Göze çarpan nesne algılama, bilgisayarla görme alanında gelişen bir ilgi alanı olarak ortaya çıkmıştır. Bununla birlikte, hakim algoritmalar, karmaşık ve çok yönlü ortamlarda göze çarpan nesneleri tespit etmekle görevlendirildiğinde azalan hassasiyet sergiler. Bu acil endişenin ışığında, bu makale, karmaşık ortamlarda göze çarpan nesneleri tespit etmeyi amaçlayan uçtan uca bir derin sinir ağı sunmaktadır. Çalışma, karmaşık ortamlarda göze çarpan nesneleri tespit etmeyi amaçlayan uçtan uca bir derin sinir ağı sunuyor. Piksel düzeyinde çok ölçekli tam evrişimli ağ ve derin kodlayıcı-kod çözücü ağı olmak üzere birbiriyle ilişkili iki bileşenden oluşan önerilen ağ, nesne sınırı tanımlamasının doğruluğunu artırmak için derin ve sığ görüntü özellikleri kullanırken, çok ölçekli özellik haritalarında görsel kontrast üretmek için bağlamsal anlambilimi bütünleştirir. Tamamen bağlantılı bir koşullu rastgele alan (CRF) modelinin entegrasyonu, göze çarpan haritaların uzamsal tutarlılığını ve kontur tasvirini daha da geliştirir. Önerilen algoritma, SOD ve ECSSD veritabanlarındaki 10 çağdaş algoritmaya karşı kapsamlı bir şekilde değerlendirilmiştir. Değerlendirme sonuçları, önerilen algoritmanın kesinlik ve doğruluk açısından diğer yaklaşımlardan daha iyi performans gösterdiğini ve böylece karmaşık ortamlarda göze çarpan nesne tespitindeki etkinliğini ortaya koyduğunu göstermektedir.

Introduction

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

Göze çarpan nesne algılama, arka plan bilgilerini bastırırken önemli görüntü bölgelerini hızla tanımlayarak insanın görsel dikkatini taklit eder. Bu teknik, görüntü kırpma1, anlamsal segmentasyon2 ve görüntü düzenleme3 gibi görevlerde bir ön işleme aracı olarak yaygın olarak kullanılmaktadır. Arka plan değiştirme ve ön plan çıkarma gibi görevleri kolaylaştırarak düzenleme verimliliğini ve hassasiyetini artırır. Ek olarak, hedef yerelleştirmeyi geliştirerek anlamsal segmentasyona yardımcı olur. Hesaplama verimliliğini artırmak ve belleği korumak için göze çarpan nesne algılama potansiyeli, önemli a....

Access restricted. Please log in or start a trial to view this content.

Protocol

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

1. Deney düzeneği ve prosedürü

  1. Önceden eğitilmiş VGG16 modelini yükleyin.
    NOT: İlk adım, önceden eğitilmiş VGG16 modelini Keras kitaplığından6 yüklemektir.
    1. PyTorch gibi popüler derin öğrenme kitaplıklarını kullanarak Python'da önceden eğitilmiş bir VGG16 modeli yüklemek için şu genel adımları izleyin:
      1. İthalat meşalesi. torchvision.models'i model olarak içe aktarın.
      2. Önceden eğitilmiş VGG16 modelini yükleyin. vgg16_model = models.vgg16(önceden eğitilmiş=Doğru).
      3. VGG16 modelinin özetinin "print(vgg16_model)" olduğundan emin olun.

Access restricted. Please log in or start a trial to view this content.

Results

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

Bu çalışma, iki tamamlayıcı ağdan oluşan uçtan uca bir derin sinir ağını tanıtmaktadır: piksel düzeyinde çok ölçekli tam evrişimli ağ ve derin kodlayıcı-kod çözücü ağı. İlk ağ, çok ölçekli özellik haritalarından görsel kontrastlar elde etmek için bağlamsal semantikiyi entegre ederek, farklı katmanlardaki derin sinir ağlarındaki sabit alıcı alanların zorluğunu ele alır. İkinci ağ, hedef nesnelerdeki bulanık sınırlar sorununu azaltmak için hem derin hem de sığ görüntü özelliklerini kullanır. Son olarak, belirginlik haritas.......

Access restricted. Please log in or start a trial to view this content.

Discussion

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

Makale, karmaşık ortamlarda göze çarpan nesnelerin algılanması için özel olarak tasarlanmış uçtan uca bir derin sinir ağını tanıtmaktadır. Ağ, birbirine bağlı iki bileşenden oluşur: piksel düzeyinde çok ölçekli tam evrişimli ağ (DCL) ve derin kodlayıcı-kod çözücü ağ (DEDN). Bu bileşenler, çok ölçekli özellik haritalarında görsel kontrastlar oluşturmak için bağlamsal anlambilimi birleştirerek sinerjik olarak çalışır. Ek olarak, nesne sınırı tanımlamasının hassasiyetini artırmak için hem derin hem de sığ görüntü özellikler.......

Access restricted. Please log in or start a trial to view this content.

Disclosures

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

Yazarların açıklayacak hiçbir şeyi yok.

Acknowledgements

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

Bu çalışma, 2024 Henan İl Yükseköğretim Kurumları Temel Bilimsel Araştırma Projesi Destekleme Programı Kurulumu (Proje No:24A520053) tarafından desteklenmektedir. Bu çalışma aynı zamanda Henan Eyaletinde Özel Oluşturma ve Entegrasyon Karakteristik Gösteri Kursu İnşaatı tarafından da desteklenmektedir.

....

Access restricted. Please log in or start a trial to view this content.

Materials

List of materials used in this article
NameCompanyCatalog NumberComments
MatlabMathWorks MatlabR2016aMATLAB'ın programlama arayüzü, kod kalitesini, sürdürülebilirliği iyileştirmek ve performansı en üst düzeye çıkarmak için geliştirme araçları sağlar.
Özel grafik arayüzler kullanarak uygulamalar oluşturmak için araçlar sağlar.
MATLAB tabanlı algoritmaları harici uygulamalar ve dillerle birleştirmek için araçlar sağlar
İşlemci Intel11. Nesil Intel(R) Core (TM) i5-1135G7 @ 2.40GHz64-bit Win11 işlemci 
PycharmJetBrainsPyCharm 3.0PyCharm bir Python IDE'dir (Entegre Geliştirme Ortamı)
gerekli python:
modulesmatplotlib
skimage
torch
os
time
pydensecrf
opencv
glob
PIL
torchvision
numpy
tkinter
PyTorch FacebookPyTorch 1.4 PyTorch açık kaynaklı bir Python makine öğrenimi kütüphanesidir , Torch tabanlı , doğal dil işleme ve diğer uygulamalar için kullanılır. PyTorch, hem GPU desteğinin eklenmesi olarak görülebilir numpy , hem de otomatik türevlere sahip güçlü bir derin sinir ağı .

References

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,
  1. Wang, W. G., Shen, J. B., Ling, H. B. A deep network solution for attention and aesthetics aware photo cropping. IEEE Transactions on Pattern Analysis and Machine Intelligence. 41 (7), 1531-1544 (2018).
  2. Wang, W. G., Sun, G. L., Gool, L. V. Looking beyond single images for weakly supervised semantic segmentation learning.

Access restricted. Please log in or start a trial to view this content.

Reprints and Permissions

Request permission to reuse the text or figures of this JoVE article

Request Permission

Tags

Salient Object DetectionDeep Neural NetworkComplex EnvironmentsConvolutional Neural NetworkEncoder Decoder NetworkConditional Random FieldImage SegmentationSOD DatabaseVGG16 BackbonePyTorch Models

Related Articles