複雑な環境で顕著な物体を検出するためのエンドツーエンドのディープニューラルネットワーク

Yu Wang; Zhiteng Wang

doi:10.3791/65554

Method Article

複雑な環境で顕著な物体を検出するためのエンドツーエンドのディープニューラルネットワーク

DOI:

10.3791/65554

⸱

December 15th, 2023

Yu Wang¹ , Zhiteng Wang²

¹Zhengzhou University of Economics and Business, ²The 713 Research Institute of CSSC

Summary

$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

本プロトコルは、新しいエンドツーエンドの突出物検出アルゴリズムを記述する。ディープニューラルネットワークを活用して、複雑な環境コンテキスト内で顕著な物体の検出精度を高めます。

Abstract

$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

顕著な物体の検出は、コンピュータビジョンの領域で急成長している関心分野として浮上しています。しかし、一般的なアルゴリズムは、複雑で多面的な環境の中で顕著な物体を検出する場合、精度が低下します。この差し迫った懸念に照らして、この記事では、複雑な環境内の顕著なオブジェクトを検出することを目的としたエンドツーエンドのディープニューラルネットワークを紹介します。この研究では、複雑な環境内の顕著な物体を検出することを目的としたエンドツーエンドのディープニューラルネットワークが導入されています。提案されたネットワークは、ピクセルレベルのマルチスケール全畳み込みネットワークと深層符号化器デコーダーネットワークという2つの相互に関連するコンポーネントで構成されており、コンテキストセマンティクスを統合してマルチスケール特徴マップ間の視覚的なコントラストを生成すると同時に、深層および浅い画像特徴を採用してオブジェクト境界識別の精度を向上させます。全結合条件付き確率場(CRF)モデルの統合により、突出マップの空間的一貫性と等高線描写がさらに強化されます。提案されたアルゴリズムは、SODおよびECSSDデータベース上の10の最新のアルゴリズムに対して広範囲に評価されています。評価結果は、提案アルゴリズムが精度と精度の点で他のアプローチを凌駕していることを示しており、複雑な環境下での顕著な物体検出における有効性を確立しています。

Introduction

$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

顕著な物体検出は、人間の視覚的注意を模倣し、背景情報を抑制しながら重要な画像領域を迅速に識別します。この手法は、画像トリミング¹、セマンティックセグメンテーション²、画像編集³などのタスクの前処理ツールとして広く採用されています。背景の置換や前景の抽出などのタスクを合理化し、編集の効率と精度を向上させます。さらに、ターゲットのローカリゼーションを強化することで、セマンティックセグメンテーションを支援します。顕著な物体検出が計算効率を高め、メモリを節約する可能性は、その重要な研究と応用の見通しを強調しています。

何年にもわたって、顕著な物体検出は、初期の従来のアルゴリズムからディープラーニングアルゴリズムの組み込みへと進化してきました。これらの進歩の目的は、顕著な物体検出と人間の視覚メカニズムの間のギャップを狭めることでした。これにより、顕著な物体検出の研究に深層畳み込みネットワークモデルが採用されました。Borji et ^al.4 は、画像の根本的な特徴に依存する古典的な従来のアルゴリズムのほとんどを要約し、一般化しました。検出精度はいくらか向上したものの、複雑な環境で顕著な物体を検出するには、手作業による経験と認知が引き続き課題となっています。

Access restricted. Please log in or start a trial to view this content.

Protocol

$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

1. 実験のセットアップと手順

事前学習済みの VGG16 モデルを読み込みます。
注: 最初のステップは、Keras ライブラリ⁶ から事前トレーニング済みの VGG16 モデルをロードすることです。
1. PyTorch などの一般的なディープラーニングライブラリ ( 材料表を参照) を使用して、事前トレーニング済みの VGG16 モデルを Python で読み込むには、次の一般的な手順に従います。
  1. トーチをインポートします。torchvision.models をモデルとしてインポートします。
  2. 事前学習済みの VGG16 モデルを読み込みます。vgg16_model = models.vgg16(pretrained=True) です。
  3. VGG16 モデルの要約が "print(vgg16_model)" であることを確認します。
DCL モデルと DEDN モデルを定義します。
1. DCL アルゴリズムの擬似コードとして、 入力: イメージデータセット SOD と 出力: トレーニング済み DCL モデル

Access restricted. Please log in or start a trial to view this content.

Results

$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

本研究では、ピクセルレベルのマルチスケール完全畳み込みネットワークと深層符号化器デコーダネットワークという2つの相補的なネットワークで構成されるエンドツーエンドの深層ニューラルネットワークを紹介します。最初のネットワークは、コンテキストセマンティクスを統合して、マルチスケールの特徴マップから視覚的なコントラストを導き出し、異なる層にわたるディープニューラルネットワークの固定受容野の課題に対処します。2 番目のネットワークは、深い画像特徴と浅い画像特徴の両方を利用して、ターゲットオブジェクトの境界がぼやけるという問題を軽減します。最後に、全結合条件付き確率場 (CRF) モデルを適用して、顕著性マップの空間的一貫性と等高線を改善します。

この研究では、提案されたアルゴリズムと、この分野の既存の10のアルゴリズムとの間の定性的および定量的な比較を実施します。実験結果は、提案されたアルゴリズムが重要な物体検出の精度を高める上で有効であることを実証しています。さらに、このアルゴリズムは、電力視覚タスクへの潜在的な適用可能性を示しており、インテリジェント電力網のドメイン内のさまざまな複雑な.......

Access restricted. Please log in or start a trial to view this content.

Discussion

$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

この記事では、複雑な環境で顕著な物体を検出するために特別に設計されたエンドツーエンドのディープニューラルネットワークを紹介します。このネットワークは、ピクセルレベルのマルチスケール完全畳み込みネットワーク (DCL) と深層符号化器デコーダーネットワーク (DEDN) という 2 つの相互接続されたコンポーネントで構成されています。これらのコンポーネントは相乗的に機能し、コンテキストセマンティクスを組み込んで、マルチスケールフィーチャマップ内で視覚的なコントラストを生成します。さらに、深い画像と浅い画像の両方の特徴を活用して、物体の境界の描写の精度を向上させます。全結合の条件付きランダム場(CRF)モデルの統合により、顕著性マップと等高線描写の空間的一貫性がさらに強化されます。

この目的を達成するために、VGG16アーキテクチャに基づいて、深層コンテキスト学習(DCL)ネットワークと深層符号化器復号ネットワーク(DEDN)の2つの深層ネットワークが構築されました。操作ステップ1.2で説明したように、DCLを介して処理された入力画像は、異なる受容野によって特徴付けられるさま.......

Access restricted. Please log in or start a trial to view this content.

Disclosures

$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

著者は何も開示していません。

Acknowledgements

$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

この研究は、2024 Henan Provincial Higher Education Institutions Key Scientific Research Project Funding Program Establishment (プロジェクト番号:24A520053) の支援を受けています。この研究は、河南省の専門創造および統合特性実証コース建設によってもサポートされています。

....

Access restricted. Please log in or start a trial to view this content.

Materials

List of materials used in this article
Name	Company	Catalog Number	Comments
Matlab	MathWorks	Matlab R2016a	MATLABのプログラミングインターフェースは、コード品質、保守性を向上させ、パフォーマンスを最大化するための開発ツールを提供します。カスタムグラフィカルインターフェースを使用してアプリケーションを構築するためのツールを提供します。 MATLABベースのアルゴリズムを外部アプリケーションや言語と組み合わせるためのツールを提供します
プロセッサ	Intel	第11世代Intel(R)Core(TM)i5-1135G7 @ 2.40GHz	64ビットWin11プロセッサ
Pycharm	JetBrains	PyCharm 3.0	PyCharm は Python IDE (統合開発環境) 必要な python: modulesmatplotlib skimage torch os time pydensecrf opencv glob PIL torchvision numpy tkinter
PyTorch	フェイスブック	PyTorch 1.4	PyTorchは、TorchをベースにしたオープンソースのPython機械学習ライブラリで、自然言語処理やその他のアプリケーションに使用されます。PyTorchは、GPUサポートnumpyの追加として見ることができるだけでなく、自動導関数を備えた強力なディープニューラルネットワークとしても見ることができます。

References

$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

Wang, W. G., Shen, J. B., Ling, H. B. A deep network solution for attention and aesthetics aware photo cropping. IEEE Transactions on Pattern Analysis and Machine Intelligence. 41 (7), 1531-1544 (2018).
Wang, W. G., Sun, G. L., Gool, L. V. Looking beyond single images for weakly supervised semantic segmentation learning.

Access restricted. Please log in or start a trial to view this content.

Reprints and Permissions

Request permission to reuse the text or figures of this JoVE article

Request Permission

複雑な環境で顕著な物体を検出するためのエンドツーエンドのディープニューラルネットワーク

In This Article

Summary

Abstract

Introduction

Protocol

Results

Discussion

Disclosures

Acknowledgements

Materials

References

Reprints and Permissions

Tags

Related Articles