この論文で説明するプロトコルは、方向性勾配ヒストグラム技術を利用して、さまざまな振動状態下での具体的な画像サンプルの特性を抽出します。機械学習にサポートベクターマシンを採用することで、学習サンプルを最小限にとどめ、コンピュータ性能の要求が低い画像認識手法を実現しました。
Method Article
この論文で説明するプロトコルは、方向性勾配ヒストグラム技術を利用して、さまざまな振動状態下での具体的な画像サンプルの特性を抽出します。機械学習にサポートベクターマシンを採用することで、学習サンプルを最小限にとどめ、コンピュータ性能の要求が低い画像認識手法を実現しました。
本論文では、指向性勾配ヒストグラム技術を用いて、異なる振動状態で撮影されたコンクリート画像サンプルの特徴を抽出します。サポートベクターマシン(SVM)は、画像の特徴と振動状態の関係を学習するために利用されます。その後、機械学習の結果を使用して、コンクリートの振動状態の実現可能性を評価します。同時に、方向勾配ヒストグラムの計算パラメータが認識精度に及ぼす影響メカニズムを解析する。この結果は、コンクリートの振動状態を特定するために、方向勾配ヒストグラム-SVM技術を使用することの実現可能性を示しています。認識精度は、最初は増加し、その後、方向勾配のブロック サイズ、または統計間隔の数が増えるにつれて減少します。認識精度も、二値化閾値の増加に伴って直線的に低下します。解像度1024ピクセル×1024ピクセルのサンプル画像を使用し、特徴抽出パラメータを最適化することで、100%の認識精度を達成することができます。
コンクリートは、建設業界で広く使用されている基本的な建材です。ポンプ中、コンクリートは振動による圧縮を必要とする空隙を頻繁に発生させます。振動が不十分な場合、コンクリート表面が蜂の巣状になる可能性があり、過度の振動はコンクリートの偏析につながる可能性があります1,2。振動動作の質は、成形コンクリート構造物7,8の強度3,4,5,6および耐久性に大きく影響する。Caiら9,10は、実験的研究と数値解析を組み合わせた研究を行い、振動が骨材沈下とコンクリートの耐久性に及ぼす影響メカニズムを調査しました。その結果、振動時間と骨材粒子が骨材沈降に大きな影響を与える一方で、骨材密度とセメント系材料の塑性粘度の影響は最小限であることが明らかになりました。振動により、コンクリート試験片の底部に骨材が堆積します。さらに、振動時間が長くなると、塩化物イオン濃度はコンクリート試験片の下部で減少し、上部で有意に増加します9,10。
現在、コンクリートの振動状態の評価は、主に手作業による判断に頼っています。建設業界がインテリジェントな改革を通じて進歩し続けるにつれて、ロボット操作が将来の方向性として浮上しています11,12。したがって、インテリジェントな振動操作における重要な課題は、ロボットがコンクリートの振動状態を識別できるようにする方法です。
配向勾配のヒストグラムは、画素の強度勾配またはエッジ方向の分布を記述子として利用して、画像13,14におけるオブジェクトの表現および形状を特徴付ける技術である。このアプローチは、画像のローカルグリッドセルに作用し、さまざまな幾何学的および光学的条件下での画像変化の特性評価において堅牢な安定性を提供します。
Zhou et al.15 は、ベイヤーモード画像から指向性勾配特徴を直接抽出する方法を提案しました。このアプローチでは、カラーフィルター列をグラデーション演算子と一致させることにより、方向性グラデーションを計算する際の多くのステップが省略されるため、方向グラデーション画像認識の計算要件が大幅に削減されます。He et al.16 は、方向勾配ヒストグラムを基礎となる特徴として利用し、平均クラスタリング アルゴリズムを使用してレール ファスナーを分類し、ファスナーに欠陥があるかどうかを判断しました。認識の結果、配向勾配特徴のヒストグラムはファスナーの欠陥に対して高い感度を示し、鉄道の保守と修理のニーズを満たしていることが示されました。別の研究では、Xuら17 は、ガボールウェーブレットフィルタリングを使用して顔画像の特徴を前処理し、バイナリコーディングとHOGアルゴリズムを使用して特徴ベクトルの次元を縮小しました。この方法の平均認識精度は92.5%です。
サポートベクターマシン(SVM)18は、ベクトルを高次元空間にマッピングするために使用され、2つの平行な超平面間の距離を最大化するために適切な方向を有する分離超平面を確立する。これにより、サポートベクター19の分類が可能になる。学者たちはこの分類技術を改良・最適化し、画像認識20,21、テキスト分類22、信頼性予測23、故障診断24など、さまざまな分野への応用につながっている。
Li et al.25 は、3つの地震破壊モードに焦点を当てて、地震破壊パターン認識のための2段階SVMモデルを開発しました。解析結果は、提案された2段階SVM法が3つの故障モードで90%以上の精度を達成できることを示しています。Yang et al.26 は、最適化アルゴリズムをSVMに統合して、5つの超音波パラメータと荷重を受けたコンクリートの応力との関係をシミュレートしました。最適化されていないSVMのパフォーマンスは、特に低ストレスの段階では不十分です。ただし、アルゴリズムによって最適化されたモデルをトラバースすると、計算時間は長くなりますが、結果は改善されます。これに対し、粒子群最適化最適化SVMは、最適なシミュレーション結果を提供しながら、計算時間を大幅に短縮します。Yanら27 は、SVM技術を採用し、高強度コンクリートの弾性率を予測するために精度非感応損失関数を導入し、その予測精度を従来の回帰モデルやニューラルネットワークモデルと比較しました。研究結果は、SVM技術が他の方法と比較して弾性率の予測誤差を小さくすることを示しました。
本稿では、様々な振動状態におけるコンクリートの画像サンプルを収集し、方向勾配ヒストグラム法を用いてコンクリートの異なる状態を記述する。SVMを学習するための特徴ベクトルとして方向性勾配が採用され、本研究では、方向性勾配ヒストグラム-SVM技術を使用してコンクリートの振動状態を特定することの実行可能性に焦点を当てています。さらに、方向性勾配ヒストグラムの特徴抽出プロセスとSVMの認識精度における3つの主要パラメータ(二値化閾値、方向勾配統計ブロックサイズ、方向勾配統計間隔数)の影響メカニズムを解析します。
1. 具体的サンプル画像取得
2.サンプル画像のグレーの2値化
3. 方向勾配固有値の計算

4. 指向性勾配特徴ベクトルの構築
5. SVMトレーニング
6. SVM認識精度の検証
このプロトコルは、方向勾配機能の3ベクトル計算パラメータが、コンクリートの振動状態を識別する際のSVMの精度にどのように影響するかを分析することを目的としています。方向勾配特徴ベクトルの主要な計算パラメータには、方向勾配統計ブロックサイズ、方向勾配統計角度間隔の数、およびバイナリグレーしきい値が含まれます。このセクションでは、3つの主要な計算パラメータを変数として使用してテストを設計します。テスト・パラメータ・レベルの詳細を 表1に示します。解像度 1024 x 1024 ピクセルの具体的な画像サンプルに対して、合計 100 回のテストが実施されました。 表1 に記載のパラメータに対応する試験結果を 表2に示す。
異なるバイナリグレー閾値-SVM認識結果の分析
表2 は、異なる二値化閾値に対するSVMの平均認識精度を示しており、二値化閾値と認識精度の関係を 図4に可視化します。ブロックサイズと統計間隔の数が固定されている場合、SVMの認識精度は一般に、二値化しきい値の増加とともに減少傾向を示します。特に、二値化閾値が100〜150の範囲に入ると、認識精度が著しく低下する。この現象の背後にある理由と、SVMの除算計算への影響を理解するには、さらなる調査が必要です。
本節では、ステップ2.1で説明した方法とステップ3.1で説明した実験計画法に従って、非振動コンクリート、振動コンクリート、振動コンクリートの画像サンプルを2値化する。使用される2値化グレーのしきい値は50、100、150、200、および250であり、 図5、 図6、 および図7に示すように、各状態の2値化グレー画像になります。
図5に示すように、二値化閾値が減少するにつれて、非振動コンクリート画像サンプルのバイナリ画像における白い領域は大幅に減少する。2 値化のしきい値が 250 の場合、バイナリ イメージは純粋な黒に見えます。図6において、二値化閾値を有する振動コンクリート画像サンプルのバイナリグレー画像の変化傾向は、非振動コンクリートサンプルのそれと同様であるが、白色領域の減少は、振動コンクリート画像サンプルにおいてより顕著である。また、図7は、異なる振動状態におけるコンクリートの表面性状特性を反映して、黒い部分と白い部分の組み合わせを示しています。振動したコンクリートのバイナリグレー画像も、二値化閾値が小さくなるにつれて減少します。たとえば、二値化の閾値を 50 と 100 に設定すると、振動したコンクリートのバイナリ グレー イメージは白くなる傾向があります。しきい値が 150 の場合、他の 2 つの状態と同様に表示されますが、しきい値が 150 を超えると、バイナリ イメージは黒くなる傾向があります。特に、二値化閾値が100〜150の場合、バイナリ画像の特徴に大きな変化が生じます。
この論文の特徴ベクトル抽出は、画像サンプルの方向勾配に依存しています。2 値化のしきい値を 50 から 100 に増やすと、白と黒のピクセル間の接触面積が減少します。この削減は、各ピクセル間のピクセル値の変化に依存するため、ピクセル方向グラデーションの統計に影響を与えます。接触面積が大きいほど、SVM 特徴ベクトルの成分が 0 未満になり、コンクリートの振動状態特性の表現がより包括的になります。二値化閾値による認識精度の変化は、主に、方向勾配特徴ベクトルにおける 0 成分の数の変化によるものです。さらに、2値化閾値を150から250に引き上げると、バイナリ画像サンプルの白色領域が有意に減少する。その結果、対応する認識精度も大幅に低下し、このルールをさらに裏付けます。
異なる方向勾配統計ブロックサイズ-SVM認識結果
このセクションでは、 表2 に示されているように、異なる方向の勾配統計の統計的ブロックサイズ識別精度が計算されます。続いて、各方向の勾配統計量の統計的ブロックサイズ同定精度の平均値を算出する。その結果を 図8に示します。
図 8 は、解像度が 1024 のコンクリート画像サンプルに対する SVM の認識と、方向勾配の統計的ブロック サイズとの関係を示しています。この関係は、式(2)で表すことができる。
y=0.09+0.144x-0.01x2 (2)
画像サンプル特徴ベクトルは、ブロックスイープ法20によって計算される。一方、ブロックが小さい場合、特徴ベクトルはバイナリ イメージの局所特異性を特徴付けます。これにより、類似した局所特異性を持つ異なる振動状態の具体的なサンプル画像が得られ、特徴ベクトルにかなりの数の 0 成分が生じます。その結果、この多数の 0 成分は、SVM 分割に大きな干渉を引き起こし、特にブロック サイズが 8 ピクセルの 1024 ピクセルの画像の場合、認識精度の低下につながります。
ブロックサイズが大きくなると、特徴ベクトルによって反映される局所特異性は徐々に減少し、 図10に示すように、特徴ベクトルは画像サンプルの局所的特異性を特徴付けます。その結果、特徴ベクトル内の 0 成分の数が減少し、SVM の分割プロセス中の干渉が少なくなります。これにより、SVMの認識精度が向上する。
しかし、ブロックサイズがさらに大きくなり、32ピクセルを超えると、特徴ベクトル内の0成分の数は減少し続ける。しかし、それはまた、SVMトレーニングセットの特徴ベクトルの次元の縮小にもつながります。この時点で、SVMの認識精度への影響は、主に特徴量の不足に起因しています。それにもかかわらず、特徴ベクトルは、具体的な画像にある程度の特異性を捉えることに成功しています。 図11に示すように、ブロックサイズをある程度拡大しても、振動状態の異なるコンクリート画像サンプルの各ブロックの方向性勾配特徴量には大きな違いが見られます。この観察は、ブロックサイズが比較的小さいにもかかわらず、ブロックサイズが過度に大きくなると認識精度が低下する理由を説明しています。
方向勾配統計角度間隔数-SVM認識結果
本節では、 表2 に示す統計的区間の方向勾配数の認識精度を算出する。続いて、方向勾配の数の統計的区間の平均認識精度が計算される。その結果を 図12に示します。
図12から、方向勾配の統計間隔の数が増えるにつれて、コンクリートの振動状態に対するSVMの認識精度は、最初は上昇し、その後低下することは明らかです。この関係は、式(3)で表すことができます
y=-0.45+0.2x-0.007x2 (3)
勾配方向の統計的区間数と認識精度の影響メカニズムは、画像特徴抽出パラメータの変化によるものです。これにより、画像サンプルの特徴ベクトルの特定の特性評価能力にシフトが生じます。このセクションでは、適度に振動したコンクリートの画像サンプルの一部をインターセプトします。 図13に示すように、グリッドサイズを4とし、方向勾配統計区間の数を6、9、12、15に設定した場合に、方向性勾配特性の計算結果が得られます。
図13A、Bに示すように、方向勾配統計間隔の数を6に設定すると、各間隔のサイズは60°になります。計算ブロックのサイズが 4x4 であることを考えると、各ブロックには 16 ピクセルがあります。間隔サイズを大きくすると、複数のピクセルの方向グラデーションが 1 つの間隔内に収まります。これにより、区間サイズが大きくなると、画像サンプルの特徴ベクトルにおける0成分の数が増加します。その結果、SVMの学習結果と認識精度に影響を与えます。ただし、方向勾配の統計間隔の数が 9 の場合、角度分割はより細分化され、間隔内にピクセルがない状況が減少します。その結果、画像サンプルの特徴ベクトルにおける0成分の数も減少し、特徴ベクトルの画像特異的表現能力が向上する。しかし、図13Cおよび図13Dと比較すると、方向勾配統計間隔の数が12から15に増加すると、指向性勾配特徴量計算結果の間隔が0の画素数が増加する。その結果、サンプル画像の特異性を特徴付ける特徴ベクトルの能力が低下します。この特性評価能力の低下は、方向勾配統計区間のサイズがさらに小さくなることに起因します。具体的には、ピクセルが 1 つしかない間隔が 2 つの間隔に分割され、1 つはピクセルが 1 つ、もう 1 つは空の間隔になります。その結果、空の間隔の数が増えると、特徴ベクトルの 0 成分が多くなり、最終的には認識精度が低下します。

図1:非振動コンクリートのイメージ。 振動操作なしで撮影されたポンプコンクリート画像。 この図の拡大版をご覧になるには、ここをクリックしてください。

図2:振動するコンクリートのイメージ。 コンクリートの揚水振動操作の画像サンプル。 この図の拡大版をご覧になるには、ここをクリックしてください。

図3:振動したコンクリートサンプルのイメージ。 コンクリートの圧送振動動作が完了したときの画像サンプル。 この図の拡大版をご覧になるには、ここをクリックしてください。

図4:二値化閾値と認識精度の関係。 SVMの認識精度に対する二値化閾値の影響。 この図の拡大版をご覧になるには、ここをクリックしてください。

図5:非振動コンクリートのバイナリグレースケール画像。 異なる2値化閾値を設定した場合の非振動コンクリート画像の2値化処理結果。(A)50の二値化閾値。(B)100での二値化閾値。(C)150の二値化閾値。(D)200における二値化閾値。(E)250の二値化閾値。 この図の拡大版をご覧になるには、ここをクリックしてください。

図6:振動するコンクリートのバイナリグレースケール画像。 異なる二値化閾値を設定した場合の振動コンクリート画像の二値化処理結果。(A)50の二値化閾値。(B)100での二値化閾値。(C)150での二値化閾値。(D)200における二値化閾値。(E)250の二値化閾値。 この図の拡大版をご覧になるには、ここをクリックしてください。

図7:振動したコンクリートのバイナリグレースケール画像。 異なる二値化閾値を設定した場合の振動コンクリート画像の二値化処理結果。(A)50の二値化閾値。(B)100での二値化閾値。(C)150の二値化閾値。(D)200における二値化閾値。(E)250の二値化閾値。 この図の拡大版をご覧になるには、ここをクリックしてください。

図8:方向勾配統計ブロックサイズ認識精度図。 SVMの認識精度に及ぼす方向勾配統計ブロックサイズの影響。 この図の拡大版をご覧になるには、ここをクリックしてください。

図9:ブロックサイズ8ピクセルの方向勾配特徴抽出結果の模式図。 グラデーション機能は、ブロックサイズが8ピクセルの場合、3種類の振動状態方向になります。(A)非振動コンクリート、(B)振動コンクリート、(C)振動コンクリート。 この図の拡大版をご覧になるには、ここをクリックしてください。

図10:ブロックサイズ128ピクセルの指向性勾配特徴抽出結果の模式図。 グラデーション機能は、ブロック サイズが 128 ピクセルの場合、3 種類の振動状態方向になります。(A)非振動コンクリート、(B)振動コンクリート、(C)振動コンクリート。 この図の拡大版をご覧になるには、ここをクリックしてください。

図11:ブロックサイズ512ピクセルの異なる振動状態のコンクリートサンプル画像の方向勾配抽出結果。 グラデーション機能は、ブロックサイズが512ピクセルの場合、3種類の振動状態方向になります。(A)非振動コンクリート、(B)振動コンクリート、(C)振動コンクリート。 この図の拡大版をご覧になるには、ここをクリックしてください。

図12:方向勾配統計間隔数と認識精度の関係。 SVMの認識精度に及ぼす方向勾配統計間隔数値r の影響 この図の拡大版をご覧になるには、ここをクリックしてください。

図13:異なる方向勾配統計区間の数の方向勾配特性の計算結果。 サンプルの方向勾配特性の結果は、異なる方向勾配の統計間隔が設定された場合に得られます。(A)6方向勾配統計区間、(B)9方向勾配統計区間、(C)12方向勾配統計区間、(D)15方向勾配統計区間。 この図の拡大版をご覧になるには、ここをクリックしてください。
表1:SVM識別テストの係数レベル。 コンクリートの振動状態を特定するためのSVMの精度に対する方向勾配特徴ベクトルの計算パラメータの影響が解析されます。 この表をダウンロードするには、ここをクリックしてください。
表2:方向勾配ヒストグラムパラメータ分析テスト結果。 表1の試験方式に基づいて、認識精度の結果を得る。この表をダウンロードするには、ここをクリックしてください。
本稿では、サポートベクターマシン(SVM)を用いて、様々なコンクリート振動状態サンプルの画像特徴を学習する。機械学習の成果をもとに、画像認識に基づく具体的な振動状態認識手法を提案する。認識精度を高めるには、画像セグメンテーション、画像の二値化、方向勾配固有値抽出の3つの重要なステップのパラメータを制御することが重要です。試験結果によれば、より小さな二値化閾値を用いて具体的なサンプル画像を前処理し、128ピクセル×128ピクセルの画像セグメンテーションブロックサイズを利用する。統計的角度間隔の方向勾配の数は 12 に設定されています。1024 解像度の画像サンプル セットでは、機械学習結果に対して最高の認識精度が達成されます。
建設現場によって環境が大きく異なるため、この方法には精度調整メカニズムがあります。認識精度が要件を満たさない場合、実行可能なソリューションとして上記の3つの主要なパラメータを拡張または縮小し、環境の変化によって引き起こされる認識精度エラーを効果的に軽減できます。この方法は、作業面の照明条件に大きく依存することに注意することが重要です。低照度条件下で撮影すると、認識精度が低下する場合があります。照明条件への依存性を低減するために、低照度画像強調アルゴリズムが検討されているが30、それらは認識時間とハードウェア要件を著しく増加させる。現在のところ、低照度認識精度と認識効率の両方を保証する効果的な技術はありません。この方法では、配向勾配技術のヒストグラムを使用して、表面の崩壊、セメントスラリーの浮遊、コンクリート振動の過程での気泡など、コンクリートの振動状態の特性を特徴付けます。既存の技術と比較して、このアプローチは必要なサンプル数を大幅に削減し、コンピューターのパフォーマンス要件を下げます。2.30GHzのCPUを搭載したノートPCでは、認識プロセスにより、SVMのトレーニングスペースの区別がわずか15秒で完了します。抽出パラメータが適切に設定されると、認識精度も向上する31。
将来的には、このプロトコルを利用して建設ロボットの振動動作を指令し、コンクリートが目的の振動レベルに達したときに作業をタイムリーに停止できるため、不十分な振動によって引き起こされる品質問題を回避できます。さらに、この手法は、構造の平坦度検出、作業面スラリーの除去、その他の関連プロセスなど、建設現場でのテクスチャ特性に基づいてロボットの動作を変更するように適用できます。
著者は何も開示していません。
この作業に資金を提供してくれた武漢都市建設グループ2023年次科学研究プロジェクト(NO.7)に感謝します。
| Name | Company | Catalog Number | Comments |
|---|---|---|---|
| カメラ | SONY | A6000 | センサーサイズは 23.5x15.6mm、最大取得解像度は 1440 * 1080、有効画素は 2,430 万です。 |
| コンクリート | 武漢建設長新技術開発有限公司 | C30ポンプコンクリート | 「コンクリート強度試験評価基準」(GB / T 50107-2010)の基準によると、立方体圧縮強度の標準値は30MPaポンプコンクリートです。 |
| Matlab | MathWorks | Matlab R2017a | MATLABのプログラミングインターフェースは、コード品質、保守性を向上させ、パフォーマンスを最大化するための開発ツールを提供します。 カスタムグラフィカルインターフェースを使用してアプリケーションを構築するためのツールを提供します。 MATLABベースのアルゴリズムを外部のアプリケーションや言語と組み合わせるためのツールを提供します |
| プロセッサ | Intel | 第12世代Intel(R)Core(TM)i7-12700H @ 2.30GHz | 64ビットWin11プロセッサ |
Request permission to reuse the text or figures of this JoVE article
Request Permission