データプライバシーとアクセス制御を強化するための学習不可能な例を生成および管理するためのブロックチェーンベースのフレームワーク

Ruijia Li; Zijiao Zhang; Shouli Fu; Lin Zhu; Qunpeng Lei; Buwei Wang

doi:10.3791/68338

Research Article

データプライバシーとアクセス制御を強化するための学習不可能な例を生成および管理するためのブロックチェーンベースのフレームワーク

DOI:

10.3791/68338

⸱

August 22nd, 2025

Ruijia Li¹ , Zijiao Zhang¹ , Shouli Fu¹ , Lin Zhu¹ , Qunpeng Lei¹ , Buwei Wang¹

¹School of Cyberspace Security, Zhengzhou University

Summary

$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

この論文では、動的摂動とアクセス制御を統合し、学習不可能な例を生成するためのブロックチェーンベースのフレームワークを提案します。権限のないユーザーが邪魔されたデータを確実に受信できるようにすることでプライバシー保護を強化し、スマートコントラクトを介した効率的なデータ管理とアクセスを可能にしながら機密情報を保護します。

Abstract

$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

大規模言語モデル (LLM) の急速な発展の中で、モデルのトレーニングに膨大な量のネットワークデータを活用することでコストのかかるデータアノテーションをバイパスできるため、対照学習が広く採用されるようになりました。ただし、この広範な使用により、データプライバシー保護に関して重大な懸念が生じます。Unlearnable Examples (UE) は、データを摂動することでモデルの学習を妨害する手法であり、不正なモデルが機密データを悪用するのを効果的に防止します。ただし、UEを生成するための既存の方法は、2つの主要な課題に直面しています:第一に、画像UEの保護摂動を除去する拡散モデルを含む、逆精製やノイズ除去などの技術を使用して摂動を逆転させることができます。第二に、データが公開されると、データのトレーサビリティの確保とアクセス制御の管理が困難になります。これらの問題に対処するために、本稿では、UEを生成・管理するためのBlockchain-Integrated Unlearnable Example Generation and Management Framework(B-UEGMF)を提案します。ブロックチェーンの分散型で不変の特性を活用することで、サンプルのハッシュ値をブロックチェーン上に保存し、スマートコントラクトを通じてデータアクセス権を動的に管理します。さらに、UE は多目的摂動技術である動的誤差最小化ノイズ (DEM) を使用して生成され、反転法に対する堅牢性が強化されます。また、生成された事例のプライバシー保護能力を定量的に評価します。実験結果は、提案フレームワークが効率的なデータプライバシー管理を確保しながら、リバースアタックに対するUEの防御を大幅に向上させることを示しています。

Introduction

$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

近年、深層学習と大規模言語モデルの急速な進歩に伴い、対比学習はコストのかかる手動アノテーションから独立しているため、効率的な教師なし学習アプローチとして浮上しています^1,2。しかし、公開データセットの広範な使用により、プライバシー侵害やデータの悪用に関する重大な懸念が生じています。モデルトレーニングのために公開されているデータを不正に利用する事例はますます一般的になっています³.たとえば、2017 年には、顔認識モデルのトレーニングに無許可の公開写真が使用されました⁴。同様に、Amazon は、すべてのユーザーからの明示的な同意を確保せずに、消費者の公開レビューデータを利用してレコメンデーションシステムをトレーニングし、プライバシー保護メカニズムの脆弱性を露呈しました⁵。

これらの問題に対処するために、新しいデータプライバシー保護技術としてUnlearnable Examples(UE)が登場しました。UEは、データサンプルに知覚できない摂動を追加し^{、データに対する}人間の認識を維持しながら、モデルが機密情報を学習するのを防ぐショートカットを導入します^6,7,8。UEを生成するための既存の方法には、主にエラー最小化ノイズ(EM)摂動⁹、敵対的生成ネットワーク(GAN)¹⁰による摂動生成、ロバストエラー最小化ノイズ(REM)、および敵対的トレーニングによって最適化された安定エラー最小化ノイズ(SEM)^11,12が含まれます。さらに、最近、誤ったラベルノイズを生成する拡散モデルが適用され、プライバシー保護がさらに強化されています¹³。

UE の生成は大幅に進歩しましたが、特にこれらの方法のプライバシー保護効果が完全に検証されていない現実世界のアプリケーションでは、いくつかの課題が残っています。具体的には、主な課題は次のとおりです。
復元の問題:拡散モデルは、データに埋め込まれた摂動を予測して除去することで、学習不能な例を部分的に回復し、それによって学習可能性を回復し、プライバシー保護を損なうことができます^14,15。トレーニング中にデータが乱れた場合でも、復元後も機密情報が漏洩する可能性があります。
データのトレーサビリティとアクセス制御: 学習できない例がリリースされると、その出所を追跡し、アクセス制限を適用するための効果的なメカニズムは技術的に困難なままです¹⁶.
プライバシー保護とモデルパフォーマンスのバランス:既存の方法は、プライバシーを保護するために学習不可能な例を生成することに重点を置いていますが、プライバシー保護とモデルトレーニングパフォーマンスのバランスを維持することは未解決のままです17,18,19。現在の研究のほとんどはプライバシー保護を優先していますが、モデルトレーニング中のパフォーマンス低下を軽減することには限られた注意を払っています^20,21。その結果、データへのアクセスと利用は、プライバシー保護における重大な懸念事項となっています²²。

集中型ソリューションと信頼できる実行環境 (TEE) は、データアクセス制御への代替アプローチを提供しますが、医療/法的シナリオでは固有の制限に直面しています。(2) TEE には特殊なハードウェアが必要であり、分散型コンセンサスが欠けています²⁴.ブロックチェーンは、その不変の台帳特性が、データガバナンス規制(HIPAA監査証跡など)への証明可能なコンプライアンス、複数機関の設定における検閲耐性のあるアクセス制御、タイムスタンプ付きのトランザクションによるきめ細かな出所追跡という、UE管理の3つの重要な要件に直接対処するため、最適なソリューションとして浮上しています²⁵^、²⁶^、²⁷。

私たちのフレームワークは、GPUアクセラレーションを備えた中規模データセットに対して最適なパフォーマンスを実証し、リアルタイムの摂動生成を実現しました。ブロックチェーンの運用には測定可能なオーバーヘッドが発生しますが、このトレードオフは、多機関の医学研究や規制されたデータ市場など、不変のアクセスログを必要とするシナリオでは正当化されます。システムはデータセットのサイズに応じて直線的に拡張されますが、安定した動作には ≥16 GB の RAM と 4 コア CPU が必要なため、リソースに制約のあるエッジデバイスにはあまり適していません。

これらの課題に対処するために、本論文では、ブロックチェーン統合の学習不能なサンプル生成および管理フレームワーク(B-UEGMF)を提案します。ブロックチェーンは、分散型で不変の分散型台帳技術として、データアクセスハッシュを効果的に記録し、スマートコントラクトによってアクセス許可を動的に管理することで、学習できない例^28,29 のプライバシー保護機能を強化します。このフレームワークでは、許可されたユーザーはクリーンなデータにアクセスできますが、許可されていないユーザーは動的に生成された学習不可能な例にのみアクセスできます。既存の問題に取り組むために、本論文では、新しい動的誤差最小化ノイズ(DEM)生成方法を紹介します。DEM は、クライアント固有の情報と時間パラメータを組み込むことで、摂動をデータに動的に埋め込み、データ要求ごとに固有の摂動を生成し、データのプライバシーと学習不能性の両方を確保します。DEM の生成プロセスを図 1 に示します。この論文の主な貢献は次のとおりです。
動的トレーサビリティとアクセス管理:本稿では、B-UEGMFフレームワークを提案することで、Unlearnable Examplesのリリースに関連するトレーサビリティとアクセス制御の問題に対処します。ブロックチェーンの分散型の性質により、従来のシステムにおける信頼できるサードパーティの問題が解決され、その透明性により、生データを公開することなく検証可能なアクセスログが可能になります。このフレームワークは、ブロックチェーンの透明性と不変性を活用し、スマートコントラクトによって実現される動的アクセス制御と組み合わせることで、権限のないユーザーがクリーンなデータを回復または配布できないようにし、それによってデータセキュリティを大幅に強化します。

動的摂動生成メカニズム: スマートコントラクトがさまざまなクライアントからのリクエストを管理する動的学習不可能な例生成スキームが導入されます。DEM 摂動は、クライアント固有の情報と時間パラメータに基づいて、不正なクライアント要求に対して動的に生成されます。これにより、摂動効果がリクエストによって異なることが保証され、拡散ベースのノイズ除去方法に対する耐性が強化され、権限のないユーザーが大規模なデータセットに一度にアクセスすることが制限されます。

CIFAR-10、CIFAR-100、ImageNetデータセットで実施された実験では、図2に示すように、DEMはプライバシー保護とリバースエンジニアリング攻撃に対する耐性の点で既存の方法(EM、TAP、SEMなど)を上回り、図3に示すように、ノイズ除去攻撃に対する耐性をEMと比較して57%、SEMと比較して25%向上させることが実証されています。現実世界のシナリオにおける潜在的な適用可能性を強調します。

Access restricted. Please log in or start a trial to view this content.

Protocol

$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

セットアップ
データセット figure-protocol-1 を使用した教師あり分類タスクを検討しましたが、 figure-protocol-2 は入力特徴を表し、 figure-protocol-3 は K クラス問題に対応するクラスラベルを示します。データセット D は、クリーンなトレーニングデータセットとテストデータセットに分割されます。

目標は、 figure-protocol-4 + δ の学習不可能なデータセット figure-protocol-5 を作成するために、小さくて知覚できない摂動δを導入してクリーンなトレーニングデータセットを変更することです。摂動δは figure-protocol-6 によって制限され、データの通常の効用を大幅に変化させません。主な目的は、D_u でトレーニングされたモデル f_θ に、意味のある特徴ではなくノイズによって誘発される無関係なパターンに焦点を当てることによって学習を混乱させることであり、その結果、クリーンなテストデータセットでの一般化が不十分になります。

figure-protocol-7

ブロックチェーン環境のシミュレーション
ブロックチェーンツールをインストールするには、Hardhat フレームワークを使用してローカル環境でイーサリアムネットワークをシミュレートし、スマートコントラクトをデプロイし、学習不可能な例の生成をテストします。ローカルネットワークを起動するには、複数のノードとアカウントを持つシミュレートされたブロックチェーンネットワークが初期化されます。各ノードには、トランザクションシミュレーションを容易にするためにイーサなどのリソースが割り当てられます。スマートコントラクトを開発するために、ユーザーの権限を動的に管理するために実装されます。許可されたユーザーはクリーンなデータにアクセスできますが、許可されていないユーザーは学習不可能な例へのアクセスに制限されます。まず、Node.js v16.x と Hardhat 2.8.4 に基づいて開発環境を構成し、Solidity 0.8.17 コンパイラを使用してスマートコントラクトのコンパイルと最適化を完了します。コンパイルプロセスは、npx hardhat compileを使用してコマンドラインによって実行され、ABIとバイトコードを含むビルドアーティファクトが生成されます。その後、デプロイスクリプト npx hardhat run scripts/deploy.js --network sepolia を実行してコントラクトを Sepolia テストネットワークにデプロイし、出力コントラクトアドレスとデプロイトランザクションハッシュを記録します。パフォーマンステストフェーズでは、次の 3 つのコアテストが順次実行されます。トランザクションコストテストでは、コントラクトの grantAccess メソッドを周期的に呼び出してガス消費量を記録します。スループットテストでは、Artillery ツールを使用して、負荷が段階的に増加するユーザー要求をシミュレートします。スマートコントラクトの機能を検証するために、データの保存や取得などのテストと検証トランザクションが実行されます。

オンチェーンユーザーと権限メカニズムの構築
一意のユーザーアカウントは、ブロックチェーンウォレット(MetaMaskなど)を使用して生成され、それぞれが秘密鍵と公開鍵で構成されています。プロトタイプの実装では、合成ユーザーエンティティが公開されているデータセットを分散型システムにアップロードし、分散型台帳に暗号化ハッシュ値のみを保存するシミュレートされたブロックチェーン環境を採用しています。これにより、実際のデータをオンチェーンに保存することなく、データの整合性が確保されますが、これは非効率的でコストがかかります。実際のデータはオフチェーンに保存され、通常は IPFS などの分散型ストレージシステムを使用して、セキュリティとプライバシーを維持しながら効率的なデータ管理が保証されます。本研究では、非代替トークン(NFT)とアクセス制御について、ERC-721標準に準拠したNFTを用いたきめ細かなアクセス制御メカニズムを実装しています。学習不可能な例の各データセットは、データにアクセスするためのキーとして機能する一意の tokenId に関連付けられています。ユーザーはマークル証明を送信してアクセスを要求します。これらの証明は、安全で分散型の方法でユーザーの身元を検証します。証明の検証が成功すると、コントラクトは固有の NFT を鋳造し、それをユーザーのウォレットに転送します。このNFTは、その特定の学習不可能な例に関連するデータにアクセスするユーザーの権利を表します。NFT を使用すると、分散化された不変の記録に基づいて、許可されたユーザーのみがデータにアクセスできるようになります。これは、通常、グループレベルで動作し、高セキュリティアプリケーションに必要な粒度を提供しない可能性がある従来のロールベースのアクセス制御(RBAC)とは対照的である³⁰。

スマートコントラクトは、ownerOf 関数を通じてアクセス許可を継続的に検証し、NFT の所有権をチェックして、許可されたユーザーのみがクリーンなデータにアクセスできるようにします。管理者は、revokeAccess 関数を通じて NFT を破棄することでアクセスを取り消すことができ、長期にわたるユーザーアクセスの管理を柔軟に確保できます。運用ワークフローは、次の 4 つの重要なステップで構成されます: (1) ユーザーはマークル証明を含むアクセス要求を送信します。(2) 契約はこれらの証明の有効性を検証します。(3) 検証が成功すると、コントラクトは対応する NFT を鋳造します。(4) ユーザーは、NFT のメタデータに埋め込まれた IPFS コンテンツ識別子 (CID) を使用して暗号化されたデータを取得します。NFTを活用することで、きめ細かな権限制御(データレベルとグループレベル)、監査機能の向上(不変のオンチェーンレコード)、権限の移転可能性(NFTマーケットプレイストランザクション)など、従来のアクセス制御メカニズムに比べていくつかの利点を達成します。

マークルルートハッシュを更新するためにマルチシグネチャコントラクトが実装され、データの不正な改ざんが防止されます。このシステムには、各データセットを一意の tokenId にバインドすることでアンチシビルメカニズムが組み込まれており、悪意のある攻撃者が不正なトークンを生成して不正なデータにアクセスできないようにします。UE は、InterPlanetary File System (IPFS) ネットワークにアップロードされる前に、AES-256 を使用して暗号化されます。暗号化されたデータハッシュはオンチェーンに保存され、完全なデータセットは IPFS に残るため、ブロックチェーンのストレージオーバーヘッドが削減されます。オンチェーンストレージとオフチェーンストレージを組み合わせるハイブリッドアプローチは、ブロックチェーンベースのアプリケーションで一般的な懸念事項であるデータの可用性の確保とストレージコストの削減のバランスをとります。

スマートコントラクトは、ユーザーの権限を動的に管理するために使用されます。各ユーザーには、認証トークンとして機能する適切な NFT を保持している場合にのみ、クリーンデータへのアクセスが許可されます。スマートコントラクトは、すべてのデータアクセスをイベントログに記録し、完全なトレーサビリティを提供します。これらのログは不変であり、監査できるため、透明性と説明責任が提供されます。スマートコントラクトは、grantAccess 関数を使用してアクセス要求を検証します。コントラクトは、ユーザーが適切なNFTを保有しているかどうかをチェックし、有効であれば、要求されたデータへのアクセスを許可します。各アクセスイベントはブロックチェーンに記録され、すべてのデータ取得アクティビティが検証可能であることが保証されます。すべてのデータアクセスイベントはスマートコントラクトによってリアルタイムで記録され、AccessGrantedイベントがトリガーされます。このイベントには、ユーザーのウォレットアドレス、アクセスのタイムスタンプ、対応する NFT tokenId などの重要な情報が含まれています。スマートコントラクトの動的な性質により、権限のリアルタイム管理が可能になります。これは、アクセス制御が非常に柔軟で、変化する条件に適応できる必要がある分散型アプリケーションで特に役立ちます。

パブリックブロックチェーン環境におけるプライバシーの懸念に対処するために、システムは低解像度のサムネイル(64 x 64ピクセルなど)をブロックチェーン上に保存し、元の高解像度画像は暗号化され、IPFSのオフチェーンに保存されます。対応する NFT を所有する許可されたユーザーのみが、高解像度データにアクセスするための復号化キーを取得できます。権限のないユーザーは、リアルタイムの DEM 摂動を含むバージョンのデータを受け取り、元のデータにアクセスできなくなります。

画像摂動の生成
CIFAR10、CIFAR100、ImageNet データセットを読み込みます。データセット内の画像は均一にサイズ変更され、PyTorch テンソルに変換され、画像テンソルは平均と標準偏差を使用して正規化されます。ガウス分布を使用して初期摂動を生成するランダムノイズδ¹ を初期化します。各画像xにランダムノイズを適用し、クロスエントロピー損失に基づいてターゲットラベルとモデル予測の間の損失を計算します。クラスCのデータセットでは、サンプルiの場合、y_iはターゲットラベル値、p_iはモデル予測確率であり、モデルによって予測された確率分布と実際のラベルの差を定量化し、モデルが誤った予測を生成するように損失を最大化します。クロスエントロピー損失は次のとおりです。

figure-protocol-8

損失関数に従って計算された予測に対する画像摂動の影響、逆伝搬は摂動を更新し、摂動範囲と摂動値は複数回の反復を通じて常に更新されます。学習率ηの場合、摂動の更新式は次のとおりです。

figure-protocol-9

テキスト摂動の生成
テキスト埋め込みを生成するために、事前トレーニング済みの BERT モデルをロードします。2 つの Transformer ブロックと完全接続層で構成されるカスタム TextFeatureExtractor ネットワークを使用して、BERT モデルによって生成されたテキスト埋め込みから特徴を抽出します。アクセスユーザーのユーザー情報とタイムスタンプを事前トレーニング済みのBERTモデルに入力し、カスタマイズされたTextFeatureExtractorネットワークを介してテキストノイズを動的に生成します。

入力画像 I は、Qwen2.5-VL-7B-Instruct マルチモーダルモデルに入力されます。構造化されたプロンプトに導かれて、モデルは簡潔なテキスト説明 T_q を生成します。この生成されたテキスト T_q は、事前トレーニングされた BERT ベースの大文字と小文字なしの言語モデルに入力されます。タスク固有の書き換えプロンプトを通じて、システムは表現を変更しながら意味を維持する摂動テキスト figure-protocol-10 を生成します。TextFeatureExtractor ネットワークは、摂動されたテキスト figure-protocol-11 を高次元のセマンティック埋め込みベクトル E_g にマッピングします。

マルチターゲット摂動の生成
テキスト埋め込みと画像摂動の互換性を確保するために、画像摂動の寸法に合わせてテキスト埋め込みの形状を調整します。E_TとE_qはテキストの埋め込みを表し、P_Lは画像摂動を表します。再形成プロセスにより、E_T と E_q が P_L と同じ次元に変換されます: figure-protocol-12 (ここで、C、H、W は PL の次元です)。テキスト埋め込み摂動と画像摂動を融合し、テキストのアテンションウェイトに応じて摂動を動的に調整するアテンションメカニズム融合モジュールを定義します。融合は次のとおりです。

figure-protocol-13

ここで、αはアテンションメカニズムパラメータの動的調整です。δ^T は、 E_q と E_T によって生成されるテキストの外乱です。過学習を防ぐために、トレーニングプロセスに正則化項を追加します。正則化項は、テキスト埋め込みの L2 ノルムであり、摂動にペナルティを与えます。多目的損失関数は、クロスエントロピー損失と融合摂動を組み合わせたもので、多目的損失関数は次のとおりです。

figure-protocol-14

損失関数の目標は次のとおりです。

figure-protocol-15

ここで、 λ は、過度の摂動または過学習を抑制する目的で、摂動のペナルティ力を制御するために使用される正則化係数です。敵対的攻撃の研究では、人間の目で知覚できる摂動限界が figure-protocol-16 であることがわかっています。摂動生成、損失計算、モデルトレーニングなどを含むトレーニングと評価のプロセスが定義されています。

比較実験
提案された動的誤差最小化ノイズ(DEM)を、既存の3つの方法(誤差最小化ノイズ(EM)、転送可能な敵対的摂動(TAP)、および安定誤差最小化ノイズ(SEM)に対して総合的に評価しました。これらの手法は、広く採用されている4つのニューラルネットワークアーキテクチャ(VGG-16、ResNet-18、ResNet-50、DenseNet-121)を使用して、CIFAR-10、CIFAR-100、およびImageNetのサブセットの3つのベンチマークデータセットでテストされ、多様な実験条件を確保しました。

さらに、拡散ベースのノイズ除去モデルを適用して防御ノイズを除去し、テストデータセットでノイズ除去された例の精度を測定することで、これらの手法の堅牢性を検討しました。このステップは、敵対的な条件下で回復攻撃に抵抗し、データプライバシーの整合性を維持する各方法の能力を評価することを目的としていました。結果は、私たちのDEMがすべてのデータセットとアーキテクチャにわたって堅牢性と精度の両方で他の方法よりも優れていることを示しており、プライバシー保護フレームワークとしての有効性を実証しています。

Access restricted. Please log in or start a trial to view this content.

Results

$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

ブロックチェーンとスマートコントラクトのフレームワーク
実験結果は、提案されたブロックチェーン統合学習不能な例生成および管理フレームワーク(B-UEGMF)をスマートコントラクトと組み合わせることで、データへのクライアント固有のアクセスの効果的な動的管理を可能にすることを実証しました。許可されたユーザーの場合、取得されたクリーンなデータは、CIFAR-10データセットで評価されたResNet-18サロゲートモデルで90.2%のテスト精度を達成しました。対照的に、DEM によって生成された UE にアクセスする権限のないユーザーは、テスト精度が 13.0% と大幅に低くなりました。これらの結果は、図2に示すように、堅牢なUnlearnable Examplesを通じてデータプライバシーを維持しながらアクセス制御を効果的に実施するB-UEGMFの機能を検証しています。その他の実験結果を表1に示します。

復元攻撃に対する耐性

Access restricted. Please log in or start a trial to view this content.

Discussion

$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

ブロックチェーンと UE の統合により、データアクセスを管理するための透明性のある分散型ソリューションが提供され、データプライバシー保護の分野が進歩しました。摂動技術のみに依存することが多い従来のプライバシー保護方法とは異なり³¹、この研究は、データ保護と責任追跡の間のギャップを埋めます。フェデレーテッド学習シナリオでは、提案されたフレームワークは、分散データセット全体で安全でプライベートなモデルトレーニングを保証し、不正なデータ回復のリスクを軽減します。さらに、DEM に組み込まれたアテンションメカニズムにより適応性と堅牢性が向上し、複雑な現実世界のシナリオでの応用への道が開かれます。

その貢献にもかかわらず、この研究にはいくつかの制限があります。まず、現在のフレームワークは主に画像分類タスクにおけるプライバシー保護を対象としており、他の下流タスクでのそのパフォーマンスは未踏のままです。第二に、ストレージやトランザクションのコストなど、ブロックチェーン統合の計...

Access restricted. Please log in or start a trial to view this content.

Disclosures

$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

著者は、この出版物に関連する開示すべきものは何もありません。

Acknowledgements

$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

この研究は、優れた研究環境と学術リソースを提供した鄭州大学サイバースペースセキュリティ学院の支援を受けました。この研究全体を通して、貴重な指導、洞察力に富んだ提案、継続的な励ましをしてくれた指導教官の Zijiao Zhang 教授に深く感謝しています。また、この研究の実施を成功させるために不可欠な実験サーバー、高性能コンピューティングリソース、ブロックチェーンテストベッドインフラストラクチャを提供してくれた鄭州大学のネットワーク管理センターにも心から感謝します。

著者の貢献:
Ruijia Liは研究を考案し、方法論を開発し、実験を実施し、データ分析を実行し、元の原稿を書きました。Zijiao Zhang は、監督、方法論の検証、および批判的な原稿レビューを提供しました。Shouli Fu はブロックチェーン実装ガイダンスに貢献しました。Lin Zhu は、データのキュレーションと検証を支援しました。Qunpeng Lei は理論的枠組みの開発に貢献しました。Buwei Wang が技術サポートを提供しました。すべての著者が最終原稿をレビューし、承認しました。

Access restricted. Please log in or start a trial to view this content.

Materials

List of materials used in this article
Name	Company	Comments
CUDA 12.1	エヌビディア	ディープラーニングアプリケーションのパフォーマンスを向上させるために使用されます
NVIDIA A800 80GB PCIe A800 80GB PCIe	エヌビディア	ディープラーニングモデルのトレーニングに使用
パイソン3.10	Pythonソフトウェア財団	データの前処理と分析に使用
PyTorch 2.5.1 (英語)	フェイスブック	モデルトレーニングに使用されるディープラーニングフレームワーク
Ubuntu22.04	正規	環境のセットアップに使用するオペレーティングシステム

References

$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

Multi-level Cross-view Contrastive Learning for Knowledge-aware Recommender System. Zou, D., Chen, Y., Wang, X. Proc 45th Int ACM SIGIR Conf Res Dev Info Retrieval, , 1358-1368 (2022).
A simple framework for contrastive learning of visual representations. Chen, T., Kornblith, S., Norouzi, M., Hinton, G. Proc 37th Int Conf Mach Learn, 119, 1597-1607 (2020).
Guo, J., et al. Domain watermark: Effective and harmless dataset copyright protection is closed at hand. arXiv. , (2023).
Hill, K. The Secretive Company That Might End Privacy as We Know It. , The New York Times. (2020).
Prabhu, V. U., Birhane, A. Large Image Datasets: A Pyrrhic Win for Computer Vision. arXiv. , (2020).
Unlearnable examples detection via iterative filtering. Yu, Y., Jiang, X., Wang, Y. Proc Int Conf Artificial Neural Net, , 241-256 (2024).
Jiang, Y., Ma, X., Erfani, S. M., Bailey, J. Unlearnable examples for time series. Adv Knowledge Disc Data Mining. , 213-225 (2024).
Unlearnable clusters: Towards label-agnostic unlearnable examples. Zhang, J., Liu, Y., Zhou, Q. Proc IEEE/CVF Conf Comput Vision Pattern Recognit, , 3984-3993 (2023).
Unlearnable examples: Making personal data unexploitable. Huang, H., Ma, X., Erfani, S. M., Bailey, J., Wang, Y. Int Conf Learning Representat, , 1-17 (2021).
Game-theoretic unlearnable example generator. Liu, S., Wang, Y., Gao, X. S. Proc AAAI Conf Artificial Intellig, 38, 21349-21358 (2024).
Robust unlearnable examples: Protecting data privacy against adversarial learning. Fu, S., He, F., Liu, Y., Shen, L., Tao, D. ICLR 2022 Proc Int Conf Learning Representat, , 1-22 (2022).
Stable unlearnable example: Enhancing the robustness of unlearnable examples via stable error-minimizing noise. Liu, S., Xu, K., Sun, L. Proc AAAI Conf Artificial Intellig, 37, 2473-2481 (2023).
Defensive unlearning with adversarial training for robust concept erasure in diffusion models. Zhang, Y., et al. NeurIPS 2024 Proc 38th Conf Neural Informat Process Syst, , 1-29 (2024).
Unlearnable examples give a false sense of security: Piercing through unexploitable data with learnable examples. Jiang, W., et al. MM 2023 Proc 31st ACM Int Conf Multimedia, , 8910-8921 (2023).
VQUNet: Vector quantization U-Net for defending adversarial attacks by regularizing unwanted noise. He, Z., Singhal, M. ICMVA 2024 Proc 2024 7th Int Conf Machine Vis Applicat, , 69-76 (2024).
Li, Z., et al. UnGANable: Defending Against GAN-based Face Manipulation. 32nd USENIX Secur Sympos. , 7213-7230 (2023).
Narcissus: A Practical Clean-Label Backdoor Attack with Limited Information. Zeng, Y., et al. Proc 2023 ACM SIGSAC Conf Comput Communicat Secur, , 771-785 (2023).
Meng, R., Chen, J., Liu, Z. Semantic deep hiding for robust unlearnable examples. IEEE Transact Info Forens Secur. 19 (12), 6545-6558 (2024).
Detection and defense of unlearnable examples. Zhu, Y., Yu, L., Gao, X. S. Proc AAAI Conf Artif Intellig, 38 (15), 17211-17219 (2024).
Unlearnable examples: Protecting open-source software from unauthorized neural code learning. Ji, Z., Ma, P., Wang, S. Proc Int Conf Software Eng Knowledge Eng, , 525-530 (2022).
Purify unlearnable examples via rate-constrained variational autoencoders. Yu, Y., et al. ICML 2024 Proc 41st Int Conf Mach Learn, 2379, 57678-57702 (2024).
Triggerless backdoor attack for NLP tasks with clean labels. Gan, L., Zhang, W., Li, X. Proc 2022 Conf North Am Chapter Associat Computat Linguist Human Lang Technol, , 2942-2952 (2022).
Punia, A., et al. A systematic review on blockchain-based access control systems in cloud environment. J Cloud Comput. 13, 146(2024).
SoK: Understanding Design Choices and Pitfalls of Trusted Execution Environments. Li, M., Yang, Y., Chen, G., Yan, M., Zhang, Y. Proc 19th ACM Asia Conf Comput Commun Secur, , 1600-1616 (2024).
Kayikci, S., Khoshgoftaar, T. M. Blockchain meets machine learning: a survey. J Big Data. 11, 9(2024).
Ullah, F., et al. Blockchain-enabled EHR access auditing: Enhancing healthcare data security. Heliyon. 10 (16), e34407(2024).
Tripathi, G., Ahad, M. A., Casalino, G. A comprehensive review of blockchain technology: Underlying principles and historical background with future challenges. Dec Anal J. 9, 100344(2023).
Saleh, A. M. S. Blockchain for secure and decentralized artificial intelligence in cybersecurity: A comprehensive review. Blockchain Res Appl. 5 (3), 100193(2024).
Badra, M., Borghol, R. An efficient blockchain-based privacy preservation scheme for smart grids. Front Communicat Net. 6, 1584152(2025).
Fine-Grained Access Control in the Era of Cloud Computing: An Analytical Review. Albulayhi, K., Abuhussein, A., Alsubaei, F., Sheldon, F. T. 2020 10th Ann Comput Communicat Workshop Conf, , 0748-0755 (2020).
Turgay, S., İlter, İ Perturbation Methods for Protecting Data Privacy: A Review of Techniques and Applications. Automat Machine Learning. 4, 31-41 (2023).
Williamson, S. M., Prybutok, V. Balancing Privacy and Progress: A Review of Privacy Challenges, Systemic Oversight, and Patient Perceptions in AI-Driven Healthcare. Appl Sci. 14 (2), 675(2024).

Access restricted. Please log in or start a trial to view this content.

Reprints and Permissions

Request permission to reuse the text or figures of this JoVE article

Request Permission

データプライバシーとアクセス制御を強化するための学習不可能な例を生成および管理するためのブロックチェーンベースのフレームワーク

In This Article

Summary

Abstract

Introduction

Protocol

Results

Discussion

Disclosures

Acknowledgements

Materials

References

Reprints and Permissions

Tags

Related Articles