Research Article

データプライバシーとアクセス制御を強化するための学習不可能な例を生成および管理するためのブロックチェーンベースのフレームワーク

DOI:

10.3791/68338

August 22nd, 2025

In This Article

Summary

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

この論文では、動的摂動とアクセス制御を統合し、学習不可能な例を生成するためのブロックチェーンベースのフレームワークを提案します。権限のないユーザーが邪魔されたデータを確実に受信できるようにすることでプライバシー保護を強化し、スマート コントラクトを介した効率的なデータ管理とアクセスを可能にしながら機密情報を保護します。

Abstract

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

大規模言語モデル (LLM) の急速な発展の中で、モデルのトレーニングに膨大な量のネットワーク データを活用することでコストのかかるデータ アノテーションをバイパスできるため、対照学習が広く採用されるようになりました。ただし、この広範な使用により、データ プライバシー保護に関して重大な懸念が生じます。Unlearnable Examples (UE) は、データを摂動することでモデルの学習を妨害する手法であり、不正なモデルが機密データを悪用するのを効果的に防止します。ただし、UEを生成するための既存の方法は、2つの主要な課題に直面しています:第一に、画像UEの保護摂動を除去する拡散モデルを含む、逆精製やノイズ除去などの技術を使用して摂動を逆転させることができます。第二に、データが公開されると、データのトレーサビリティの確保とアクセス制御の管理が困難になります。これらの問題に対処するために、本稿では、UEを生成・管理するためのBlockchain-Integrated Unlearnable Example Generation and Management Framework(B-UEGMF)を提案します。ブロックチェーンの分散型で不変の特性を活用することで、サンプルのハッシュ値をブロックチェーン上に保存し、スマートコントラクトを通じてデータアクセス権を動的に管理します。さらに、UE は多目的摂動技術である動的誤差最小化ノイズ (DEM) を使用して生成され、反転法に対する堅牢性が強化されます。また、生成された事例のプライバシー保護能力を定量的に評価します。実験結果は、提案フレームワークが効率的なデータプライバシー管理を確保しながら、リバースアタックに対するUEの防御を大幅に向上させることを示しています。

Introduction

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

近年、深層学習と大規模言語モデルの急速な進歩に伴い、対比学習はコストのかかる手動アノテーションから独立しているため、効率的な教師なし学習アプローチとして浮上しています1,2。しかし、公開データセットの広範な使用により、プライバシー侵害やデータの悪用に関する重大な懸念が生じています。モデルトレーニングのために公開されているデータを不正に利用する事例はますます一般的になっています3.たとえば、2017 年には、顔認識モデルのトレーニングに無許可の公開写真が使用されました4。同様に、Amazon は、すべてのユーザーからの明示的な同意を確保せずに、消費者の公開レビュー データを利用してレコメンデーション システムをトレーニングし、プライバシー保護メカニズムの脆弱性を露呈しました5

これらの問題に対処するために、新しいデータプライバシー保護技術としてUnlearnable Examples(UE)が登場しました。UEは、データサンプルに知覚できない摂動を追加し、データに対する人間の認識を維持しながら、モデルが機....

Access restricted. Please log in or start a trial to view this content.

Protocol

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

セットアップ
データセット figure-protocol-1を使用した教師あり分類タスクを検討しましたが、 figure-protocol-2 は入力特徴を表し、 figure-protocol-3K クラス問題に対応するクラス ラベルを示します。データセット D は、クリーンなトレーニングデータセットとテストデータセットに分割されます。

目標は、figure-protocol-4 +....

Access restricted. Please log in or start a trial to view this content.

Results

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

ブロックチェーンとスマートコントラクトのフレームワーク
実験結果は、提案されたブロックチェーン統合学習不能な例生成および管理フレームワーク(B-UEGMF)をスマートコントラクトと組み合わせることで、データへのクライアント固有のアクセスの効果的な動的管理を可能にすることを実証しました。許可されたユーザーの場合、取得されたクリーンなデータは、CIFAR-10データセットで評価されたResNet-18サロゲートモデルで90.2%のテスト精度を達成しました。対照的に、DEM によって生成された UE にアクセスする権限のないユーザーは、テスト精度が 13.0% と大幅に低くなりました。これらの結果は、 図2に示すように、堅牢なUnlearnable Examplesを通じてデータプライバシーを維持しながらアクセス制御を効果的に実施するB-UEGMFの機能を検証しています。その他の実験結果を 表1に示します。

復元攻撃に対する耐性

Access restricted. Please log in or start a trial to view this content.

Discussion

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

ブロックチェーンと UE の統合により、データ アクセスを管理するための透明性のある分散型ソリューションが提供され、データ プライバシー保護の分野が進歩しました。摂動技術のみに依存することが多い従来のプライバシー保護方法とは異なり31、この研究は、データ保護と責任追跡の間のギャップを埋めます。フェデレーテッド学習シナリオでは、提案されたフレームワークは、分散データセット全体で安全でプライベートなモデルトレーニングを保証し、不正なデータ回復のリスクを軽減します。さらに、DEM に組み込まれたアテンション メカニズムにより適応性と堅牢性が向上し、複雑な現実世界のシナリオでの応用への道が開かれます。

その貢献にもかかわらず、この研究にはいくつかの制限があります。まず、現在のフレームワークは主に画像分類タスクにおけるプライバシー保護を対象としており、他の下流タスクでのそのパフォーマンスは未踏のままです。第二に、ストレージやトランザクションのコストなど、ブロックチェーン統合の計.......

Access restricted. Please log in or start a trial to view this content.

Disclosures

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

著者は、この出版物に関連する開示すべきものは何もありません。

Acknowledgements

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

この研究は、優れた研究環境と学術リソースを提供した鄭州大学サイバースペースセキュリティ学院の支援を受けました。この研究全体を通して、貴重な指導、洞察力に富んだ提案、継続的な励ましをしてくれた指導教官の Zijiao Zhang 教授に深く感謝しています。また、この研究の実施を成功させるために不可欠な実験サーバー、高性能コンピューティングリソース、ブロックチェーンテストベッドインフラストラクチャを提供してくれた鄭州大学のネットワーク管理センターにも心から感謝します。

著者の貢献:
Ruijia Liは研究を考案し、方法論を開発し、実験を実施し、データ分析を実行し、元の原稿を書きました。Zijiao Zhang は、監督、方法論の検証、および批判的な原稿レビューを提供しました。Shouli Fu はブロックチェーン実装ガイダンスに貢献しました。Lin Zhu は、データのキュレーションと検証を支援しました。Qunpeng Lei は理論的枠組みの開発に貢献しました。Buwei Wang が技術サポートを提供しました。すべての著者が最終原稿をレビューし、承認しました。

....

Access restricted. Please log in or start a trial to view this content.

Materials

List of materials used in this article
NameCompanyCatalog NumberComments
CUDA 12.1エヌビディアディープラーニングアプリケーションのパフォーマンスを向上させるために使用されます
NVIDIA A800 80GB PCIe A800 80GB PCIeエヌビディアディープラーニングモデルのトレーニングに使用
パイソン3.10Pythonソフトウェア財団データの前処理と分析に使用
PyTorch 2.5.1 (英語)フェイスブックモデルトレーニングに使用されるディープラーニングフレームワーク
Ubuntu22.04正規環境のセットアップに使用するオペレーティングシステム

References

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,
  1. Multi-level Cross-view Contrastive Learning for Knowledge-aware Recommender System. Zou, D., Chen, Y., Wang, X. Proc 45th Int ACM SIGIR Conf Res Dev Info Retrieval, , 1358-1368 (2022).
  2. A simple framework for contrastive learning of visual representations. Chen, T., Kornblith, S., Norouzi, M., Hinton, G. Proc 37th Int Conf Mach Learn, 119, 1597-1607 (2020).
  3. Guo, J., et al. Domain watermark: Effective and harmless dataset copyri....

Access restricted. Please log in or start a trial to view this content.

Reprints and Permissions

Request permission to reuse the text or figures of this JoVE article

Request Permission

Tags

Blockchain Data PrivacyUnlearnable ExamplesAccess ControlContrastive LearningData TraceabilitySmart ContractsData PerturbationPrivacy ProtectionReverse Attack DefenseDynamic Error Minimizing Noise

Related Articles