Research Article

Framework basato su blockchain per la generazione e la gestione di esempi non apprendibili per migliorare la privacy dei dati e il controllo degli accessi

DOI:

10.3791/68338

August 22nd, 2025

In This Article

Summary

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

Questo articolo propone un framework basato su blockchain per generare esempi non apprendibili, integrando la perturbazione dinamica con il controllo degli accessi. Migliora la protezione della privacy garantendo che gli utenti non autorizzati ricevano dati perturbati, salvaguardando le informazioni sensibili e consentendo una gestione efficiente dei dati e l'accesso tramite contratti intelligenti.

Abstract

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

Nel contesto del rapido sviluppo di modelli linguistici di grandi dimensioni (LLM), l'apprendimento contrastivo è stato ampiamente adottato grazie alla sua capacità di aggirare le costose annotazioni dei dati sfruttando grandi quantità di dati di rete per l'addestramento dei modelli. Tuttavia, questo uso diffuso solleva notevoli preoccupazioni per quanto riguarda la protezione della privacy dei dati. Gli esempi non apprendibili, una tecnica che interrompe l'apprendimento dei modelli perturbando i dati, impedisce efficacemente ai modelli non autorizzati di utilizzare in modo improprio i dati sensibili. Tuttavia, i metodi esistenti per generare UE devono affrontare due sfide principali: in primo luogo, le perturbazioni possono essere invertite utilizzando tecniche come la purificazione inversa o il denoising, compresi i modelli di diffusione che rimuovono le perturbazioni protettive nelle UE di immagine; In secondo luogo, una volta pubblicati i dati, garantire la tracciabilità dei dati e gestire il controllo degli accessi diventa difficile. Per affrontare questi problemi, questo articolo propone un Blockchain-Integrated Unlearnable Example Generation and Management Framework (B-UEGMF) per la generazione e la gestione degli UE. Sfruttando le proprietà decentralizzate e immutabili della blockchain, memorizziamo i valori hash di esempio sulla blockchain e gestiamo dinamicamente i diritti di accesso ai dati attraverso contratti intelligenti. Inoltre, gli UE vengono generati utilizzando una tecnica di perturbazione multi-obiettivo, il Dynamic Error-Minimizing Noise (DEM), che migliora la robustezza rispetto ai metodi di inversione. Forniamo anche una valutazione quantitativa delle capacità di protezione della privacy degli esempi generati. I risultati sperimentali dimostrano che il framework proposto ha migliorato significativamente la difesa delle UE contro gli attacchi inversi, garantendo al contempo una gestione efficiente della privacy dei dati.

Introduction

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

Negli ultimi anni, con il rapido progresso del deep learning e dei modelli linguistici di grandi dimensioni, l'apprendimento contrastivo è emerso come un approccio efficiente all'apprendimento non supervisionato grazie alla sua indipendenza dalle costose annotazioni manuali 1,2. Tuttavia, l'uso estensivo di set di dati pubblici ha sollevato notevoli preoccupazioni in merito alle violazioni della privacy e all'uso improprio dei dati. I casi di utilizzo non autorizzato di dati pubblicamente disponibili per l'addestramento dei modelli sono diventati sempre più comuni

Access restricted. Please log in or start a trial to view this content.

Protocol

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

Apparecchio
Abbiamo preso in considerazione un'attività di classificazione supervisionata con un set di dati figure-protocol-1, dove figure-protocol-2 rappresenta le caratteristiche di input e figure-protocol-3 denota le etichette di classe corrispondenti per un problema di classe K. Il set di dati D viene suddiviso in un set d....

Access restricted. Please log in or start a trial to view this content.

Results

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

Blockchain e framework di smart contract
I risultati sperimentali hanno dimostrato che il proposto Blockchain-Integrated Unlearnable Example Generation and Management Framework (B-UEGMF), combinato con contratti intelligenti, ha consentito un'efficace gestione dinamica dell'accesso ai dati specifico del cliente. Per gli utenti autorizzati, i dati puliti recuperati hanno raggiunto un'accuratezza del test del 90,2% su un modello surrogato ResNet-18 valutato sul set di dati CIFAR-10. Al contrario, gli ut.......

Access restricted. Please log in or start a trial to view this content.

Discussion

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

L'integrazione di blockchain e UE ha fatto progredire il campo della protezione della privacy dei dati fornendo una soluzione trasparente e decentralizzata per la gestione dell'accesso ai dati. A differenza dei metodi convenzionali di tutela della privacy, che spesso si basano esclusivamente su tecniche di perturbazione31, questo studio colma il divario tra la protezione dei dati e il tracciamento delle responsabilità. Negli scenari di apprendimento federato, il f.......

Access restricted. Please log in or start a trial to view this content.

Disclosures

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

Gli autori non hanno nulla di rilevante per questa pubblicazione da rivelare.

Acknowledgements

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

Questo lavoro è stato sostenuto dalla School of Cyberspace Security dell'Università di Zhengzhou, che ha fornito un eccellente ambiente di ricerca e risorse accademiche. Siamo profondamente grati al nostro supervisore, il Prof. Zijiao Zhang, per la sua preziosa guida, i suggerimenti penetranti e il continuo incoraggiamento durante questa ricerca. Estendiamo anche i nostri sinceri ringraziamenti al Network Management Center dell'Università di Zhengzhou per aver fornito server sperimentali, risorse di calcolo ad alte prestazioni e un'infrastruttura di test blockchain, essenziali per il successo dell'implementazione di questo studio.

....

Access restricted. Please log in or start a trial to view this content.

Materials

List of materials used in this article
NameCompanyCatalog NumberComments
CUDA 12.1NVIDIAUtilizzato per migliorare le prestazioni delle applicazioni di deep learning
NVIDIA A800 80GB PCIe A800 80GB PCIeNVIDIAUtilizzato per l'addestramento del modello di Deep Learning
Pitone 3.10Fondazione del software PythonUtilizzato per la pre-elaborazione e l'analisi dei dati
PyTorch 2.5.1ContattiFramework di deep learning utilizzato per l'addestramento dei modelli
Ubuntu 22.04CanonicoSistema operativo utilizzato per la configurazione dell'ambiente

References

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,
  1. Multi-level Cross-view Contrastive Learning for Knowledge-aware Recommender System. Zou, D., Chen, Y., Wang, X. Proc 45th Int ACM SIGIR Conf Res Dev Info Retrieval, , 1358-1368 (2022).
  2. A simple framework for contrastive learning of visual representations. Chen, T., Kornblith, S., Norouzi, M., Hinton, G. Proc 37th Int Conf Mach Learn, 119, 1597-1607 (2020).
  3. Guo, J., et al. Domain watermark: Effective and harmless dataset copyri....

Access restricted. Please log in or start a trial to view this content.

Reprints and Permissions

Request permission to reuse the text or figures of this JoVE article

Request Permission

Tags

Blockchain Data PrivacyUnlearnable ExamplesAccess ControlContrastive LearningData TraceabilitySmart ContractsData PerturbationPrivacy ProtectionReverse Attack DefenseDynamic Error Minimizing Noise

Related Articles