Blockchain-gebaseerd raamwerk voor het genereren en beheren van niet-leerbare voorbeelden voor het verbeteren van gegevensprivacy en toegangscontrole

Ruijia Li; Zijiao Zhang; Shouli Fu; Lin Zhu; Qunpeng Lei; Buwei Wang

doi:10.3791/68338

Research Article

Blockchain-gebaseerd raamwerk voor het genereren en beheren van niet-leerbare voorbeelden voor het verbeteren van gegevensprivacy en toegangscontrole

DOI:

10.3791/68338

⸱

August 22nd, 2025

Ruijia Li¹ , Zijiao Zhang¹ , Shouli Fu¹ , Lin Zhu¹ , Qunpeng Lei¹ , Buwei Wang¹

¹School of Cyberspace Security, Zhengzhou University

Summary

$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

Dit artikel stelt een op blockchain gebaseerd raamwerk voor het genereren van niet-leerbare voorbeelden, waarbij dynamische verstoring wordt geïntegreerd met toegangscontrole. Het verbetert de privacybescherming door ervoor te zorgen dat onbevoegde gebruikers verstoorde gegevens ontvangen, gevoelige informatie te beschermen en tegelijkertijd efficiënt gegevensbeheer en toegang via slimme contracten mogelijk te maken.

Abstract

$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

In de context van de snelle ontwikkeling van grote taalmodellen (LLM's) is contrastief leren op grote schaal toegepast vanwege het vermogen om kostbare gegevensannotatie te omzeilen door gebruik te maken van enorme hoeveelheden netwerkgegevens voor modeltraining. Dit wijdverbreide gebruik roept echter grote zorgen op over de bescherming van de privacy van gegevens. Unlearnable Examples (UE's), een techniek die het leren van modellen verstoort door gegevens te verstoren, voorkomt effectief dat ongeautoriseerde modellen misbruik maken van gevoelige gegevens. Bestaande methoden voor het genereren van UE's staan echter voor twee primaire uitdagingen: ten eerste kunnen verstoringen worden omgekeerd met behulp van technieken zoals omgekeerde zuivering of ruisonderdrukking, inclusief diffusiemodellen die beschermende verstoringen in beeld-UE's verwijderen; Ten tweede, zodra de gegevens zijn gepubliceerd, wordt het moeilijk om de traceerbaarheid van gegevens te waarborgen en de toegangscontrole te beheren. Om deze problemen aan te pakken, stelt dit artikel een Blockchain-Integrated Unlearnable Example Generation and Management Framework (B-UEGMF) voor het genereren en beheren van UE's. Door gebruik te maken van de gedecentraliseerde en onveranderlijke eigenschappen van blockchain, slaan we voorbeeldhash-waarden op de blockchain op en beheren we dynamisch de toegangsrechten tot gegevens via slimme contracten. Bovendien worden UE's gegenereerd met behulp van een multi-objectieve verstoringstechniek, Dynamic Error-Minimizing Noise (DEM), die de robuustheid tegen omkeringsmethoden verbetert. We bieden ook een kwantitatieve evaluatie van de privacybeschermingsmogelijkheden van de gegenereerde voorbeelden. Experimentele resultaten tonen aan dat het voorgestelde raamwerk de verdediging van UE's tegen omgekeerde aanvallen aanzienlijk heeft verbeterd en tegelijkertijd een efficiënt beheer van gegevensprivacy garandeert.

Introduction

$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

In de afgelopen jaren, met de snelle vooruitgang van deep learning en grote taalmodellen, is contrastief leren naar voren gekomen als een efficiënte leerbenadering zonder toezicht vanwege de onafhankelijkheid van dure handmatige annotaties ^1,2. Het uitgebreide gebruik van openbare datasets heeft echter geleid tot aanzienlijke bezorgdheid over inbreuken op de privacy en misbruik van gegevens. Gevallen van ongeoorloofd gebruik van openbaar beschikbare gegevens voor modeltraining komen steeds vaker voor³. In 2017 werden bijvoorbeeld ongeautoriseerde openbare foto's gebruikt om gezichtsherkenningsmodellen te trainen⁴. Evenzo gebruikte Amazon openbare beoordelingsgegevens van consumenten om zijn aanbevelingssystemen te trainen zonder expliciete toestemming van alle gebruikers te verkrijgen, waardoor kwetsbaarheden in privacybeschermingsmechanismen werden blootgelegd⁵.

Om deze problemen aan te pakken, zijn Unlearnable Examples (UE's) naar voren gekomen als een nieuwe techniek voor de bescherming van gegevensprivacy. UE's voegen onmerkbare verstoringen toe aan gegevensmonsters, waardoor een snelkoppeling wordt geïntroduceerd die voorkomt dat modellen gevoelige informatie leren, terwijl de menselijke perceptie van de gegevens behouden blijft ^6,7,8. Bestaande methoden voor het genereren van UE's omvatten voornamelijk Error-Minimizing noise (EM) perturbaties⁹, perturbatie generatie door generative adversarial networks (GAN's)¹⁰, Robust Error-Minimizing noise (REM) en Stable Error-Minimizing noise (SEM) geoptimaliseerd door adversarial training^11,12. Bovendien zijn er onlangs diffusiemodellen toegepast om onjuiste labelruis te genereren, waardoor de privacybescherming verder wordt verbeterd¹³.

Ondanks aanzienlijke vooruitgang bij het genereren van UE's, blijven er verschillende uitdagingen bestaan, met name in real-world toepassingen waar de privacybeschermingseffecten van deze methoden niet volledig zijn gevalideerd. Concreet zijn de belangrijkste uitdagingen:
Herstelproblemen: Diffusiemodellen kunnen niet-leerbare voorbeelden gedeeltelijk herstellen door de verstoringen die in de gegevens zijn ingebed, te voorspellen en te verwijderen, waardoor de leerbaarheid wordt hersteld en de privacybescherming in gevaar komt^14,15. Zelfs wanneer gegevens tijdens de training worden verstoord, kan gevoelige informatie na herstel nog steeds worden vrijgegeven.
Traceerbaarheid van gegevens en toegangscontrole: Zodra niet-leerbare voorbeelden zijn vrijgegeven, blijven effectieve mechanismen om hun oorsprong te traceren en toegangsbeperkingen af te dwingen technisch uitdagend¹⁶.
Evenwicht tussen privacybescherming en modelprestaties: Hoewel bestaande methoden zich richten op het genereren van niet-leerbare voorbeelden om de privacy te waarborgen, blijft het handhaven van een evenwicht tussen privacybescherming en de prestaties van modeltraining onopgelost 17,18,19. Het meeste huidige onderzoek geeft prioriteit aan privacybescherming, maar besteedt beperkte aandacht aan het beperken van prestatievermindering tijdens modeltraining^20,21. Bijgevolg zijn de toegang tot en het gebruik van gegevens kritieke aandachtspunten geworden bij de bescherming van de privacy²².

Hoewel gecentraliseerde oplossingen en Trusted Execution Environments (TEE's) alternatieve benaderingen bieden voor gegevenstoegangscontrole, hebben ze te maken met inherente beperkingen in medische/juridische scenario's: (1) Gecentraliseerde systemen introduceren single points of failure en auditafhankelijkheid²³; (2) TEE's vereisen gespecialiseerde hardware en missen gedecentraliseerde consensus²⁴. Blockchain komt naar voren als de optimale oplossing omdat de onveranderlijke grootboekeigenschappen rechtstreeks voldoen aan drie kritieke vereisten voor UE-beheer: aantoonbare naleving van regelgeving voor gegevensbeheer (bijv. HIPAA-audittrails), censuurbestendige toegangscontrole in omgevingen met meerdere instellingen en gedetailleerde herkomsttracering door middel van transacties met tijdstempel 25,26,27.

Ons framework liet optimale prestaties zien voor middelgrote datasets met GPU-versnelling, waardoor realtime verstoringsgeneratie werd gegenereerd. Hoewel blockchain-operaties meetbare overhead introduceren, is deze afweging gerechtvaardigd in scenario's die onveranderlijke toegangslogboeken vereisen, zoals multi-institutioneel medisch onderzoek of gereguleerde datamarkten. Het systeem schaalt lineair met de grootte van de dataset, maar vereist ≥16 GB RAM en 4-core CPU's voor een stabiele werking, waardoor het minder geschikt is voor edge-apparaten met beperkte middelen.

Om deze uitdagingen aan te gaan, stelt dit document een Blockchain-Integrated Unlearnable Example Generation and Management Framework (B-UEGMF) voor. Blockchain, als een gedecentraliseerde en onveranderlijke gedistribueerde grootboektechnologie, registreert effectief hashes voor gegevenstoegang en beheert dynamisch toegangsrechten door middel van slimme contracten, waardoor de privacybeschermingsmogelijkheden van niet-leerbare voorbeelden worden verbeterd^28,29. Onder dit raamwerk hebben geautoriseerde gebruikers toegang tot schone gegevens, terwijl onbevoegde gebruikers alleen toegang hebben tot dynamisch gegenereerde niet-leerbare voorbeelden. Om bestaande problemen aan te pakken, introduceert dit artikel een nieuwe methode voor het genereren van dynamische foutminimaliserende ruis (DEM). Door klantspecifieke informatie en tijdelijke parameters op te nemen, integreert DEM verstoringen dynamisch in de gegevens, waardoor unieke verstoringen worden gegenereerd voor elk gegevensverzoek en zowel de privacy van de gegevens als de leerbaarheid van de gegevens worden gegarandeerd. Het DEM-generatieproces wordt geïllustreerd in figuur 1. De belangrijkste bijdragen van dit document zijn de volgende:
Dynamisch traceerbaarheids- en toegangsbeheer: Dit document gaat in op de traceerbaarheids- en toegangscontroleproblemen die verband houden met het vrijgeven van niet-leerbare voorbeelden door het B-UEGMF-raamwerk voor te stellen. Het gedecentraliseerde karakter van blockchain lost het probleem van vertrouwde derden in traditionele systemen op, terwijl de transparantie ervan verifieerbare toegangslogboeken mogelijk maakt zonder onbewerkte gegevens bloot te leggen. Door gebruik te maken van de transparantie en onveranderlijkheid van blockchain, in combinatie met de dynamische toegangscontrole die mogelijk wordt gemaakt door slimme contracten, zorgt het raamwerk ervoor dat onbevoegde gebruikers geen schone gegevens kunnen herstellen of verspreiden, waardoor de gegevensbeveiliging aanzienlijk wordt verbeterd.

Dynamisch mechanisme voor het genereren van verstoringen: Er wordt een dynamisch schema voor het genereren van niet-leerbare voorbeelden geïntroduceerd, waarbij slimme contracten verzoeken van verschillende klanten beheren. DEM-verstoringen worden dynamisch gegenereerd voor ongeautoriseerde clientaanvragen op basis van klantspecifieke informatie en tijdelijke parameters. Dit zorgt ervoor dat verstoringseffecten variëren tussen verzoeken, waardoor de weerstand tegen op diffusie gebaseerde ruisverwijderingsmethoden wordt versterkt en onbevoegde gebruikers worden beperkt tot toegang tot grootschalige datasets tegelijk.

Experimenten uitgevoerd op CIFAR-10-, CIFAR-100- en ImageNet-datasets tonen aan dat DEM beter presteert dan bestaande methoden (bijv. EM, TAP en SEM) op het gebied van privacybescherming en weerstand tegen reverse engineering-aanvallen, zoals aangetoond in figuur 2, terwijl de weerstand tegen aanvallen met ruisonderdrukking met 57% wordt verbeterd in vergelijking met EM en 25% in vergelijking met SEM, zoals aangetoond in figuur 3. het benadrukken van de potentiële toepasbaarheid ervan in real-world scenario's.

Access restricted. Please log in or start a trial to view this content.

Protocol

$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

Setup
We hebben een gesuperviseerde classificatietaak overwogen met een dataset figure-protocol-1 , waarbij figure-protocol-2 de invoerfuncties worden weergegeven en figure-protocol-3 de bijbehorende klasselabels voor een K-klasse-probleem worden aangeduid. De gegevensset D is opgesplitst in een schone trainingsgegevensset en een testgegevensset.

Het doel is om de schone trainingsdataset aan te passen door kleine, onmerkbare verstoringen te introduceren δ om een niet-leerbare dataset figure-protocol-4 te creëren, waarbij figure-protocol-5 + δ. De verstoring δ wordt begrensd door figure-protocol-6 , wat ervoor zorgt dat het normale nut van de gegevens niet significant wordt gewijzigd. Het belangrijkste doel is om het leren te verstoren door het model f_θ, getraind op D_u, te dwingen zich te concentreren op irrelevante patronen die door de ruis worden veroorzaakt in plaats van op de betekenisvolle kenmerken, wat resulteert in een slechte generalisatie op een schone testdataset:

figure-protocol-7

Een blockchain-omgeving simuleren
Om blockchain-tools te installeren, wordt het Hardhat-framework gebruikt om een Ethereum-netwerk te simuleren in een lokale omgeving voor het implementeren van slimme contracten en het testen van het genereren van niet-leerbare voorbeelden. Om een lokaal netwerk te starten, wordt een gesimuleerd blockchain-netwerk met meerdere knooppunten en accounts geïnitialiseerd. Elk knooppunt krijgt bronnen zoals Ether toegewezen om transactiesimulaties mogelijk te maken. Om slimme contracten te ontwikkelen, worden ze geïmplementeerd om gebruikersrechten dynamisch te beheren. Geautoriseerde gebruikers hebben toegang tot schone gegevens, terwijl onbevoegde gebruikers beperkt zijn tot toegang tot niet-leerbare voorbeelden. Configureer eerst een ontwikkelomgeving op basis van Node.js v16.x en Hardhat 2.8.4 en gebruik de Solidity 0.8.17-compiler om de compilatie en optimalisatie van het slimme contract te voltooien. Het compilatieproces wordt uitgevoerd door de opdrachtregel met behulp van npx hardhat compile om build-artefacten te genereren die de ABI en bytecode bevatten. Implementeer vervolgens het contract in het Sepolia-testnetwerk door het implementatiescript npx hardhat uit te voeren, scripts/deploy.js --network sepolia uit te voeren en het uitvoercontractadres en de hash van de implementatietransactie vast te leggen. Tijdens de fase van de prestatietests worden achtereenvolgens drie kerntests uitgevoerd: de transactiekostentest registreert het gasverbruik door cyclisch een beroep te doen op de grantAccess-methode van het contract; throughput test maakt gebruik van de Artillerie-tool om gebruikersverzoeken te simuleren met een stapsgewijs toenemende belasting; Test- en validatietransacties, waaronder het opslaan en ophalen van gegevens, worden uitgevoerd om de functionaliteit van het slimme contract te valideren.

Bouwen van on-chain gebruikers en machtigingsmechanismen
Unieke gebruikersaccounts worden gegenereerd met behulp van blockchain-portefeuilles (bijv. MetaMask), elk bestaande uit een privésleutel en een openbare sleutel. De prototype-implementatie maakt gebruik van een gesimuleerde blockchain-omgeving waar synthetische gebruikersentiteiten openbaar beschikbare datasets uploaden naar het gedecentraliseerde systeem, waarbij alleen cryptografische hash-waarden worden opgeslagen in het gedistribueerde grootboek. Dit zorgt voor de integriteit van de gegevens zonder de daadwerkelijke gegevens in de keten op te slaan, wat inefficiënt en kostbaar zou zijn. De feitelijke gegevens worden off-chain opgeslagen, meestal met behulp van gedecentraliseerde opslagsystemen zoals IPFS, waardoor een efficiënt gegevensbeheer wordt gegarandeerd met behoud van veiligheid en privacy. Voor non-fungible tokens (NFT's) en toegangscontrole implementeert deze studie een fijnmazig toegangscontrolemechanisme met behulp van NFT's die voldoen aan de ERC-721-standaard. Elke gegevensset met niet-leerbare voorbeelden is gekoppeld aan een unieke tokenId, die fungeert als een sleutel voor toegang tot de gegevens. Gebruikers vragen toegang door Merkle-proeven in te dienen. Deze bewijzen verifiëren de identiteit van de gebruiker op een veilige, gedecentraliseerde manier. Na succesvolle validatie van het bewijs slaat het contract een unieke NFT en brengt deze over naar de portemonnee van de gebruiker. Deze NFT vertegenwoordigt het recht van de gebruiker op toegang tot de gegevens die verband houden met dat specifieke niet-leerbare voorbeeld. Het gebruik van NFT's zorgt ervoor dat alleen geautoriseerde gebruikers toegang hebben tot de gegevens, op basis van een gedecentraliseerd, onveranderlijk record. Dit in tegenstelling tot traditionele Role-Based Access Control (RBAC), die doorgaans op groepsniveau werkt en mogelijk niet de granulariteit biedt die nodig is voor hoogbeveiligde toepassingen³⁰.

Het slimme contract verifieert continu toegangsrechten via de ownerOf-functie en controleert het eigendom van de NFT om ervoor te zorgen dat alleen geautoriseerde gebruikers toegang hebben tot de schone gegevens. Beheerders kunnen de toegang intrekken door de NFT te vernietigen via de revokeAccess-functie, waardoor flexibiliteit wordt gegarandeerd bij het beheren van gebruikerstoegang in de loop van de tijd. De operationele workflow bestaat uit vier kritieke stappen: (1) gebruikers dienen toegangsverzoeken in met Merkle-proeven; (2) het contract de geldigheid van deze bewijzen verifieert; (3) na succesvolle validatie slaat het contract de bijbehorende NFT; (4) gebruikers halen versleutelde gegevens op met behulp van de IPFS Content Identifier (CID) die is ingebed in de metadata van de NFT. Door gebruik te maken van NFT's behalen we verschillende voordelen ten opzichte van traditionele toegangscontrolemechanismen, zoals fijnmazig toestemmingsbeheer (gegevensniveau versus groepsniveau), betere auditcapaciteit (onveranderlijke on-chain records) en overdraagbaarheid van machtigingen (NFT-marktplaatstransacties).

Er worden contracten met meerdere handtekeningen geïmplementeerd voor het bijwerken van de root-hash van Merkle, waardoor ongeoorloofd knoeien met gegevens wordt voorkomen. Het systeem bevat anti-Sybil-mechanismen door elke dataset te binden aan een unieke tokenId, zodat kwaadwillenden geen frauduleuze tokens kunnen genereren om toegang te krijgen tot ongeautoriseerde gegevens. De UE's worden versleuteld met AES-256 voordat ze worden geüpload naar het InterPlanetary File System (IPFS)-netwerk. De versleutelde datahashes worden on-chain opgeslagen, terwijl de volledige datasets op IPFS blijven, waardoor de overhead van blockchain-opslag wordt verminderd. De hybride aanpak van het combineren van on-chain en off-chain opslag zorgt voor een evenwicht tussen het waarborgen van de beschikbaarheid van gegevens en het verlagen van de opslagkosten, een veelvoorkomend probleem in op blockchain gebaseerde toepassingen.

Slimme contracten worden gebruikt om gebruikersrechten dynamisch te beheren. Elke gebruiker krijgt alleen toegang tot schone gegevens als hij in het bezit is van de juiste NFT, die dient als zijn autorisatietoken. Slimme contracten registreren alle gegevenstoegang in gebeurtenislogboeken, waardoor volledige traceerbaarheid wordt geboden. Deze logboeken zijn onveranderlijk en kunnen worden gecontroleerd, wat transparantie en verantwoording biedt. Het slimme contract maakt gebruik van de grantAccess-functie om toegangsverzoeken te valideren. Het contract controleert of de gebruiker in het bezit is van de juiste NFT en, indien geldig, verleent toegang tot de gevraagde gegevens. Elke toegangsgebeurtenis wordt geregistreerd op de blockchain, zodat alle activiteiten voor het ophalen van gegevens verifieerbaar zijn. Elke gebeurtenis voor gegevenstoegang wordt in realtime geregistreerd door het slimme contract, waardoor een AccessGranted-gebeurtenis wordt geactiveerd. Dit evenement bevat belangrijke informatie, zoals het wallet-adres van de gebruiker, het tijdstempel van de toegang en de bijbehorende NFT tokenId. Het dynamische karakter van slimme contracten maakt real-time beheer van machtigingen mogelijk. Dit is met name handig in gedecentraliseerde toepassingen, waar toegangscontrole zeer flexibel moet zijn en moet kunnen worden aangepast aan veranderende omstandigheden.

Om privacyproblemen in openbare blockchain-omgevingen aan te pakken, slaat het systeem miniaturen met een lage resolutie (bijv. 64 x 64 pixels) op de blockchain op, terwijl de originele afbeeldingen met hoge resolutie worden versleuteld en off-chain op IPFS worden opgeslagen. Alleen geautoriseerde gebruikers die over de bijbehorende NFT beschikken, kunnen de decoderingssleutels ophalen voor toegang tot de gegevens met hoge resolutie. Onbevoegde gebruikers ontvangen versies van de gegevens met realtime DEM-verstoringen, zodat ze geen toegang hebben tot de originele gegevens.

Beeldverstoring genereren
Laad CIFAR10-, CIFAR100- en ImageNet-gegevenssets. Afbeeldingen in de datasets worden uniform verkleind en geconverteerd naar PyTorch-tensor, en de afbeeldingstensor wordt genormaliseerd met behulp van het gemiddelde en de standaarddeviatie. Initialiseer een willekeurige ruis δ¹, met behulp van een Gauss-verdeling om de initiële verstoring te genereren. Willekeurige ruis wordt toegepast op elke afbeelding x en het verlies tussen het doellabel en de modelvoorspelling wordt berekend op basis van het verlies van kruisentropie. In een dataset van klasse C is voor een steekproef i y _i de doellabelwaarde, p_i is de modelvoorspellingskans, die het verschil kwantificeert tussen de kansverdeling die door het model wordt voorspeld en het werkelijke label, waarbij het verlies wordt gemaximaliseerd zodat het model valse voorspellingen produceert. Het verlies van cross-entropie is:

figure-protocol-8

De invloed van beeldverstoring op de voorspelling wordt berekend op basis van de verliesfunctie, de omgekeerde voortplanting werkt de verstoring bij en het verstoringsbereik en de verstoringswaarde worden voortdurend bijgewerkt via meerdere iteraties. Voor de η leersnelheid is de updateformule voor de verstoring:

figure-protocol-9

Tekstverstoringen genereren
Laad vooraf getrainde BERT-modellen voor het genereren van tekstinsluitingen. Een aangepast TextFeatureExtractor-netwerk dat bestaat uit twee transformatorblokken en een volledig verbonden laag wordt gebruikt om functies te extraheren uit tekstinbeddingen die door BERT-modellen zijn gegenereerd. Voer de gebruikersinformatie en het tijdstempel van de toegangsgebruiker in het vooraf getrainde BERT-model in en genereer dynamisch tekstruis via het aangepaste TextFeatureExtractor-netwerk.

Het invoerbeeld I wordt ingevoerd in het multimodale model Qwen2.5-VL-7B-Instruct. Geleid door een gestructureerde prompt, genereert het model een beknopte tekstuele beschrijving T_q. Deze gegenereerde tekst T_q wordt ingevoerd in het vooraf getrainde BERT-base-uncased taalmodel. Door middel van taakspecifieke herschrijfprompts genereert het systeem verstoorde tekst figure-protocol-10 die de semantiek behoudt en tegelijkertijd de expressie verandert. Een TextFeatureExtractor-netwerk brengt de verstoorde tekst figure-protocol-11 in kaart in een hoogdimensionale semantische inbeddingsvector E_g.

Genereer verstoringen met meerdere doelen
Om compatibiliteit tussen tekstinsluitingen en afbeeldingsverstoringen te garanderen, passen we de vorm van de tekstinbedding aan de afmetingen van de afbeeldingsverstoring aan. Laat E_T en E_q de tekstinbeddingen vertegenwoordigen, en P_L de verstoring van de afbeelding. Het hervormingsproces zorgt ervoor dat E_T en E_q worden getransformeerd naar dezelfde dimensionaliteit als P_L: figure-protocol-12 , waarbij C, H, W de dimensies van P_L zijn. Definieer een fusiemodule voor het aandachtsmechanisme die tekstinbeddingsverstoringen en afbeeldingsverstoringen samenvoegt, waarbij de verstoringen dynamisch worden aangepast aan de aandachtsgewichten van de tekst. De fusie is:

figure-protocol-13

waarbij α de dynamische aanpassing van de parameters van het aandachtsmechanisme is. δ^T is de tekstverstoring die wordt veroorzaakt door de E_q en E_T. Voeg een regularisatietermijn toe aan het trainingsproces om overfitting te voorkomen. De regularisatieterm is de L2-norm van de tekstinbedding, die verstoringen bestraft. De verliesfunctie met meerdere objectieven combineert kruisentropieverlies en fusieverstoring, en de verliesfunctie met meerdere objectieven is als volgt:

figure-protocol-14

De doelen van de verliesfunctie zijn:

figure-protocol-15

waarbij λ een regularisatiecoëfficiënt is die wordt gebruikt om de strafkracht van de verstoring te beheersen, met als doel overmatige verstoring of overfitting te voorkomen. Bij de studie van vijandige aanvallen is gebleken dat figure-protocol-16 is de verstoringslimiet die waarneembaar is voor het menselijk oog. Het trainings- en evaluatieproces wordt gedefinieerd, inclusief het genereren van verstoringen, verliesberekening, modeltraining, enz.

Vergelijkende experimenten
We hebben een uitgebreide evaluatie uitgevoerd van de voorgestelde Dynamic Error-Minimizing Noise (DEM) aan de hand van drie bestaande methoden: Error-Minimizing Noise (EM), Transferable Adversarial Perturbaations (TAP) en Stable Error-Minimizing Noise (SEM). Deze methoden werden getest op drie benchmarkdatasets: CIFAR-10, CIFAR-100 en een subset van ImageNet, met behulp van vier algemeen aanvaarde neurale netwerkarchitecturen: VGG-16, ResNet-18, ResNet-50 en DenseNet-121, om diverse experimentele omstandigheden te garanderen.

Daarnaast hebben we de robuustheid van deze methoden onderzocht door op diffusie gebaseerde ruisonderdrukkingsmodellen toe te passen om defensieve ruis te verwijderen en de nauwkeurigheid van de voorbeelden zonder ruis op de testdatasets te meten. Deze stap was bedoeld om het vermogen van elke methode te evalueren om herstelaanvallen te weerstaan en de integriteit van de privacy van gegevens te behouden onder vijandige omstandigheden. De resultaten geven aan dat onze DEM beter presteert dan andere methoden in zowel robuustheid als nauwkeurigheid in alle datasets en architecturen, wat de doeltreffendheid ervan aantoont als een privacybeschermend kader.

Access restricted. Please log in or start a trial to view this content.

Results

$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

Blockchain en kader voor slimme contracten
Experimentele resultaten toonden aan dat het voorgestelde Blockchain-Integrated Unlearnable Example Generation and Management Framework (B-UEGMF), in combinatie met slimme contracten, een effectief dynamisch beheer van klantspecifieke toegang tot gegevens mogelijk maakte. Voor geautoriseerde gebruikers bereikten de opgehaalde schone gegevens een testnauwkeurigheid van 90.2% op een ResNet-18-surrogaatmodel dat werd geëvalueerd...

Access restricted. Please log in or start a trial to view this content.

Discussion

$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

De integratie van blockchain en UE's heeft het gebied van gegevensprivacybescherming vooruit geholpen door een transparante en gedecentraliseerde oplossing te bieden voor het beheren van gegevenstoegang. In tegenstelling tot conventionele privacybeschermende methoden, die vaak uitsluitend gebaseerd zijn op verstoringstechnieken³¹, overbrugt deze studie de kloof tussen gegevensbescherming en het traceren van verantwoordelijkheid. In scenario's voor gefedereerd lere...

Access restricted. Please log in or start a trial to view this content.

Disclosures

$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

De auteurs hebben niets relevants voor deze publicatie te onthullen.

Acknowledgements

$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

Dit werk werd ondersteund door de School of Cyberspace Security, Zhengzhou University, die een uitstekende onderzoeksomgeving en academische middelen bood. We zijn onze supervisor, prof. Zijiao Zhang, zeer dankbaar voor zijn onschatbare begeleiding, inzichtelijke suggesties en voortdurende aanmoediging tijdens dit onderzoek. We betuigen ook onze oprechte dank aan het Network Management Center van de Universiteit van Zhengzhou voor het leveren van experimentele servers, high-performance computing-bronnen en blockchain-testbedinfrastructuur, die essentieel waren voor de succesvolle implementatie van dit onderzoek.

Bijdrage van de auteur:
Ruijia Li bedacht het onderzoek, ontwikkelde de methodologie, voerde experimenten uit, voerde gegevensanalyse uit en schreef het originele manuscript. Zijiao Zhang zorgde voor supervisie, methodologievalidatie en kritische beoordeling van manuscripten. Shouli Fu heeft bijgedragen aan de implementatiebegeleiding van blockchain. Lin Zhu assisteerde bij het cureren en valideren van gegevens. Qunpeng Lei heeft bijgedragen aan de ontwikkeling van het theoretisch kader. Buwei Wang zorgde voor technische ondersteuning. Alle auteurs hebben het definitieve manuscript beoordeeld en goedgekeurd.

Access restricted. Please log in or start a trial to view this content.

Materials

List of materials used in this article
Name	Company	Comments
CUDA 12.1	NVIDIA	Wordt gebruikt om de prestaties van deep learning-toepassingen te verbeteren
NVIDIA A800 80GB PCIe A800 80GB PCIe	NVIDIA	Wordt gebruikt voor het trainen van deep learning-modellen
Python 3.10	Python Software Foundation	Wordt gebruikt voor datavoorverwerking en analyse
PyTorch 2.5.1	Facebook	Deep learning-framework dat wordt gebruikt voor het trainen van modellen
Ubuntu 22.04	Canonical	Besturingssysteem dat wordt gebruikt voor het instellen van de omgeving

References

$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

Multi-level Cross-view Contrastive Learning for Knowledge-aware Recommender System. Zou, D., Chen, Y., Wang, X. Proc 45th Int ACM SIGIR Conf Res Dev Info Retrieval, , 1358-1368 (2022).
A simple framework for contrastive learning of visual representations. Chen, T., Kornblith, S., Norouzi, M., Hinton, G. Proc 37th Int Conf Mach Learn, 119, 1597-1607 (2020).
Guo, J., et al. Domain watermark: Effective and harmless dataset copyright protection is closed at hand. arXiv. , (2023).
Hill, K. The Secretive Company That Might End Privacy as We Know It. , The New York Times. (2020).
Prabhu, V. U., Birhane, A. Large Image Datasets: A Pyrrhic Win for Computer Vision. arXiv. , (2020).
Unlearnable examples detection via iterative filtering. Yu, Y., Jiang, X., Wang, Y. Proc Int Conf Artificial Neural Net, , 241-256 (2024).
Jiang, Y., Ma, X., Erfani, S. M., Bailey, J. Unlearnable examples for time series. Adv Knowledge Disc Data Mining. , 213-225 (2024).
Unlearnable clusters: Towards label-agnostic unlearnable examples. Zhang, J., Liu, Y., Zhou, Q. Proc IEEE/CVF Conf Comput Vision Pattern Recognit, , 3984-3993 (2023).
Unlearnable examples: Making personal data unexploitable. Huang, H., Ma, X., Erfani, S. M., Bailey, J., Wang, Y. Int Conf Learning Representat, , 1-17 (2021).
Game-theoretic unlearnable example generator. Liu, S., Wang, Y., Gao, X. S. Proc AAAI Conf Artificial Intellig, 38, 21349-21358 (2024).
Robust unlearnable examples: Protecting data privacy against adversarial learning. Fu, S., He, F., Liu, Y., Shen, L., Tao, D. ICLR 2022 Proc Int Conf Learning Representat, , 1-22 (2022).
Stable unlearnable example: Enhancing the robustness of unlearnable examples via stable error-minimizing noise. Liu, S., Xu, K., Sun, L. Proc AAAI Conf Artificial Intellig, 37, 2473-2481 (2023).
Defensive unlearning with adversarial training for robust concept erasure in diffusion models. Zhang, Y., et al. NeurIPS 2024 Proc 38th Conf Neural Informat Process Syst, , 1-29 (2024).
Unlearnable examples give a false sense of security: Piercing through unexploitable data with learnable examples. Jiang, W., et al. MM 2023 Proc 31st ACM Int Conf Multimedia, , 8910-8921 (2023).
VQUNet: Vector quantization U-Net for defending adversarial attacks by regularizing unwanted noise. He, Z., Singhal, M. ICMVA 2024 Proc 2024 7th Int Conf Machine Vis Applicat, , 69-76 (2024).
Li, Z., et al. UnGANable: Defending Against GAN-based Face Manipulation. 32nd USENIX Secur Sympos. , 7213-7230 (2023).
Narcissus: A Practical Clean-Label Backdoor Attack with Limited Information. Zeng, Y., et al. Proc 2023 ACM SIGSAC Conf Comput Communicat Secur, , 771-785 (2023).
Meng, R., Chen, J., Liu, Z. Semantic deep hiding for robust unlearnable examples. IEEE Transact Info Forens Secur. 19 (12), 6545-6558 (2024).
Detection and defense of unlearnable examples. Zhu, Y., Yu, L., Gao, X. S. Proc AAAI Conf Artif Intellig, 38 (15), 17211-17219 (2024).
Unlearnable examples: Protecting open-source software from unauthorized neural code learning. Ji, Z., Ma, P., Wang, S. Proc Int Conf Software Eng Knowledge Eng, , 525-530 (2022).
Purify unlearnable examples via rate-constrained variational autoencoders. Yu, Y., et al. ICML 2024 Proc 41st Int Conf Mach Learn, 2379, 57678-57702 (2024).
Triggerless backdoor attack for NLP tasks with clean labels. Gan, L., Zhang, W., Li, X. Proc 2022 Conf North Am Chapter Associat Computat Linguist Human Lang Technol, , 2942-2952 (2022).
Punia, A., et al. A systematic review on blockchain-based access control systems in cloud environment. J Cloud Comput. 13, 146(2024).
SoK: Understanding Design Choices and Pitfalls of Trusted Execution Environments. Li, M., Yang, Y., Chen, G., Yan, M., Zhang, Y. Proc 19th ACM Asia Conf Comput Commun Secur, , 1600-1616 (2024).
Kayikci, S., Khoshgoftaar, T. M. Blockchain meets machine learning: a survey. J Big Data. 11, 9(2024).
Ullah, F., et al. Blockchain-enabled EHR access auditing: Enhancing healthcare data security. Heliyon. 10 (16), e34407(2024).
Tripathi, G., Ahad, M. A., Casalino, G. A comprehensive review of blockchain technology: Underlying principles and historical background with future challenges. Dec Anal J. 9, 100344(2023).
Saleh, A. M. S. Blockchain for secure and decentralized artificial intelligence in cybersecurity: A comprehensive review. Blockchain Res Appl. 5 (3), 100193(2024).
Badra, M., Borghol, R. An efficient blockchain-based privacy preservation scheme for smart grids. Front Communicat Net. 6, 1584152(2025).
Fine-Grained Access Control in the Era of Cloud Computing: An Analytical Review. Albulayhi, K., Abuhussein, A., Alsubaei, F., Sheldon, F. T. 2020 10th Ann Comput Communicat Workshop Conf, , 0748-0755 (2020).
Turgay, S., İlter, İ Perturbation Methods for Protecting Data Privacy: A Review of Techniques and Applications. Automat Machine Learning. 4, 31-41 (2023).
Williamson, S. M., Prybutok, V. Balancing Privacy and Progress: A Review of Privacy Challenges, Systemic Oversight, and Patient Perceptions in AI-Driven Healthcare. Appl Sci. 14 (2), 675(2024).

Access restricted. Please log in or start a trial to view this content.

Reprints and Permissions

Request permission to reuse the text or figures of this JoVE article

Request Permission

Blockchain-gebaseerd raamwerk voor het genereren en beheren van niet-leerbare voorbeelden voor het verbeteren van gegevensprivacy en toegangscontrole

In This Article

Summary

Abstract

Introduction

Protocol

Results

Discussion

Disclosures

Acknowledgements

Materials

References

Reprints and Permissions

Tags

Related Articles