$$\rightleftharpoonup{xx}$$
$$\longleftharp{xx}$$,
$$\longrightharp{xx}$$,
In de context van de snelle ontwikkeling van grote taalmodellen (LLM's) is contrastief leren op grote schaal toegepast vanwege het vermogen om kostbare gegevensannotatie te omzeilen door gebruik te maken van enorme hoeveelheden netwerkgegevens voor modeltraining. Dit wijdverbreide gebruik roept echter grote zorgen op over de bescherming van de privacy van gegevens. Unlearnable Examples (UE's), een techniek die het leren van modellen verstoort door gegevens te verstoren, voorkomt effectief dat ongeautoriseerde modellen misbruik maken van gevoelige gegevens. Bestaande methoden voor het genereren van UE's staan echter voor twee primaire uitdagingen: ten eerste kunnen verstoringen worden omgekeerd met behulp van technieken zoals omgekeerde zuivering of ruisonderdrukking, inclusief diffusiemodellen die beschermende verstoringen in beeld-UE's verwijderen; Ten tweede, zodra de gegevens zijn gepubliceerd, wordt het moeilijk om de traceerbaarheid van gegevens te waarborgen en de toegangscontrole te beheren. Om deze problemen aan te pakken, stelt dit artikel een Blockchain-Integrated Unlearnable Example Generation and Management Framework (B-UEGMF) voor het genereren en beheren van UE's. Door gebruik te maken van de gedecentraliseerde en onveranderlijke eigenschappen van blockchain, slaan we voorbeeldhash-waarden op de blockchain op en beheren we dynamisch de toegangsrechten tot gegevens via slimme contracten. Bovendien worden UE's gegenereerd met behulp van een multi-objectieve verstoringstechniek, Dynamic Error-Minimizing Noise (DEM), die de robuustheid tegen omkeringsmethoden verbetert. We bieden ook een kwantitatieve evaluatie van de privacybeschermingsmogelijkheden van de gegenereerde voorbeelden. Experimentele resultaten tonen aan dat het voorgestelde raamwerk de verdediging van UE's tegen omgekeerde aanvallen aanzienlijk heeft verbeterd en tegelijkertijd een efficiënt beheer van gegevensprivacy garandeert.