$$\rightleftharpoonup{xx}$$
$$\longleftharp{xx}$$,
$$\longrightharp{xx}$$,
Nel contesto del rapido sviluppo di modelli linguistici di grandi dimensioni (LLM), l'apprendimento contrastivo è stato ampiamente adottato grazie alla sua capacità di aggirare le costose annotazioni dei dati sfruttando grandi quantità di dati di rete per l'addestramento dei modelli. Tuttavia, questo uso diffuso solleva notevoli preoccupazioni per quanto riguarda la protezione della privacy dei dati. Gli esempi non apprendibili, una tecnica che interrompe l'apprendimento dei modelli perturbando i dati, impedisce efficacemente ai modelli non autorizzati di utilizzare in modo improprio i dati sensibili. Tuttavia, i metodi esistenti per generare UE devono affrontare due sfide principali: in primo luogo, le perturbazioni possono essere invertite utilizzando tecniche come la purificazione inversa o il denoising, compresi i modelli di diffusione che rimuovono le perturbazioni protettive nelle UE di immagine; In secondo luogo, una volta pubblicati i dati, garantire la tracciabilità dei dati e gestire il controllo degli accessi diventa difficile. Per affrontare questi problemi, questo articolo propone un Blockchain-Integrated Unlearnable Example Generation and Management Framework (B-UEGMF) per la generazione e la gestione degli UE. Sfruttando le proprietà decentralizzate e immutabili della blockchain, memorizziamo i valori hash di esempio sulla blockchain e gestiamo dinamicamente i diritti di accesso ai dati attraverso contratti intelligenti. Inoltre, gli UE vengono generati utilizzando una tecnica di perturbazione multi-obiettivo, il Dynamic Error-Minimizing Noise (DEM), che migliora la robustezza rispetto ai metodi di inversione. Forniamo anche una valutazione quantitativa delle capacità di protezione della privacy degli esempi generati. I risultati sperimentali dimostrano che il framework proposto ha migliorato significativamente la difesa delle UE contro gli attacchi inversi, garantendo al contempo una gestione efficiente della privacy dei dati.