$$\rightleftharpoonup{xx}$$
$$\longleftharp{xx}$$,
$$\longrightharp{xx}$$,
W kontekście szybkiego rozwoju dużych modeli językowych (LLM), uczenie kontrastywne stało się szeroko stosowane ze względu na jego zdolność do omijania kosztownych adnotacji danych poprzez wykorzystanie ogromnych ilości danych sieciowych do trenowania modeli. To powszechne stosowanie budzi jednak poważne obawy dotyczące ochrony prywatności danych. Nieuczące się przykłady (UE), technika, która zakłóca uczenie się modelu poprzez zakłócanie danych, skutecznie zapobiega niewłaściwemu wykorzystaniu poufnych danych przez nieautoryzowane modele. Jednak istniejące metody generowania UEs stoją przed dwoma podstawowymi wyzwaniami: po pierwsze, perturbacje można odwrócić za pomocą technik takich jak odwrotne oczyszczanie lub odszumianie, w tym modeli dyfuzyjnych, które usuwają ochronne perturbacje w obrazowych UE; Po drugie, po opublikowaniu danych zapewnienie identyfikowalności danych i zarządzanie kontrolą dostępu staje się trudne. Aby rozwiązać te problemy, w niniejszym dokumencie zaproponowano Blockchain-Integrated Unlearnable Example Generation and Management Framework (B-UEGMF) do generowania i zarządzania interfejsami UE. Wykorzystując zdecentralizowane i niezmienne właściwości blockchaina, przechowujemy przykładowe wartości skrótu w łańcuchu bloków i dynamicznie zarządzamy prawami dostępu do danych za pośrednictwem inteligentnych kontraktów. Dodatkowo, UEs są generowane przy użyciu wieloobiektywowej techniki perturbacji, Dynamic Error-Minimizing Noise (DEM), która zwiększa odporność na metody odwrócenia. Zapewniamy również ilościową ocenę możliwości ochrony prywatności wygenerowanych przykładów. Wyniki eksperymentalne pokazują, że zaproponowana struktura znacznie poprawiła ochronę UEs przed atakami odwrotnymi, zapewniając jednocześnie efektywne zarządzanie prywatnością danych.