Research Article

Oparta na blockchainie platforma do generowania i zarządzania niezrozumiałymi przykładami w celu zwiększenia prywatności danych i kontroli dostępu

DOI:

10.3791/68338

August 22nd, 2025

In This Article

Summary

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

W niniejszym artykule zaproponowano opartą na blockchainie strukturę do generowania niemożliwych do nauczenia się przykładów, integrującą dynamiczne perturbacje z kontrolą dostępu. Zwiększa ochronę prywatności, zapewniając, że nieautoryzowani użytkownicy otrzymują zakłócone dane, chroniąc poufne informacje, a jednocześnie umożliwiając efektywne zarządzanie danymi i dostęp za pośrednictwem inteligentnych kontraktów.

Abstract

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

W kontekście szybkiego rozwoju dużych modeli językowych (LLM), uczenie kontrastywne stało się szeroko stosowane ze względu na jego zdolność do omijania kosztownych adnotacji danych poprzez wykorzystanie ogromnych ilości danych sieciowych do trenowania modeli. To powszechne stosowanie budzi jednak poważne obawy dotyczące ochrony prywatności danych. Nieuczące się przykłady (UE), technika, która zakłóca uczenie się modelu poprzez zakłócanie danych, skutecznie zapobiega niewłaściwemu wykorzystaniu poufnych danych przez nieautoryzowane modele. Jednak istniejące metody generowania UEs stoją przed dwoma podstawowymi wyzwaniami: po pierwsze, perturbacje można odwrócić za pomocą technik takich jak odwrotne oczyszczanie lub odszumianie, w tym modeli dyfuzyjnych, które usuwają ochronne perturbacje w obrazowych UE; Po drugie, po opublikowaniu danych zapewnienie identyfikowalności danych i zarządzanie kontrolą dostępu staje się trudne. Aby rozwiązać te problemy, w niniejszym dokumencie zaproponowano Blockchain-Integrated Unlearnable Example Generation and Management Framework (B-UEGMF) do generowania i zarządzania interfejsami UE. Wykorzystując zdecentralizowane i niezmienne właściwości blockchaina, przechowujemy przykładowe wartości skrótu w łańcuchu bloków i dynamicznie zarządzamy prawami dostępu do danych za pośrednictwem inteligentnych kontraktów. Dodatkowo, UEs są generowane przy użyciu wieloobiektywowej techniki perturbacji, Dynamic Error-Minimizing Noise (DEM), która zwiększa odporność na metody odwrócenia. Zapewniamy również ilościową ocenę możliwości ochrony prywatności wygenerowanych przykładów. Wyniki eksperymentalne pokazują, że zaproponowana struktura znacznie poprawiła ochronę UEs przed atakami odwrotnymi, zapewniając jednocześnie efektywne zarządzanie prywatnością danych.

Introduction

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

W ostatnich latach, wraz z szybkim postępem głębokiego uczenia i dużych modeli językowych, uczenie kontrastywne stało się skutecznym podejściem do uczenia się bez nadzoru ze względu na jego niezależność od kosztownych ręcznych adnotacji 1,2. Jednak szerokie wykorzystanie publicznych zbiorów danych wzbudziło poważne obawy dotyczące naruszeń prywatności i niewłaściwego wykorzystania danych. Przypadki nieautoryzowanego wykorzystania publicznie dostępnych danych do trenowania modelu stają się coraz częstsze3. Na przykład w 2017 r. nieautoryzowane zdjęcia publiczne zostały wykorzystane do tr....

Access restricted. Please log in or start a trial to view this content.

Protocol

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

Instalacji
Rozważyliśmy nadzorowane zadanie klasyfikacyjne z zestawem danych figure-protocol-1, gdzie figure-protocol-2 reprezentuje cechy wejściowe i figure-protocol-3 oznacza odpowiednie etykiety klas dla problemu klasy K. Zestaw danych D jest podzielony na czysty zestaw danych treningowych i zestaw danych testowych.

Access restricted. Please log in or start a trial to view this content.

Results

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

Ramy łańcucha bloków i inteligentnych kontraktów
Wyniki eksperymentalne wykazały, że proponowana struktura generowania i zarządzania nieuczącymi się przykładami zintegrowanymi z blockchainem (B-UEGMF), w połączeniu z inteligentnymi kontraktami, umożliwiła skuteczne dynamiczne zarządzanie dostępem do danych specyficznym dla klienta. W przypadku autoryzowanych użytkowników uzyskane czyste dane osiągnęły dokładność testu na poziomie 90,2% w modelu zastępczym ResNet-18 ocenianym na zestawie danych CIFAR-1.......

Access restricted. Please log in or start a trial to view this content.

Discussion

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

Integracja blockchaina i UEs posunęła naprzód dziedzinę ochrony prywatności danych, zapewniając przejrzyste i zdecentralizowane rozwiązanie do zarządzania dostępem do danych. W przeciwieństwie do konwencjonalnych metod ochrony prywatności, które często opierają się wyłącznie na technikach perturbacji31, badanie to wypełnia lukę między ochroną danych a śledzeniem odpowiedzialności. W scenariuszach uczenia federacyjnego proponowana struktura zapewnia bezpieczne i prywatne trenowanie modelu w zdecent.......

Access restricted. Please log in or start a trial to view this content.

Disclosures

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

Autorzy nie mają nic istotnego dla tej publikacji do ujawnienia.

Acknowledgements

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

Prace te były wspierane przez Szkołę Bezpieczeństwa Cyberprzestrzeni Uniwersytetu w Zhengzhou, która zapewniła doskonałe środowisko badawcze i zasoby akademickie. Jesteśmy głęboko wdzięczni naszemu promotorowi, prof. Zijiao Zhangowi, za jego nieocenione wskazówki, wnikliwe sugestie i ciągłą zachętę podczas tych badań. Składamy również serdeczne podziękowania Centrum Zarządzania Siecią Uniwersytetu w Zhengzhou za dostarczenie eksperymentalnych serwerów, wysokowydajnych zasobów obliczeniowych i infrastruktury testowej blockchain, które były niezbędne do pomyślnego wdrożenia tego badania.

Wkład autora:
Ruijia Li wymyśliła....

Access restricted. Please log in or start a trial to view this content.

Materials

List of materials used in this article
NameCompanyCatalog NumberComments
CUDA 12.1Technologia NVIDIASłuży do zwiększania wydajności aplikacji głębokiego uczenia
NVIDIA A800 80 GB PCIe A800 80 GB PCIeTechnologia NVIDIASłuży do trenowania modelu uczenia głębokiego
Język Python 3.10Fundacja oprogramowania PythonSłuży do wstępnego przetwarzania i analizy danych
PyTorch 2.5.1AktualnościStruktura uczenia głębokiego używana do trenowania modelu
Ubuntownik 22.04KanonicznySystem operacyjny używany do konfigurowania środowiska

References

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,
  1. Multi-level Cross-view Contrastive Learning for Knowledge-aware Recommender System. Zou, D., Chen, Y., Wang, X. Proc 45th Int ACM SIGIR Conf Res Dev Info Retrieval, , 1358-1368 (2022).
  2. A simple framework for contrastive learning of visual representations. Chen, T., Kornblith, S., Norouzi, M., Hinton, G. Proc 37th Int Conf Mach Learn, 119, 1597-1607 (2020).
  3. Guo, J., et al. Domain watermark: Effective and harmless dataset copyri....

Access restricted. Please log in or start a trial to view this content.

Reprints and Permissions

Request permission to reuse the text or figures of this JoVE article

Request Permission

Tags

Blockchain Data PrivacyUnlearnable ExamplesAccess ControlContrastive LearningData TraceabilitySmart ContractsData PerturbationPrivacy ProtectionReverse Attack DefenseDynamic Error Minimizing Noise

Related Articles