Research Article

Marco basado en blockchain para generar y gestionar ejemplos imposibles de aprender para mejorar la privacidad de los datos y el control de acceso

DOI:

10.3791/68338

August 22nd, 2025

In This Article

Summary

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

Este artículo propone un marco basado en blockchain para generar ejemplos imposibles de aprender, integrando la perturbación dinámica con el control de acceso. Mejora la protección de la privacidad al garantizar que los usuarios no autorizados reciban datos perturbados, salvaguardando la información confidencial y permitiendo una gestión eficiente de los datos y el acceso a través de contratos inteligentes.

Abstract

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

En el contexto del rápido desarrollo de grandes modelos de lenguaje (LLM), el aprendizaje contrastivo se ha adoptado ampliamente debido a su capacidad para eludir la costosa anotación de datos al aprovechar grandes cantidades de datos de red para el entrenamiento de modelos. Sin embargo, este uso generalizado plantea importantes preocupaciones con respecto a la protección de la privacidad de los datos. Los ejemplos no aprendibles (UE), una técnica que interrumpe el aprendizaje de modelos al perturbar los datos, evita eficazmente que los modelos no autorizados hagan un mal uso de los datos confidenciales. Sin embargo, los métodos existentes para generar UE enfrentan dos desafíos principales: primero, las perturbaciones se pueden revertir utilizando técnicas como la purificación inversa o la eliminación de ruido, incluidos los modelos de difusión que eliminan las perturbaciones protectoras en los UE de imagen; En segundo lugar, una vez que se publican los datos, garantizar la trazabilidad de los datos y administrar el control de acceso se vuelve difícil. Para abordar estos problemas, este documento propone un marco de gestión y generación de ejemplos no aprendibles integrado en blockchain (B-UEGMF) para generar y administrar UE. Al aprovechar las propiedades descentralizadas e inmutables de blockchain, almacenamos valores hash de ejemplo en blockchain y administramos dinámicamente los derechos de acceso a los datos a través de contratos inteligentes. Además, los UE se generan utilizando una técnica de perturbación multiobjetivo, Dynamic Error-Minimizing Noise (DEM), que mejora la robustez frente a los métodos de inversión. También proporcionamos una evaluación cuantitativa de las capacidades de protección de la privacidad de los ejemplos generados. Los resultados experimentales demuestran que el marco propuesto mejoró significativamente la defensa de los UE contra ataques inversos al tiempo que garantizaba una gestión eficiente de la privacidad de los datos.

Introduction

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

En los últimos años, con el rápido avance del aprendizaje profundo y los grandes modelos de lenguaje, el aprendizaje contrastivo ha surgido como un enfoque eficiente de aprendizaje no supervisado debido a su independencia de las costosas anotaciones manuales 1,2. Sin embargo, el uso extensivo de conjuntos de datos públicos ha planteado preocupaciones significativas sobre violaciones de privacidad y uso indebido de datos. Los casos de utilización no autorizada de datos disponibles públicamente para el entrenamiento de modelos se han vuelto cada vez más comunes....

Access restricted. Please log in or start a trial to view this content.

Protocol

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

Arreglo
Consideramos una tarea de clasificación supervisada con un conjunto de datos figure-protocol-1, donde figure-protocol-2 representa las características de entrada y figure-protocol-3 denota las etiquetas de clase correspondientes para un problema de clase K. El conjunto de datos D se divide en un conjunto de datos de ent....

Access restricted. Please log in or start a trial to view this content.

Results

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

Marco de blockchain y contratos inteligentes
Los resultados experimentales demostraron que el marco de gestión y generación de ejemplos no aprendibles integrado en blockchain (B-UEGMF) propuesto, combinado con contratos inteligentes, permitió una gestión dinámica efectiva del acceso específico del cliente a los datos. Para los usuarios autorizados, los datos limpios recuperados lograron una precisión de prueba del 90,2% en un modelo sustituto de ResNet-18 evaluado en el conjunto de datos CIFAR-10. Por.......

Access restricted. Please log in or start a trial to view this content.

Discussion

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

La integración de blockchain y UE ha avanzado en el campo de la protección de la privacidad de datos al proporcionar una solución transparente y descentralizada para administrar el acceso a los datos. A diferencia de los métodos convencionales de preservación de la privacidad, que a menudo se basan únicamente en técnicas de perturbación31, este estudio cierra la brecha entre la protección de datos y el rastreo de responsabilidades. En escenarios de aprendizaje fed.......

Access restricted. Please log in or start a trial to view this content.

Disclosures

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

Los autores no tienen nada relevante para esta publicación que revelar.

Acknowledgements

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

Este trabajo fue apoyado por la Escuela de Seguridad del Ciberespacio de la Universidad de Zhengzhou, que proporcionó un excelente entorno de investigación y recursos académicos. Estamos profundamente agradecidos a nuestro supervisor, el Prof. Zijiao Zhang, por su invaluable orientación, sugerencias perspicaces y aliento continuo a lo largo de esta investigación. También extendemos nuestro sincero agradecimiento al Centro de Gestión de Redes de la Universidad de Zhengzhou por proporcionar servidores experimentales, recursos informáticos de alto rendimiento e infraestructura de banco de pruebas de blockchain, que fueron esenciales para....

Access restricted. Please log in or start a trial to view this content.

Materials

List of materials used in this article
NameCompanyCatalog NumberComments
CUDA 12.1NVIDIASe utiliza para mejorar el rendimiento de las aplicaciones de aprendizaje profundo
NVIDIA A800 80GB PCIe A800 80GB PCIeNVIDIASe utiliza para el entrenamiento de modelos de aprendizaje profundo
Python 3.10Fundación de software PythonSe utiliza para el preprocesamiento y análisis de datos
PyTorch 2.5.1FacebookMarco de aprendizaje profundo utilizado para el entrenamiento de modelos
Ubuntu 22.04CanónicoSistema operativo utilizado para configurar el entorno

References

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,
  1. Multi-level Cross-view Contrastive Learning for Knowledge-aware Recommender System. Zou, D., Chen, Y., Wang, X. Proc 45th Int ACM SIGIR Conf Res Dev Info Retrieval, , 1358-1368 (2022).
  2. A simple framework for contrastive learning of visual representations. Chen, T., Kornblith, S., Norouzi, M., Hinton, G. Proc 37th Int Conf Mach Learn, 119, 1597-1607 (2020).
  3. Guo, J., et al. Domain watermark: Effective and harmless dataset copyri....

Access restricted. Please log in or start a trial to view this content.

Reprints and Permissions

Request permission to reuse the text or figures of this JoVE article

Request Permission

Tags

Blockchain Data PrivacyUnlearnable ExamplesAccess ControlContrastive LearningData TraceabilitySmart ContractsData PerturbationPrivacy ProtectionReverse Attack DefenseDynamic Error Minimizing Noise

Related Articles