$$\rightleftharpoonup{xx}$$
$$\longleftharp{xx}$$,
$$\longrightharp{xx}$$,
En el contexto del rápido desarrollo de grandes modelos de lenguaje (LLM), el aprendizaje contrastivo se ha adoptado ampliamente debido a su capacidad para eludir la costosa anotación de datos al aprovechar grandes cantidades de datos de red para el entrenamiento de modelos. Sin embargo, este uso generalizado plantea importantes preocupaciones con respecto a la protección de la privacidad de los datos. Los ejemplos no aprendibles (UE), una técnica que interrumpe el aprendizaje de modelos al perturbar los datos, evita eficazmente que los modelos no autorizados hagan un mal uso de los datos confidenciales. Sin embargo, los métodos existentes para generar UE enfrentan dos desafíos principales: primero, las perturbaciones se pueden revertir utilizando técnicas como la purificación inversa o la eliminación de ruido, incluidos los modelos de difusión que eliminan las perturbaciones protectoras en los UE de imagen; En segundo lugar, una vez que se publican los datos, garantizar la trazabilidad de los datos y administrar el control de acceso se vuelve difícil. Para abordar estos problemas, este documento propone un marco de gestión y generación de ejemplos no aprendibles integrado en blockchain (B-UEGMF) para generar y administrar UE. Al aprovechar las propiedades descentralizadas e inmutables de blockchain, almacenamos valores hash de ejemplo en blockchain y administramos dinámicamente los derechos de acceso a los datos a través de contratos inteligentes. Además, los UE se generan utilizando una técnica de perturbación multiobjetivo, Dynamic Error-Minimizing Noise (DEM), que mejora la robustez frente a los métodos de inversión. También proporcionamos una evaluación cuantitativa de las capacidades de protección de la privacidad de los ejemplos generados. Los resultados experimentales demuestran que el marco propuesto mejoró significativamente la defensa de los UE contra ataques inversos al tiempo que garantizaba una gestión eficiente de la privacidad de los datos.