$$\rightleftharpoonup{xx}$$
$$\longleftharp{xx}$$,
$$\longrightharp{xx}$$,
No contexto do rápido desenvolvimento de grandes modelos de linguagem (LLMs), o aprendizado contrastivo tornou-se amplamente adotado devido à sua capacidade de contornar anotações de dados dispendiosas, aproveitando grandes quantidades de dados de rede para treinamento de modelos. No entanto, esse uso generalizado levanta preocupações significativas em relação à proteção da privacidade de dados. Exemplos não aprendidos (UEs), uma técnica que interrompe o aprendizado de modelos ao perturbar os dados, impede efetivamente que modelos não autorizados façam uso indevido de dados confidenciais. No entanto, os métodos existentes para gerar UEs enfrentam dois desafios principais: primeiro, as perturbações podem ser revertidas usando técnicas como purificação reversa ou redução de ruído, incluindo modelos de difusão que removem perturbações protetoras em UEs de imagem; Em segundo lugar, uma vez que os dados são publicados, torna-se difícil garantir a rastreabilidade dos dados e gerenciar o controle de acesso. Para resolver esses problemas, este artigo propõe uma Estrutura de Geração e Gerenciamento de Exemplos Não Aprendidos Integrados a Blockchain (B-UEGMF) para gerar e gerenciar UEs. Ao alavancar as propriedades descentralizadas e imutáveis do blockchain, armazenamos exemplos de valores de hash no blockchain e gerenciamos dinamicamente os direitos de acesso a dados por meio de contratos inteligentes. Além disso, os UEs são gerados usando uma técnica de perturbação multiobjetivo, Dynamic Error-Minimizing Noise (DEM), que aumenta a robustez contra métodos de reversão. Também fornecemos uma avaliação quantitativa dos recursos de proteção de privacidade dos exemplos gerados. Os resultados experimentais demonstram que a estrutura proposta melhorou significativamente a defesa dos UEs contra ataques reversos, garantindo um gerenciamento eficiente da privacidade dos dados.