Research Article

基于区块链的框架,用于生成和管理不可学习的示例,以增强数据隐私和访问控制

DOI:

10.3791/68338

August 22nd, 2025

In This Article

Summary

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

本文提出了一种基于区块链的框架,用于生成不可学习的示例,将动态扰动与访问控制相结合。它通过确保未经授权的用户接收受干扰的数据来增强隐私保护,保护敏感信息,同时通过智能合约实现高效的数据管理和访问。

Abstract

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

在大型语言模型(LLM)快速发展的背景下,对比学习因其能够利用大量网络数据进行模型训练来绕过昂贵的数据标注而被广泛采用。然而,这种广泛使用引起了人们对数据隐私保护的严重担忧。不可学习示例 (UE) 是一种通过扰动数据来破坏模型学习的技术,可有效防止未经授权的模型滥用敏感数据。然而,现有的生成UE的方法面临着两个主要挑战:首先,可以使用反向纯化或去噪等技术来逆转扰动,包括消除图像UE中保护性扰动的扩散模型;其次,数据一旦发布,确保数据可追溯性和管理访问控制就变得困难。针对这些问题,本文提出了一种区块链集成不可学习示例生成和管理框架(B-UEGMF)来生成和管理UE。通过利用区块链的去中心化和不可变属性,我们将示例哈希值存储在区块链上,并通过智能合约动态管理数据访问权限。此外,UE 是使用多目标扰动技术动态误差最小化噪声 (DEM) 生成的,这增强了对反转方法的鲁棒性。我们还对生成的示例的隐私保护能力进行了定量评估。实验结果表明,所提框架在保证高效数据隐私管理的同时,显著提高了UE对反向攻击的防御能力。

Introduction

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

近年来,随着深度学习和大型语言模型的快速发展,对比学习由于独立于昂贵的手动注释而成为一种高效的无监督学习方法1,2。然而,公共数据集的广泛使用引起了人们对隐私泄露和数据滥用的严重担忧。未经授权使用公开数据进行模型训练的情况变得越来越普遍3.例如,2017 年,未经授权的公共照片被用来训练面部识别模型4。同样,亚马逊在未获得所有用户明确同意的情况下利用消费者公开评论数据来训练其推荐系统,暴露了隐私保护机制的漏洞5.

为了解决这些问题,不可学习示例 (UE) 应运而生,成为一种新颖的数据隐私保护技术。UE为数据样本添加了难以察觉的扰动,引入了一种快捷方式,防止模型学习敏感信息,同时保留人类对数据的感知6,7,8。现有的生成UE的方法主要包括误差最小化噪声(EM)扰动9、生成对抗网络(GAN)

Access restricted. Please log in or start a trial to view this content.

Protocol

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

设置
我们考虑了一个带有数据集 figure-protocol-1的监督分类任务,其中 figure-protocol-2 表示输入特征并 figure-protocol-3 表示 K 类问题的相应类标签。数据集 D 分为干净的训练数据集和测试数据集。

目标是通过引入小的、难以察觉的扰动来修改干净的训练数据集,δ创建一个不可学习的数据集figure-protocol-4,其中....

Access restricted. Please log in or start a trial to view this content.

Results

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

区块链和智能合约框架
实验结果表明,所提出的区块链集成不可学习示例生成和管理框架(B-UEGMF)与智能合约相结合,能够对特定于客户端的数据访问进行有效的动态管理。对于授权用户,在CIFAR-10数据集上评估的ResNet-18代理模型上,检索到的干净数据的测试准确率为90.2%。相比之下,未经授权的用户访问DEM生成的UE获得了明显较低的13.0%的测试准确率。这些结果验证了 B-UEGMF 通过强大的不可学习示例有效实施访问控制的能力,同时保护数据隐私,如 图 2 所示。更多实验结果见 表1

抵抗恢复攻击
与现有方法相比,所提出的动态误差最小化噪声(DEM)对基于恢复的对抗性攻击表现出卓越的鲁棒性。 图 4 显示了不同方法的训练损失比较。在涉及扩散模型和其他去噪技术的实验场景中,DEM 生成的 UE 始终抵制逆向工程尝试。与 EM 和 SEM 的.......

Access restricted. Please log in or start a trial to view this content.

Discussion

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

区块链和 UE 的集成通过提供透明且去中心化的数据访问管理解决方案,推动了数据隐私保护领域的发展。与通常仅依赖扰动技术的传统隐私保护方法不同31,这项研究弥合了数据保护和责任追踪之间的差距。在联合学习场景中,所提出的框架可确保跨去中心化数据集进行安全和私密的模型训练,从而降低未经授权的数据恢复的风险。此外,DEM 中嵌入的注意力机制提高了适应性和鲁棒性,为其在复杂的现实场景中的应用铺平了道路。

尽管有其贡献,但这项研究有几个局限性。首先,当前框架主要针对图像分类任务中的隐私保护,其在其他下游任务上的性能仍有待探索。其次,区块链集成的计算开销,包括存储和交易成本,可能会限制其在大规模应用程序中的可扩展性。第三,动态扰动生成方法依赖于客户端元数据和时间戳,它们可能无法捕获所有相关的上下文因素来生成最佳噪声。解决这些限制需要进一步优化区块链框架和扰动生成策略。

所提出的框架在需要严格隐私保护和可追溯数据访问的场景中具有.......

Access restricted. Please log in or start a trial to view this content.

Disclosures

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

作者没有任何与本出版物相关的信息可以披露。

Acknowledgements

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

这项工作得到了郑州大学网络空间安全学院的支持,提供了良好的研究环境和学术资源。我们非常感谢导师张子佼教授在整个研究过程中给予的宝贵指导、富有洞察力的建议和不断的鼓励。我们也衷心感谢郑州大学网络管理中心提供的实验服务器、高性能计算资源和区块链测试平台基础设施,这些对于本研究的成功实施至关重要。

作者贡献:
李瑞佳构思了这项研究,制定了方法,进行了实验,进行了数据分析,并撰写了原始手稿。张子佼提供监督、方法论验证和批判性稿件审稿。Shouli Fu 为区块链实施指导做出了贡献。Lin Zhu 协助进行数据管理和验证。雷群鹏对理论框架的制定做出了贡献。王步伟提供技术支持。所有作者都审阅并批准了最终稿件。

....

Access restricted. Please log in or start a trial to view this content.

Materials

List of materials used in this article
NameCompanyCatalog NumberComments
CUDA 12.1英伟达用于增强深度学习应用程序的性能
英伟达 A800 80GB PCIe A800 80GB PCIe英伟达用于深度学习模型训练
Python 3.10 中文文档Python 软件基础用于数据预处理和分析
PyTorch 2.5.1脸书用于模型训练的深度学习框架
Ubuntu 22.04 的规范用于设置环境的作系统

References

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,
  1. Multi-level Cross-view Contrastive Learning for Knowledge-aware Recommender System. Zou, D., Chen, Y., Wang, X. Proc 45th Int ACM SIGIR Conf Res Dev Info Retrieval, , 1358-1368 (2022).
  2. A simple framework for contrastive learning of visual representations. Chen, T., Kornblith, S., Norouzi, M., Hinton, G. Proc 37th Int Conf Mach Learn, 119, 1597-1607 (2020).
  3. Guo, J., et al. Domain watermark: Effective and harmless dataset copyri....

Access restricted. Please log in or start a trial to view this content.

Reprints and Permissions

Request permission to reuse the text or figures of this JoVE article

Request Permission

Tags

Blockchain Data PrivacyUnlearnable ExamplesAccess ControlContrastive LearningData TraceabilitySmart ContractsData PerturbationPrivacy ProtectionReverse Attack DefenseDynamic Error Minimizing Noise

Related Articles