Research Article

데이터 개인 정보 보호 및 액세스 제어 강화를 위한 학습 불가능한 예제 생성 및 관리를 위한 블록체인 기반 프레임워크

DOI:

10.3791/68338

August 22nd, 2025

In This Article

Summary

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

이 백서는 학습할 수 없는 예제를 생성하고 동적 섭동과 액세스 제어를 통합하기 위한 블록체인 기반 프레임워크를 제안합니다. 승인되지 않은 사용자가 교란된 데이터를 수신하도록 보장하고 민감한 정보를 보호하는 동시에 스마트 계약을 통해 효율적인 데이터 관리 및 액세스를 가능하게 함으로써 개인 정보 보호를 강화합니다.

Abstract

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

대규모 언어 모델(LLM)의 급속한 발전과 맥락에서 모델 훈련을 위해 방대한 양의 네트워크 데이터를 활용하여 비용이 많이 드는 데이터 주석을 우회할 수 있는 능력으로 인해 대조 학습이 널리 채택되었습니다. 그러나 이러한 광범위한 사용은 데이터 개인 정보 보호와 관련하여 심각한 우려를 불러일으킵니다. 데이터를 교란하여 모델 학습을 방해하는 기술인 학습할 수 없는 예제(UE)는 승인되지 않은 모델이 민감한 데이터를 오용하는 것을 효과적으로 방지합니다. 그러나 UE를 생성하는 기존 방법은 두 가지 주요 과제에 직면해 있습니다: 첫째, 이미지 UE에서 보호 섭동을 제거하는 확산 모델을 포함하여 역정제 또는 노이즈 제거와 같은 기술을 사용하여 섭동을 반전시킬 수 있습니다. 둘째, 데이터가 게시되면 데이터 추적성을 보장하고 액세스 제어를 관리하기가 어려워집니다. 이러한 문제를 해결하기 위해 본 백서에서는 UE를 생성하고 관리하기 위한 B-UEGMF(Blockchain-Integrated Unlearnable Example Generation and Management Framework)를 제안합니다. 블록체인의 탈중앙화되고 불변의 속성을 활용하여 예제 해시 값을 블록체인에 저장하고 스마트 계약을 통해 데이터 접근 권한을 동적으로 관리합니다. 또한 UE는 반전 방법에 대한 견고성을 향상시키는 다중 목표 섭동 기술인 DEM(Dynamic Error-Minimizing Noise)을 사용하여 생성됩니다. 또한 생성된 예제의 개인 정보 보호 기능에 대한 정량적 평가를 제공합니다. 실험 결과는 제안된 프레임워크가 효율적인 데이터 개인 정보 보호를 보장하면서 역공격에 대한 UE의 방어력을 크게 향상시켰음을 보여줍니다.

Introduction

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

최근 몇 년 동안 딥 러닝과 대규모 언어 모델의 급속한 발전으로 대조 학습은 비용이 많이 드는 수동 주석으로부터 독립적이기 때문에 효율적인 비지도 학습 접근 방식으로 부상했습니다 1,2. 그러나 공개 데이터 세트의 광범위한 사용으로 인해 개인 정보 침해 및 데이터 오용에 대한 심각한 우려가 제기되었습니다. 모델 훈련을 위해 공개적으로 사용 가능한 데이터를 무단으로 사용하는 사례가 점점 더 보편화되고 있습니다3. 예를 들어, 2017년에는 안면 인식 모델을 훈련하기 위해 승인되지 않은 공개 사진이 사용되었습니다4. 마찬가지로 Amazon은 소비자 공개 리뷰 데이터를 활용하여 모든 사용자의 명시적인 동의를 확보하지 않고 추천 시스템을 교육하여 개인 정보 보호 메커니즘의 취약성을 노출했습니다5.

이러한 문제를 해결하기 위해 학습할 수 없는 예제(UE)가 새로운 데이터 개인 정보 보호 기술로 등장했습니다. UE는 데이터 샘플에 감지할 수 없는 섭동을 추가하여 ....

Access restricted. Please log in or start a trial to view this content.

Protocol

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

설치
우리는 데이터 세트 figure-protocol-1figure-protocol-2 를 사용한 지도 분류 작업을 고려했습니다. 여기서 는 입력 특징을 나타내고 figure-protocol-3 K-클래스 문제에 대한 해당 클래스 레이블을 나타냅니다. 데이터 세트 D는 클린 학습 데이터 세트와 테스트 데이터 세트로 분할됩니다.

목표는 학습할 수 없는 데이터 세트

Access restricted. Please log in or start a trial to view this content.

Results

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

블록체인 및 스마트 계약 프레임워크
실험 결과는 제안된 B-UEGMF(Blockchain-Integrated Unlearnable Example Generation and Management Framework)가 스마트 계약과 결합되어 데이터에 대한 클라이언트별 액세스를 효과적으로 동적으로 관리할 수 있음을 보여주었습니다. 승인된 사용자의 경우 검색된 클린 데이터는 CIFAR-10 데이터 세트에서 평가된 ResNet-18 대리 모델에서 90.2%의 테스트 정확도를 달성했습니다. 반면, DEM에서 생성된 UE에 액세스하는 무단 사용자는 13.0%로 현저히 낮은 테스트 정확도를 얻었습니다. 이러한 결과는 그림 2에서 볼 수 있듯이 강력한 학습 불가능한 예제를 통해 데이터 개인 정보를 보호하면서 액세스 제어를 효과적으로 시행하는 B-UEGMF의 기능을 검증합니다. 더 많은 실험 결과는 표 1에 나와 있습니다.

.......

Access restricted. Please log in or start a trial to view this content.

Discussion

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

블록체인과 UE의 통합은 데이터 액세스 관리를 위한 투명하고 분산된 솔루션을 제공함으로써 데이터 개인 정보 보호 분야를 발전시켰습니다. 종종 섭동 기술에만 의존하는 기존의 개인 정보 보호 방법과 달리31, 이 연구는 데이터 보호와 책임 추적 사이의 격차를 해소합니다. 연합 학습 시나리오에서 제안된 프레임워크는 분산형 데이터 세트 전반에 걸쳐 안전한 비공개 모델 훈련을 보장하여 무단 데이터 복구 위험을 완화합니다. 또한 DEM에 내장된 주의 메커니즘은 적응성과 견고성을 향상시켜 복잡한 실제 시나리오에 적용할 수 있는 길을 열어줍니다.

기여에도 불구하고 이 연구에는 몇 가지 한계가 있습니다. 첫째, 현재 프레임워크는 주로 이미지 분류 작업에서 개인 정보 보호를 목표로 하며 다른 다운스트림 작업에서의 성능은 아직 탐구되지 않았습니다. 둘째, 스토리지 및 트랜잭션 비용을 포함한 블록체.......

Access restricted. Please log in or start a trial to view this content.

Disclosures

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

저자는 이 간행물과 관련된 공개할 내용이 없습니다.

Acknowledgements

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

이 작업은 우수한 연구 환경과 학술 자원을 제공한 정저우 대학교 사이버 공간 보안 학교의 지원을 받았습니다. 우리는 이 연구 전반에 걸쳐 귀중한 지도, 통찰력 있는 제안 및 지속적인 격려에 대해 지도교수인 Zijiao Zhang 교수에게 깊은 감사를 드립니다. 또한 본 연구의 성공적인 구현에 필수적인 실험 서버, 고성능 컴퓨팅 리소스 및 블록체인 테스트베드 인프라를 제공한 정저우 대학의 네트워크 관리 센터에도 진심으로 감사드립니다.

저자 기여:
Ruijia Li는 연구를 구상하고, 방법론을 개발하고, 실험을 수행하고, 데이터 분석을 수행하고, 원본 원고를 작성했습니다. Zijiao Zhang은 감독, 방법론 검증 및 비판적 원고 검토를 제공했습니다. Shouli Fu는 블록체인 구현 지침에 기여했습니다. Lin Zhu는 데이터 큐레이션 및 검증을 지원했습니다. Qunpeng Lei는 이론적 프레임워크 개발에 기여했습니다. Buwei Wang은 기술 지원을 제공했습니다. 모든 저자는 최종 원고를 검토하고 승인했습니다.

....

Access restricted. Please log in or start a trial to view this content.

Materials

List of materials used in this article
NameCompanyCatalog NumberComments
쿠다 12.1엔비디아딥 러닝 애플리케이션의 성능을 향상시키는 데 사용됩니다.
NVIDIA A800 80GB PCIe A800 80GB PCIe엔비디아딥러닝 모델 학습에 사용
파이썬 3.10파이썬 소프트웨어 재단데이터 전처리 및 분석에 사용
파이토치 2.5.1페이스북모델 학습에 사용되는 딥러닝 프레임워크
우분투 22.04교회법에 의거한환경 설정에 사용되는 운영 체제

References

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,
  1. Multi-level Cross-view Contrastive Learning for Knowledge-aware Recommender System. Zou, D., Chen, Y., Wang, X. Proc 45th Int ACM SIGIR Conf Res Dev Info Retrieval, , 1358-1368 (2022).
  2. A simple framework for contrastive learning of visual representations. Chen, T., Kornblith, S., Norouzi, M., Hinton, G. Proc 37th Int Conf Mach Learn, 119, 1597-1607 (2020).
  3. Guo, J., et al. Domain watermark: Effective and harmless dataset copyri....

Access restricted. Please log in or start a trial to view this content.

Reprints and Permissions

Request permission to reuse the text or figures of this JoVE article

Request Permission

Tags

Blockchain Data PrivacyUnlearnable ExamplesAccess ControlContrastive LearningData TraceabilitySmart ContractsData PerturbationPrivacy ProtectionReverse Attack DefenseDynamic Error Minimizing Noise

Related Articles