Research Article

מסגרת מבוססת בלוקצ'יין ליצירה וניהול של דוגמאות בלתי ניתנות ללמידה לשיפור פרטיות הנתונים ובקרת הגישה

DOI:

10.3791/68338

August 22nd, 2025

In This Article

Summary

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

מאמר זה מציע מסגרת מבוססת בלוקצ'יין ליצירת דוגמאות בלתי ניתנות ללמידה, המשלבת הפרעה דינמית עם בקרת גישה. זה משפר את הגנת הפרטיות על ידי הבטחה שמשתמשים לא מורשים יקבלו נתונים מופרעים, שמירה על מידע רגיש תוך מתן אפשרות לניהול וגישה יעילים לנתונים באמצעות חוזים חכמים.

Abstract

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

בהקשר של ההתפתחות המהירה של מודלים גדולים של שפה (LLMs), למידה ניגודית אומצה באופן נרחב בשל יכולתה לעקוף הערות נתונים יקרות על ידי מינוף כמויות עצומות של נתוני רשת לאימון מודלים. עם זאת, שימוש נרחב זה מעלה חששות משמעותיים לגבי הגנה על פרטיות הנתונים. דוגמאות בלתי ניתנות ללמידה (UEs), טכניקה המשבשת את למידת המודלים על ידי הפרעה לנתונים, מונעת למעשה ממודלים לא מורשים לעשות שימוש לרעה בנתונים רגישים. עם זאת, השיטות הקיימות ליצירת UEs מתמודדות עם שני אתגרים עיקריים: ראשית, ניתן להפוך הפרעות באמצעות טכניקות כגון טיהור הפוך או דה-נוז, כולל מודלים של דיפוזיה המסירים הפרעות הגנה ב-UE של תמונה; שנית, לאחר פרסום הנתונים, הבטחת מעקב אחר נתונים וניהול בקרת גישה הופכת לקשה. כדי לטפל בסוגיות אלה, מאמר זה מציע מסגרת יצירה וניהול דוגמה בלתי ניתנת ללמידה משולבת בלוקצ'יין (B-UEGMF) ליצירה וניהול של UEs. על ידי מינוף המאפיינים המבוזרים והבלתי ניתנים לשינוי של בלוקצ'יין, אנו מאחסנים ערכי גיבוב לדוגמה בבלוקצ'יין ומנהלים באופן דינמי זכויות גישה לנתונים באמצעות חוזים חכמים. בנוסף, UEs נוצרים באמצעות טכניקת הפרעה רב-תכליתית, רעש דינמי למזעור שגיאות (DEM), המשפרת את החוסן כנגד שיטות היפוך. אנו מספקים גם הערכה כמותית של יכולות הגנת הפרטיות של הדוגמאות שנוצרו. תוצאות הניסוי מראות כי המסגרת המוצעת שיפרה משמעותית את ההגנה על UEs מפני התקפות הפוכות תוך הבטחת ניהול יעיל של פרטיות נתונים.

Introduction

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

בשנים האחרונות, עם ההתקדמות המהירה של למידה עמוקה ומודלים גדולים של שפה, למידה ניגודית התגלתה כגישת למידה יעילה ללא פיקוח בשל עצמאותה מהערות ידניות יקרות 1,2. עם זאת, השימוש הנרחב במערכי נתונים ציבוריים העלה חששות משמעותיים לגבי הפרות פרטיות ושימוש לרעה בנתונים. מקרים של שימוש לא מורשה בנתונים הזמינים לציבור לצורך אימון מודלים הפכו נפוצים יותרויותר 3. לדוגמה, בשנת 2017 נעשה שימוש בתצלומים ציבוריים לא מורשים כדי להכשיר דוגמניות לזיהוי פנים4. באופן דומה, אמזון השתמשה בנתוני ביקורת ציבור צרכנים כדי לאמן את מערכות ההמלצות שלה מבלי לה....

Access restricted. Please log in or start a trial to view this content.

Protocol

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

ההתקנה
שקלנו משימת סיווג מפוקחת עם מערך figure-protocol-1נתונים , שבו figure-protocol-2 מייצג את תכונות הקלט ומציין figure-protocol-3 את תוויות המחלקה המתאימות לבעיה במחלקה K. מערך הנתונים D מחולק למערך נתוני אימון נקי ומערך נתוני בדיקה.

המטרה היא לשנות את מערך הנתונים של האימון הנקי על ידי הצגת הפרע....

Access restricted. Please log in or start a trial to view this content.

Results

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

מסגרת בלוקצ'יין וחוזים חכמים
תוצאות הניסוי הראו כי מסגרת היצירה והניהול המשולבת בבלוקצ'יין (B-UEGMF), בשילוב עם חוזים חכמים, אפשרה ניהול דינמי יעיל של גישה ספציפית ללקוח לנתונים. עבור משתמשים מורשים, הנתונים הנקיים שאוחזרו השיגו דיוק בדיקה של 90.2% במודל חלופי של ResNet-18 שהוערך במערך הנתונים CIFAR-10. לעומת זאת, משתמשים לא מורשים שניגשים ל-UEs שנוצרו על ידי DEM השיגו דיוק בדיקה נמוך משמעותית של 13.0%. תוצאות אלו מאמתות את היכולת של B-UEGMF לאכוף ביעילות בקרת גישה תוך שמירה על פרטיות הנתונים באמצעות .......

Access restricted. Please log in or start a trial to view this content.

Discussion

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

השילוב של בלוקצ'יין ו-UEs קידם את תחום הגנת פרטיות הנתונים על ידי מתן פתרון שקוף ומבוזר לניהול גישה לנתונים. בניגוד לשיטות קונבנציונליות לשמירה על פרטיות, המסתמכות לעתים קרובות אך ורק על טכניקות הפרעה31, מחקר זה מגשר על הפער בין הגנה על נתונים למעקב אחר אחריות. בתרחישי למידה מאוחדים, המסגרת המוצעת מבטיחה אימון מאובטח ופרטי על פני מערכי נתונים מבוזרים, ומפחית את הסיכון לשחזור נתונים לא מורשה. בנוסף, מנגנון הקשב המוטמע ב-DEM משפר את יכולת ההסתגלות והחוסן, וסולל את ה.......

Access restricted. Please log in or start a trial to view this content.

Disclosures

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

למחברים אין שום דבר רלוונטי לפרסום זה לחשוף.

Acknowledgements

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

עבודה זו נתמכה על ידי בית הספר לאבטחת מרחב הסייבר, אוניברסיטת ז'נגג'ואו, שסיפק סביבת מחקר ומשאבים אקדמיים מצוינים. אנו אסירי תודה למנחה שלנו, פרופ' זיג'יאו ז'אנג, על הדרכתו שלא תסולא בפז, הצעותיו מלאות התובנות והעידוד המתמשך לאורך כל המחקר הזה. אנו גם מודים מקרב לב למרכז ניהול הרשת של אוניברסיטת ג'נגז'ו על אספקת שרתים ניסיוניים, משאבי מחשוב בעלי ביצועים גבוהים ותשתית בדיקות בלוקצ'יין, שהיו חיוניים ליישום מוצלח של מחקר זה.

תרומת המחבר:
רויג'יה לי הגתה את המחקר, פיתח את המתודולוגיה, ערך ניסויים, ביצע ניתוח נתונים וכתב את כתב היד המקורי. זיג'יאו ז'אנג סיפק פיקוח, אימות מתודולוגיה וסקירת כתב....

Access restricted. Please log in or start a trial to view this content.

Materials

List of materials used in this article
NameCompanyCatalog NumberComments
קודה - CUDA 12.1NVIDIAמשמש לשיפור הביצועים של יישומי למידה עמוקה
NVIDIA A800 PCIe A800 בנפח 80 גיגה-בתים PCIe בנפח 80 גיגה-בתיםNVIDIAמשמש לאימון מודלים של למידה עמוקה
פייתון 3.10קרן התוכנה של פייתוןמשמש לעיבוד מקדים וניתוח נתונים
פייטורץ' - PyTorch 2.5.1פייסבוקמסגרת למידה עמוקה המשמשת לאימון מודלים
אובונטו 22.04הקנונימערכת הפעלה המשמשת להגדרת הסביבה

References

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,
  1. Multi-level Cross-view Contrastive Learning for Knowledge-aware Recommender System. Zou, D., Chen, Y., Wang, X. Proc 45th Int ACM SIGIR Conf Res Dev Info Retrieval, , 1358-1368 (2022).
  2. A simple framework for contrastive learning of visual representations. Chen, T., Kornblith, S., Norouzi, M., Hinton, G. Proc 37th Int Conf Mach Learn, 119, 1597-1607 (2020).
  3. Guo, J., et al. Domain watermark: Effective and harmless dataset copyri....

Access restricted. Please log in or start a trial to view this content.

Reprints and Permissions

Request permission to reuse the text or figures of this JoVE article

Request Permission

Tags

Blockchain Data PrivacyUnlearnable ExamplesAccess ControlContrastive LearningData TraceabilitySmart ContractsData PerturbationPrivacy ProtectionReverse Attack DefenseDynamic Error Minimizing Noise

Related Articles