Research Article

למידת מכונה והערת רגשות חסכונית מבוססת כללים לקסיקליים של אמירות הינגליש

DOI:

10.3791/68437

August 19th, 2025

In This Article

Summary

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

מחקר זה משלב את האסטרטגיה מבוססת הכללים עם למידת מכונה וסיוע של מומחים לביאור הטקסט ההינגליש והאנגלית. הנתונים נבדקים על 19,000 ציוצים בדיוק של 81%, וזה הרבה יותר זול מאשר לעשות זאת ידנית. זה יכול להיות שימושי למעקב אחר רגשות במהלך משבר.

Abstract

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

הערת רגשות בשפות מעורבות קוד כמו הינגליש (הינדית-אנגלית) מציגה אתגרים ייחודיים בשל מורכבות לשונית ואילוצי משאבים. מחקר זה מציג מסגרת למידה פעילה היברידית המשלבת כללים לקסיקליים, למידת מכונה ומשוב מומחה איטרטיבי כדי להשיג הערת רגשות חסכונית ומדויקת. המסגרת מבוססת על תיאוריות פסיכולוגיות של רגשות, כולל תיאוריית הרגשות הבדידים ותיאוריית ההערכה הקוגניטיבית, ומשתמשת במילוני רגשות דו-לשוניים (למשל, מיפוי גוסה וזעם לכעס), טוקניזציה של תת-מילים למונחים מורכבים (למשל, פיצול figure-abstract-1 ל figure-abstract-2), ולמידה פעילה כדי לתעדף דוגמאות דו-משמעיות. המסגרת, שהוערכה על בסיס מערך נתונים של 19,000 ציוצים הקשורים למלחמה וסכסוך, השיגה דיוק של 81% (ציון F: 0.76) תוך הפחתת עלויות התפעול ב-40% בהשוואה להערות ידניות. כללים לקסיקליים פתרו 89% מאי הבהירות בהחלפת קוד, ושכלולים איטרטיביים אפשרו שיפור דיוק מצטבר מ-72% ל-81%. יעילות המערכת נובעת מהגבלת המאמץ האנושי ל-73% ממערך הנתונים, עם עיבוד מקדים אוטומטי של אימוג'ים, האשטאגים וסלנג. מחקר זה מבוסס על ההשערה ששילוב שיטות מבוססות כללים לקסיקליים עם למידה פעילה ולמידת מכונה יכול לשפר את הדיוק של הערת רגשות בטקסט הינגליש, ובמקביל להפחית את התיוג הידני ואת מאמץ ההערות הכולל.

Introduction

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

כאשר שתי שפות או יותר מעורבבות יחד בשורה אחת או בדיבור אחד, זה נקרא שפה מעורבת קוד. זה נפוץ בדיאלוג מזדמן כמו הינגליש. ישנן דרכים רבות להבנת רגשות אנושיים, ומודל חישובי של סדרה של הצהרות רגשיות פירושו לבאר אותן על ידי האנשים שאמרו את המשפטים האלה. ניתן להבין אותו במונחים של רמות ביולוגיות, פיזיולוגיות, פסיכולוגיות וכן הלאה. על פי מדענים כמו רוג'ר פנרוז, תופעות רבות בעולמנו אינן חישוביות, ומדענים כמו וולפרם סבורים שניתן למדל כל דבר (כל תופעה) באופן חישובי1. פנרוז מאמין שתודעה מערבת תהליכים (אולי קשורים למכניקת הקוונטים בתוך המוח) שהם מעבר למה שכל הליך אלגוריתמי צעד אחר צעד יכול להשיג. הוא מצטט לעתים קרובות את מש....

Access restricted. Please log in or start a trial to view this content.

Protocol

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

סעיף זה מסביר גם כיצד נבנתה המסגרת הרב-מודאלית ל-8 הערות רגשות. החלק מתחיל בדיון במאפייני מערך הנתונים, ואחריו ההליכים הבאים. להבנה טובה יותר של הליך המחקר, עיין באיור 1.

figure-protocol-1
איור 1: מסגרת שיטתית של ביאור רגשות. האיור מסביר את הרגש האפקטיבי, ביאור של טקסט הינגליש המשלב למידת מכונה, למידה פעילה וכללי לקסיקון דינמיים באמצעות קלט מומחה, דוגמאות שסווגו באופן שגוי משתפרות בהדרגה כדי להגביר את הדיוק ולהוזיל את עלות הביאור.

Access restricted. Please log in or start a trial to view this content.

Results

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

ממצאי מחקר זה מצביעים על כך ששילוב הכללים הלקסיקליים עם למידת מכונה וטכניקות למידה פעילה מציע מסלול בר-קיימא לשיפור היעילות והדיוק של הערת רגשות בטקסט הינגליש מעורבב קוד. באמצעות חידוד איטרטיבי והצעת מומחים, המסגרת המוצעת הצליחה להשיג הפחתות ניכרות במאמץ הידני תוך שמירה על ביצועים גבוהים על פני מטריצות אבולוציה. התוצאות מצביעות על פוטנציאל ליישום רחב יותר בתחומים הדורשים פתרון זיהוי רגשות ניתן להרחבה, במיוחד בסביבות רב-לשוניות ומוגבלות במשאבים כגון ניתוח מדיה חברתית ואינפורמטיקה של משברים.......

Access restricted. Please log in or start a trial to view this content.

Discussion

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

מערך הנתונים למחקר זה נאסף באמצעות שילוב של הערות ידניות ולמידה פעילה. בתחילה, 10,040 ציוצים של הינגליש הקשורים למלחמה וסכסוך סומנו ידנית עם שמונה רגשות מוגדרים מראש. לאחר מכן הורחב מערך הנתונים ל-19,000 ציוצים בגישה חצי אוטומטית. למידה פעילה אפשרה התערבות סלקטיבית של מומחים, הפחיתה את המאמץ הידני ב-40% תוך שמירה על דיוק הערות גבוה של 81% עם ציון F של 0.76. כללים לקסיקליים ומילונים ספציפיים לרגש מילאו תפקיד מכריע בפתרון 89% מאי הבהירות של החלפת קוד. מסגרת הלמידה הפעילה חידדה את המודל באופן איטרטיבי, והדגימה רווחים מצטברי.......

Access restricted. Please log in or start a trial to view this content.

Disclosures

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

המחברים מצהירים שאין ניגוד עניינים.

Acknowledgements

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

מחקר זה לא קיבל מימון חיצוני.

....

Access restricted. Please log in or start a trial to view this content.

Materials

List of materials used in this article
NameCompanyCatalog NumberComments
טקסט מהירהבינה המלאכותית של פייסבוקלא ישיםייצוג וסיווג מילים
גוגל קולאבגוגללא ישיםסביבת Jupyter Notebook מבוססת ענן
Google Colab GPU/TPUגוגללא ישיםהאצת חומרה מבוססת ענן
Intel Core i5/i7 או AMD Ryzen 5/7אינטל / AMDלא ישיםמעבד לביצוע מקומי (אם נדרש)
מטפלוטלבקוד פתוחלא ישיםספריית תצוגה חזותית של נתונים
NLTKקוד פתוחלא ישיםערכת כלים לשפה טבעית לעיבוד טקסט
NumPyקוד פתוחלא ישיםספריית מחשוב מספרית
NVIDIA GTX 1650 ואילך (אופציונלי)NVIDIAלא ישיםGPU למשימות למידה עמוקה
פנדהקוד פתוחלא ישיםספריית טיפול בנתונים
פייתון קרן התוכנה של פייתוןלא ישיםשפת תכנות ל-ML ו-NLP
פייטורץ'מטא בינה מלאכותיתלא ישיםמסגרת למידה עמוקה
זיכרון RAM (מינימום 8GB, מומלץ 16GB)מגווןלא ישיםדרישת זיכרון למשימות ML
Scikit-learnקוד פתוחלא ישיםספריית למידת מכונה
סיבורןקוד פתוחלא ישיםויזואליזציה של נתונים סטטיסטיים
SpaCyפיצוץ AIלא ישיםספריית NLP בעוצמה תעשייתית
אחסון SSD (מינימום 256GB, מומלץ 512GB)מגווןלא ישיםאחסון לעיבוד סל נתונים
TensorFlowגוגללא ישיםמסגרת למידה עמוקה

References

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,
  1. Herce, R. Non-locality of the phenomenon of consciousness according to Roger Penrose. Dialogo. 3 (2), 127-134 (2016).
  2. Wolfram, S. The future of computation. Math J. 10 (2), 329-362 (2006).
  3. Kusal, S., et al.

Access restricted. Please log in or start a trial to view this content.

Reprints and Permissions

Request permission to reuse the text or figures of this JoVE article

Request Permission

Tags

Emotion AnnotationHinglish UtterancesCode Mixed LanguageLexical Rule BasedMachine LearningActive LearningBilingual Emotion DictionarySubword TokenizationCognitive Appraisal TheoryDiscrete Emotions Theory
Video Coming Soon

Related Articles