$$\rightleftharpoonup{xx}$$
$$\longleftharp{xx}$$,
$$\longrightharp{xx}$$,
Die Emotionsannotation in Code-gemischten Sprachen wie Hinglish (Hindi-Englisch) stellt aufgrund der linguistischen Komplexität und Ressourcenbeschränkungen einzigartige Herausforderungen dar. In dieser Studie wird ein hybrides Framework für aktives Lernen vorgestellt, das lexikalische Regeln, maschinelles Lernen und iteratives Expertenfeedback kombiniert, um eine kosteneffiziente, hochpräzise Emotionsannotation zu erreichen. Basierend auf psychologischen Emotionstheorien, einschließlich der Theorie der diskreten Emotionen und der kognitiven Bewertungstheorie, verwendet das Framework zweisprachige Emotionswörterbücher (z. B. Mapping von Gussa und Wut auf Wut), Subword-Tokenisierung für zusammengesetzte Begriffe (z. B. Aufspaltung
in
) und aktives Lernen, um mehrdeutige Stichproben zu priorisieren. Anhand eines Datensatzes von 19.000 kriegs- und konfliktbezogenen Hinglish-Tweets erreichte das Framework eine Genauigkeit von 81 % (F-Score: 0,76) und reduzierte gleichzeitig die Betriebskosten um 40 % im Vergleich zur manuellen Annotation. Lexikalische Regeln lösten 89 % der Mehrdeutigkeiten beim Code-Switching, und iterative Verfeinerungen ermöglichten inkrementelle Genauigkeitssteigerungen von 72 % auf 81 %. Die Effizienz des Systems beruht auf der Begrenzung des menschlichen Aufwands auf 73 % des Datensatzes mit automatischer Vorverarbeitung von Emojis, Hashtags und Slang. Diese Studie basiert auf der Hypothese, dass die Integration lexikalischer regelbasierter Methoden mit aktivem Lernen und maschinellem Lernen die Genauigkeit der Emotionsannotation in hinglischen Texten verbessern und gleichzeitig den manuellen Beschriftungs- und Gesamtannotationsaufwand reduzieren kann.