$$\rightleftharpoonup{xx}$$
$$\longleftharp{xx}$$,
$$\longrightharp{xx}$$,
Naarmate het gebruik van e-mail toeneemt, is spam een kritieke uitdaging geworden, die de netwerkbeveiliging bedreigt en de communicatie-efficiëntie vermindert. Conventionele detectiemethoden hebben te maken met hardnekkige beperkingen: traditionele machine learning-modellen worstelen vaak met hoogdimensionale schaarse gegevens, terwijl deep learning aanzienlijke rekenkracht vereist.
Deze studie introduceert een Van der Waerden rank score-functie attention-enhanced Support Vector Machine (VWR-Attn-SVM) om deze problemen aan te pakken. De methode past Van der Waerden rangtransformatie toe om tekstkenmerken te normaliseren, de robuustheid tegen uitschieters te verbeteren en ordinale relaties te behouden. Een verbeterd aandachtsmechanisme optimaliseert de selectie van functies verder door middel van niet-lineaire verwerking met regularisatie, waarbij de functies worden gemarkeerd die het meest relevant zijn voor spamdetectie.
Experimenten met de UCI Spambase en Indonesische spam-datasets tonen aan dat VWR-Attn-SVM beter presteert dan traditionele classificaties op het gebied van nauwkeurigheid, precisie, herinnering, F1-score en AUC. Door hoge prestaties te combineren met lagere rekenkosten, biedt de methode een efficiënte en interpreteerbare oplossing voor spamclassificatie, met mogelijke uitbreiding naar andere op tekst gebaseerde platforms zoals messaging en sociale media.