Research Article

Entwicklung interaktiver künstlicher Intelligenz für personalisierte somatosensorische und rhythmische Bewertung in intelligenten Musikbildungsplattformen

DOI:

10.3791/69058

December 19th, 2025

In This Article

Summary

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

Diese Studie präsentiert ein reproduzierbares somatosensorisches Musiklernprotokoll, das Residual-LSTM-Erkennung mit TRPO für adaptive Schwierigkeiten kombiniert. Es behandelt Preprocessing, FFT-Funktionen, Training, Personalisierung und Evaluation. In einem öffentlichen Datensatz erreichte das Hybridmodell Acc 95,0 / P 93,5 / R 94,6 / F1 94,2 über drei subjekt-disjunkte Faltungen.

Abstract

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

Der traditionelle Musikunterricht weist oft keine Interaktivität und Anpassungsfähigkeit in Echtzeit auf, besonders in entfernten Umgebungen. Diese Studie führt ein personalisiertes somatosensorisches Framework, TRPO-ResLSTM, für Musikbildungsplattformen ein. Das System erfasst Bewegung, Rhythmus und Reaktionszeit, verarbeitet Daten mit Wiener-Filterung und Z-Score-Normalisierung vor und extrahiert Features mittels FFT. Gestenerkennung wird durch DeepRes-LSTM durchgeführt, während die adaptive Schwierigkeit durch TRPO-Verstärkungslernen reguliert wird. Inkrementelles Lernen sorgt für Personalisierung zwischen den Sitzungen. Experimente an einem öffentlich zugänglichen, anonymisierten Gestenrhythmus-Datensatz (n = 2.730 Stichproben; Training/Validierung/Test-Aufteilung 70/15/15) zeigen eine überlegene Leistung gegenüber multimodalen Baselines und erreichen 95 % Genauigkeit, 93,5 % Präzision, 94,6 % Erinnerung und 94,2 % F1-Score. Ablationsstudien bestätigen die individuellen Beiträge von TRPO und Res-LSTM. Die Innovation dieses Protokolls liegt in der Integration von Verstärkungslernen mit Residualzeitmodellierung für adaptive Gestenerkennung, was stabiles, aber personalisiertes Lernen ermöglicht. Diese Arbeit zeigt, dass adaptive, gestenresponsive Werkzeuge Engagement, Personalisierung und fortschreitende Kompetenzentwicklung in der intelligenten Musikausbildung fördern können. Einschränkungen umfassen die Abhängigkeit von einem einzigen Datensatz und die Notwendigkeit der Validierung durch echte Lernende, die die Richtungen für zukünftige Arbeiten festlegen.

Introduction

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

Jüngste Fortschritte in der künstlichen Intelligenz (KI) und somatosensorischen Technologien verändern den Musikunterricht, indem sie es Lernenden ermöglichen, mit Musik durch Körperbewegungen zu interagieren, wobei Gesten in Noten, Rhythmen oder Steuerungen für virtuelle Instrumenteübersetzt werden. Diese interaktiven Funktionen verbessern Engagement, Bindung und Kreativität im Vergleich zum traditionellen Unterricht, und somatosensorische Werkzeuge ermöglichen es den Schülern, Rhythmus, Koordination und Ausdruck durch Körperperkussion, Gesten und Ensemble-Simulationen zu übe....

Access restricted. Please log in or start a trial to view this content.

Protocol

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

Diese Studie analysierte anonymisierte, öffentlich zugängliche Daten und betraf weder menschliche Probanden noch Tiere. Daher war keine zusätzliche ethische Zustimmung erforderlich.

1. Überblick

Dieses Protokoll beschreibt einen reproduzierbaren Rahmen für somatosensorische Musikausbildung, basierend auf tiefer Residual-LSTM-Erkennung und Trust Region Policy Optimization (TRPO) zur Kontrolle adaptiver Schwierigkeiten. Sie umfasst die Vorbereitung von Datensätzen, Vorverarbeitung, Extraktion von Frequenzdomänenmerkmalen, Modellarchitektur, Schulung, Personalisierung....

Access restricted. Please log in or start a trial to view this content.

Results

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

Versuchsaufbau
Das TRPO-ResLSTM-Framework wurde in Python 3.10.1 mit GPU-Beschleunigung implementiert. Die Rechenumgebung, die Bewegungssensor-Hardware und die Python-Bibliotheken sind in der Materialtabelle aufgeführt. Die Daten wurden in subjekt-disjunkte Trainings-/Validierungs-/Testpartitionen aufgeteilt, wie in Tabelle 1 (15.70.15) dargestellt. Wichtige Hyperparameter sind in Tabelle 2 zusammengefasst. Drei Modelle wurden bewerte.......

Access restricted. Please log in or start a trial to view this content.

Discussion

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

Diese Studie schlägt ein hybrides Protokoll vor, TRPO-ResLSTM, das Reinforcement Learning und residualzeitliche Modellierung für gestenbasierte Musikerziehung integriert. Durch die Kombination der Stabilität der Trust Region Policy Optimization (TRPO) mit der Sequenzlernkapazität verbleibender LSTMs liefert das Framework Echtzeit-Gestenerkennung zusammen mit adaptiver Schwierigkeitskontrolle, was personalisiertes Feedback und progressiven Kompetenzerwerbermöglicht.......

Access restricted. Please log in or start a trial to view this content.

Disclosures

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

Die Autoren erklären keine Interessenkonflikte.

Acknowledgements

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

Die Autoren danken ihren Kollegen für konstruktives Feedback zum Studiendesign und zur Manuskripterstellung. Dieses Werk erhielt keine spezifische Förderung von einer Förderagentur im öffentlichen, kommerziellen oder gemeinnützigen Sektor.

....

Access restricted. Please log in or start a trial to view this content.

Materials

List of materials used in this article
NameCompanyCatalog NumberComments
BeschleunigungssensordatenKaggle (Gemeinfrei)Multimodale Eingangssignale (Bewegungsmuster, Zeitfunktionen), enthalten im Datensatz
GPU-ArbeitsstationNVIDIA Corporation, USATrainingshardware: NVIDIA RTX 3080 (10 GB), 32 GB RAM, Ubuntu 20.04
Hand- und GelenkpositionsdatenKaggle (Gemeinfrei)Somatosensorischer Input für Gestenerkennung
Matplotlib (v3.7)https://matplotlib.orgVisualisierungsbibliothek zum Darstellen von Zahlen und Leistungskennzahlen
NumPy (v1.23)https://numpy.orgNumerische Berechnungsbibliothek für Array-Operationen
Datensatz für öffentliche Musikgestik und RhythmusKaggle (Gemeinfrei)Anonymisierter Datensatz mit 2.730 Proben, der Körperreaktionen auf Tempo und Beat aufzeichnet; Verwendung für Training/Validierung/Tests (15.70.15)
Python 3.10.1Python Software Foundation, https://www.python.orgProgrammierumgebung für Modellimplementierung und -analyse
PyTorch (v1.13)https://pytorch.orgDeep-Learning-Framework zur Implementierung von ResLSTM- und TRPO-Modulen
Scikit – Learn (v1.2)https://scikit-learn.orgMaschinelle Lernprogramme für Vorverarbeitung und Bewertung
SciPy (v1.10)https://scipy.orgWissenschaftliche Rechenbibliothek (verwendet für Wiener-Filterung)

References

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,
  1. Wei, J., Karuppiah, M., Prathik, A. College music education and teaching based on AI techniques. Comput Electr Eng. 100, 107851(2022).
  2. Yu, X., et al. Developments and applications of artificial intelligence in music education. Technol. 11 (2), ....

Access restricted. Please log in or start a trial to view this content.

Reprints and Permissions

Request permission to reuse the text or figures of this JoVE article

Request Permission

Tags

Intelligent Music EducationSomatosensory EvaluationGesture RecognitionRhythm EvaluationTRPO Reinforcement LearningResLSTM ModelAdaptive DifficultyIncremental LearningFeature ExtractionPersonalized Learning

Related Articles