Research Article

Ontwikkeling van interactieve kunstmatige intelligentie-tools voor gepersonaliseerde somatosensorische en ritme-evaluatie in intelligente muziekonderwijsplatforms

DOI:

10.3791/69058

December 19th, 2025

In This Article

Summary

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

Deze studie presenteert een reproduceerbaar somatosensorisch muziekleerprotocol dat residuele LSTM-herkenning combineert met TRPO voor adaptieve moeilijkheid. Het behandelt preprocessing, FFT-functies, training, personalisatie en evaluatie. Op een openbare dataset bereikte het hybride model Acc 95.0 / P 93.5 / R 94.6 / F1 94.2 over drie subject-disjuncte vouwen.

Abstract

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

Traditioneel muziekonderwijs mist vaak interactiviteit en realtime aanpassingsvermogen, vooral op afstand. Deze studie introduceert een gepersonaliseerd somatosensorisch kader, TRPO-ResLSTM, voor muziekeducatieplatforms. Het systeem legt beweging, ritme en responstijd vast, verwerkt data vooraf met Wiener-filtering en Z-score normalisatie, en extraheert kenmerken via FFT. Gebaarherkenning wordt uitgevoerd door DeepRes-LSTM, terwijl de adaptieve moeilijkheidsgraad wordt gereguleerd door TRPO-versterkingsleer. Incrementeel leren zorgt voor personalisatie over sessies heen. Experimenten op een publiek toegankelijke, geanonimiseerde gebarenritme-dataset (n = 2.730 monsters; training/validatie/test verdeling 15/70/15) tonen superieure prestaties ten opzichte van multimodale baselines, met 95% nauwkeurigheid, 93,5% precisie, 94,6% herinnering en 94,2% F1-score. Ablatiestudies bevestigen de individuele bijdragen van TRPO en Res-LSTM. De innovatie van dit protocol ligt in het integreren van reinforcement learning met residuele temporele modellering voor adaptieve gebarenherkenning, waardoor stabiel maar gepersonaliseerd leren mogelijk wordt. Dit werk toont aan dat adaptieve, gebaarresponsieve tools betrokkenheid, personalisatie en progressieve vaardigheidsontwikkeling in intelligent muziekonderwijs kunnen verbeteren. Beperkingen zijn onder meer het vertrouwen op één dataset en de noodzaak van validatie door echte leerlingen, wat richtingen voor toekomstig werk bepaalt.

Introduction

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

Recente ontwikkelingen in kunstmatige intelligentie (AI) en somatosensorische technologie hervormen muziekonderwijs door leerlingen in staat te stellen met muziek te interageren via lichaamsbewegingen, waarbij gebaren worden vertaald naar noten, ritmes of bedieningselementen voor virtuele instrumenten 1,2. Deze interactieve functies verbeteren betrokkenheid, behoud en creativiteit in vergelijking met traditioneel klassikaal onderwijs, en somatosensorische hulpmiddelen stellen studenten in staat ritme, coördinatie en expressie te oefenen via lichaamslagwerk, gebaren uitvoeren e....

Access restricted. Please log in or start a trial to view this content.

Protocol

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

Deze studie analyseerde geanonimiseerde, openbaar beschikbare gegevens en betrof geen menselijke proefpersonen of dieren. Daarom was aanvullende ethische goedkeuring niet vereist.

1. Overzicht

Dit protocol beschrijft een reproduceerbaar kader voor somatosensorisch muziekonderwijs, gebaseerd op diepe residuele LSTM-herkenning en Trust Region Policy Optimization (TRPO) voor adaptieve moeilijkheidsbeheersing. Het omvat datasetvoorbereiding, preprocessing, het extraheren van functies in het frequentiedomein, modelarchitectuur, training, personalisatie en evaluatie.

Access restricted. Please log in or start a trial to view this content.

Results

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

Experimentele opstelling
Het TRPO-ResLSTM-framework werd geïmplementeerd in Python 3.10.1 met GPU-versnelling. De computeromgeving, bewegingssensorapparatuur en Python-bibliotheken zijn vermeld in de Table of Materials. De gegevens werden opgesplitst in proefpersoon-disjuncte training/validatie/test-partitionen zoals weergegeven in Tabel 1 (15-70-15). Belangrijke hyperparameters worden samengevat in Tabel 2. Drie modellen werden geëva.......

Access restricted. Please log in or start a trial to view this content.

Discussion

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

Deze studie stelt een hybride protocol voor, TRPO-ResLSTM, dat reinforcement learning en residuele temporele modellering integreert voor gebaargebaseerde muziekeducatie. Door de stabiliteit van Trust Region Policy Optimization (TRPO) te combineren met de sequentieleercapaciteit van resterende LSTM's, levert het framework realtime gebarenherkenning samen met adaptieve moeilijkheidsbeheersing, wat gepersonaliseerde feedback en progressieve vaardigheidsverwervingmogelijk

Access restricted. Please log in or start a trial to view this content.

Disclosures

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

De auteurs geven geen belangenconflicten aan.

Acknowledgements

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

De auteurs bedanken hun collega's voor de constructieve feedback op het studieontwerp en de voorbereiding van het manuscript. Dit werk ontving geen specifieke subsidie van een financieringsinstantie in de publieke, commerciële of non-profitsector.

....

Access restricted. Please log in or start a trial to view this content.

Materials

List of materials used in this article
NameCompanyCatalog NumberComments
Accelerometer sensor dataKaggle (Public domain)Multimodal input signals (motion patterns, timing features) included in dataset
GPU workstationNVIDIA Corporation, USATraining hardware: NVIDIA RTX 3080 (10 GB), 32 GB RAM, Ubuntu 20.04
Hand - joint position dataKaggle (Public domain)Somatosensory input for gesture recognition
Matplotlib (v3.7)https://matplotlib.orgVisualization library for plotting figures and performance metrics
NumPy (v1.23)https://numpy.orgNumerical computation library for array operations
Public music gesture and rhythm datasetKaggle (Public domain)Anonymized dataset of 2,730 samples recording body responses to tempo and beat; used for training/validation/testing (70/15/15)
Python 3.10.1Python Software Foundation, https://www.python.orgProgramming environment for model implementation and analysis
PyTorch (v1.13)https://pytorch.orgDeep learning framework for implementing ResLSTM and TRPO modules
scikit - learn (v1.2)https://scikit-learn.orgMachine learning utilities for preprocessing and evaluation
SciPy (v1.10)https://scipy.orgScientific computing library (used for Wiener filtering)

References

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,
  1. Wei, J., Karuppiah, M., Prathik, A. College music education and teaching based on AI techniques. Comput Electr Eng. 100, 107851(2022).
  2. Yu, X., et al. Developments and applications of artificial intelligence in music education. Technol. 11 (2), ....

Access restricted. Please log in or start a trial to view this content.

Reprints and Permissions

Request permission to reuse the text or figures of this JoVE article

Request Permission

Tags

Intelligent Music EducationSomatosensory EvaluationGesture RecognitionRhythm EvaluationTRPO Reinforcement LearningResLSTM ModelAdaptive DifficultyIncremental LearningFeature ExtractionPersonalized Learning

Related Articles