Research Article

Desenvolvimento de Ferramentas Interativas de Inteligência Artificial para Avaliação Somatossensorial e Rítmica Personalizada em Plataformas Inteligentes de Educação Musical

DOI:

10.3791/69058

December 19th, 2025

In This Article

Summary

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

Este estudo apresenta um protocolo somatossensorial reprodutível de aprendizagem musical que combina reconhecimento residual de LSTM com TRPO para dificuldade adaptativa. Ele abrange pré-processamento, recursos de FFT, treinamento, personalização e avaliação. Em um conjunto de dados público, o modelo híbrido alcançou Acc 95.0 / P 93.5 / R 94.6 / F1 94.2 em três dobras disjuntas entre sujeito.

Abstract

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

A educação musical tradicional frequentemente carece de interatividade e adaptabilidade em tempo real, especialmente em ambientes remotos. Este estudo introduz uma estrutura somatossensorial personalizada, TRPO-ResLSTM, para plataformas de educação musical. O sistema captura movimento, ritmo e tempo de resposta, pré-processa dados com filtragem de Wiener e normalização Z-score, e extrai características via FFT. O reconhecimento de gestos é realizado pelo DeepRes-LSTM, enquanto a dificuldade adaptativa é regulada pelo aprendizado por reforço TRPO. O aprendizado incremental garante personalização ao longo das sessões. Experimentos em um conjunto de dados de ritmo gestual anonimizado e disponível publicamente (n = 2.730 amostras; divisão de treinamento/validação/teste 70/15/15) mostram desempenho superior em linhas de base multimodais, alcançando 95% de precisão, 93,5% de precisão, 94,6% de recordação e 94,2% de pontuação F1. Estudos de ablação confirmam as contribuições individuais do TRPO e do Res-LSTM. A inovação desse protocolo está na integração do aprendizado por reforço com modelagem temporal residual para reconhecimento adaptativo de gestos, permitindo um aprendizado estável, porém personalizado. Este trabalho demonstra que ferramentas adaptativas e responsivas a gestos podem aumentar o engajamento, a personalização e o desenvolvimento progressivo de habilidades na educação musical inteligente. As limitações incluem a dependência de um único conjunto de dados e a necessidade de validação real do aprendiz, que define direções para trabalhos futuros.

Introduction

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

Avanços recentes em inteligência artificial (IA) e tecnologia somatossensorial estão remodelando a educação musical ao permitir que os alunos interajam com a música por meio de movimentos corporais, onde gestos são traduzidos em notas, ritmos ou controles para instrumentosvirtuais 1,2. Esses recursos interativos aumentam o engajamento, a retenção e a criatividade em comparação com a instrução tradicional em sala de aula, e as ferramentas somatossensoriais permitem que os alunos pratiquem ritmo, coordenação e expressão por meio de percussão corporal, gestos de condução e simula....

Access restricted. Please log in or start a trial to view this content.

Protocol

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

Este estudo analisou dados anonimizados e públicos e não envolveu indivíduos humanos ou animais. Portanto, não era necessária aprovação ética adicional.

1. Visão geral

Este protocolo descreve uma estrutura reprodutível para a educação musical somatossensorial baseada no reconhecimento residual profundo de LSTM e na Otimização da Política de Região de Confiança (TRPO) para controle adaptativo da dificuldade. Inclui preparação de conjuntos de dados, pré-processamento, extração de características no domínio da frequência, arquitetura do modelo, treinamento, personaliz....

Access restricted. Please log in or start a trial to view this content.

Results

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

Configuração Experimental
O framework TRPO-ResLSTM foi implementado em Python 3.10.1 com aceleração por GPU. O ambiente computacional, o hardware de detecção de movimento e as bibliotecas de Python estão listados na Tabela de Materiais. Os dados foram divididos em partições de treinamento/validação/teste disjuntas por sujeito, conforme mostrado na Tabela 1 (15/70/15). Os hiperparâmetros-chave são resumidos na Tabela 2. Três modelos fo.......

Access restricted. Please log in or start a trial to view this content.

Discussion

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

Este estudo propõe um protocolo híbrido, TRPO-ResLSTM, que integra aprendizado por reforço e modelagem temporal residual para educação musical baseada em gestos. Ao combinar a estabilidade da Otimização de Políticas de Região de Confiança (TRPO) com a capacidade de aprendizado de sequências dos LSTMs residuais, a estrutura oferece reconhecimento de gestos em tempo real juntamente com controle adaptativo de dificuldade, permitindo feedback personalizado e aquisição progressiva

Access restricted. Please log in or start a trial to view this content.

Disclosures

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

Os autores não declaram conflitos de interesse.

Acknowledgements

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

Os autores agradecem aos colegas pelo feedback construtivo sobre o desenho do estudo e a preparação do manuscrito. Esse trabalho não recebeu nenhuma subvenção específica de qualquer agência de financiamento dos setores público, comercial ou sem fins lucrativos.

....

Access restricted. Please log in or start a trial to view this content.

Materials

List of materials used in this article
NameCompanyCatalog NumberComments
Dados do sensor do acelerômetroKaggle (Domínio público)Sinais de entrada multimodais (padrões de movimento, características de tempo) incluídos no conjunto de dados
Estação de trabalho GPUNVIDIA Corporation, EUAHardware de treinamento: NVIDIA RTX 3080 (10 GB), 32 GB de RAM, Ubuntu 20.04
Dados de posição da mão - articulaçãoKaggle (Domínio público)Entrada somatossensorial para reconhecimento de gestos
Matplotlib (v3.7)https://matplotlib.orgBiblioteca de visualização para plotar figuras e métricas de desempenho
NumPy (v1.23)https://numpy.orgBiblioteca numérica de computação para operações de array
Conjunto de dados públicos de gestos musicais e ritmoKaggle (Domínio público)Conjunto de dados anonimizado com 2.730 amostras registrando respostas corporais ao tempo e ao batido; Usado para treinamento/validação/testes (15/70/15)
Python 3.10.1Fundação de Software em Python, https://www.python.orgAmbiente de programação para implementação e análise de modelos
PyTorch (v1.13)https://pytorch.orgFramework de deep learning para implementar módulos ResLSTM e TRPO
scikit - Learn (v1.2)https://scikit-learn.orgUtilitários de aprendizado de máquina para pré-processamento e avaliação
SciPy (v1.10)https://scipy.orgBiblioteca de computação científica (usada para filtragem de Wiener)

References

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,
  1. Wei, J., Karuppiah, M., Prathik, A. College music education and teaching based on AI techniques. Comput Electr Eng. 100, 107851(2022).
  2. Yu, X., et al. Developments and applications of artificial intelligence in music education. Technol. 11 (2), ....

Access restricted. Please log in or start a trial to view this content.

Reprints and Permissions

Request permission to reuse the text or figures of this JoVE article

Request Permission

Tags

Intelligent Music EducationSomatosensory EvaluationGesture RecognitionRhythm EvaluationTRPO Reinforcement LearningResLSTM ModelAdaptive DifficultyIncremental LearningFeature ExtractionPersonalized Learning

Related Articles