Research Article

지능형 음악 교육 플랫폼에서 개인화된 체감각 및 리듬 평가를 위한 인터랙티브 인공지능 도구 개발

DOI:

10.3791/69058

December 19th, 2025

In This Article

Summary

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

본 연구는 잔여 LSTM 인식과 적응적 난이도에 대한 TRPO를 결합한 재현 가능한 체성감각 음악 학습 프로토콜을 제시합니다. 전처리, FFT 기능, 교육, 개인화, 평가를 포함합니다. 공개 데이터셋에서 하이브리드 모델은 세 개의 주체-분리 접힘에서 Acc 95.0 / P 93.5 / R 94.6 / F1 94.2에 도달했습니다.

Abstract

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

전통적인 음악 교육은 특히 원격 환경에서 상호작용성과 실시간 적응성이 부족한 경우가 많습니다. 본 연구는 음악 교육 플랫폼을 위한 맞춤형 체성감각 프레임워크인 TRPO-ResLSTM을 소개합니다. 이 시스템은 움직임, 리듬, 반응 시간을 포착하고, Wiener 필터링과 Z-점수 정규화로 데이터를 전처리하며, FFT 를 통해 특징을 추출합니다. 제스처 인식은 DeepRes-LSTM에 의해 수행되며, 적응적 난이도는 TRPO 강화 학습에 의해 조절됩니다. 점진적 학습은 세션 전반에 걸쳐 개인화를 보장합니다. 공개된 익명 제스처-리듬 데이터셋(n = 2,730표본; 훈련/검증/테스트 70/15/15 분할)에서의 실험은 다중 모달 기준선보다 우수한 성과를 보여 95% 정확도, 93.5% 정확도, 94.6% 회상 및 94.2% F1 점수를 달성했습니다. 절제 연구는 TRPO와 Res-LSTM의 개별 기여를 확인시켜 줍니다. 이 프로토콜의 혁신은 강화 학습과 잔류 시간 모델링을 통합하여 적응형 제스처 인식을 가능하게 하여 안정적이면서도 개인화된 학습을 가능하게 하는 데 있습니다. 이 연구는 적응적이고 제스처 반응형 도구들이 지능적인 음악 교육에서 참여도, 개인화, 점진적 기술 개발을 향상시킬 수 있음을 보여줍니다. 제한 사항으로는 단일 데이터셋에 의존하는 점과 실제 학습자 검증이 필요하며, 이는 향후 연구의 방향을 정의합니다.

Introduction

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

인공지능(AI)과 체성감각 기술의 최근 발전은 학습자들이 몸짓을 통해 음악과 상호작용할 수 있게 하여, 제스처를 음표, 리듬, 가상 악기의 조작으로 변환함으로써 음악 교육을 재편하고있습니다. 이러한 상호작용 기능은 전통적인 교실 수업에 비해 참여도, 기억력, 창의성을 향상시키며, 체성감각 도구를 통해 학생들이 바디 퍼커션, 제스처 수행, 앙상블 시뮬레이션을 통해 리듬, 협응, 표현을 연습할 수 있게합니다. AI 기반 적응 경로와 결합하여 학습자는 개별화된 콘텐츠, 실시간 피드백, 그리고 동기 부여와 성과를 향상시키는 점진적인 기술 개발을 받습니다 4,5.

이러한 발전에도 불구하고, 기존 플랫폼은 제한된 학습 방식에 의존하거나, 개인화의 연속성이 부족하거나, 다양한 문화적·신체적 학습 스타일에 적응하지 못하는 경우가 많습니다 6,7....

Access restricted. Please log in or start a trial to view this content.

Protocol

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

이 연구는 익명화된 공개 데이터를 분석했으며 인간 대상이나 동물은 포함하지 않았습니다. 따라서 추가적인 윤리적 승인은 필요하지 않았습니다.

1. 개요

이 프로토콜은 심층 잔여 LSTM 인식과 적응적 난이도 제어를 위한 신뢰 영역 정책 최적화(TRPO)를 기반으로 한 체성감각 음악 교육의 재현 가능한 프레임워크를 설명합니다. 데이터셋 준비, 전처리, 주파수 영역 특징 추출, 모델 아키텍처, 학습, 개인화, 평가 등이 포함됩니다. 그림 1 은 종단 간 워크플로우를 보여줍니다14.

2. 데이터셋

템포와 박자 강도 같은 청각 신호에 대한 신체 반응을 기록하는 공개된 익명 음악 제스처 및 리듬 데이터셋이 사용되었습니다. 이 데이터셋은 리듬 실행 및 학습 행동 연구에 적합한 다중 모달 시계열 데이터를 제공합니다. 각 기록에는 움직임 패턴, 타이밍, 리듬 정확도 측정, 반응 피드백, 작업 완료 시간이....

Access restricted. Please log in or start a trial to view this content.

Results

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

실험 장치
TRPO-ResLSTM 프레임워크는 GPU 가속을 적용한 Python 3.10.1로 구현되었습니다. 컴퓨팅 환경, 모션 감지 하드웨어, Python 라이브러리는 재료표에 나열되어 있습니다. 데이터는 표 1 (70/15/15)에 나타난 대상자-비서로 연결된 훈련/검증/시험 구획으로 나뉘었습니다. 주요 하이퍼파라미터는 표 2에 요약되어 있습니다. 세 가지 모델이 평가되었습니다: 기본 TRPO, 기본 ResLSTM, 그리고 통합 TRPO-ResLSTM. 이 설정은 음악 학습 시나리오에서 제스처 인식, 적응적 난이도 제어, 개인화에 대한 일관된 평가를 가능하게 했습니다.

혼란 매트릭스
분류 수행은 처음에 보류된 시험 세트의 혼동 행렬을 사용하여 검토되었습니다(

Access restricted. Please log in or start a trial to view this content.

Discussion

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

본 연구는 강화 학습과 잔여 시간 모델링을 통합하여 제스처 기반 음악 교육을 위한 하이브리드 프로토콜인 TRPO-ResLSTM을 제안합니다. 신뢰 영역 정책 최적화(TRPO)의 안정성과 잔류 LSTM의 시퀀스 학습 능력을 결합함으로써, 이 프레임워크는 실시간 제스처 인식과 적응적 난이도 제어를 제공하여 개인화된 피드백과 점진적 기술 습득을 가능하게합니다. 재현성을 보장하기 위해 피험자-불순 접힘, 고정 시드, 모델 간 동일한 전처리가 사용되었으며, 평균 ± SD는 3회 접힘에 걸쳐 보고되었으며, 유의성 검정은 결과 섹션에 맞춰 진행되었습니다.

이 연구의 기여는 개인화되고 상호작용적인 학습 환경을 발전시키는 데 있습니다. 정적 지시나 단방향 인식에 의존하는 시스템과 달리, TRPO-ResLSTM은 학습자의 리듬 및 움직임 패턴에 동적으로 적응하여 실습 지향

Access restricted. Please log in or start a trial to view this content.

Disclosures

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

저자들은 이해 상충이 없음을 선언합니다.

Acknowledgements

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

저자들은 연구 설계와 원고 준비에 대해 건설적인 피드백을 주신 동료들에게 감사를 표합니다. 이 작업은 공공, 상업, 비영리 부문의 어떤 자금 지원 기관으로부터도 별도의 보조금을 받지 못했습니다.

....

Access restricted. Please log in or start a trial to view this content.

Materials

List of materials used in this article
NameCompanyCatalog NumberComments
가속도계 센서 데이터캐글 (퍼블릭 도메인)데이터셋에 포함된 다중 모달 입력 신호(운동 패턴, 타이밍 특징)
GPU 워크스테이션NVIDIA Corporation, 미국학습 하드웨어: NVIDIA RTX 3080 (10 GB), 32 GB RAM, Ubuntu 20.04
손 - 관절 위치 데이터캐글 (퍼블릭 도메인)제스처 인식을 위한 체감각 입력
Matplotlib (v3.7)https://matplotlib.org수치 및 성능 지표를 시각화하는 시각화 라이브러리
넘치파이 (v1.23)https://numpy.org배열 연산을 위한 수치 계산 라이브러리
공공 음악 제스처 및 리듬 데이터셋캐글 (퍼블릭 도메인)템포와 박자에 대한 신체 반응을 기록한 2,730개의 익명 데이터셋; 교육/검증/테스트에 사용됨 (70/15/15)
파이썬 3.10.1파이썬 소프트웨어 재단, https://www.python.org모델 구현 및 분석을 위한 프로그래밍 환경
파이토치 (v1.13)https://pytorch.orgResLSTM 및 TRPO 모듈 구현을 위한 딥러닝 프레임워크
Scikit - Learn (v1.2)https://scikit-learn.org전처리 및 평가를 위한 머신러닝 유틸리티
SciPy (v1.10)https://scipy.org과학 컴퓨팅 라이브러리 (Wiener 필터링에 사용됨)

References

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,
  1. Wei, J., Karuppiah, M., Prathik, A. College music education and teaching based on AI techniques. Comput Electr Eng. 100, 107851(2022).
  2. Yu, X., et al. Developments and applications of artificial intelligence in music education. Technol. 11 (2), ....

Access restricted. Please log in or start a trial to view this content.

Reprints and Permissions

Request permission to reuse the text or figures of this JoVE article

Request Permission

Tags

Intelligent Music EducationSomatosensory EvaluationGesture RecognitionRhythm EvaluationTRPO Reinforcement LearningResLSTM ModelAdaptive DifficultyIncremental LearningFeature ExtractionPersonalized Learning

Related Articles