September 19th, 2025
Questo studio ha realizzato in modo efficace la classificazione automatizzata di due categorie distinte acquisendo dati sui suoni della tosse da pazienti con diagnosi di broncopneumopatia cronica ostruttiva (BPCO) e infezioni del tratto respiratorio (RTI), utilizzando un'integrazione di tecniche di elaborazione del segnale vocale e algoritmi di apprendimento automatico.
Questa ricerca si concentra sulla diagnostica acustica, utilizzando l'analisi del segnale vocale e il machine learning per estrarre caratteristiche vocali distintive per una classificazione precoce non invasiva della broncopneumopatia cronica ostruttiva e delle infezioni delle vie respiratorie. Gli sviluppi recenti in questo campo includono analisi vocale basate su IA, tecniche di apprendimento automatico come reti neurali convoluzionali e macchine vettoriali di supporto, strumenti di elaborazione del segnale come MFCC e sensori acustici variabili per rilevare pattern legati a malattie nei segnali sonori. Una delle principali sfide nella traduzione clinica della diagnostica basata sulla voce è la scarsità di dati.
Altre sfide includono la limitata generalizzazione dei modelli, l'etica sulla privacy, i conflitti e le barriere all'interpretabilità. Dopo aver assemblato il database degli indicatori vocali, apri SPSS e carica il file dati appropriato. Dalla barra del menu, seleziona Analizza, poi seleziona Test Non Parametrici, seguita da Dialoghi Legacy, e clicca su 2 Campioni Indipendenti.
Nella finestra di dialogo pop-up, seleziona le variabili osservate da confrontare nella sezione Test Variable List. Poi, sotto Variabile di Raggruppamento, seleziona la variabile che verrà utilizzata per il raggruppamento. Clicca sul pulsante Definisci Gruppi e inserisci gli identificatori dei due gruppi nella finestra pop-up.
Sotto Tipo di Test, seleziona il test Mann-Whitney U. Clicca su OK per eseguire il test e permettere a SPSS di generare automaticamente l'output. Per l'analisi dei componenti principali, assicurarsi che i dati siano raccolti, salvati in formato Excel o CSV e importati nella versione 20.0 di SPSS.
Per aprire il file, seleziona File, poi Apri, seguito da Dati e seleziona il file appropriato. Per avviare l'analisi delle componenti principali, clicca su Analizza, poi scegli Riduzione Dimensionale e seleziona Fattore. Nella finestra di dialogo, aggiungi tutte le variabili continue usate nell'analisi a componenti principali nel campo Variabili.
Clicca sul pulsante Estrazione e seleziona il metodo dei componenti principali come tecnica di estrazione. Selezionare autovalori maggiori di 1 come criterio per mantenere i componenti principali. Seleziona il metodo di rotazione e clicca su Rotazione per scegliere Varimax o Promax.
Sotto Opzioni, controlla sia il grafico di Scree che la matrice dei coefficienti per includere il diagramma di ghiaia e la matrice dei coefficienti nell'output per valutare le varianti conservate. Dopo aver completato tutte le impostazioni, clicca su OK per eseguire l'analisi e permettere a SPSS di generare l'output. Interpretare la matrice di carico delle componenti principali per valutare la relazione tra le componenti principali e le variabili originali.
Identificare variabili con valori di carico più elevati, poiché queste contribuiscono in modo più significativo ai cambiamenti dei componenti. Utilizzare la tabella Varianza Totale Spiegata per valutare quanta varianza ogni componente principale considera. Identifica i componenti principali con grandi proporzioni di varianza, poiché tipicamente catturano la maggior parte della variazione dei dati.
Consulta il terreno di detrizione per determinare quali componenti trattenere. Individua il punto di flessione e tieni tutti i componenti a sinistra di questo punto. Se sono necessari punteggi a componenti principali, seleziona Salva come variabili prima di eseguire l'analisi.
SPSS aggiungerà i punteggi per ogni campione come nuove variabili nel dataset. L'analisi delle componenti principali ha identificato sei componenti principali che insieme rappresentavano il 76,8% della varianza totale. Il modello di regressione logistica ha dimostrato prestazioni stabili su tre pieghe di validazione, con valori AUC di 0,71, 0,74 e 0,88, ottenendo una media AUC di 0,77.
Al contrario, il modello della foresta casuale ha mostrato una maggiore variabilità, con punteggi AUC di piegatura di 0,69, 0,52 e 0,83, e una media AUC più bassa di 0,68. Il modello di regressione logistica ha raggiunto previsioni corrette al 100% per la BPCO e sei su sette corrette per le infezioni delle vie respiratorie, come mostrato nella matrice di confusione, indicando un'elevata accuratezza nella classificazione. Il modello della foresta casuale ha classificato erroneamente un caso di BPCO e due infezioni delle vie respiratorie, risultando in una precisione di classificazione inferiore rispetto al modello di regressione logistica.
Nel dataset di test, il modello di regressione logistica ha fornito eccellenti prestazioni di classificazione, raggiungendo un valore AUC di 0,95. Il modello a foresta casuale ha mostrato prestazioni di test inferiori con un valore AUC di 0,76.
View the full transcript and gain access to thousands of scientific videos
Questa ricerca si concentra sulla diagnostica acustica, utilizzando l'analisi del segnale vocale e il machine learning per estrarre caratteristiche vocali distintive per la classificazione precoce non invasiva della malattia polmonare ostruttiva cronica e delle infezioni del tratto respiratorio. Lo studio evidenzia l'integrazione di tecniche avanzate nell'elaborazione del segnale vocale e algoritmi di machine learning.