September 19th, 2025
Diese Studie erreichte effektiv die automatisierte Klassifizierung von zwei verschiedenen Kategorien, indem sie Hustengeräuschdaten von Patienten mit chronisch obstruktiver Lungenerkrankung (COPD) und Atemwegsinfektionen (RTI) erfasste, wobei eine Integration von Sprachsignalverarbeitungstechniken und Algorithmen des maschinellen Lernens verwendet wurde.
Diese Forschung konzentriert sich auf akustische Diagnostik und nutzt Sprachsignalanalyse und maschinelles Lernen, um charakteristische Stimmmerkmale für eine nicht-invasive frühe Klassifikation chronisch obstruktiver Lungenerkrankungen und Atemwegsinfektionen zu extrahieren. Die jüngsten Entwicklungen auf diesem Gebiet umfassen KI-gesteuerte Sprachanalyse, maschinelle Lerntechniken wie konvolutionelle neuronale Netze und unterstützende Vektormaschinen, Signalverarbeitungswerkzeuge wie MFCCs sowie variable akustische Sensoren zur Erkennung krankheitsbedingter Muster in Schallsignalen. Eine der größten Herausforderungen bei der klinischen Übersetzung sprachbasierter Diagnostik ist die Datenknappheit.
Weitere Herausforderungen sind begrenzte Modellverallgemeinerungen, Datenschutzethik, Konflikte und Barrieren für die Interpretierbarkeit. Nach der Zusammenstellung der Vocal Feature Indicator-Datenbank öffnen Sie SPSS und laden Sie die entsprechende Datendatei. In der Menüleiste wählen Sie Analysieren, dann Nichtparametrische Tests, dann Legacy-Dialoge und klicken Sie auf 2 unabhängige Stichproben.
Im Pop-up-Dialogfeld wählen Sie die beobachteten Variablen aus, die im Abschnitt Testvariablenliste verglichen werden sollen. Wählen Sie dann unter Gruppierungsvariable die Variable aus, die für die Gruppierung verwendet wird. Klicken Sie auf die Schaltfläche Gruppen definieren und geben Sie die Kennungen der beiden Gruppen im Pop-up-Fenster ein.
Wählen Sie unter Testtyp den Mann-Whitney U-Test. Klicken Sie auf OK, um den Test durchzuführen und SPSS die automatische Ausgabe generieren zu lassen. Für die Analyse der Hauptkomponenten stellen Sie sicher, dass die Daten zusammengestellt, im Excel- oder CSV-Format gespeichert und in SPSS Version 20.0 importiert werden.
Um die Datei zu öffnen, wählen Sie Datei, dann Öffnen, dann Daten und wählen die entsprechende Datei. Um die Hauptkomponentenanalyse zu starten, klicken Sie auf Analysieren, wählen Sie dann Dimensionsreduktion und wählen Sie Faktor. Im Dialogfeld fügen Sie alle in der Hauptkomponentenanalyse verwendeten kontinuierlichen Variablen in das Feld Variablen ein.
Klicken Sie auf die Schaltfläche Extraktion und wählen Sie die Methode Hauptkomponenten als Extraktionstechnik. Wählen Sie Eigenwerte größer als 1 als Kriterium für die Erhaltung der Hauptkomponenten. Wählen Sie die Rotationsmethode und klicken Sie auf Rotation, um entweder Varimax oder Promax auszuwählen.
Unter Optionen prüfen Sie sowohl das Schelfelddiagramm als auch die Koeffizientenmatrix, um das Kiesdiagramm und die Koeffizientenmatrix in die Ausgabe einzubeziehen, um erhaltene Varianten zu bewerten. Nachdem Sie alle Einstellungen abgeschlossen haben, klicken Sie auf OK, um die Analyse auszuführen und SPSS die Ausgabe generieren zu lassen. Interpretieren Sie die Hauptkomponenten-Lastmatrix, um die Beziehung zwischen den Hauptkomponenten und den ursprünglichen Variablen zu bewerten.
Identifizieren Sie Variablen mit höheren Belastungswerten, da diese wesentlich zu Bauteiländerungen beitragen. Verwenden Sie die Total Variance Explained Tabelle, um zu bewerten, wie viel Varianz jede Hauptkomponente berücksichtigt. Identifizieren Sie die Hauptkomponenten mit großen Varianzverhältnissen, da sie typischerweise den Großteil der Datenvariation abdecken.
Konsultieren Sie das Schuttdiagramm, um zu bestimmen, welche Komponenten erhalten bleiben sollten. Lokalisieren Sie den Wendepunkt und halten Sie alle Komponenten links davon auf. Wenn Principal-Component-Werte benötigt werden, überprüfen Sie Save als Variablen, bevor Sie die Analyse durchführen.
SPSS fügt die Werte jeder Stichprobe als neue Variablen in den Datensatz ein. Die Hauptkomponentenanalyse identifizierte sechs Hauptkomponenten, die zusammen 76,8 % der Gesamtvarianz ausmachten. Das logistische Regressionsmodell zeigte stabile Leistung über drei Validierungsfolds hinweg, mit AUC-Werten von 0,71, 0,74 und 0,88, was einen durchschnittlichen AUC von 0,77 ergab.
Im Gegensatz dazu zeigte das Zufallswaldmodell eine größere Variabilität, mit fold-AUC-Werten von 0,69, 0,52 und 0,83 sowie einem niedrigeren durchschnittlichen AUC von 0,68. Das logistische Regressionsmodell erzielte 100 % korrekte Vorhersagen für COPD und sechs von sieben korrekten für Atemwegsinfektionen, wie in der Verwirrungsmatrix gezeigt, was auf eine hohe Klassifikationsgenauigkeit hinweist. Das Zufallswaldmodell klassifizierte einen Fall von COPD und zwei Atemwegsinfektionen falsch, was zu einer geringeren Klassifikationsgenauigkeit im Vergleich zum logistischen Regressionsmodell führte.
Im Testdatensatz erzielte das logistische Regressionsmodell eine ausgezeichnete Klassifikationsleistung und erreichte einen AUC-Wert von 0,95. Das Random Forest-Modell zeigte eine geringere Testleistung mit einem AUC-Wert von 0,76.
View the full transcript and gain access to thousands of scientific videos
Diese Forschung konzentriert sich auf akustische Diagnostik und nutzt Stimmsignalanalyse und maschinelles Lernen, um charakteristische Stimmmerkmale für eine nicht-invasive frühe Klassifizierung von chronisch obstruktiver Lungenerkrankung und Atemwegsinfektionen zu extrahieren. Die Studie hebt die Integration fortschrittlicher Techniken in der Sprachsignalverarbeitung und maschinelle Lernalgorithmen hervor.