September 19th, 2025
Badanie to skutecznie przeprowadziło automatyczną klasyfikację dwóch odrębnych kategorii poprzez pozyskiwanie danych dźwiękowych o kaszlu od pacjentów zdiagnozowanych z przewlekłą obturacyjną chorobą płuc (POChP) oraz infekcjami dróg oddechowych (RTI), wykorzystując integrację technik przetwarzania sygnałów mowy i algorytmów uczenia maszynowego.
Badania koncentrują się na diagnostyce akustycznej, wykorzystując analizę sygnałów głosu i uczenie maszynowe do wyodrębnienia charakterystycznych cech głosu dla nieinwazyjnej wczesnej klasyfikacji przewlekłej obturacyjnej choroby płuc i infekcji dróg oddechowych. Najnowsze osiągnięcia w tej dziedzinie obejmują analizę głosu opartą na AI, techniki uczenia maszynowego, takie jak konwolucyjne sieci neuronowe i maszyny wektorowe wsparcia, narzędzia do przetwarzania sygnałów takich jak MFCC oraz zmienne czujniki akustyczne do wykrywania wzorców chorób w sygnałach dźwiękowych. Jednym z głównych wyzwań w klinicznym tłumaczeniu diagnostyki głosowej jest niedobór danych.
Inne wyzwania to ograniczone uogólnianie modeli, etyka prywatności, konflikty oraz bariery w interpretacji. Po złożeniu bazy wskaźników cech wokalnych otwórz SPSS i załaduj odpowiedni plik danych. Z paska menu wybierz Analizuj, następnie wybierz Testy Nieparametryczne, następnie Dialogi Starsze i kliknij na 2 Niezależne Przykłady.
W okienku dialogowym wyskoczył, wybierz obserwowane zmienne do porównania w sekcji Lista Zmiennych Testowych. Następnie, w sekcji Zmienna grupowania, wybierz zmienną, która będzie używana do grupowania. Kliknij przycisk Definiuj grupy i wpisz identyfikatory obu grup w okienku wyskakującym (pop-up).
W sekcji Typ testu wybierz test Mann-Whitney U. Kliknij OK, aby uruchomić test i pozwolić SPSS na automatyczne generowanie wyniku. Do analizy głównych komponentów upewnij się, że dane są zebrane, zapisane w formacie Excel lub CSV i importowane do wersji SPSS 20.0.
Aby otworzyć plik, wybierz Plik, następnie otwórz Otworz, następnie Dane i wybierz odpowiedni plik. Aby rozpocząć analizę głównych składowych, kliknij Analizuj, następnie wybierz Redukcję wymiaru i wybierz Czynnik. W oknie dialogowym dodaj wszystkie zmienne ciągłe używane w analizie głównych komponentów do pola Zmienne.
Kliknij przycisk Extraction i wybierz metodę Principal Components jako technikę ekstrakcji. Należy wybrać wartości własne większe niż 1 jako kryterium zachowania głównych składowych. Wybierz metodę obrotu i kliknij Rotation, aby wybrać Varimax lub Promax.
W sekcji Opcje sprawdź zarówno wykres Scree, jak i macierz współczynników, aby uwzględnić diagram żwirowy oraz macierz współczynników w wyjściu do oceny zachowanych wariantów. Po zakończeniu wszystkich ustawień kliknij OK, aby wykonać analizę i pozwolić SPSS wygenerować wynik. Interpretuj macierz obciążenia głównych komponentów, aby ocenić zależność między głównymi składowymi a zmiennymi oryginalnymi.
Zidentyfikuj zmienne o wyższych wartościach obciążenia, ponieważ one znacząco przyczyniają się do zmian komponentów. Użyj tabeli Total Variance Explained, aby ocenić, ile wariancji uwzględnia każdy główny składnik. Zidentyfikuj główne składniki o dużych proporcjach wariancji, ponieważ zazwyczaj obejmują one większość zmienności danych.
Sprawdź wykres żwiru, aby określić, które komponenty zachować. Zlokalizuj punkt zwrotny i zachowaj wszystkie elementy po lewej stronie tego punktu. Jeśli wymagane są oceny głównych komponentów, przed rozpoczęciem analizy sprawdź Zapisz jako zmienne.
SPSS doda wyniki dla każdej próby jako nowe zmienne w zbiorze danych. Analiza głównych składników zidentyfikowała sześć głównych składników, które razem odpowiadały za 76,8% całkowitej wariancji. Model regresji logistycznej wykazał stabilną wydajność w trzech fazach walidacji, z wartościami AUC 0,71, 0,74 i 0,88, co dało średni AUC 0,77.
Dla porównania, model losowego lasu wykazywał większą zmienność, z wynikami AUC fałdowania 0,69, 0,52 i 0,83 oraz niższą średnią AUC 0,68. Model regresji logistycznej osiągnął 100% poprawne prognozy dla POChP oraz sześć z siedmiu poprawnych dla infekcji dróg oddechowych, co pokazuje macierz dezorientacji, co wskazuje na wysoką dokładność klasyfikacji. Model losowego lasu błędnie sklasyfikował jeden przypadek POChP i dwa zakażenia dróg oddechowych, co skutkowało niższą dokładnością klasyfikacji w porównaniu z modelem regresji logistycznej.
Na zbiorze danych testowych model regresji logistycznej wykazał doskonałe wyniki klasyfikacji, osiągając wartość AUC 0,95. Model losowego lasu wykazał niższą wydajność testową przy wartości AUC 0,76.
View the full transcript and gain access to thousands of scientific videos
To badanie koncentruje się na diagnostyce akustycznej, wykorzystując analizę sygnału głosu i uczenie maszynowe do wyodrębniania charakterystycznych cech głosu w celu nieinwazyjnej wczesnej klasyfikacji przewlekłej obturacyjnej choroby płuc i infekcji dróg oddechowych. Badanie podkreśla integrację zaawansowanych technik przetwarzania sygnałów mowy i algorytmów uczenia maszynowego.