September 19th, 2025
Это исследование эффективно завершило автоматическую классификацию двух различных категорий путем получения данных о звуках кашля у пациентов с диагнозом хронической обструктивной болезни легких (ХОБЛ) и инфекциями дыхательных путей (РТИ), используя интеграцию методов обработки речевых сигналов и алгоритмов машинного обучения.
Это исследование сосредоточено на акустической диагностике, используя анализ голосовых сигналов и машинное обучение для выделения характерных голосовых признаков для неинвазивной ранней классификации хронических обструктивных заболеваний лёгких и инфекций дыхательных путей. Недавние достижения в этой области включают голосовой анализ на основе искусственного интеллекта, методы машинного обучения, такие как сверточные нейронные сети и поддерживающие векторные машины, инструменты обработки сигналов, такие как MFCC, и переменные акустические датчики для обнаружения патологических закономерностей звуковых сигналов. Одной из главных проблем в клинической трансляции голосовой диагностики является дефицит данных.
Другие проблемы включают ограниченное обобщение моделей, этику конфиденциальности, конфликты и барьеры для интерпретации. После сборки базы данных индикаторов голосовых признаков откройте SPSS и загрузите соответствующий файл данных. В строке меню выберите «Анализ», затем «Непараметрические тесты», затем «Наследственные диалоги» и нажмите на 2 независимых образца.
В всплывающем окне выберите наблюдаемые переменные для сравнения в разделе Список тестовых переменных. Затем, в разделе Grouping Variable, выберите переменную, которая будет использоваться для группировки. Нажмите кнопку «Определить группы» и введите идентификаторы двух групп в всплывающем окне.
В разделе «Тип теста» выберите тест Mann-Whitney U. Нажмите OK, чтобы запустить тест и позволить SPSS автоматически сгенерировать результат. Для анализа основных компонентов убедитесь, что данные собраны, сохранены в формате Excel или CSV и импортированы в версию SPSS 20.0.
Чтобы открыть файл, выберите «Файл», затем «Открыть», затем «Данные» и выберите соответствующий файл. Чтобы начать анализ главных компонентов, нажмите Анализировать, затем выберите Уменьшение размерности и выберите Фактор. В диалоговом окне добавьте все непрерывные переменные, используемые в анализе основных компонентов, в поле Variables.
Нажмите кнопку «Извлечение» и выберите метод «Основные компоненты» в качестве техники извлечения. Выберите собственные значения больше 1 в качестве критерия для сохранения главных компонентов. Выберите метод вращения и нажмите Rotation, чтобы выбрать либо Varimax, либо Promax.
В разделе «Опции» проверьте как график Scree, так и матрицу коэффициентов, чтобы включить гравийную диаграмму и матрицу коэффициентов в выход для оценки сохранившихся вариантов. После выполнения всех настроек нажмите OK, чтобы выполнить анализ и позволить SPSS сгенерировать результат. Интерпретировать матрицу нагрузки главных компонентов для оценки связи между главными компонентами и исходными переменными.
Выявляйте переменные с более высокими значениями нагрузки, так как они вносят более значительный вклад в изменения компонентов. Используйте таблицу объяснения общей дисперсии, чтобы оценить, какую дисперсию учитывает каждый основной компонент. Определите основные компоненты с большими пропорциями дисперсии, так как они обычно охватывают большую часть вариаций данных.
Обратитесь к графику осыпи, чтобы определить, какие компоненты сохранить. Определите точку перегиба и держите все компоненты слева от этой точки. Если требуются оценки основных компонентов, перед анализом отметьте «Сохранить как переменные».
SPSS добавит баллы для каждой выборки в виде новых переменных в наборе данных. Анализ основных компонентов выявил шесть основных компонентов, которые вместе составляют 76,8% от общей дисперсии. Модель логистической регрессии показала стабильную эффективность на трёх этапах валидации: значения AUC составляли 0,71, 0,74 и 0,88, что дало средний AUC 0,77.
В отличие от этого, модель случайного леса показала большую вариативность: баллы AUC по фолду составляли 0,69, 0,52 и 0,83, а средний AUC — 0,68. Модель логистической регрессии дала 100% правильные прогнозы для ХОБЛ и шесть из семи — для инфекций дыхательных путей, что показано в матрице путаницы, что указывает на высокую точность классификации. Случайная лесная модель неправильно классифицировала один случай ХОБЛ и два случая инфекций дыхательных путей, что привело к более низкой точности классификации по сравнению с логистической регрессионной моделью.
В тестовом наборе данных модель логистической регрессии показала отличную классификационную эффективность, достигнув значения AUC 0,95. Случайная лесная модель показала более низкую производительность тестирования с AUC 0,76.
View the full transcript and gain access to thousands of scientific videos
Данное исследование сосредоточено на акустической диагностике, используя анализ голосовых сигналов и машинное обучение для извлечения характерных голосовых характеристик для неинвазивной ранней классификации хронической обструктивной болезни легких и инфекций дыхательных путей. Исследование подчеркивает интеграцию передовых методик обработки голосовых сигналов и алгоритмов машинного обучения.