September 19th, 2025
Este estudio logró efectivamente la clasificación automatizada de dos categorías distintas mediante la adquisición de datos de sonidos de tos de pacientes diagnosticados con enfermedad pulmonar obstructiva crónica (EPOC) e infecciones del tracto respiratorio (RTI), utilizando una integración de técnicas de procesamiento de señales del habla y algoritmos de aprendizaje automático.
Esta investigación se centra en el diagnóstico acústico, utilizando análisis de señales de voz y aprendizaje automático para extraer características vocales distintivas para una clasificación temprana no invasiva de la enfermedad pulmonar obstructiva crónica y las infecciones respiratorias. Los desarrollos recientes en este campo incluyen análisis de voz impulsado por IA, técnicas de aprendizaje automático como redes neuronales convolucionales y máquinas vectoriales de soporte, herramientas de procesamiento de señales como MFCCs y sensores acústicos variables para detectar patrones relacionados con enfermedades en señales sonoras. Uno de los principales retos en la traducción clínica del diagnóstico basado en voz es la escasez de datos.
Otros desafíos incluyen la limitada generalización del modelo, la ética en la privacidad, los conflictos y las barreras a la interpretabilidad. Después de ensamblar la base de datos de indicadores de características vocales, abre SPSS y carga el archivo de datos correspondiente. Desde la barra de menú, selecciona Analizar, luego selecciona Pruebas No Paramétricas, seguida de Diálogos Legados, y haz clic en 2 Muestras Independientes.
En el cuadro de diálogo emergente, selecciona las variables observadas para comparar en la sección Lista de Variables de Prueba. Luego, en Agrupar variables, selecciona la variable que se usará para agrupar. Haz clic en el botón Definir grupos e introduce los identificadores de los dos grupos en la ventana emergente.
En Tipo de prueba, selecciona la prueba Mann-Whitney U. Haz clic en OK para ejecutar la prueba y permitir que SPSS genere automáticamente la salida. Para el análisis de componentes principales, asegúrese de que los datos se recopilen, guarden en formato Excel o CSV e importen a SPSS versión 20.0.
Para abrir el archivo, selecciona Archivo, luego Abrir, seguido de Datos, y selecciona el archivo correspondiente. Para iniciar el análisis de componentes principales, haz clic en Analizar, luego elige Reducción de Dimensiones y selecciona Factor. En el cuadro de diálogo, añade todas las variables continuas usadas en el análisis de componentes principales en el campo Variables.
Haz clic en el botón Extracción y selecciona el método de componentes principales como técnica de extracción. Seleccione valores propios mayores que 1 como criterio para conservar componentes principales. Selecciona el método de rotación y haz clic en Rotación para elegir Varimax o Promax.
En Opciones, compruebe tanto el gráfico de Spiee como la matriz de coeficientes para incluir el diagrama de grava y la matriz de coeficientes en la salida para evaluar variantes retenidas. Tras completar todos los ajustes, haz clic en OK para ejecutar el análisis y permitir que SPSS genere la salida. Interpreta la matriz de carga de componentes principales para evaluar la relación entre los componentes principales y las variables originales.
Identificar variables con valores de carga más altos, ya que estas contribuyen de forma más significativa a los cambios de componentes. Utiliza la tabla de Varianza Total Explicada para evaluar cuánta varianza tiene en cuenta cada componente principal. Identifica los componentes principales con grandes proporciones de varianza, ya que suelen capturar la mayor parte de la variación de los datos.
Consulta la parcela de pedrero para determinar qué componentes conservar. Localiza el punto de inflexión y mantén todos los componentes a la izquierda de este punto. Si se requieren puntuaciones de componentes principales, comprueba Guardar como variables antes de ejecutar el análisis.
SPSS añadirá las puntuaciones de cada muestra como nuevas variables en el conjunto de datos. El análisis de componentes principales identificó seis componentes principales que, en conjunto, representaban el 76,8% de la varianza total. El modelo de regresión logística demostró un rendimiento estable en tres pliegues de validación, con valores AUC de 0,71, 0,74 y 0,88, lo que dio una media de AUC de 0,77.
En cambio, el modelo de bosque aleatorio mostró mayor variabilidad, con puntuaciones de fold AUC de 0,69, 0,52 y 0,83, y una media AUC más baja de 0,68. El modelo de regresión logística logró predicciones 100% correctas para EPOC y seis de siete correctas para infecciones respiratorias, como se muestra en la matriz de confusión, lo que indica una alta precisión en la clasificación. El modelo de bosque aleatorio clasificó erróneamente un caso de EPOC y dos casos de infección respiratoria, lo que resultó en una menor precisión de clasificación en comparación con el modelo de regresión logística.
En el conjunto de datos de prueba, el modelo de regresión logística ofreció un excelente rendimiento en la clasificación, logrando un valor AUC de 0,95. El modelo de bosque aleatorio mostró un menor rendimiento en pruebas con un valor de AUC de 0,76.
View the full transcript and gain access to thousands of scientific videos
Esta investigación se centra en el diagnóstico acústico, utilizando el análisis de señales de voz y el aprendizaje automático para extraer características distintivas de la voz para la clasificación temprana no invasiva de la enfermedad pulmonar obstructiva crónica y las infecciones del tracto respiratorio. El estudio destaca la integración de técnicas avanzadas en el procesamiento de señales de voz y algoritmos de aprendizaje automático.