September 19th, 2025
Este estudo realizou efetivamente a classificação automatizada de duas categorias distintas, adquirindo dados sonoros de tosse de pacientes diagnosticados com doença pulmonar obstrutiva crônica (DPOC) e infecções do trato respiratório (ITR), utilizando uma integração de técnicas de processamento de sinais de fala e algoritmos de aprendizado de máquina.
Esta pesquisa foca em diagnósticos acústicos, utilizando análise de sinais de voz e aprendizado de máquina para extrair características vocais distintas para a classificação precoce não invasiva de doença pulmonar obstrutiva crônica e infecções do trato respiratório. Os desenvolvimentos recentes nessa área incluem análise de voz impulsionada por IA, técnicas de aprendizado de máquina como redes neurais convolucionais e máquinas vetoriais de suporte, ferramentas de processamento de sinais como MFCCs e sensores acústicos variáveis para detectar padrões relacionados a doenças em sinais sonoros. Um dos principais desafios na tradução clínica do diagnóstico baseado em voz é a escassez de dados.
Outros desafios incluem generalização limitada de modelos, ética em privacidade, conflitos e barreiras à interpretabilidade. Após montar o banco de dados de indicadores de características vocais, abra o SPSS e carregue o arquivo de dados apropriado. Na barra de menus, selecione Analisar, depois escolha Testes Não Paramétricos, seguido de Diálogos Legados, e clique em 2 Amostras Independentes.
Na caixa de diálogo pop-up, selecione as variáveis observadas a serem comparadas na seção Lista de Variáveis de Teste. Depois, em Variável de Agrupamento, selecione a variável que será usada para agrupamento. Clique no botão Definir Grupos e insira os identificadores dos dois grupos na janela pop-up.
Em Tipo de Teste, selecione o teste Mann-Whitney U. Clique em OK para rodar o teste e permitir que o SPSS gere automaticamente a saída. Para análise de componentes principais, certifique-se de que os dados estejam reunidos, salvos em formato Excel ou CSV e importados para a versão 20.0 do SPSS.
Para abrir o arquivo, selecione Arquivo, depois Abrir, seguido de Dados, e selecione o arquivo apropriado. Para iniciar a análise de componentes principais, clique em Analisar, depois escolha Redução de Dimensão e selecione Fator. Na caixa de diálogo, adicione todas as variáveis contínuas usadas na análise de componentes principais no campo Variáveis.
Clique no botão Extração e selecione o método dos componentes principais como técnica de extração. Selecione autovalores maiores que 1 como critério para manter componentes principais. Selecione o método de rotação e clique em Rotação para escolher Varimax ou Promax.
Em Opções, verifique tanto o gráfico de Scree quanto a matriz de coeficientes para incluir o diagrama de cascalho e a matriz de coeficientes na saída para avaliar variantes mantidas. Após completar todas as configurações, clique em OK para executar a análise e permitir que o SPSS gere a saída. Interprete a matriz de carregamento dos componentes principais para avaliar a relação entre os componentes principais e as variáveis originais.
Identifique variáveis com valores de carga mais altos, pois eles contribuem de forma mais significativa para as mudanças nos componentes. Use a tabela de Variância Total Explicada para avaliar quanto de variância cada componente principal considera. Identifique os componentes principais com grandes proporções de variância, pois eles normalmente capturam a maior parte da variação dos dados.
Consulte o gráfico de cascalho para determinar quais componentes manter. Localize o ponto de inflexão e mantenha todos os componentes à esquerda desse ponto. Se forem necessárias pontuações de componentes principais, verifique Salvar como variáveis antes de executar a análise.
O SPSS adicionará as pontuações de cada amostra como novas variáveis no conjunto de dados. A análise de componentes principais identificou seis componentes principais que, juntos, representaram 76,8% da variância total. O modelo de regressão logística demonstrou desempenho estável em três dobras de validação, com valores de AUC de 0,71, 0,74 e 0,88, resultando em uma média de AUC de 0,77.
Em contraste, o modelo de floresta aleatória apresentou maior variabilidade, com escores de AUC de dobra de 0,69, 0,52 e 0,83, e uma média de AUC menor de 0,68. O modelo de regressão logística alcançou previsões 100% corretas para DPOC e seis em sete corretas para infecções do trato respiratório, conforme mostrado na matriz de confusão, indicando alta precisão na classificação. O modelo de floresta aleatória classificou erroneamente um caso de DPOC e dois casos de infecção do trato respiratório, resultando em menor precisão de classificação em comparação com o modelo de regressão logística.
No conjunto de dados de teste, o modelo de regressão logística apresentou excelente desempenho de classificação, alcançando um valor AUC de 0,95. O modelo de floresta aleatória mostrou desempenho menor nos testes, com um valor AUC de 0,76.
View the full transcript and gain access to thousands of scientific videos
Esta pesquisa concentra-se em diagnósticos acústicos, utilizando análise de sinal de voz e aprendizado de máquina para extrair características vocais distintivas para classificação precoce não invasiva de doença pulmonar obstrutiva crônica e infecções do trato respiratório. O estudo destaca a integração de técnicas avançadas em processamento de sinal de fala e algoritmos de aprendizado de máquina.