Method Article

基于机器学习的咳嗽音分类:慢性阻塞性肺疾病和呼吸道感染的诊断探索

DOI:

10.3791/68222

September 19th, 2025

In This Article

Summary

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

本研究利用语音信号处理技术和机器学习算法的集成,从诊断为慢性阻塞性肺病 (COPD) 和呼吸道感染 (RTI) 的患者中获取咳嗽声数据,有效地完成了两个不同类别的自动分类。

Abstract

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

本研究的目的是开发和评估一种非侵入性方法,使用语音信号分析和机器学习来区分慢性阻塞性肺病 (COPD) 患者和呼吸道感染 (RTI) 患者。收集25例COPD患者和25例RTI患者(作为对照组/对照组)的固定模式语音信号。进行多维语音特征分析,识别出显著区分两组的特征。选择具有统计学意义的特征并进行降维。然后训练逻辑回归 (LR) 和随机森林 (RF) 模型,并评估区分 COPD 和 RTI 的分类性能。最初分析了 400 多个语音特征。COPD与RTI患者差异较高的18个特征(P <;0.05)。在区分COPD患者和RTI患者的任务中,LR模型实现了0.95的测试集曲线下面积AUC,明显优于RF模型(AUC = 0.76)。这项研究证明了使用语音分析和机器学习,特别是 LR 模型作为区分 COPD 和 RTI 的有前途的非侵入性工具的可行性。它为这种基于语音的方法在需要对呼吸系统疾病进行鉴别诊断的临床环境中的实际应用和进一步优化奠定了基础。

Introduction

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

慢性阻塞性肺病 (COPD) 和呼吸道感染是全球死亡率和发病率的重要因素。慢性阻塞性肺病被定义为影响气道和肺实质的慢性炎症性疾病,主要由吸烟诱发。其特征是持续咳嗽、呼吸困难和痰液分泌增加等症状1。世界卫生组织预计,到 2030 年,慢性阻塞性肺病将成为全球第三大死因,造成巨大的经济负担 2,3。相比之下,呼吸道感染 (RTI) 约占全球疾病负担的 6%,超过了与缺血性心脏病、艾滋病毒感染、癌症、疟疾和腹泻病相关的负担4

由于这两种疾病的临床表现存在大量相似性,特别是在咳嗽的症状上,这是一种普遍症状,因此早期和精确鉴别这些疾病对于有效治疗至关重要 5,6。传统的诊断方法主要依赖于临床症状评估、肺功能测试和实验室分析7。虽然慢性阻塞性肺病的传统诊断方法可以有效识别和评估病情,但它们在临床实践中表现出一些局限性。这些局限性包括诊断准确性不足、早期诊断能力有限、对疾病异质性的了解不足以及缺乏动态监测

Access restricted. Please log in or start a trial to view this content.

Protocol

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

北京中医药大学伦理委员会及其附属第三医院批准了这项研究。所有参与者都提供了参与的书面知情同意书。2024年7月至8月,从北京中医药大学附属第三医院呼吸内科招募了25名COPD患者。同时,还组建了一个由 25 名具有典型上 RTI 的患者组成的对照组。

1. 参与者选择

  1. 纳入标准
    1. 选择背景噪音低、发音清晰的音频样本。
    2. 确保肺部专家制定的临床指南强制要求对 COPD 组进行 COPD 诊断。
      1. 根据 GOLD 2024 标准,通过支气管扩张剂后肺活量测定法 (FEV 1/FVC< 0.70) 确认诊断。
      2. 验证临床稳定性(4 周≥无恶化)
    3. 确保对照组包括患有典型上层 RTI 的人。
      1. 使用《呼吸道感染疾病诊疗指南》的诊断标准进行诊断。
      2. 确保症状发作时间≤ 72 小时。
      3. 排除慢性呼吸道疾病史。
    4. 将年龄限制在 18-85 岁。
    5. 要求所有参与者提供参与研究的书面知情同意书。
  2. 排除标准
    1. 排除有言语困难的参与者,例如声带疾病或喉炎。<....

Access restricted. Please log in or start a trial to view this content.

Results

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

数据分析结果

该研究采用时域分析、频域分析、梅尔频倒谱系数(MFCC)提取、中医诊断特征指标改变等方法,成功分离出400多个语音特征指标。分析时域是语音信号处理中的关键要素,重点是直接作信号时间序列数据,以直观地理解信号属性,如能量、过零率、线性趋势和包络、自相关研究和幅度调制等 16,17,18,19,20.频域分析是通过傅里叶变换将时域信号转换为频域信号以检查信号的频率元素的过程。这种改变揭示了信号在频谱中的各种频率分量,增强了对其特性的理解。分析频域的各种方法包括短时傅里叶变换

Access restricted. Please log in or start a trial to view this content.

Discussion

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

本研究研究了通过语音信号分析和机器学习技术检测慢性阻塞性肺病的非侵入性方法。它涉及收集 25 名 COPD 患者和 25 名 RTI 患者的语音数据。使用 LR 和 RF 算法构建模型。两种模型在对样本进行总体正确分类方面表现出相似的准确性,但 AUC 值的差异表明 LR 模型可能在灵敏度和特异性之间提供卓越的平衡。后续部分对研究成果进行了详细检查。

研究表明,LR模型在测试集上达到了90%的准确率,而RF模型达到了80%,LR模型对应的AUC值为0.95,RF模型对应的AUC值为0.76。这可能是因为LR模型固有的简单性使其在小数据场景中具有更强的抗过拟合能力和更大的鲁棒性,从而能够有效地利用18个关键特征进行精确分类。相反,RF的复杂结构使其在有限的数据条件下容易在训练集中出现过拟合噪声,从而导致在推广到测试集时性能显着下降。

最初,在收集数据时,管理环境至关重要。在宁静的咨询区捕捉咳嗽声,防止任何外部干扰,并保证咳嗽声音的清晰度和精确度。在采样时选择和调.......

Access restricted. Please log in or start a trial to view this content.

Disclosures

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

作者声明本研究的发表没有利益冲突。没有从任何商业组织获得可能影响本研究结果或解释的财务或非财务支持。研究的所有方面,包括设计、数据收集、分析和稿件准备,都是独立于任何外部影响进行的。

Acknowledgements

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

本研究得到了国家自然科学基金青年科学基金项目(项目立件号:82104739)和河北省中医药管理局科研计划(项目编号:B2025032)的支持。作者要感谢所有在实验过程中提供帮助的老师和学生。

....

Access restricted. Please log in or start a trial to view this content.

Materials

List of materials used in this article
NameCompanyCatalog NumberComments
数字录音机缩放H6ZOOM音频商店
GitHubGit2.47.1.2官方网站
Matlab数学作品R2024b官方网站
派查姆喷气脑2024.1官方网站
3.12官方网站

References

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,
  1. Roth, M. Pathogenesis of COPD. Part III. Inflammation in COPD. Int J Tuberc Lung Dis. 12 (4), 375-380 (2008).
  2. Alsayari, A., Muhsinah, A. B., Almaghaslah, D., Annadurai, S., Wahab, S. Pharmacological efficacy of ginseng against respiratory tract infections. Molecules.

Access restricted. Please log in or start a trial to view this content.

Reprints and Permissions

Request permission to reuse the text or figures of this JoVE article

Request Permission

Tags

Cough Tone ClassificationMachine Learning DiagnosticsVoice Signal AnalysisChronic Obstructive PulmonaryRespiratory Tract InfectionsLogistic Regression ModelRandom Forest ModelPrincipal Component AnalysisVoice Feature ExtractionNon Invasive Diagnosis

Related Articles