September 19th, 2025
본 연구는 음성 신호 처리 기술과 머신러닝 알고리즘의 통합을 활용하여 만성폐쇄성폐질환(COPD)과 호흡기 감염(RTI) 진단을 받은 환자로부터 기침음 데이터를 획득하여 두 가지 범주의 자동 분류를 효과적으로 달성했습니다.
이 연구는 음성 신호 분석과 머신러닝을 활용하여 만성 폐쇄성 폐질환 및 호흡기 감염의 비침습적 조기 분류를 위한 독특한 음성 특징을 추출하는 음향 진단에 중점을 둡니다. 이 분야의 최근 발전으로는 AI 기반 음성 분석, 합성곱 신경망과 지원 벡터 머신과 같은 머신러닝 기법, MFCC 같은 신호 처리 도구, 그리고 음성 신호에서 질병 관련 패턴을 감지하는 가변 음향 센서 등이 있습니다. 음성 기반 진단의 임상 번역에서 주요 과제 중 하나는 데이터 부족입니다.
기타 도전 과제로는 제한된 모델 일반화, 개인정보 보호 윤리, 이해 충돌, 해석 가능성의 장벽 등이 있습니다. 음성 특징 지시기 데이터베이스를 조립한 후 SPSS를 열고 적절한 데이터 파일을 불러오세요. 메뉴 바에서 분석(Analysis)을 선택한 후 비모수 검정(Nonparametric Tests), 레거시 대화(Legacy Dialogues)를 선택한 후 2개의 독립 샘플을 클릭하세요.
팝업 대화창에서 테스트 변수 목록 섹션에서 비교할 관측 변수를 선택하세요. 그 다음 그룹 변수 아래에서 그룹화에 사용할 변수를 선택하세요. 그룹 정의 버튼을 클릭하고 팝업 창에 두 그룹의 식별자를 입력하세요.
테스트 유형 항목에서 Mann-Whitney U 테스트를 선택하세요. 확인을 클릭하여 테스트를 실행하고 SPSS가 자동으로 출력을 생성하도록 하세요. 주성분 분석의 경우, 데이터를 수집하여 Excel 또는 CSV 형식으로 저장하고 SPSS 버전 20.0으로 가져오도록 하세요.
파일을 열려면 파일을 선택한 후 열기, 그리고 데이터로 선택하여 적절한 파일을 선택하세요. 주성분 분석을 시작하려면 분석(Analysis)을 클릭한 후 차원 축소(Dimension Reduction)를 선택한 후 팩터(Factor)를 선택하세요. 대화 상자에서 주성분 분석에 사용되는 모든 연속 변수를 변수 필드에 추가하세요.
추출 버튼을 클릭하고 추출 기법으로 주성분 방법을 선택하세요. 주성분을 유지하기 위한 기준으로 1보다 큰 고유값을 선택하세요. 회전 방식을 선택하고 회전을 클릭해 Varimax 또는 Promax 중 하나를 선택하세요.
옵션 항목에서 스크리 플롯과 계수 행렬을 확인하여 자갈 다이어그램과 계수 행렬을 출력에 포함시켜 보존된 변형을 평가하세요. 모든 설정을 완료한 후 확인 버튼을 눌러 분석을 실행하고 SPSS가 출력을 생성하도록 허용합니다. 주성분 부하 행렬을 해석하여 주성분과 원래 변수 간의 관계를 평가합니다.
부하 값이 높은 변수를 식별하라. 이들이 구성 요소 변화에 더 크게 기여한다. 총 분산 설명 표를 사용하여 각 주성분이 얼마나 많은 분산을 차지하는지 평가하세요. 주요 구성 요소는 일반적으로 데이터 변동의 대부분을 포착하므로 분산 비율이 큰 것을 식별하세요.
어떤 성분을 유지해야 할지 결정하려면 자석 도면을 참고하세요. 전환점을 찾고 모든 성분을 이 점 왼쪽에 두세요. 주성분 점수가 필요하다면, 분석을 실행하기 전에 변수로 저장(Save as variables)을 확인하세요.
SPSS는 각 샘플의 점수를 데이터셋에 새로운 변수로 추가합니다. 주성분 분석은 총 분산의 76.8%를 차지하는 여섯 가지 주요 성분을 확인했습니다. 로지스틱 회귀 모델은 세 가지 검증 접행에서 안정적인 성능을 보였으며, AUC 값은 0.71, 0.74, 0.88로 평균 AUC 0.77을 얻었습니다.
반면, 무작위 숲 모델은 더 큰 변동성을 보였으며, 폴드 AUC 점수는 0.69, 0.52, 0.83이었고, 평균 AUC는 0.68로 낮았습니다. 로지스틱 회귀 모델은 COPD에 대해 100% 정확한 예측을 달성했으며, 호흡기 감염에 대해서는 7개 중 6개가 정확했는데, 이는 혼동 행렬에서 나타난 것으로, 높은 분류 정확도를 나타냅니다. 무작위 포레스트 모델은 COPD 1건과 호흡기 감염 2건을 잘못 분류하여 로지스틱 회귀 모델에 비해 분류 정확도가 낮았습니다.
테스트 데이터셋에서 로지스틱 회귀 모델은 AUC 값 0.95로 우수한 분류 성능을 보였습니다. 무작위 숲 모델은 AUC 값 0.76으로 테스트 성능이 낮았습니다.
View the full transcript and gain access to thousands of scientific videos
이 연구는 음성 신호 분석과 기계 학습을 활용한 음향 진단에 중점을 두고, 만성 폐쇄성 폐 질환 및 호흡기 감염의 비침습적 조기 분류를 위해 독특한 음성 특징을 추출합니다. 이 연구는 음성 신호 처리 및 기계 학습 알고리즘의 고급 기술 통합을 강조합니다.