April 18th, 2025
이 연구는 기계 학습 모델과 경쟁 위험 분석을 사용하여 결장직장 인장 고리 세포 암종 환자의 예후 시스템을 평가합니다. 양성 림프절의 로그 확률을 pN 병기와 비교하여 우수한 예측 변수로 식별하여 강력한 예측 성능을 입증하고 강력한 생존 예측 도구를 통해 임상 의사 결정을 지원합니다.
- 우리의 연구는 예후 정확도와 생존 예측을 최적화하기 위해 기계 학습과 경쟁 위험 모델을 사용하여 결장직장 인장 고리 세포 암종의 세 가지 림프절 병기 결정 시스템을 평가합니다.
기계 학습을 포함한 정보학 방법을 통해 위험 모델 비교 및 Kaplan-Meier 생존 추정을 사용하여 생존 예측 및 림프절 분류 정확도를 향상시킵니다.
추적 관찰 기간을 연장하는 동시에 다양한 집단에서 데이트를 하고, 예후 노모그램을 개선하고, 대장 인장 고리 세포 암종의 분자적 특성을 탐색하여 임상 의사 결정 도구를 향상시킵니다.
[해설자] 시작하려면 SEER를 다운로드하여 설치하십시오. 그런 다음 SEER 데이터베이스 웹사이트에서 통계 8.4.3 소프트웨어를 얻습니다. 소프트웨어에 로그인하고 사례 목록 세션을 클릭한 다음 데이터를 클릭하고 사건 SEER 연구 및 데이터, 17개 레지스트리, 2022년 11월, 2000년 미만에서 2020년 데이터베이스를 선택합니다. 이제 선택을 클릭한 다음 편집을 클릭하고 인종, 성별, 2004년부터 2015년까지의 진단 연도를 선택합니다. 그런 다음 사이트 recode ICD-0-3 WHO 2008을 선택합니다. 테이블을 클릭하고 사용 가능한 변수 인터페이스에서 필요한 모든 진단 세부 정보를 선택합니다. 그런 다음 출력을 클릭합니다. 데이터 이름을 지정하고 실행을 클릭하여 데이터를 출력하고 저장합니다. 그런 다음 X-Tile 소프트웨어를 열고 파일을 클릭한 다음 열기를 선택합니다. 데이터 파일을 선택하여 소프트웨어로 가져옵니다. 데이터가 로드되면 생존 상태에 해당하는 변수 센서, 마커 1의 생존 시간을 분석할 변수로 매핑하여 데이터가 올바르게 일치하는지 확인합니다. 이제 do를 클릭한 다음 Kaplan-Meier 및 마커 1을 클릭하여 Kaplan-Meier 생존 분석을 수행하고 생존 곡선을 생성합니다. 그런 다음 SRCC가 있는 총 2,409개의 적격 환자 데이터를 훈련 코호트 번호 1,686과 검증 코호트 번호 723에 7-3 비율로 무작위로 할당합니다. 임의 분할을 위해 제공된 코드를 사용하십시오. 필요한 버전의 RStudio 및 R 소프트웨어를 다운로드하여 설치합니다. 새 파일을 클릭하고 R 스크립트를 선택하여 새 R 프로그래밍 인터페이스를 만듭니다. 그런 다음 코드 편집기에 관련 코드를 입력하고 실행을 클릭하여 코드를 실행합니다. 제공된 코드를 사용하여 Cox 회귀 분석을 통해 기계 학습 모델에 포함된 변수를 선별합니다. 또한 LODDS, LNR 및 PN 병기가 SRCC 환자의 암 특이적 생존에 미치는 영향을 탐색합니다. 이 코드를 사용하여 훈련, 검증 및 외부 검증 코호트에서 세 가지 림프절 시스템, LODDS, LNR 및 PN 병기의 예후 예측 능력을 비교합니다. 그런 다음 코드를 사용하여 XGBoost 모델을 빌드하고 변수의 상대적 중요도를 나타내는 막대 그래프를 생성합니다. 수신기 작동 특성 곡선 및 보정 곡선을 생성하여 3개의 림프절 시스템의 성능을 평가합니다. 다음으로, 코드를 사용하여 랜덤 포레스트 모델을 구축하고 변수의 상대적 중요도에 대한 막대 그래프를 생성합니다. 마찬가지로 수신기 작동 특성 곡선과 보정 곡선을 생성하여 세 가지 림프절 시스템을 평가하고 비교합니다. 적절한 코드를 사용하여 신경망 모델을 구축하고 변수의 상대적 중요도에 대한 막대 그래프를 생성합니다. 수신기 작동 특성 및 보정 곡선을 생성하여 세 가지 림프절 시스템의 예측 성능을 비교합니다. 그런 다음 단변량 분석을 수행하고 data.csv 파일을 사용하여 누적 사건 함수 곡선을 표시합니다. 사이트를 다른 요인으로 바꾸어 각 요인에 대한 단변량 분석을 수행합니다. 다변량 분석의 경우 코드를 적용하고 data1.csv로 시각화합니다. 마지막으로 노모그램, 수신기 작동 특성 곡선 및 보정 곡선을 표시합니다. 학습 코호트의 데이터를 사용하여 모델을 학습시키고 검증 및 외부 검증 코호트 데이터를 사용하여 모델의 유효성을 검증합니다. 다변량 Cox 회귀 분석을 기반으로 LNR, LODDS 및 PN 병기는 모두 SRCC 환자의 암 특이적 생존과 유의한 관련이 있었습니다. LNR은 RF 및 XGBoost 모델에서 가장 높은 중요성을 보였고, LODDS는 NN 모델에서 가장 큰 예측 능력을 보였으며 이는 LODDS가 전반적으로 가장 신뢰할 수 있는 LN 시스템임을 시사합니다. XGBoost, RF 및 NN 모델은 0.777에서 0.851 범위의 AUC 값과 45도 선과 밀접하게 정렬되는 검량선으로 높은 예측 정확도를 달성하여 모델 신뢰성을 확인했습니다. 경쟁 위험 모델 분석은 T 병기, N 병기, M 병기, LODDS 분류 및 원발성 종양 위치를 독립적인 예후 인자로 식별했습니다. 경쟁 위험 노모그램은 AUC가 0.75 이상인 잘 정렬된 보정 및 ROC 곡선에 의해 뒷받침되는 정확한 1년, 3년 및 5년 암 특이적 생존 예측을 보여주었습니다.
View the full transcript and gain access to thousands of scientific videos
본 연구는 기계 학습 모델과 경쟁 위험 분석을 사용하여 대장 세포 암 환자의 예후 시스템을 평가합니다. 긍정적인 림프절의 로그 확률을 pN 분기보다 우수한 예측 변수로 식별하여, 강력한 예측 성능을 보이고 견고한 생존 예측 도구를 통해 임상 의사 결정을 돕습니다.