Waiting
Login processing...

Trial ends in Request Full Access Tell Your Colleague About Jove
Click here for the English version

Medicine

군 보건 시스템 데이터 저장소 및 국가 사망 지수를 사용하여 치료 가중치의 역 확률 (성향 점수)

Published: January 8, 2020 doi: 10.3791/59825

Summary

무작위 통제 예심이 실현 가능하지 않은 경우에, 군사 건강 시스템 데이터 저장소와 같은 포괄적인 건강 관리 데이터 소스는 소급 분석을 위한 매력적인 대안을 제공합니다. 국가 사망 지수에서 사망률 데이터를 통합하고 성향 가중치를 사용하여 그룹 간의 차이를 균형을 조정하면 회고적 디자인에 내재된 편견을 줄일 수 있습니다.

Abstract

무작위 통제 실험이 실현 가능하지 않은 경우, 빅 데이터를 사용한 소급 연구는 치료 선택 편향의 위험에 처해 있지만 효율적이고 비용 효율적인 대안을 제공합니다. 치료 선택 편향은 치료 선택이 또한 결과와 연관되는 전처리 특성에 기초할 때 비무작위 연구에서 발생합니다. 이러한 전처리 특성 또는 혼란은 결과에 대한 치료의 영향 평가에 영향을 미칠 수 있습니다. 성향 점수는 치료 그룹 간의 알려진 혼란 사이의 균형을 조정하여 이러한 편견을 최소화합니다. 성향 점수, 성향 일치 및 치료 가중치 (IPTW)의 역 확률에 의해 계층화를 포함하여 성향 점수 분석을 수행하는 몇 가지 접근 방식이 있습니다. 여기에 설명된 IPTW는 미군 보건 시스템 데이터 저장소(MDR) 내의 환자 집단에서 기준선 동반조절의 균형을 맞추는 데 사용됩니다. MDR은 상대적으로 최적의 데이터 소스, 그것은 포함 된 코호트를 제공 하는 입원 환자 및 외래 환자 서비스에 대 한 거의 완전 한 정보를 적격 한 수혜자에 대 한 사용할 수 있는. 아래에 설명된 MDR은 강력한 사망률 데이터를 제공하기 위해 국가 사망 지수의 정보로 보충된 MDR의 사용입니다. 또한 관리 데이터 사용에 대한 제안도 제공됩니다. 마지막으로 프로토콜은 IPTW를 사용하여 알려진 혼란자의 균형을 맞추고 관심 결과에 대한 누적 발생률 함수를 플로팅하기 위한 SAS 코드를 공유합니다.

Introduction

무작위화, 위약 대조 시험은 치료의 효능을 정량화하는 가장 강력한 연구 설계이지만, 비용과 시간 요구 사항 또는 치료 그룹 사이의 균형의 부족으로 인해 항상 실현 가능하지는 않습니다1. 이러한 경우, 대규모 관리 데이터("빅 데이터")를 사용하는 회고적 코호트 설계는 종종 효율적이고 비용 효율적인 대안을 제공하지만 무작위화의 부족은 치료 선택 편향을 도입합니다2. 치료 선택 편향은 치료 결정이 관심의 결과와 관련된 전처리 특성에 의존할 때 비무작위 연구에서 발생합니다. 이러한 특성을 혼동 요인으로 알려져 있습니다.

성향 점수는 치료 그룹 사이의 알려진 혼란사이의 균형을 조정하여이러한 편견을 최소화하기 때문에, 그들은 점점 더 인기를 끌고있다3. 성향 점수는 외과 접근 4 의학 식이요법5를비교하기 위하여 이용되었습니다. 최근에는 관상동맥 칼슘의 존재 및 중증도에 기초하여 심혈관 결과의 1차 예방에 스타틴의 효과를 평가하기 위해 미국 군 보건 시스템 데이터 저장소(MDR)의 데이터에 대한 성향 분석을 사용했습니다6.

MDR은 연구 목적으로 메디케어 및 VA 데이터 세트보다 덜 자주 활용되며 현역 군인, 은퇴자 및 기타 국방부 (DoD) 의료 수혜자 및 그 부양 가족에 대해 제공되는 입원 환자 및 외래 환자 서비스의 포괄적 인 관리 및 의료 청구 정보를 포함합니다. 데이터베이스에는 미군 치료 시설이나 국방부에 청구된 민간 시설에서 전 세계적으로 제공되는 서비스가 포함됩니다. 데이터베이스에는 2001년 10월 1일 이후의 완전한 약국 데이터가 포함되어 있습니다. 실험실 데이터는 2009년부터 사용할 수 있지만 군사 치료 시설로만 제한됩니다. MDR 내에서, 코호트는 진단 코드의 사용을 포함하는 방법으로 정의되었습니다 (예를 들어, 당뇨병7)또는 절차 코드 (예를 들어, 관절 경 수술8). 또는 레지스트리와 같은 적격 수혜자의 외부 정의 코호트를 MDR과 일치하여 기준 및 후속 데이터9를얻을 수 있습니다. 메디케어와는 달리, MDR은 모든 연령대의 환자를 포함한다. 그것은 또한 종속 을 포함 하기 때문에 VA 데이터베이스 보다 남성으로 덜 편향. 그러나 MDR에 대한 액세스는 제한되어 있습니다. 일반적으로 군 보건 시스템의 구성원인 조사자만 VA 데이터베이스 사용 요구 사항과 유사하게 액세스를 요청할 수 있습니다. 군사 보건 시스템 데이터에 대한 액세스를 원하는 비정부 연구원은 정부 후원자의 감독하에 데이터 공유 계약을 통해 이를 수행해야 합니다.

관리 데이터 집합을 사용할 때는 관리 코딩의 강점뿐만 아니라 제한 사항을 염두에 두어야 합니다. 코드의 민감도 및 특이성은 관련 진단에 따라 달라질 수 있습니다. 급성 심근 경색에 대한 입원 환자 코드는 일반적으로 90 %10이상 긍정적 인 예측 값으로 정확하게보고되지만 담배 사용은 종종11로 코딩됩니다. 이러한 언더코딩은 연구 결과에 의미 있는 영향을 미칠 수도 있고 그렇지 않을 수도 있습니다12. 추가적으로, 주어진 조건에 대한 몇몇 코드는 문제의 질병에 상관관계의 다양한 수준으로 존재할 수 있습니다13. 조사팀은 적절한 코드가 연구에 포함되도록 국제 질병 분류, 9차 개정, 임상 수정(ICD-9-CM) 및/또는 ICD-10-CM 코딩 매뉴얼에 대한 포괄적인 문헌 검색 및 검토를 수행해야 합니다.

comorbid 조건을 정의하기 위해 진단 코드의 감도 및 정확도를 개선하기 위해 여러 가지 방법을 사용할 수 있습니다. 기준 준수를 설정하려면 적절한 "룩백" 기간이 포함되어야 합니다. 룩백 기간에는 연구 진입 전에 제공된 입원 환자 및 외래 환자 서비스가 포함됩니다. 1년의 기간은 최적14일수 있습니다. 또한 단일 클레임 대신 두 개의 개별 클레임을 요구하면 특이성이 향상될 수 있으며 제약 데이터로 코딩 데이터를 보완하면 민감도15가향상될 수 있습니다. 데이터의 일부에 대한 수동 차트 감사를 선택하여 코딩 전략의 정확성을 검증할 수 있습니다.

일단 comorbidities가 문제의 코호트에 대해 정의되고 평가되면, 성향 점수는 처리 단 사이 공변량에 있는 다름을 균형을 위해 이용될 수 있습니다. 성향 점수는 환자가 알려진 공변량에 근거한 처리에 할당되는 확률에서 파생됩니다. 이 성향 처리를 위한 회계는 공변류가 처리 할당에 있는 효력을 감소시키고 결과에 처리 효력의 실제적인 견적을 생성하는 것을 돕습니다. 성향 점수가 반드시 다변량 모델에 우수한 결과를 제공하는 것은 아니지만, 그들은 성향 점수3을적용 한 후 처리 및 치료되지 않은 그룹이 비교되는지 여부를 평가 할 수 있습니다. 연구 조사관은 알려진 confounders가 그룹 사이에서 균형을 이루고 있는지 확인하기 위하여 처리 가중치의 성향 일치 또는 역 확률 (IPTW) 전후에 공변량에 있는 절대 표준화한 다름을 분석할 수 있습니다. 중요한 것은, 알 수없는 혼란은 균형되지 않을 수 있습니다, 하나는 잔류 혼란에 대한 잠재력을 알고 있어야합니다.

제대로 실행 하는 경우, 그래도, 성향 점수 예측 하 고 무작위 통제 실험의 결과 복제할 수 있는 강력한 도구16. 이용 가능한 성향 점수 기술 중, 매칭 및 IPTW는 일반적으로17로바람직하다. IPTW 내에서, 환자는 그들의 성향 또는 치료에 대 한 확률에 의해 가중. 안정화 가중치는 일반적으로 원시 분동보다 권장되며, 가중치 트리밍도18,19,20,21로간주될 수 있습니다.

일단 연구 그룹이 균형을 이루면, 관심의 결과가 나올 때까지 그(것)들은 따를 수 있습니다. 행정 데이터를 활용한 연구는 재입학률 및 이벤트 시간 분석과 같은 결과에 관심이 있을 수 있습니다. 사망률에 관심이 있는 연구에서, 군 보건 시스템 데이터 저장소는 국가 사망 지수(NDI)22,23을사용하여 더욱 증강될 수 있는 중요한 상태에 대한 필드를 포함한다. NDI는 질병 통제 센터에 의해 관리되는 국가 사무실에서 죽음 기록 정보의 중앙 집중식 데이터베이스입니다. 수사관은 사망 증명서에 따라 기본적인 중요 상태 및 / 또는 특정 사망 원인을 요청할 수 있습니다.

다음 프로토콜은 NDI의 사망률 정보로 증강된 MDR을 사용하여 관리 데이터베이스 연구를 수행하는 프로세스를 자세히 설명합니다. SAS 코드 및 예제 출력을 포함한 두 치료 그룹 간의 기준선 차이를 균형 조정하기 위해 IPTW를 사용하는 방법을 자세히 설명합니다.

Subscription Required. Please recommend JoVE to your librarian.

Protocol

다음 의정서는 기관 윤리 위원회의 지침을 따릅니다.

1. 코호트 정의

  1. 1) 레지스트리 또는 2) 진단 또는 절차에 대한 관리 코드(즉, 2개 이상의 모든 환자)와 같이 MDR에서 추출할 수 있는 데이터 포인트를 사용하여 계획된 코호트의 포함 및 배제 기준을 결정하고 명확하게 정의합니다. 외래 환자 진단 또는 심방 세동의 한 입원 환자 진단).
    1. 레지스트리를 사용하는 경우 의료 기록 번호(patuniq 및 edipn으로 다른 데이터 세트에 나열됨), 전체 이름, 생년월일 및/또는 스폰서의 사회 보장 번호와 같은 군 보건 시스템 데이터 저장소와 정확하게 일치하기 위해 두 개 이상의 환자 식별자를 포함합니다.
      참고: 개인 건강 정보를 활용하는 모든 연구와 마찬가지로 안전 장치가 필요하며 준수해야 합니다. 수집 과정에서 적절한 암호화 및 데이터 관리를 사용해야 하며 가능한 한 빨리 정보를 식별 해제해야 합니다.
      참고: 스폰서의 사회 보장 번호(sponssn)를 참조할 때, 모든 환자는 후원자, 배우자 및 자녀에 대한 식별자를 포함하여 군인(또는 후원자)과의 관계에 대해 나열됩니다. 환자가 성인이 되고 결혼하거나 이혼할 때 데이터 세트에서 관계 코드및 스폰서의 사회 보장 번호가 시간이 지남에 따라 변경될 수 있습니다. 따라서 여러 환자 식별자가 정확도를 보장하는 데 도움이 됩니다.
    2. 관리 코딩을 통해 코호트를 정의하는 경우 포괄적인 문헌 검색을 수행하여 관심 코드의 유효성을 잠재적으로 검증한 이전 연구를 식별합니다. ICD-9-CM24 및/또는 ICD-10-CM25 설명서를 검토하여 코드 정의 및 인접 코드를 명확히 하여 적절한 범위의 코드가 사용되고 있는지 확인합니다. 또한 설명서에 포함된 상호 참조 테이블을 검토하여 포함/제외를 위한 추가 코드를 고려하십시오. 사전 유효성 검사 연구에는 다양한 관리 코딩 전략에 대한 긍정적인 예측 값, 민감도 및 특이성에 대한 보고서가 포함되어 있습니다. 이는 코호트 선택과 결과 식별을 최적화하는 데 도움이 됩니다.
  2. 데이터 요청에 포함할 원하는 코호트 또는 기타 제외 기준에 제한(예: 연령기준)이 있는지 확인합니다.
  3. 기준선 동변량 수집을 위한 인덱스 날짜 이전의 시간(일반적으로 관리 데이터 연구에서 12개월)과 연구 종료 날짜를 포함하도록 스터디 기간을 정의합니다.

2. 공동변량 및 결과 정의

  1. 위의 1.1.2단계에서 수행한 대로 ICD-9-CM24 및/또는 ICD-10-CM25 매뉴얼의 사용 및 사용내본문 검색을 통해 혼란스러운 조건에 대한 관리 코드를 정의합니다.
  2. 인구 통계, 약물 및 실험실 데이터를 포함하여 필요한 다른 공동 변량계를 결정합니다.
  3. MDR 데이터 사전에서 사용 가능한 데이터 필드를 검토합니다 https://health.mil/Military-Health-Topics/Technology/Support-Areas/MDR-M2-ICD-Functional-References-and-Specification-Documents.

3. MDR에 대한 요청 제출

  1. 기관 심사 위원회의 승인을 얻으시다.
  2. 여기에서 찾을 수 있는 데이터 공유 계약 응용 프로그램을 완료합니다: https://health.mil/Military-Health-Topics/Privacy-and-Civil-Liberties/Submit-a-Data-Sharing-Application?type=All#RefFeed. 응용 프로그램의 일부로 DRT 군사 보건 시스템 데이터 저장소(MDR) 추출 워크시트(응용 프로그램 양식에서 링크됨)에 요청되는 데이터 필드 및 파일을 지정합니다. 팀에서 데이터 분석가가 원시 데이터를 제공하거나 팀이 MDR에 직접 액세스할지 여부를 지정합니다. 또한 요청이 일회성 데이터 끌어오기인지 또는 정기적인 끌어오기가 매일, 월별 또는 연간 요청되는지 여부를 지정합니다.
    참고 : 어떤 방법으로 MDR 데이터를 얻으려면 일반적으로 조사 팀의 일원인 공무원 (현역 군인 또는 GS)인 스폰서가 있어야합니다.
  3. MDR에 직접 액세스하는 경우 여기에서 찾을 수 있는 "MDR 권한 부여 요청 양식" 및 "MDR CS 2875 양식"https://health.mil/Military-Health-Topics/Technology/Support-Areas/MDR-M2-ICD-Functional-References-and-Specification-Documents을 작성합니다.

4. MDR에 액세스하고 관련 데이터 추출

  1. MDR에 직접 액세스하는 경우 여기에 있는 "MDR 사용자 가이드" 및 "MDR 기능 가이드"에서 사용할 수 있는 소프트웨어 요구 사항 및 예제 SAS 프로그램을 포함하여 MDR에 액세스하고 사용하는 방법에 대한 지침을 따르십시오 https://health.mil/Military-Health-Topics/Technology/Support-Areas/MDR-M2-ICD-Functional-References-and-Specification-Documents.
    참고 : 파일은 SAS 형식으로 저장하고 일반적으로 putty.exe뿐만 아니라 ftp 프로그램을 사용하여 유닉스 쉘을 통해 액세스 할 수 있습니다. SAS에 대한 지식이 필요합니다.
  2. MDR 설정에 대한 유용한 개요를 보려면 HTTPS://HEALTH.MIL/REFERENCE-CENTER/PUBLICATIONS/2012/10/10/GUIDE-FOR-DOD-RESEARCHERS-ON-USING-MHS-DATA MHS 데이터사용에 대한 DOD 연구원의 DOD 가이드를 검토하십시오.
  3. 2.3단계에서 수행한 것처럼 MDR 데이터 사전을 검토하여 사용 가능한 모든 데이터 파일에 대한 자세한 정보를 https://health.mil/Military-Health-Topics/Technology/Support-Areas/MDR-M2-ICD-Functional-References-and-Specification-Documents.
    참고: 모든 데이터 파일에 일치/병합을 위한 모든 환자 식별자가 포함되지는 않습니다. 데이터 사전은 각 데이터 파일에 사용할 수 있는 식별자를 나열하는 데 도움이 됩니다. 예를 들어 약국 정보를 추출하려면 "patuniq" 또는 "edipn"이라고도 하는 DOD ID 번호가 필요합니다. 따라서 데이터 마이닝 단계에서 모든 적절한 환자 식별자를 갖는 것은 여러 해 및 여러 데이터 세트에 걸쳐 모든 환자 정보를 일치시도록 하는 능력을 보장하는 것이 중요합니다. PHI를 포함하는 연구에 내재된, 데이터 보호 절차에 대한 엄격한 준수는 필요한 승인을 획득한 후에 필요하며, PHI는 더 이상 필요하지 않은 후에 파괴되어야 한다는 것을 반복하는 것이 중요합니다.
  4. vm6 수혜자 데이터(2002년 9월-현재) 또는 pben 파일(2000년 9월-2002년 9월)에 액세스하여 코호트에 필요한 환자 식별자를 획득합니다.
    1. 아래 또는 유사한 프로그램을 사용하여 vm6 데이터를 코호트 파일과 일치시다. 이 경우, 코드는 코호트 파일에 이미 있는 주어진 환자 소셜에 대한 환자 의료 기록 번호(MRN)를 찾기 위해 작성된 대로 사용될 수 있다. 나중에 오류를 확인하는 데 도움이 환자 이름과 생년월에 대한 vm6 데이터 그리기 및 코호트 파일에 다른 변수 이름을 사용합니다. PHI를 보호하려면 데이터 요청의 일부로 제공된 공간에 서비스 노드에 환자 식별자와 함께 데이터를 저장합니다(MDR 사용자 설명서 참조).
      참고: MRN은 MDR에서 DOD ID 번호, PATUNIQ 또는 EDIPN이라고 합니다.
      Equation 1
    2. 데이터베이스 항목에 오류가 완전히 없는 것은 아니므로 잠재적인 문제에 대한 프로그램 로그 및 출력을 확인하는 것 외에도 각 주요 단계 후에 오류 검사를 수행합니다. 아래 데이터 단계를 사용하여 위의 코드와 잠재적인 불일치를 검토합니다(환자 파일은 환자/수혜자 소셜에 따라 일치합니다). 코호트 파일(성, 이름)의 이름을 vm6 파일(last_name, first_name)과 비교할 때 처음 세 글자만 일치하여 파일 간의 맞춤법/간격 차이로 발생하는 잘못된 오류를 줄입니다.
      Equation 2
    3. 오류 데이터 파일("확인 이름")을 검토합니다. 문장 부호로 인한 오류를 무시합니다(오라일리 vs. 오라일리). 건강 기록의 수동 검토와 우려의 다른 오류를 확인하거나 중요한 오류가 존재하고 확인이 불가능한 경우 관련 환자 / 환자 정보를 폐기하는 것이 좋습니다.
  5. MDR에서 나머지 필요한 데이터를 추출합니다.
    1. 필요한 경우 vm6ben 파일 (2002 년 9 월 이전의 pben 파일)에서 인종과 성별을 얻고 코호트 파일과 병합하고 위에서 수행 한 오류를 확인하십시오.
      Equation 3
    2. 사망 마스터 파일에서 사망 데이터를 가져오고 코호트 파일과 병합하고 위에서 수행한 오류를 확인합니다.
      Equation 4
    3. 분석에 필요한 추가 데이터 파일을 가져옵니다(데이터 위치 및 유용한 SAS 매크로 및 코드에 대한 MDR 기능 사용자 가이드 참조).
      참고: 데이터는 군 의료 시스템에 의해 직접 제공되었는지 또는 다른 곳에서 전달되었는지 여부에 따라 별도의 파일에 저장되며 군 의료 시스템에 청구됩니다. 예제 파일은 다음과 같습니다.
      CAPER – 2004년도-현재의 직접 진료, 외래 환자 파일
      SADR – 1998-2005년 의 직접 치료, 외래 환자 파일
      SIDR – 1989년부터 현재까지 직접 진료, 입원 환자 입원(직접 치료)
      TEDI – 청구 된 치료, 기관 청구 파일 fy 2001-현재
      HCSRI – 청구 된 치료, 기관 청구 fy 1994-2005
      TEDNI – 청구 된 치료, 비 기관 청구 fy 2001-현재
      HCSRNI – 청구 된 치료, 비 기관 청구 fy 1994-2005
      PDTS – 개별 처방전 fy 2002-현재와 약국 파일

5. 데이터 병합 및 합계 파일 생성

  1. 위의 섹션 4에서 수행한 것처럼 데이터 분석가로부터 데이터를 가져오든 MDR에서 직접 가져온 데이터든 관계없이 데이터 파일을 함께 병합하여 분석 파일을 구성해야 합니다. 프로세스 전반에 걸쳐 앞에서 설명한 대로 오류 검사 및 로그 및 출력 검토를 포함하여 데이터 정확도를 향상시키는 방법을 활용합니다.
    1. 데이터를 병합할 때 오류가 모든 필드에 존재할 수 있기 때문에 가능한 한 두 명 이상의 환자 식별자를 사용하여 강력한 일치(예: 의료 기록 번호 및 생년월일)를 보장합니다. 데이터가 병합된 후 데이터를 검토하여 예상 결과를 확인합니다. 코드를 실행하여 다른 식별자 또는 두 개의 식별자 외에 이름의 처음 세 글자가 일치하는지 확인하는 것이 적절한 일치를 확인하는 데 유용합니까(4.5.1 단계 참조).
      참고: 환자가 해당 기간 동안 결혼한 경우 성은 일치하지 않을 수 있습니다. 아포스트로피 나 간격뿐만 아니라 오타로 인해 이름 필드에 사소한 변형이 존재할 수도 있습니다.
    2. 결과를 가진 환자를 정의하는 것과 같은 프로세스에 있는 말기 단계에서 일치에 특히 주의를 기울이기.
  2. 지수 날짜 이전의 기간으로부터 ICD-9-CM 또는 ICD-10-CM 코드를 사용하여 기준선 혼수염을 추출하고, 환자가 연구에 진입하는 것으로 간주되는 날짜. 일반적으로 색인 날짜 12개월 전에 사용하여 comorbidities를 정의합니다.
    1. 환자가 기준 기간 동안 군 의료 시스템에 대한 자격을 가지고 있는지 확인 (vm6ben 파일에서 매월 확인할 수 있습니다).
    2. 외래 환자 및/또는 입원 환자 파일에서 기준 선 진단 코드를 검색하여 인덱스 날짜 이전의 기준 선 12개월 기간 동안 기준 선연수를 설정합니다. 섹션 1에 설정된 ICD-9-CM 또는 ICD-10-CM 코드를 사용합니다. Elixhauser comorbidities를 사용하는 경우, 필요에 따라 진단 변수 및 파일의 이름을 수정해야합니다, HCUP에서 사용 가능한 소프트웨어를 사용합니다. (https://www.hcup-us.ahrq.gov/toolssoftware/comorbidity/comorbidity.jsp#download)
  3. 1 차 적인 진단으로 심근 경색을 위한 입원과 같은 ICD-9-CM 또는 ICD-10-CM 코드에 의해 정의된 관심의 결과에 대한 색인 날짜 후에 입원 환자 및/또는 입원 환자 파일을 검색합니다 (SIDR에서 410.x1을 검색하십시오).
  4. 관심의 결과를 입증하지 않은 환자에 대한 후속 조치에 대한 컷오프로 모든 환자에 대한 연구 종료 날짜를 설정합니다. 어떤 환자가 연구 종료 전에 검열될 필요가 있는지 결정합니다.
    1. 연구 종료 일을 통해 의료 에 대한 자격을 보장하기 위해 vm6ben 파일을 검색.; 그렇지 않으면 자격을 상실 할 때 환자를 검열하십시오.
    2. 약국의 활성 사용자와 같은 적격성에 관계없이 의료 시스템의 활성 사용자로 연구를 제한하는 것이 중요하다면 데이터 파일 내에서 마지막 건강 관리 연락처 (예 : 마지막 약물 채우기)를 결정하고 환자를 검열하십시오. 그 날짜.
      참고: 사망 후 또는 수혜자가 다른 방식으로 의료 시스템을 종료한 경우 건강 기록에 있을 수 있기 때문에 전화 만남을 사용하는 데 주의하십시오.

6. 국가 사망 지수(NDI)와 일치

  1. 전체 코호트가 확인되면 사망률이 종점인 경우 일치하는 정보를 국가 사망 지수로 보냅니다.
    1. 먼저 MDR 데이터 및 IRB 승인 요청에 NDI와 일치시키려는 의도를 포함합니다. 승인을 확인하고 일치하는 경우 보호된 상태 정보(PHI)를 NDI로 보내기 전에 완료된 모든 데이터 암호화 단계를 완료합니다.
  2. "국가 사망 지수 (NDI) 신청서"와 국가 사망 지수에서 사망 데이터를 요청하는 지침은 여기에서 찾을 수 있습니다 : https://www.cdc.gov/nchs/ndi/index.htm.
  3. 암호로 보호된 CD의 데이터를 야간 우편으로 NDI에 보냅니다. 결과는 약 2주 후에 동일한 방식으로 다시 전송됩니다.
  4. NDI 결과를 받은 후 부분 일치 항목을 검토하여 포함/제외할 수 있습니다.
    1. "제 4 장 - NDI 출력 평가"는 결과 검토에 대한 유용한 개요를 제공하며 동일한 웹 페이지에서 찾을 수 있습니다: https://www.cdc.gov/nchs/ndi/index.htm. 사회 보장 번호의 일치는 일반적으로 가장 강한 일치를 제공합니다.
    2. 필요한 경우, 사회 보장 사망 지수 및 / 또는 재향 군인 업무 수혜자 식별 기록 로케이터 하위 시스템 (BIRLS)에서 사망을 교차 확인하여 정확성을 향상시킵니다. 해외에서 사망한 서비스 회원은 NDI 검색에 나타나지 않지만 MDR 중요 상태 파일 이나 VA BIRLS에서 종종 인식됩니다.
  5. 검토를 완료한 후 사망 파일을 주 코호트 파일과 병합합니다.

7. 데이터 식별 해제

  1. 필요한 모든 정보가 수집되면 PHI를 보호하기 위해 데이터 파일을 식별 해제합니다. "ranuni"를 사용하여 각 환자에 대해 임의의 환자 식별자를 생성합니다(MDR 기능 사용자 설명서 참조). 데이터 파일에서 환자 사회, 의료 기록 번호, 생년월일(계산 연령 후) 등을 제거합니다. 필요하고 승인된 경우 무작위 환자 식별자를 PHI에 안전하게 연결하는 키를 SCE 노드에 저장합니다.

8. 성향 점수 계산18,19,26

  1. 로지스틱 회귀를 사용하여 치료 확률(SAS의 proc logistic)을 모델링합니다.
    1. 데이터 파일(예제에서 "dat")을 지정합니다.
    2. 클래스 문을 사용하여 범주형 변수를 지정합니다. "ref = first"를 사용하여 가장 낮은 값(예: 0)을 참조 값으로 지정합니다.
    3. 모델 문에서 처리 변수를 종속 변수(Rx)로 지정하고 "이벤트"에 대한 값을 치료를 받는 값으로 설정합니다(이 경우 1).
    4. 특히 결과에 대한 예측변수(예: 사망)가 될 수 있는 경우 모델에서 치료를 동변량으로 받을 수 있는 모든 예측 변수를 포함합니다. 용어 간의 상호 작용이 치료에 영향을 미칠 수 있는지 고려하십시오. "*"(예: male*ckd)를 사용하여 모델에 포함하거나 아래 표시된 구문을 사용하여 공변량과 끝에 "@2"를 배치하여 특정 모델에 적합한 2 x 2 상호 작용을 모두 지정합니다.
    5. 출력 문을 사용하여 예측된 치료 확률(prob)이 "ps"로 정의되고 파일에 "ps_data"로 출력되도록 지정합니다.
      Equation 5
      참고 : 모델의 변수 : 남성 : 남성 성 (바이너리), ckd : 만성 신장 질환 (바이너리), 간 : 만성 간 질환 (바이너리), 당뇨병 (바이너리), 대처 : 만성 폐쇄성 폐 질환 (바이너리), chf : 심장 마비 (바이너리), 캐드 : 관상 동맥 질환 (바이너리), cvd: 뇌혈관 질환 (바이너리), 패드 : 말초 동맥 질환 (바이너리), 연령 (연속).
  2. 예측 된 확률 (성향 점수)에서 가중치를 계산합니다. 환자가 치료를 받은 경우 (Rx = 1), 성향 점수 무게는 1/(성향 점수)입니다. 환자가 치료를받지 않은 경우 성향 점수 무게는 1 /(1 - 성향 점수)입니다.
    Equation 6
  3. 성향 점수를 평균 가중치로 나누어 안정화합니다. 아래 코드에서 Proc는 데이터 파일 "m"의 변수 "mn_wt"에 평균 가중치를 출력합니다. 데이터 파일 "m"에서 mn_wt 유지 하는 아래 데이터 집합 다음 각 관찰에 대 한 안정화 된 성향 점수 (st_ps_weight) 계산 합니다.
    Equation 7
  4. 치료 가중치의 역 확률을 적용한 후 균형을 확인합니다.
    1. stddiff 매크로는 SAS에서 가중치를 가중하기 전과 후에 공변량에 대한 계산 표준화 평균 차이를 단순화합니다. 매크로에 대한 코드는 여기에서 찾을 수 있습니다: http://www.lerner.ccf.org/qhs/software/lib/stddiff.sas.
    2. 가중치를 계산하기 전에 표준화된 평균 차이를 계산합니다. 모든 매크로와 마찬가지로 매크로 코드는 호출하기 전에 SAS에서 실행되어야 합니다. 예를 들어 호출 문은 관심 있는 공동 변량과 함께 아래와 같습니다.
      Equation 8
      Inds - 입력 데이터 집합, groupvar - 스터디 그룹을 정의하는 변수, charvars – 범주형 변수, numvars – 연속 변수, stdfmt – 표준화된 차이의 형식, 출력 데이터 집합.
    3. stddiff 매크로를 다시 호출하여 가중치 를 가중한 후 표준화된 평균 차이를 계산합니다. "Wtvar"은 표준화된 성향 점수를 포함하는 변수를 지정하고 매크로 호출 문에 추가됩니다. 표준화된 차이가 모두 0.1보다 작거나 같으면 균형조정이 성공한 것으로 간주됩니다.
      Equation 9
  5. 가중치 전후의 ASD는 표 형식 또는 그래프 형식으로 보고할 수 있습니다. 플롯을 생성하기 위해 SAS 매크로를 활용하는 방법에 대한 자세한 내용은 보충 자료를참조하십시오.
  6. IPTW 조정 된 데이터는 이제 측정 된 confounders의 균형을 보장 한 후 일변량 분석에 사용할 수 있습니다.

9. 결과 모델 작성 및 누적 입사 함수 플롯 생성

  1. 생존 플롯을 생성하기 위해 proc lifetest를 사용하는 것을 포함하여 결과 시간 대 이벤트 분석을 플로팅할 수 있는 몇 가지 방법이 있습니다. 가중치 문을 사용하여 표준화된 성향 가중치를 나타냅니다.
  2. 성향 가중치를 사용하여 cif 플롯을 생성하려면 proc phreg를 사용합니다.
    1. proc phreg에서 동변량 파일을 참조하여 플롯을 생성할 때 사용할 공동 변량값을 지정합니다. 이 경우 동변량 파일에는 1 또는 0일 수 있는 단일 변수 Rx만 포함됩니다.
      Equation 10
    2. 그래픽을 전환합니다. 그래프 또는 파일 형식(jpeg 등) 출력 파일을 지정하려면 필요에 따라 추가 문을 https://support.sas.com/documentation/cdl/en/statug/63962/HTML/default/viewer.htm#statug_odsgraph_sect014.htm.
      Equation 11
    3. proc phreg 구문에서 가중치 문을 사용하여 표준화된 성향 점수 변수를 지정합니다. 누적 입사 함수를 플롯할 수 있도록 기준선 문을 사용하여 기준선 동변량에 대한 값을 지정합니다. "rowid"(이 경우 RX 1 대 0)를 사용하여 플롯에 사용할 계층을 지정합니다. 결과 변수("event")다음에 괄호 안의 숫자는 중도지정해야 하는 변수의 값(들)을 지정하며, 여기에는 중도절단 날짜와 경쟁 이벤트가 포함됩니다. 이 경우 0은 검열되고 1은 실제 이벤트입니다.
      Equation 12

Subscription Required. Please recommend JoVE to your librarian.

Representative Results

IPTW가 완료되면 stddiff 매크로 코드 또는 asdplot 매크로 코드를 사용하여 절대 표준화 된 차이점의 테이블이나 플롯을 각각 생성 할 수 있습니다. 그림 1은 asdplot 매크로를 사용하여 10,000명의 참가자의 대규모 코호트에서 적절한 균형 조정의 예를 보여줍니다. 성향 점수를 적용 한 후, 절대 표준화 된 차이는 크게 감소되었다. 절대 표준화 된 차이에 사용되는 컷오프는 0.1이 자주 사용되며 두 그룹 간의 무시할 만한 차이를 나타내지만 다소 임의적입니다. 작은 코호트에서 적절한 균형을 이루는 것이 더 어렵습니다. 그림 2는 100명의 참가자집단에서 동변량의 균형을 맞추려는 시도가 실패한 결과를 보여줍니다.

표준화된 성향 점수가 생성되면 연구팀은 결과 분석을 진행할 수 있습니다. 생존 분석은 고르지 않은 후속 정보를 가진 참가자를 검열할 필요성으로 인해 종종 사용되며, 도 3은 누적 발생률 함수(CIF) 플롯을 생성하기 위해 표준화된 성향 점수 가중치를 가진 proc phreg의 사용 예를 묘사합니다. CIF 플롯은 시간이 지남에 따라 증가하는 이벤트 수를 설명합니다. 이 경우, 치료되지 않은, 또는 대조군(No Rx)은 더 많은 수의 이벤트를 가지며 치료군(Rx)보다 비교적 더 나쁘다.

Figure 1
그림 1: 성공적인 균형 조정의 예입니다. 큰 코호트(n = 10,000)에서 IPTW는 모든 절대 표준화 된 차이로 공변량의 균형을 0.1 미만으로 줄였습니다. 이 그림의 더 큰 버전을 보려면 여기를 클릭하십시오.

Figure 2
그림 2: 실패한 균형 조정의 예입니다. 작은 코호트(n = 100)에서 IPTW는 0.1보다 큰 많은 절대 표준화 된 차이로 공변량의 균형을 달성 할 수 없었습니다. 이 그림의 더 큰 버전을 보려면 여기를 클릭하십시오.

Figure 3
도 3: 누적 발생률 함수 플롯의 예는 치료 군을 비교한다. 시간이 지남에 따라, 사망률의 누적 부각은 치료되지 않은 그룹 (없음 Rx)에서 더 높더라도, 두 단에서 증가합니다. 따라서, 이 예에서, 처리군은 생존을 향상시켰다. 이 그림의 더 큰 버전을 보려면 여기를 클릭하십시오.

보충 자료. 이 파일을 보려면 여기를 클릭하십시오 (다운로드 오른쪽 버튼을 클릭하십시오).

Subscription Required. Please recommend JoVE to your librarian.

Discussion

대규모 관리 데이터 세트를 사용한 회고적 분석은 무작위 통제 시험이 실현 가능하지 않을 때 효율적이고 비용 효율적인 대안을 제공합니다. 적절한 데이터 세트는 인구와 관심 변수에 따라 달라지지만 MDR은 메디케어 데이터에서 볼 수있는 연령 제한이없는 매력적인 옵션입니다. 모든 데이터 집합에서는 레이아웃 및 데이터 사전에 대해 잘 알고 있어야 합니다. 전체 데이터가 캡처되고 데이터가 정확하게 일치하고 병합되도록 주의를 기울여야 합니다.

진단을 위한 코드는 할당된 진단의 가치를 최대화하기 위하여 ICD-9-CM 및 ICD-10-CM 코딩 시스템의 기존 문헌 및 철저한 이해를 사용하여 정의되어야 합니다. Elixhauser27 또는 정제 된 Charlson comorbidity 인덱스28,29를포함하는 기존의 comorbidity 코드 세트는 관심의 결과에 영향을 미칠 수있는 comorbid 조건을 정의하는 데 사용할 수 있습니다. 마찬가지로, 관리 데이터에서 검증된 코딩 알고리즘을 활용해야 합니다. 광범위한 질병의 정확한 분류를 최대화하기 위해 ICD-9-CM 및 ICD-10-CM 코딩 알고리즘의 최적 사용에 대한 학습이 계속되고 있기 때문에 유효성 검사는 적극적인 연구의 영역으로 남아 있어야합니다.

성향 점수는 모든 회고적 분석에 내재된 편견을 해결하는 데 사용할 수 있습니다. 효과적인 성향 점수 가중치 또는 매칭은 일반적으로 0.1로 설정된 원하는 임계값 이하의 절대 표준화 차이(ASD)를 감소시켜야 합니다. 적절한 균형은 알려진 confounders에 관하여 처리 단의 비교를 지키는 것을 돕고, 적당히 채택된 성향 점수 기술은 성공적으로 무작위예심 결과를 복제하기 위하여 이용되었습니다. 일단 제대로 균형을, 처리 단은 일변량 시간-투-이벤트 또는 그밖 분석과 비교될 수 있습니다.

적절한 밸런싱이 있더라도 잔류 혼란3이발생할 가능성이 있으므로 조사팀은 측정되지 않은 혼란의 영향을 제한해야 합니다. 또한, 치료 선택에 대한 동변량의 영향이 강한 경우, 바이어스는 여전히30남아있을 수 있습니다. 작은 코호트에서 성향 점수는 모든 변수에 대해 0.1 미만의 ASD를 완전히 감소시킬 가능성은 낮으며, 회귀 조정은 잔류불균형(31)을제거하는 데 도움이 될 수 있다. 적절한 균형이 더 이상 보장되지 않을 때 회귀 조정을 하위 그룹 분석에 사용할 수도 있습니다.

올바르게 수행하면, 행정 데이터를 가진 연구는 무작위 임상 시험의 부재에 중요한 임상 질문에 적시에 답변을 제공합니다. 관측 연구에서 모든 편견을 제거하는 것은 불가능하지만 성향 점수를 사용하고 세심한 분석을 유지함으로써 편견이 제한될 수 있습니다.

Subscription Required. Please recommend JoVE to your librarian.

Disclosures

저자는 공개 할 것이 없다.

Acknowledgments

이 간행물에 보고된 연구는 수상 번호 UL1 TR002345의 밑에 건강의 국가 학회의 전진 번역 과학을 위한 국가 센터에 의해 지원되었습니다. 이 내용은 전적으로 저자의 책임이며 반드시 국립 보건원의 공식 견해를 나타내는 것은 아닙니다.

면책 조항 : 또한,이 문서에 표현 된 견해는 저자의 견해이며 미국 정부, 미국 국방부 (DoD) 또는 미국 국방부의 어떤 식으로든 대표되는 것으로 해석되어서는 안됩니다. 육군. 특정 제품 또는 과학 기기의 식별은 과학적 노력의 필수적인 부분으로 간주되며 저자, DoD 또는 구성 요소 기관의 보증 또는 묵시적 보증을 구성하지 않습니다.

Materials

Name Company Catalog Number Comments
CD Burner (for NDI Request)
Computer
Putty.exe Putty.org
SAS 9.4 SAS Institute Cary, NC
WinSCP or other FTP software https://winscp.net/eng/index.php

DOWNLOAD MATERIALS LIST

References

  1. Concato, J., Shah, N., Horwitz, R. I. Randomized, controlled trials, observational studies, and the hierarchy of research designs. New England Journal of Medicine. 342 (25), 1887-1892 (2000).
  2. Austin, P. C., Platt, R. W. Survivor treatment bias, treatment selection bias, and propensity scores in observational research. Journal of Clinical Epidemiology. 63 (2), 136-138 (2010).
  3. Sturmer, T., Wyss, R., Glynn, R. J., Brookhart, M. A. Propensity scores for confounder adjustment when assessing the effects of medical interventions using nonexperimental study designs. Journal of Internal Medicine. 275 (6), 570-580 (2014).
  4. Schermerhorn, M. L., et al. Long-Term Outcomes of Abdominal Aortic Aneurysm in the Medicare Population. New England Journal of Medicine. 373 (4), 328-338 (2015).
  5. Williams, R. J. II, et al. A Propensity-Matched Analysis Between Standard Versus Tapered Oral Vancomycin Courses for the Management of Recurrent Clostridium difficile Infection. Open Forum Infectious Diseases. 4 (4), (2017).
  6. Mitchell, J. D., et al. Impact of Statins on Cardiovascular Outcomes Following Coronary Artery Calcium Scoring. Journal of the American College of Cardiology. 72 (25), 3233-3242 (2018).
  7. Rush, T., McGeary, M., Sicignano, N., Buryk, M. A. A plateau in new onset type 1 diabetes: Incidence of pediatric diabetes in the United States Military Health System. Pediatric Diabetes. 19 (5), 917-922 (2018).
  8. Rhon, D. I., Greenlee, T. A., Marchant, B. G., Sissel, C. D., Cook, C. E. Comorbidities in the first 2 years after arthroscopic hip surgery: substantial increases in mental health disorders, chronic pain, substance abuse and cardiometabolic conditions. British Journal of Sports Medicine. , (2018).
  9. Mitchell, J., Paisley, R., Moon, P., Novak, E., Villines, T. Coronary Artery Calcium Score and Long-term Risk of Death, Myocardial Infarction and Stroke: The Walter Reed Cohort Study. Journal of the American College of Cardiology: Cardiovascular Imaging. , (2017).
  10. McCormick, N., Lacaille, D., Bhole, V., Avina-Zubieta, J. A. Validity of myocardial infarction diagnoses in administrative databases: a systematic review. PLoS ONE. 9 (3), e92286 (2014).
  11. Huo, J., Yang, M., Tina Shih, Y. -C. Sensitivity of Claims-Based Algorithms to Ascertain Smoking Status More Than Doubled with Meaningful Use. Value in Health. , Available from: https://doi.org/10.1016/j.jval.2017.09.002 (2017).
  12. Nayan, M., et al. The value of complementing administrative data with abstracted information on smoking and obesity: A study in kidney cancer. Canadian Urological Association Journal. 11 (6), 167-171 (2017).
  13. Birman-Deych, E., et al. Accuracy of ICD-9-CM codes for identifying cardiovascular and stroke risk factors. Medical Care. 43 (5), 480-485 (2005).
  14. Preen, D. B., Holman, C. D., Spilsbury, K., Semmens, J. B., Brameld, K. J. Length of comorbidity lookback period affected regression model performance of administrative health data. Journal of Clinical Epidemiology. 59 (9), 940-946 (2006).
  15. Rector, T. S., et al. Specificity and sensitivity of claims-based algorithms for identifying members of Medicare+Choice health plans that have chronic medical conditions. Health Services Research. 39 (6 Pt 1), 1839-1857 (2004).
  16. Hernán, M. A., et al. Observational studies analyzed like randomized experiments: an application to postmenopausal hormone therapy and coronary heart disease. Epidemiology (Cambridge, Mass.). 19 (6), 766-779 (2008).
  17. Austin, P. C. The relative ability of different propensity score methods to balance measured covariates between treated and untreated subjects in observational studies. Medical Decision Making. 29 (6), 661-677 (2009).
  18. Robins, J. M., Hernan, M. A., Brumback, B. Marginal structural models and causal inference in epidemiology. Epidemiology. 11 (5), 550-560 (2000).
  19. Robins, J. Marginal structural models. 1997 Proceedings of the American Statistical Association, section on Bayesian statistical science. , 1-10 (1998).
  20. Thoemmes, F., Ong, A. D. A Primer on Inverse Probability of Treatment Weighting and Marginal Structural Models. Emerging Adulthood. 4 (1), 40-59 (2016).
  21. Xu, S., et al. Use of stabilized inverse propensity scores as weights to directly estimate relative risk and its confidence intervals. Value in Health: the Journal of the International Society for Pharmacoeconomics and Outcomes Research. 13 (2), 273-277 (2010).
  22. Cowper, D. C., Kubal, J. D., Maynard, C., Hynes, D. M. A primer and comparative review of major US mortality databases. Annals of Epidemiology. 12 (7), 462-468 (2002).
  23. Skopp, N. A., et al. Evaluation of a methodology to validate National Death Index retrieval results among a cohort of U.S. service members. Annals of epidemiology. 27 (6), 397-400 (2017).
  24. Buck, C. J. 2015 ICD-9-CM for Hospitals, Volumes 1, 2, & 3, Professional Edition. , Elsevier Saunders. (2015).
  25. Buck, C. J. 2018 ICD-10-CM for Hospitals, Professional Edition. , Elsevier Saunders. (2018).
  26. Guo, S., Fraser, W. M. Propensity Score Analysis: Statistical Methods and Applications, Second Edition. , Sage Publications. (2015).
  27. Elixhauser, A., Steiner, C., Harris, D. R., Coffey, R. M. Comorbidity measures for use with administrative data. Medical Care. 36 (1), 8-27 (1998).
  28. Charlson, M. E., Pompei, P., Ales, K. L., MacKenzie, C. R. A new method of classifying prognostic comorbidity in longitudinal studies: development and validation. Journal of Chronic Diseases. 40 (5), 373-383 (1987).
  29. Deyo, R. A., Cherkin, D. C., Ciol, M. A. Adapting a clinical comorbidity index for use with ICD-9-CM administrative databases. Journal of Clinical Epidemiology. 45 (6), 613-619 (1992).
  30. Austin, P. C., Stuart, E. A. The performance of inverse probability of treatment weighting and full matching on the propensity score in the presence of model misspecification when estimating the effect of treatment on survival outcomes. Statistical Methods in Medical Research. 26 (4), 1654-1670 (2017).
  31. Austin, P. C. Balance diagnostics for comparing the distribution of baseline covariates between treatment groups in propensity-score matched samples. Statistics in Medicine. 28 (25), 3083-3107 (2009).

Tags

의학 문제 155 치료 가중치의 역 확률 성향 점수 국가 사망 지수 군 보건 시스템 데이터 저장소 편견 치료 선택 혼란 빅 데이터
군 보건 시스템 데이터 저장소 및 국가 사망 지수를 사용하여 치료 가중치의 역 확률 (성향 점수)
Play Video
PDF DOI DOWNLOAD MATERIALS LIST

Cite this Article

Mitchell, J. D., Gage, B. F.,More

Mitchell, J. D., Gage, B. F., Fergestrom, N., Novak, E., Villines, T. C. Inverse Probability of Treatment Weighting (Propensity Score) using the Military Health System Data Repository and National Death Index. J. Vis. Exp. (155), e59825, doi:10.3791/59825 (2020).

Less
Copy Citation Download Citation Reprints and Permissions
View Video

Get cutting-edge science videos from JoVE sent straight to your inbox every month.

Waiting X
Simple Hit Counter