Waiting
Login processing...

Trial ends in Request Full Access Tell Your Colleague About Jove
Click here for the English version

Medicine

軍事保健システムデータリポジトリと国家死亡指数を用いた治療重み付け(傾向スコア)の逆確率

Published: January 8, 2020 doi: 10.3791/59825

Summary

ランダム化比較試験が実現できない場合、軍事保健システムデータリポジトリのような包括的なヘルスケアデータソースは、回顧分析のための魅力的な代替手段を提供します。国民の死亡指数から死亡率データを組み込み、傾向性重み付けを使用してグループ間の差異のバランスを取ることにより、回顧的な設計に固有のバイアスを減らすことができます。

Abstract

無作為化比較試験が実現不可能な場合、ビッグデータを用いた振り返り研究は、治療選択バイアスのリスクがあるものの、効率的で費用対効果の高い代替手段を提供する。治療選択バイアスは、治療選択が結果に関連する前処理特性に基づいている場合、非ランダム化された研究で発生します。これらの前処理特性、またはコンファウンダーは、結果に対する治療の効果の評価に影響を与えることができる。傾向スコアは、治療グループ間の既知のコンファウンダーのバランスをとることによって、このバイアスを最小限に抑えます。傾向スコアによる階層化、傾向一致、治療重み付け(IPTW)の逆確率など、傾向スコア分析を実行する方法がいくつかあります。ここでは、IPTWを使用して、米国軍事保健システムデータリポジトリ(MDR)内の患者のコホートにおけるベースラインの併用のバランスをとることです。MDRは、入院および外来サービスに関するほぼ完全な情報が適格な受益者のために利用可能である封じ込められたコホートを提供するので、比較的最適なデータソースです。以下に概説するのは、堅牢な死亡データを提供するために、国家死亡指数からの情報を補足するMDRの使用である。また、管理データを使用するための推奨事項も示します。最後に、プロトコルは、既知のコンファウンダーのバランスを取るためにIPTWを使用するためのSASコードを共有し、関心のある結果のための累積発生関数をプロットします。

Introduction

無作為化されたプラセボ対照試験は、治療の有効性を定量化するための最も強力な研究設計であるが、それらは、コストと時間の要件または治療群1間のエクイポイズの欠如のために必ずしも実現可能ではない。このような場合、大規模な管理データ(「ビッグデータ」)を用いたレトロスペクティブコホート設計は、多くの場合、効率的で費用対効果の高い代替手段を提供しますが、ランダム化の欠如は治療選択バイアス2を導入します。治療選択バイアスは、治療決定が目的の結果に関連する前治療特性に依存する場合に、非ランダム化された研究で発生します。これらの特性は、混同因子として知られています。

傾向スコアは、治療グループ間の既知のコンファウンダーのバランスをとることによって、このバイアスを最小限に抑えるので、彼らはますます人気となっています 3.傾向スコアは、外科的アプローチ4と医療レジメン5を比較するために使用されている。最近では、冠状動脈カルシウム6の存在と重症度に基づいて心血管転帰の一次予防におけるスタチンの効果を評価するために、米国軍事保健システムデータリポジトリ(MDR)からのデータの傾向分析を使用しています。

MDRは、研究目的でメディケアおよびVAデータセットよりも頻繁に利用される頻度が低く、現役軍、退職者、その他の国防総省(DoD)の医療受益者とその被扶養者に提供される入院および外来サービスからの包括的な行政および医療請求情報が含まれています。このデータベースには、米国の軍事処理施設またはDoDに請求される民間施設で世界中で提供されるサービスが含まれています。データベースには、2001年10月1日以降の完全な薬局データが含まれています。実験室のデータは2009年から入手可能であるが、軍事治療施設に限定される。MDR内では、コホートは、診断コード(例えば、糖尿病7)または処置コード(例えば、関節鏡手術8)の使用を含む方法で定義されている。または、レジストリなどの適格受益者の外部定義コホートを MDR と照合して、ベースラインおよびフォローアップ データ9を取得することもできます。メディケアとは異なり、MDRはすべての年齢の患者を含む。また、従属を含むため、VA データベースよりも男性に対する偏りも少なくなります。ただし、MDR へのアクセスは制限されています。一般に、VA データベースの使用要件に類似したアクセスを要求できるのは、軍事保健システムのメンバーである調査者だけです。軍事保健システムデータへのアクセスを求める非政府研究者は、政府のスポンサーの監督の下でデータ共有契約を通じて行う必要があります。

管理データ・セットを使用する場合は、管理コーディングの長所と同様に、制限事項に留意することが重要です。コードの感度と特異性は、関連する診断、それが一次診断か二次診断か、または入院ファイルか外来ファイルかによって異なります。急性心筋梗塞の入院コードは、一般に90%10を超える陽性予測値で正確に報告されるが、タバコの使用はしばしば11をアンダーコードされる。このようなアンダーコーディングは、研究の結果12に有意な影響を及ぼす場合とない場合があります。さらに、特定の状態に対するいくつかのコードは、問題13の疾患との相関の様々なレベルで存在し得る。調査チームは、国際疾病分類、第9リビジョン、臨床改変(ICD-9-CM)および/またはICD-10-CMコーディングマニュアルの包括的な文献検索とレビューを行い、適切なコードが研究に含まれていることを確認する必要があります。

診断コードの感度と精度を向上させ、併用条件を定義するために、いくつかの方法を使用できます。ベースラインの併用を確立するには、適切な「ルックバック」期間を含める必要があります。ルックバック期間には、研究エントリー前に提供される入院患者および外来サービスが含まれます。1 年の期間が最適な14になる場合があります。さらに、単一のクレームの代わりに 2 つの別個のクレームを要求すると特異性が高まり、医薬品データを使用してデータを補完すると感度が 15向上します。データの一部に対する手動チャート監査を選択して、コーディング戦略の正確性を検証できます。

問題のコホートに対して併用が定義され、評価されると、治療群間の共変量の違いのバランスを取るために傾向スコアが使用される場合があります。傾向スコアは、患者が既知の共変量に基づいて治療に割り当てられる確率から導き出されます。この傾向治療を考慮すると、共変量が治療割り当てに及ぼす影響を軽減し、結果に対する治療効果の真の推定値を生成するのに役立ちます。傾向スコアは必ずしも多変量モデルに優れた結果を提供するとは限りませんが、傾向スコア3を適用した後に処理されたグループと未処理のグループが同等であるかどうかを評価することができます。研究研究者は、傾向一致または治療重み付け(IPTW)の逆確率の前後の共変量の絶対的な標準化された違いを分析して、既知の共創者がグループ間でバランスが取れていることを確認できます。重要なのは、未知の共同創設者はバランスが取れていない可能性があり、残留混乱の可能性を認識する必要があります。

しかし、適切に実行されると、傾向スコアは、ランダム化比較試験16の結果を予測し、複製することができる強力なツールです。利用可能な傾向スコアの技術のうち、マッチングおよびIPTWは一般に好ましい17である。IPTW内では、患者は治療の傾向または確率によって重み付けされる。安定化ウェイトは一般に生の重みよりも推奨されますが、重量のトリミングは18、19、20、21と考えることができます。

研究グループのバランスが取れたら、興味のある結果になるまでフォローできます。管理データを利用した研究は、読み取り率やイベントまでの時間分析などの結果に関心を持つ場合があります。死亡率に関心のある研究では、軍事保健システムデータリポジトリは、国家死亡指数(NDI)22、23を使用してさらに増強することができる重要なステータスのためのフィールドを含んでいます。NDIは、疾病管理センターが管理する州事務所からの死亡記録情報の一元的なデータベースです。調査官は、死亡証明書に基づいて、基本的な重要な地位および/または特定の死因を要求することができます。

次のプロトコルは、NDI からの死亡率情報で拡張された MDR を使用して管理データベーススタディを実行するプロセスの詳細を示しています。SAS コードと出力例を含む 2 つの治療グループ間のベースライン差をバランスを取るために IPTW を使用する方法について詳しく説明します。

Subscription Required. Please recommend JoVE to your librarian.

Protocol

以下の議定書は、当社の制度的な人間倫理委員会のガイドラインに従っています。

1. コホートの定義

  1. 1)レジストリまたは2)診断または手順のための管理コードなどのMDRから抽出できる計画コホートの包含および除外基準を決定し、明確に定義する(すなわち、3つ以上の患者外来診断または心房細動の1つの入院診断)。
    1. レジストリを使用する場合は、医療記録番号(patuniqおよびedipnとして異なるデータセットに記載されている)、氏名、生年月日、スポンサーの社会保障番号など、軍事保健システムデータリポジトリと正確に一致するための2つ以上の患者識別子を含めます。
      注:個人の健康情報を利用するすべての研究と同様に、安全対策が必要であり、遵守する必要があります。収集プロセス中に適切な暗号化とデータ管理を使用する必要があり、情報はできるだけ早く識別解除する必要があります。
      注:スポンサーの社会保障番号(スポンサー)を参照する場合、すべての患者は、スポンサー、配偶者、および子供の識別子を含む軍のメンバー(またはスポンサー)との関係に関してリストされます。患者が成人し、結婚または離婚すると、関係コードとスポンサーの社会保障番号がデータセットの時間の経過と一度に変化する可能性があることに注意してください。したがって、複数の患者識別子は、正確性を確保するのに役立ちます。
    2. 管理コーディングを使用してコホートを定義する場合は、包括的な文献検索を実行して、対象のコードを検証する可能性のある以前の研究を特定します。ICD-9-CM24および/または ICD-10-CM25マニュアルを参照して、コード定義と隣接コードを明確にし、適切な範囲のコードが使用されていることを確認します。さらに、マニュアルに含まれている相互参照テーブルを確認して、包含/除外の追加コードを検討してください。以前の検証調査には、さまざまな管理コーディング戦略に対する正の予測値、感度、特異性のレポートが含まれています。これらは、コホート選択の最適化と結果の識別に役立ちます。
  2. 目的のコホートまたはその他の除外基準に制限 (年齢など) があるかどうかを判断します。
  3. ベースライン共変量の収集 (通常は管理データ調査で 12 か月) および研究終了日のインデックス日付より前の時間を含むように、研究期間を定義します。

2. 共変量と結果の定義

  1. 上記の手順 1.1.2 で行ったように、文献検索および ICD-9-CM24および/または ICD-10-CM25マニュアルの使用を通じて、混乱状態の管理コードを定義します。
  2. 人口統計、投薬、検査室データなど、その他の必要な共変量を決定します。
  3. MDR データ ディクショナリで使用可能なデータ フィールドを確認するには、 https://health.mil/Military-Health-Topics/Technology/Support-Areas/MDR-M2-ICD-Functional-References-and-Specification-Documents

3. MDR の要求の送信

  1. 機関審査委員会の承認を得る。
  2. データ共有アグリーメント アプリケーションを完成させる方法: https://health.mil/Military-Health-Topics/Privacy-and-Civil-Liberties/Submit-a-Data-Sharing-Application?type=All#RefFeed。アプリケーションの一部として、DRT軍事保健システムデータリポジトリ(MDR)抽出ワークシート(アプリケーションフォームからリンク)で要求されるデータフィールドとファイルを指定します。チームが生データを提供するデータ アナリストを要求しているか、チームが MDR に直接アクセスするかを指定します。さらに、要求が 1 回限りのデータ プル用であるか、通常のプルを毎日、毎月、または毎年要求するかを指定します。
    注:任意の方法でMDRデータを取得するには、通常、調査チームのメンバーである政府職員(現役軍またはGS)であるスポンサーが必要です。
  3. MDR に直接アクセスする場合は、次の https://health.mil/Military-Health-Topics/Technology/Support-Areas/MDR-M2-ICD-Functional-References-and-Specification-Documents にある「MDR 認証要求フォーム」と「MDR CS 2875 フォーム」に記入してください。

4. MDR へのアクセスと関連データの抽出

  1. MDR に直接アクセスする場合は、「MDR ユーザーズ ガイド」および「MDR 機能ガイド」に記載されているソフトウェア要件や SAS プログラムの例など、MDR へのアクセスと使用に関する手順に従ってくださいhttps://health.mil/Military-Health-Topics/Technology/Support-Areas/MDR-M2-ICD-Functional-References-and-Specification-Documents。
    注: ファイルは SAS 形式で保存され、一般的に putty.exe と ftp プログラムを使用して unix シェルを介してアクセスされます。SAS に関する知識が必要です。
  2. MDR のセットアップの有用な概要については、「MHS データhttps://health.mil/Reference-Center/Publications/2012/10/10/Guide-for-DoD-Researchers-on-Using-MHS-Dataの使用に関する DOD 研究者向け DOD ガイド」を参照してください。
  3. 手順 2.3 で行ったように、使用可能なすべてのデータ ファイルの詳細については、MDR データ ディクショナリhttps://health.mil/Military-Health-Topics/Technology/Support-Areas/MDR-M2-ICD-Functional-References-and-Specification-Documents確認してください。
    注: すべてのデータ ファイルに、照合/マージ用のすべての患者識別子が含まれているわけではありません。データ ディクショナリは、各データ ファイルで使用できる識別子の一覧に役立ちます。例えば、薬局情報を抽出するには、DOD ID番号が「パチュニク」または「edipn」とも呼ばれ、必要です。したがって、データ マイニング ステップで適切な患者識別子をすべて持つことは、複数年および複数のデータセットにわたってすべての患者情報を一致させる能力を確保することが重要です。PHIを含む研究に内在する研究には、必要な承認を得た後にデータ保護手順を厳格に遵守する必要があり、PHIは不要になった後に破壊されるべきであることを繰り返し述べることが重要です。
  4. vm6 受益者データ (2002 年 9 月) または pben ファイル (2000 年 9 月から 2002 年 9 月) にアクセスして、コホートに必要な患者識別子を取得します。
    1. 以下のマクロまたは同様のプログラムを使用して、vm6 データをコホート ファイルに一致させます。この場合、コードは、コホートファイルに既に存在する特定の患者の社会の患者の医療記録番号(MRN)を見つけるために書かれたように使用することができます。後でエラーをチェックできるように、患者名と生年月日に vm6 データ描画ファイルとコホート ファイルで異なる変数名を使用します。PHI を保護するには、データ要求の一部として提供されるスペースに、サービス・ノードに患者 ID を持つデータを保管します (MDR ユーザーズ・ガイドを参照)。
      注: MRN は、MDR では DOD ID 番号、PATUNIQ または EDIPN と呼ばれます。
      Equation 1
    2. データベース エントリに完全にエラーが発生することはないため、プログラム ログと出力の潜在的な懸念事項を確認するだけでなく、各主要な手順の後にエラー チェックを実行します。上記のデータステップを使用して、上記のコードとの潜在的な不一致を確認します(患者ファイルは患者/受益者の社会に基づいて照合されます)。コホート ファイル (姓、名) の名前を vm6 ファイル (last_name、first_name) と比較する場合は、最初の 3 文字のみに一致して、ファイル間のスペル/間隔の違いで発生する誤ったエラーを減らすことができます。
      Equation 2
    3. エラー データ ファイル ("小切手名") を確認します。句読点によって引き起こされるエラーを無視します (オライリー対オライリー)。重大なエラーが存在し、検証が不可能な場合は、健康記録の手動レビューに関する他の問題のエラーを確認するか、関連する患者/患者情報を破棄することを検討してください。
  5. MDR から残りの必要なデータを抽出します。
    1. 必要に応じて、vm6ben ファイル (2002 年 9 月より前の pben ファイル) から人種と性別を取得し、コホート ファイルとマージして、上記のようにエラーを確認します。
      Equation 3
    2. デス マスター ファイルから死亡データを取得し、コホート ファイルとマージして、上記のエラーを確認します。
      Equation 4
    3. 分析に必要な追加のデータ ファイルを取得します (データの場所と追加の有用な SAS マクロとコードについては、「MDR 機能ユーザーズ ガイド」を参照してください)。
      注:データは、それが直接軍事医療システムによって提供されたか、他の場所に提供され、軍事医療システムに請求されたかに応じて、別々のファイルに格納されます。ファイルの例を以下に示します。
      CAPER – 直接ケア、2004年度からの外来ファイル
      SADR – 1998年から2005年の直接ケア、外来ファイル
      SIDR – 1989年から直接ケア、入院(直接ケア)
      TEDI – 請求済みケア,制度的請求ファイル 2001年度~現在
      HCSRI – 請求済みケア、1994~2005年度の制度的請求
      TEDNI – 請求済みケア、非制度的請求 2001年~現在
      HCSRNI – 請求対象ケア、非制度的請求 1994~2005年
      PDTS – 個々の処方箋を持つ薬局ファイル 2002年~現在

5. データのマージと要約ファイルの構築

  1. データがデータアナリストから取得されるか、上記のセクション4で行われたようにMDRから直接取得されるかにかかわらず、データファイルは合計してマージして分析ファイルを形成する必要があります。プロセス全体を通じて、前に説明したように、エラーチェックやログと出力のレビューなど、データの精度を向上させる方法を使用します。
    1. データをマージする場合は、任意のフィールドにエラーが存在する可能性があるため、可能な限り少なくとも 2 つの患者識別子を使用して、強力な一致 (医療記録番号や生年月日など) を確保します。データのマージ後、データを確認して、期待どおりの結果を確認します。コードを実行して、別の識別子または 2 に加えて、名前の最初の 3 文字が正しい一致を確認するのに役立つことを確認します (手順 4.5.1 を参照)。
      注:患者が問題の期間中に結婚していた場合、姓が一致しない場合があります。アポストロフィや間隔、入力ミスが原因で、名前フィールドに小さなバリエーションが存在する場合もあります。
    2. 結果を持っていた患者を定義するなど、プロセスの末端ステップでのマッチに特に注意を払ってください。
  2. 指標日付より前の期間からICD-9-CMまたはICD-10-CMコードを用いてベースラインの併用を抽出し、患者が研究に入ると考えられる日付。一般に、インデックス日付の 12 か月前に使用して、併用を定義します。
    1. 患者がベースライン期間中に軍事医療システムの資格を持っていたことを確認します(vm6benファイルで毎月検証できます)。
    2. 外来ファイルや入院ファイル内の検索ベースライン診断コードを使用して、インデックス日付の 12 か月前のベースラインの併用を確立します。セクション 1 で確立された ICD-9-CM または ICD-10-CM コードを使用します。Elixhauser の併用を使用する場合は、HCUP から利用可能なソフトウェアを使用し、必要に応じて診断変数とファイルの名前を変更してください。(https://www.hcup-us.ahrq.gov/toolssoftware/comorbidity/comorbidity.jsp#download)
  3. 一次診断として心筋梗塞の入院など、ICD-9-CMまたはICD-10-CMコードで定義された関心の結果について、指標日以降の入院ファイルや入院ファイルを検索します(SIDRで410.x1を検索)。
  4. 関心のある結果を実証していない患者のフォローアップのカットオフとして、すべての患者の研究終了日を設定します。研究終了前に打ち切る必要がある患者を決定します。
    1. 調査終了日を通じて医療の適格性を確認するために vm6ben ファイルを検索します。それ以外の場合は、適格性の喪失時に患者を検閲する。
    2. 薬局のアクティブユーザーなど、適格性に関係なく医療システムのアクティブユーザーに研究を制限することが重要な場合は、データファイル内の最後のヘルスケアコンタクト(最後の投薬充填など)を決定し、患者を打ち切ります。その日付。
      注:死亡後、または受益者が別の方法で医療システムを終了した場合は、電話での出会いに注意してください。

6. 国民死亡指数(NDI)とのマッチング

  1. 完全なコホートが特定されたら、死亡率がエンドポイントである場合に照合するための情報を国家死亡指数に送信します。
    1. まず、MDR データと IRB 承認の要求に NDI に一致させる意図を含めます。保護された正常性情報 (PHI) を NDI に送信して照合する前に、承認を確認し、完了したすべてのデータ暗号化手順を完了します。
  2. 「国民死亡指数(NDI)申請書」と国民死亡指数から死亡データを要求する方法は、以下のhttps://www.cdc.gov/nchs/ndi/index.htm見つけることができます。
  3. パスワードで保護された CD のデータを夜間メールで NDI に送信します。結果は約2週間後に同じ方法で返送されます。
  4. NDI 結果を受信したら、部分的な一致を確認して、包含/除外の可能性を確認します。
    1. 「第 4 章 NDI 出力の評価」は、結果の確認に役立つ概要を示し、同じ Web ページで見つけることができます: https://www.cdc.gov/nchs/ndi/index.htm。社会保障番号の一致は、一般的に最も強い一致を提供します。
    2. 必要に応じて、社会保障死亡指数および/または退役軍人事務受益者識別記録ロケータサブシステム(BIRLS)の死亡をクロスチェックして、精度を向上させます。海外で死亡したサービスメンバーはNDI検索には表示されない可能性が高いが、MDRの重要なステータスファイルまたはVA BIRLSで認識されることが多いことに注意してください。
  5. レビューを完了した後、死のファイルをメインコホートファイルとマージします。

7. データの識別解除

  1. 必要な情報がすべて取得されたら、PHI の保護に役立つデータ ファイルを識別解除します。「ラドゥニ」を使用して各患者のランダムな患者識別子を生成します(MDR機能ユーザーズガイドを参照)。患者の社会、医療記録番号、生年月日(計算年齢以降)などをデータファイルから削除します。必要に応じて(および承認)、ランダムな患者識別子をPHIに安全にリンクするキーをSCEノードに安全に保管します。

8. 傾向スコアの計算18,19,26

  1. ロジスティック回帰を使用して、治療の確率をモデル化します (SAS のプロセス ロジスティック)。
    1. データ ファイル (この例では "dat") を指定します。
    2. クラス・ステートメントを使用して、カテゴリー変数を指定します。参照値として最小値 (0 など) を指定するには、"ref = first" を使用します。
    3. model ステートメントで、処理変数を従属変数 (Rx) として指定し、"event" の値を処理を受け取るための値 (この場合は 1) として設定します。
    4. 特に結果の予測変数(死亡など)である場合は、モデルに共変量として治療を受ける可能性のある予測変数を含めます。用語間の相互作用が治療に影響を与える可能性があるかどうかを検討します。"*" (male*ckd など) を使用してモデルに含めるか、次に示す構文を使用して、特定のモデルに応じて 2 x 2 の相互作用をすべて指定するには、最後に共変量と "@2" の間に "|" を配置します。
    5. 出力ステートメントを使用して、予測治療確率 (prob) が "ps" で定義され、ファイル "ps_data" に出力されることを指定します。
      Equation 5
      注:モデル内の変数:男性の性別(バイナリ)、ckd:慢性腎臓病(バイナリ)、肝臓:慢性肝疾患(バイナリ)、糖尿病(バイナリ)、コップ:慢性閉塞性肺疾患(バイナリ)、chf:心不全(バイナリ)、cad:冠状動脈疾患(バイナリ)、cvd:脳血管疾患(バイナリ)、パッド:末梢動脈疾患(バイナリ)、年齢(連続)。
  2. 予測確率 (傾向スコア) から重みを計算します。患者が治療を受けた場合(Rx = 1)、傾向スコア重量は1/(傾向スコア)である。患者が治療を受けなかった場合、傾向スコアの重量は1/(1 - 傾向スコア)です。
    Equation 6
  3. 平均重量で割って傾向スコアを安定させます。次のコードでは、Proc は平均ウェイトをデータ ファイル "m" の変数 "mn_wt" に出力することを意味します。データ ファイル "m" のmn_wtを保持する下のデータ セットは、各観測値の安定化傾向スコア (st_ps_weight) を計算します。
    Equation 7
  4. 治療重み付けの逆確率を適用した後、バランスを確認します。
    1. stddiff マクロは、SAS での重み付けの前後の共変量の標準化平均差の計算を簡略化します。マクロのコードは、 http://www.lerner.ccf.org/qhs/software/lib/stddiff.sasにあります。
    2. 重み付け前に標準化平均差を計算します。すべてのマクロと同様に、マクロ コードは呼び出す前に SAS で実行する必要があります。呼び出しステートメントの例は、対象の共変量を含む以下の通りです。
      Equation 8
      Inds - 入力データセット、グループvar - 研究グループを定義する変数、charvars - カテゴリ変数、numvars - 連続変数、stdfmt - 標準化された差の形式、出力データセット。
    3. stddiff マクロを再度呼び出して、重み付け後の標準化平均差を計算します。"Wtvar" は、標準化された傾向スコアを含む変数を指定し、マクロ呼び出しステートメントに追加します。標準化された差異がすべて 0.1 以下の場合、バランシングは成功したと見なされます。
      Equation 9
  5. 重み付けの前後の ASD は、表形式またはグラフ形式で報告できます。SAS マクロを使用してプロットを生成する方法については、補足資料を参照してください。
  6. IPTW調整データは、測定されたコンファウンダーのバランスを確保した後、単変量解析に使用できるようになりました。

9. 結果モデルの作成と累積発生率関数のプロットの生成

  1. 結果として得られる事象までの時間分析をプロットする方法はいくつかあります。重みステートメントを使用して、標準化された傾向ウェイトを示します。
  2. 傾向ウェイトを使用して cif プロットを生成するには、proc phreg を使用します。
    1. proc phreg では、共変量ファイルを参照して、プロットの生成時に使用する共変量値を指定します。この場合、共変量ファイルには単一の変数 Rx (1 または 0) のみが含まれます。
      Equation 10
    2. グラフィックスをオンに切り替えます。必要に応じて追加のステートメントを使用して、グラフまたはファイルの種類の出力ファイルを指定します (jpeg など、https://support.sas.com/documentation/cdl/en/statug/63962/HTML/default/viewer.htm#statug_odsgraph_sect014.htm参照してください)。
      Equation 11
    3. proc phreg 構文では、weight ステートメントを使用して標準化傾向スコア変数を指定します。累積発生関数をプロットできるように、ベースラインステートメントを使用してベースライン共変量の値を指定します。「rowid」(この場合は RX 1 対 0) を使用して、プロットに使用する階層を指定します。結果変数 ("event") の後の括弧内の数字は、打ち切り日と競合するイベントを含む必要がある打ち切り記号付き変数の値を指定します。この場合、0 は打ち切られ、1 は真のイベントです。
      Equation 12

Subscription Required. Please recommend JoVE to your librarian.

Representative Results

IPTW が完了すると、絶対標準化された相違点のテーブルまたはプロットを、それぞれ stddiff マクロ コードまたは asdplot マクロ コードを使用して生成できます。図1は、asdplotマクロを使用して10,000人の参加者の大規模なコホートにおける適切なバランスの例を示しています。傾向スコアの適用後、絶対標準化された差異は大幅に減少した。絶対的な標準化された差に使用されるカットオフはやや任意ですが、0.1が頻繁に使用され、2つのグループ間のわずかな違いを示します。小さなコホートでは、適切なバランスを取ることはより困難です。図 2は、100 人の参加者のコホートで共変量のバランスをとろうとした場合の失敗した結果を示しています。

標準化された傾向スコアが生成されると、研究チームは結果分析を進めることができます。生存分析は、不均等なフォローアップ情報を持つ参加者を検閲する必要性のためにしばしば採用され、図3は、累積発生関数(CIF)プロットを生成するために標準化された傾向スコアウェイトを持つproc phregの使用例を示しています。CIF プロットは、時間の経過に伴うイベントの数の増加を示しています。この場合、未処理または制御グループ (Rx なし) はイベントの数が多く、処理されたグループ (Rx) よりも比較的悪くなります。

Figure 1
図 1: 正常なバランシングの例大規模なコホート(n = 10,000)では、IPTWは、0.1未満に減少するすべての絶対標準化された差と共変量のバランスを達成しました。この図の大きなバージョンを表示するには、ここをクリックしてください。

Figure 2
図 2: バランシングが失敗した例小さなコホート(n = 100)では、IPTWは0.1より大きい多くの絶対的な標準化された差が残っている共変量のバランスを達成できませんでした。この図の大きなバージョンを表示するには、ここをクリックしてください。

Figure 3
図3:治療群を比較した累積発生率関数プロットの例。時間が経つにつれて、死亡率の累積発生率は両方のグループで増加するが、それは未治療の群(No Rx)で高い。したがって、この例では、処理された群は生存率を改善した。この図の大きなバージョンを表示するには、ここをクリックしてください。

補足資料。このファイルを表示するには、ここをクリックしてください (右クリックしてダウンロードしてください)。

Subscription Required. Please recommend JoVE to your librarian.

Discussion

大規模な管理データセットを使用したレトロスペクティブ解析は、ランダム化比較試験が実現できない場合に、効率的で費用対効果の高い代替手段を提供します。適切なデータセットは、対象となる人口と変数によって異なりますが、MDR はメディケア データに表示される年齢制限を持たない魅力的なオプションです。どのデータセットでも、そのレイアウトとデータディクショナリに精通することが重要です。完全なデータがキャプチャされ、データが正確に一致してマージされるように注意する必要があります。

診断のコードは、既存の文献を使用して定義し、割り当てられた診断の価値を最大化するために、ICD-9-CMおよびICD-10-CMコーディングシステムを完全に理解する必要があります。Elixhauser27または洗練されたチャールソン併用指数28、29を含む既存の併用コードのセットは、関心のある結果に影響を与える可能性のある併用条件を定義するために使用することができる。同様に、管理データ内の検証済みのコーディング アルゴリズムを利用する必要があります。ICD-9-CMおよびICD-10-CM符号化アルゴリズムの最適な使用に関する学習が続いているため、検証は積極的な研究の領域であり続け、広範囲の疾患の正確な分類を最大化する必要があります。

傾向スコアは、任意の振り返り分析に固有のバイアスに対処するために使用できます。効果的な傾向スコアの重み付けまたは一致は、通常 0.1 に設定された目的のしきい値を下回る絶対標準化差(ASD)を減らす必要があります。適切なバランスは、既知のコンファウンダーに関する治療群の比較可能性を確保するのに役立ち、適切に採用された傾向スコア技術は、無作為化試験結果を正常に複製するために使用されている。適切にバランスが取れたら、治療群を一変量事象または他の分析と比較することができる。

適切なバランスをとっても、残留混乱3の可能性があるので、調査チームは未測定の共創者の影響を制限する必要があります。さらに、共変量が治療選択に及ぼす影響が強い場合、偏りは依然として30のままである。小さなコホートでは、傾向スコアがすべての変数に対して0.1未満のASDを完全に減少させる可能性は低く、残差不均衡31を除去するために回帰調整を採用することができます。回帰調整は、適切なバランスが保証されなくなった場合のサブグループ分析でも使用できます。

正しく行われると、行政データを使用した研究は、無作為化された臨床試験がない場合に重要な臨床問題に対するタイムリーな答えを提供します。観測研究からすべてのバイアスを取り除くことは不可能ですが、傾向スコアを使用し、細心の注意を払って分析することでバイアスを制限することができます。

Subscription Required. Please recommend JoVE to your librarian.

Disclosures

著者たちは何も開示する必要はない。

Acknowledgments

この出版物で報告された研究は、国立衛生研究所の翻訳科学を進める国立センターによって支援されました。コンテンツは、著者のみ責任であり、必ずしも国立衛生研究所の公式見解を表すものではありません。

免責事項:さらに、この記事で表明された見解は著者のものであり、米国政府、米国国防総省(DoD)、または米国国務省のいかなる方法でも表すと解釈されるべきではありません。軍。特定の製品または科学的な機器の識別は、科学的努力の不可欠な部分と見なされ、著者、DoD、または任意のコンポーネント機関の一部に対する支持または黙示的な支持を構成するものではありません。

Materials

Name Company Catalog Number Comments
CD Burner (for NDI Request)
Computer
Putty.exe Putty.org
SAS 9.4 SAS Institute Cary, NC
WinSCP or other FTP software https://winscp.net/eng/index.php

DOWNLOAD MATERIALS LIST

References

  1. Concato, J., Shah, N., Horwitz, R. I. Randomized, controlled trials, observational studies, and the hierarchy of research designs. New England Journal of Medicine. 342 (25), 1887-1892 (2000).
  2. Austin, P. C., Platt, R. W. Survivor treatment bias, treatment selection bias, and propensity scores in observational research. Journal of Clinical Epidemiology. 63 (2), 136-138 (2010).
  3. Sturmer, T., Wyss, R., Glynn, R. J., Brookhart, M. A. Propensity scores for confounder adjustment when assessing the effects of medical interventions using nonexperimental study designs. Journal of Internal Medicine. 275 (6), 570-580 (2014).
  4. Schermerhorn, M. L., et al. Long-Term Outcomes of Abdominal Aortic Aneurysm in the Medicare Population. New England Journal of Medicine. 373 (4), 328-338 (2015).
  5. Williams, R. J. II, et al. A Propensity-Matched Analysis Between Standard Versus Tapered Oral Vancomycin Courses for the Management of Recurrent Clostridium difficile Infection. Open Forum Infectious Diseases. 4 (4), (2017).
  6. Mitchell, J. D., et al. Impact of Statins on Cardiovascular Outcomes Following Coronary Artery Calcium Scoring. Journal of the American College of Cardiology. 72 (25), 3233-3242 (2018).
  7. Rush, T., McGeary, M., Sicignano, N., Buryk, M. A. A plateau in new onset type 1 diabetes: Incidence of pediatric diabetes in the United States Military Health System. Pediatric Diabetes. 19 (5), 917-922 (2018).
  8. Rhon, D. I., Greenlee, T. A., Marchant, B. G., Sissel, C. D., Cook, C. E. Comorbidities in the first 2 years after arthroscopic hip surgery: substantial increases in mental health disorders, chronic pain, substance abuse and cardiometabolic conditions. British Journal of Sports Medicine. , (2018).
  9. Mitchell, J., Paisley, R., Moon, P., Novak, E., Villines, T. Coronary Artery Calcium Score and Long-term Risk of Death, Myocardial Infarction and Stroke: The Walter Reed Cohort Study. Journal of the American College of Cardiology: Cardiovascular Imaging. , (2017).
  10. McCormick, N., Lacaille, D., Bhole, V., Avina-Zubieta, J. A. Validity of myocardial infarction diagnoses in administrative databases: a systematic review. PLoS ONE. 9 (3), e92286 (2014).
  11. Huo, J., Yang, M., Tina Shih, Y. -C. Sensitivity of Claims-Based Algorithms to Ascertain Smoking Status More Than Doubled with Meaningful Use. Value in Health. , Available from: https://doi.org/10.1016/j.jval.2017.09.002 (2017).
  12. Nayan, M., et al. The value of complementing administrative data with abstracted information on smoking and obesity: A study in kidney cancer. Canadian Urological Association Journal. 11 (6), 167-171 (2017).
  13. Birman-Deych, E., et al. Accuracy of ICD-9-CM codes for identifying cardiovascular and stroke risk factors. Medical Care. 43 (5), 480-485 (2005).
  14. Preen, D. B., Holman, C. D., Spilsbury, K., Semmens, J. B., Brameld, K. J. Length of comorbidity lookback period affected regression model performance of administrative health data. Journal of Clinical Epidemiology. 59 (9), 940-946 (2006).
  15. Rector, T. S., et al. Specificity and sensitivity of claims-based algorithms for identifying members of Medicare+Choice health plans that have chronic medical conditions. Health Services Research. 39 (6 Pt 1), 1839-1857 (2004).
  16. Hernán, M. A., et al. Observational studies analyzed like randomized experiments: an application to postmenopausal hormone therapy and coronary heart disease. Epidemiology (Cambridge, Mass.). 19 (6), 766-779 (2008).
  17. Austin, P. C. The relative ability of different propensity score methods to balance measured covariates between treated and untreated subjects in observational studies. Medical Decision Making. 29 (6), 661-677 (2009).
  18. Robins, J. M., Hernan, M. A., Brumback, B. Marginal structural models and causal inference in epidemiology. Epidemiology. 11 (5), 550-560 (2000).
  19. Robins, J. Marginal structural models. 1997 Proceedings of the American Statistical Association, section on Bayesian statistical science. , 1-10 (1998).
  20. Thoemmes, F., Ong, A. D. A Primer on Inverse Probability of Treatment Weighting and Marginal Structural Models. Emerging Adulthood. 4 (1), 40-59 (2016).
  21. Xu, S., et al. Use of stabilized inverse propensity scores as weights to directly estimate relative risk and its confidence intervals. Value in Health: the Journal of the International Society for Pharmacoeconomics and Outcomes Research. 13 (2), 273-277 (2010).
  22. Cowper, D. C., Kubal, J. D., Maynard, C., Hynes, D. M. A primer and comparative review of major US mortality databases. Annals of Epidemiology. 12 (7), 462-468 (2002).
  23. Skopp, N. A., et al. Evaluation of a methodology to validate National Death Index retrieval results among a cohort of U.S. service members. Annals of epidemiology. 27 (6), 397-400 (2017).
  24. Buck, C. J. 2015 ICD-9-CM for Hospitals, Volumes 1, 2, & 3, Professional Edition. , Elsevier Saunders. (2015).
  25. Buck, C. J. 2018 ICD-10-CM for Hospitals, Professional Edition. , Elsevier Saunders. (2018).
  26. Guo, S., Fraser, W. M. Propensity Score Analysis: Statistical Methods and Applications, Second Edition. , Sage Publications. (2015).
  27. Elixhauser, A., Steiner, C., Harris, D. R., Coffey, R. M. Comorbidity measures for use with administrative data. Medical Care. 36 (1), 8-27 (1998).
  28. Charlson, M. E., Pompei, P., Ales, K. L., MacKenzie, C. R. A new method of classifying prognostic comorbidity in longitudinal studies: development and validation. Journal of Chronic Diseases. 40 (5), 373-383 (1987).
  29. Deyo, R. A., Cherkin, D. C., Ciol, M. A. Adapting a clinical comorbidity index for use with ICD-9-CM administrative databases. Journal of Clinical Epidemiology. 45 (6), 613-619 (1992).
  30. Austin, P. C., Stuart, E. A. The performance of inverse probability of treatment weighting and full matching on the propensity score in the presence of model misspecification when estimating the effect of treatment on survival outcomes. Statistical Methods in Medical Research. 26 (4), 1654-1670 (2017).
  31. Austin, P. C. Balance diagnostics for comparing the distribution of baseline covariates between treatment groups in propensity-score matched samples. Statistics in Medicine. 28 (25), 3083-3107 (2009).

Tags

医学、問題155、治療重み付けの逆確率、傾向スコア、国家死亡指数、軍事保健システムデータリポジトリ、バイアス、治療選択、混乱、ビッグデータ
軍事保健システムデータリポジトリと国家死亡指数を用いた治療重み付け(傾向スコア)の逆確率
Play Video
PDF DOI DOWNLOAD MATERIALS LIST

Cite this Article

Mitchell, J. D., Gage, B. F.,More

Mitchell, J. D., Gage, B. F., Fergestrom, N., Novak, E., Villines, T. C. Inverse Probability of Treatment Weighting (Propensity Score) using the Military Health System Data Repository and National Death Index. J. Vis. Exp. (155), e59825, doi:10.3791/59825 (2020).

Less
Copy Citation Download Citation Reprints and Permissions
View Video

Get cutting-edge science videos from JoVE sent straight to your inbox every month.

Waiting X
Simple Hit Counter