Waiting
Login processing...

Trial ends in Request Full Access Tell Your Colleague About Jove
Click here for the English version

Medicine

Probabilité inverse de pondération du traitement (score de propension) à l'aide du référentiel de données du système de santé militaire et de l'indice national de décès

Published: January 8, 2020 doi: 10.3791/59825

Summary

Lorsque des essais contrôlés randomisés ne sont pas réalisables, une source complète de données sur les soins de santé comme le Dépôt de données du système de santé militaire constitue une solution de rechange intéressante pour les analyses rétrospectives. L'intégration des données sur la mortalité de l'indice national de mortalité et l'équilibre entre les groupes utilisant la pondération de la propension aident à réduire les biais inhérents aux conceptions rétrospectives.

Abstract

Lorsque des essais contrôlés randomisés ne sont pas réalisables, les études rétrospectives utilisant des données volumineuses constituent une solution de rechange efficace et rentable, bien qu'elles soient à risque de biais de sélection du traitement. Le biais de sélection de traitement se produit dans une étude non randomisée quand la sélection de traitement est basée sur des caractéristiques de pré-traitement qui sont également associées aux résultats. Ces caractéristiques de pré-traitement, ou les confusions, peuvent influencer l'évaluation de l'effet d'un traitement sur les résultats. Les scores de propension minimisent ce biais en équilibrant les confusions connues entre les groupes de traitement. Il existe quelques approches pour effectuer des analyses de score de propension, y compris la stratification par le score de propension, l'appariement de la propension et la probabilité inverse de pondération du traitement (IPTW). Décrit ici est l'utilisation de l'IPTW pour équilibrer les comorbidités de base dans une cohorte de patients au sein du dépôt de données du système de santé militaire des États-Unis (MDR). Le MDR est une source de données relativement optimale, car il fournit une cohorte contenue dans laquelle des renseignements presque complets sur les services aux patients hospitalisés et externes sont disponibles pour les bénéficiaires admissibles. L'utilisation du MDR, complétée par des renseignements tirés de l'indice national de mortalité, est décrite ci-dessous. Sont également fournies des suggestions pour l'utilisation des données administratives. Enfin, le protocole partage un code SAS pour l'utilisation de l'IPTW pour équilibrer les facteurs de confusion connus et tracer la fonction d'incidence cumulative pour le résultat de l'intérêt.

Introduction

Les essais randomisés et contrôlés par placebo sont la conception la plus solide de l'étude pour quantifier l'efficacité du traitement, mais ils ne sont pas toujours réalisables en raison des coûts et des délais ou d'un manque d'équipemententre les groupes de traitement1. Dans ces cas, une conception de cohorte rétrospective utilisant des données administratives à grande échelle (« big data ») offre souvent une solution de rechange efficace et rentable, bien que l'absence de randomisation introduise un biais de sélection de traitement2. Le biais de sélection de traitement se produit dans les études non randomisées quand la décision de traitement dépend des caractéristiques de pré-traitement qui sont associées aux résultats de l'intérêt. Ces caractéristiques sont connues sous le nom de facteurs de confusion.

Parce que les scores de propension minimisent ce biais en équilibrant les confusions connues entre les groupes de traitement, ils sont devenus de plus en plus populaires3. Les scores de propension ont été utilisés pour comparer les approches chirurgicales4 et les régimes médicaux5. Récemment, nous avons utilisé une analyse de propension des données du dépôt de données du système de santé militaire des États-Unis (MDR) pour évaluer l'effet des statines dans la prévention primaire des résultats cardio-vasculaires basé sur la présence et la sévérité du calcium d'artère coronaire6.

Le MDR, utilisé moins fréquemment que les ensembles de données Medicare et VA à des fins de recherche, contient des informations complètes sur les réclamations administratives et médicales des services hospitaliers et ambulatoires fournis pour les militaires en service actif, les retraités, et d'autres bénéficiaires du ministère de la Défense (DoD) de soins de santé et leurs personnes à charge. La base de données comprend des services fournis dans le monde entier dans des installations de traitement militaire des États-Unis ou dans des installations civiles facturées au ministère de la Justice. La base de données comprend des données complètes sur les pharmacies depuis le 1er octobre 2001. Les données de laboratoire sont disponibles à partir de 2009, mais ne sont limitées qu'aux installations de traitement militaire. Au sein du MDR, les cohortes ont été définies avec des méthodes, y compris l'utilisation de codes de diagnostic (p. ex., diabète sucré7) ou de codes de procédure (p. ex., chirurgie arthroscopique8). Alternativement, une cohorte externe de bénéficiaires admissibles, comme un registre, peut être jumelée au MDR pour obtenir des données de base et de suivi9. Contrairement à l'assurance-maladie, le MDR comprend les patients de tous âges. Il est également moins biaisé envers les hommes que la base de données VA car il comprend les personnes à charge. L'accès au MDR est toutefois limité. En général, seuls les enquêteurs qui sont membres du Système de santé militaire peuvent demander l'accès, ce qui est analogue aux exigences d'utilisation de la base de données de l'AV. Les chercheurs non gouvernementaux qui cherchent à accéder aux données des systèmes de santé militaires doivent le faire dans le cadre d'une entente de partage de données sous la supervision d'un parrain gouvernemental.

Lors de l'utilisation d'un ensemble de données administratives, il est important de garder à l'esprit les limites ainsi que les forces du codage administratif. La sensibilité et la spécificité du code peuvent varier en fonction du diagnostic connexe, qu'il s'agisse d'un diagnostic primaire ou secondaire, ou qu'il s'agisse d'un dossier d'hospitalisation ou de consultation externe. Les codes d'hospitalisation pour l'infarctus aigu du myocarde sont généralement rapportés avec précision avec des valeurs prédictives positives de plus de 90 %10,mais l'usage du tabac est souvent sous-codé11. Un tel sous-codage peut ou non avoir un effet significatif sur les résultats d'une étude12. En outre, plusieurs codes pour une condition donnée peuvent exister avec des niveaux variables de corrélation à la maladie dans la question13. Une équipe d'enquête devrait effectuer une recherche et un examen complets de la classification internationale des maladies, de la neuvième révision, de la modification clinique (ICD-9-CM) et/ou des manuels de codage de la CIM-10-CM pour s'assurer que les codes appropriés sont inclus dans l'étude.

Plusieurs méthodes peuvent être employées pour améliorer la sensibilité et l'exactitude des codes diagnostiques pour définir les conditions comorbides. Une période appropriée de « retour en arrière » devrait être incluse pour établir les comorbidités de base. La période de retour comprend les services d'hospitalisation et de consultation externe fournis avant l'entrée à l'étude. Une période d'un an peut être optimale14. En outre, exiger deux revendications distinctes au lieu d'une seule revendication peut augmenter la spécificité, tandis que la complétance des données de codage avec des données pharmaceutiques peut améliorer la sensibilité15. Sélectionnez des audits manuels sur une partie des données peuvent être utilisés pour vérifier l'exactitude de la stratégie de codage.

Une fois que les comorbidités ont été définies et évaluées pour la cohorte en question, un score de propension peut être utilisé pour équilibrer les différences dans les covariates entre les groupes de traitement. Le score de propension est dérivé de la probabilité qu'un patient soit affecté à un traitement basé sur des covariables connues. La comptabilisation de ce traitement de propension réduit l'effet que les covariates ont sur l'affectation de traitement et aide à générer une estimation plus vraie de l'effet de traitement sur les résultats. Bien que les scores de propension ne donnent pas nécessairement des résultats supérieurs aux modèles multivariés, ils permettent d'évaluer si les groupes traités et non traités sont comparables après l'application du score de propension3. Les chercheurs de l'étude peuvent analyser les différences standardisées absolues dans les covariates avant et après l'appariement de la propension ou la probabilité inverse de pondération du traitement (IPTW) pour s'assurer que les confusions connues ont été équilibrées entre les groupes. Fait important, les confusions inconnues peuvent ne pas être équilibrées, et il faut être conscient du potentiel de confusion résiduelle.

Lorsqu'ils sont exécutés correctement, cependant, les scores de propension sont un outil puissant qui peut prédire et reproduire les résultats des essais contrôlés randomisés16. Parmi les techniques de score de propension disponibles, l'appariement et l'IPTW sont généralement préférés17. Au sein de l'IPTW, les patients sont pondérés en fonction de leur propension ou de leur probabilité de traitement. Les poids stabilisateurs sont généralement recommandés sur les poids bruts, tandis que l'élagage des poids peut également être considéré comme18,19,20,21.

Une fois que les groupes d'étude sont équilibrés, ils peuvent être suivis jusqu'au résultat de l'intérêt. Les études utilisant des données administratives peuvent être intéressées par des résultats tels que les taux de réadmission et les analyses de temps à événement. Dans les études portant sur la mortalité, le Dépôt de données du système de santé militaire comprend un champ pour l'état vital qui peut être encore augmenté en utilisant l'indice national de mortalité (NDI)22,23. Le NDI est une base de données centralisée des informations sur les dossiers de décès des bureaux de l'État qui est gérée par le Center for Disease Control. Les enquêteurs peuvent demander l'état vital de base et/ou la cause précise du décès en se fondant sur le certificat de décès.

Le protocole suivant détaille le processus de réalisation d'une étude de base de données administrative à l'aide du MDR, complété par des informations sur la mortalité de l'IND. Il détaille l'utilisation de l'IPTW pour équilibrer les différences de base entre deux groupes de traitement, y compris le code SAS et la sortie de l'exemple.

Subscription Required. Please recommend JoVE to your librarian.

Protocol

Le protocole suivant suit les lignes directrices de nos comités institutionnels d'éthique humaine.

1. Définir la cohorte

  1. Déterminer et définir clairement les critères d'inclusion et d'exclusion de la cohorte prévue à l'aide d'un registre ou de 2) points de données qui peuvent être extraits du MDR, comme les codes administratifs pour les diagnostics ou les procédures (c.-à-d. tous les patients ayant plus de deux diagnostics ambulatoires ou un diagnostic de fibrillation auriculaire chez l'patient hospitalisé).
    1. Si vous utilisez un registre, incluez deux identifiants de patients ou plus pour une correspondance précise avec le dépôt de données du système de santé militaire, comme le numéro de dossier médical (indiqué dans différents ensembles de données comme patuniq et edipn), le nom complet, la date de naissance et/ou le numéro de sécurité sociale du commanditaire.
      REMARQUE : Comme pour toutes les études utilisant des renseignements personnels sur la santé, des mesures de protection sont requises et doivent être respectées. Un cryptage et une gestion des données appropriés doivent être utilisés pendant le processus de collecte, et l'information doit être désidentifiée dès que possible.
      REMARQUE : Lorsqu'on fait référence au numéro de sécurité sociale du répondant (sponssn), tous les patients sont répertoriés en ce qui concerne leur relation avec le militaire (ou le parrain), y compris un identifiant pour le parrain, le conjoint et les enfants. Sachez que le code relationnel et le numéro de sécurité sociale du commanditaire peuvent changer au fil du temps dans l'ensemble de données lorsque les patients deviennent adultes et se marient ou divorcent. Ainsi, plusieurs identificateurs de patient aident à assurer l'exactitude.
    2. Si vous définissez les cohortes au moyen du codage administratif, effectuez une recherche documentaire exhaustive afin d'identifier les études antérieures qui ont potentiellement validé les codes d'intérêt. Passez en revue les manuels ICD-9-CM24 et/ou ICD-10-CM25 pour clarifier les définitions de code et les codes voisins afin de s'assurer que la gamme appropriée de codes est utilisée. En outre, examinez les tableaux de référence recoupement inclus dans les manuels pour examiner des codes supplémentaires d'inclusion/exclusion. Les études de validation antérieures contiennent des rapports de valeur prédictive positive, de sensibilité et de spécificité pour diverses stratégies de codage administratif. Ces aides à l'optimisation de la sélection des cohortes ainsi qu'à l'identification des résultats.
  2. Déterminer s'il y a des restrictions (p. ex., en fonction de l'âge) sur la cohorte souhaitée ou d'autres critères d'exclusion à inclure dans la demande de données.
  3. Définir la période d'étude pour inclure le temps précédant la date d'indice pour la collecte des covariates de base (généralement 12 mois dans la recherche de données administratives) ainsi que la date de fin de l'étude.

2. Définir les covariables et les résultats

  1. Définir les codes administratifs pour les conditions de confusion par le biais de recherches documentaires et de l'utilisation des manuels ICD-9-CM24 et/ou ICD-10-CM25, comme c'est le cas à l'étape 1.1.2 ci-dessus.
  2. Déterminer d'autres covariates nécessaires, y compris les données démographiques, les médicaments et les données de laboratoire.
  3. Passez en revue les champs de données disponibles dans le Dictionnaire de données MDR ici: https://health.mil/Military-Health-Topics/Technology/Support-Areas/MDR-M2-ICD-Functional-References-and-Specification-Documents.

3. Soumettre une demande pour le MDR

  1. Obtenir l'approbation de la Commission d'examen institutionnel.
  2. Complétez une application d'accord de partage de données qui peut être trouvée ici: https://health.mil/Military-Health-Topics/Privacy-and-Civil-Liberties/Submit-a-Data-Sharing-Application?type=All#RefFeed. Dans le cadre de la demande, spécifiez les champs de données et les fichiers demandés sur la feuille de travail d'extraction du système de santé militaire (DrDr) (liée à partir du formulaire de demande). Précisez si l'équipe demande à un analyste de données de fournir les données brutes ou si l'équipe accède directement au MDR. Précisez en outre si la demande porte sur une collecte ponctuelle de données ou si des tirages réguliers sont demandés quotidiennement, mensuellement ou annuellement.
    REMARQUE : Pour obtenir des données MDR par n'importe quelle méthode, il doit y avoir un commanditaire qui est un employé du gouvernement (militaire de service actif ou GS), qui est habituellement un membre de l'équipe d'investigateur.
  3. Si vous accédez directement au MDR, remplissez le « formulaire de demande d'autorisation MDR » et le « formulaire MDR CS 2875 » que l'on peut trouver ici : https://health.mil/Military-Health-Topics/Technology/Support-Areas/MDR-M2-ICD-Functional-References-and-Specification-Documents.

4. Accès au MDR et extraction des données pertinentes

  1. Si vous accédez directement au MDR, suivez les instructions d'accès et d'utilisation du MDR, y compris les exigences logicielles et les programmes SAS par exemple disponibles dans le « Guide de l'utilisateur MDR » et le « Guide fonctionnel mDR » que l'on trouve ici : https://health.mil/Military-Health-Topics/Technology/Support-Areas/MDR-M2-ICD-Functional-References-and-Specification-Documents.
    REMARQUE : Les fichiers sont enregistrés en format SAS et accessibles via une coquille unix généralement à l'aide de putty.exe ainsi que d'un programme ftp. La connaissance de SAS est nécessaire.
  2. Pour un aperçu utile de la configuration MDR, consultez le Guide doD pour les chercheurs du DOD sur l'utilisation des données MHS https://health.mil/Reference-Center/Publications/2012/10/10/Guide-for-DoD-Researchers-on-Using-MHS-Data.
  3. Comme cela a été fait à l'étape 2.3, examinez le Dictionnaire des données MDR pour obtenir des renseignements détaillés sur tous les fichiers de données disponibles https://health.mil/Military-Health-Topics/Technology/Support-Areas/MDR-M2-ICD-Functional-References-and-Specification-Documents.
    REMARQUE : Tous les fichiers de données n'incluent pas tous les identificateurs de patients pour l'appariement/fusion. Le dictionnaire de données permet de répertorier les identifiants disponibles pour chaque fichier de données. Le numéro d'iD du ministère de la DD, également appelé "patuniq" ou "edipn", est nécessaire pour extraire les informations de la pharmacie, par exemple. Il est donc important d'avoir tous les identifiants de patients appropriés dans l'étape de l'exploration de données afin d'assurer la capacité de faire correspondre toutes les informations sur les patients sur plusieurs années et ensembles de données multiples. Il est important de réitérer qu'en inhérent à la recherche qui implique l'ICP, le strict respect des procédures de sauvegarde des données est nécessaire après l'obtention de l'approbation nécessaire, et l'ICP devrait être détruite après qu'elle ne soit plus nécessaire.
  4. Obtenir les identifiants de patients nécessaires pour la cohorte en accédant aux données vm6 des bénéficiaires (sep 2002-présent) ou au fichier pben (sep 2000-sep 2002).
    1. Utilisez la macro ci-dessous ou un programme similaire pour faire correspondre les données vm6 au fichier de cohorte. Dans ce cas, le code peut être utilisé tel qu'il est écrit pour trouver les numéros d'enregistrement médical des patients (MRN) pour un patient social donné qui est déjà dans un dossier de cohorte. Utilisez différents noms variables dans le tirage de données vm6 et les fichiers de cohorte pour les noms des patients et les dates de naissance pour aider à vérifier les erreurs plus tard. Pour protéger l'ICP, stockez les données avec des identifiants de patients sur le nœud de service dans l'espace fourni dans le cadre de la demande de données (voir Guide de l'utilisateur MDR).
      REMARQUE : Les MRN sont appelés numéro d'iD DOD, PATUNIQ ou EDIPN dans le MDR).
      Equation 1
    2. Comme les entrées de base de données ne sont jamais complètement exemptes d'erreurs, effectuez des vérifications d'erreurs après chaque étape majeure en plus de vérifier le journal du programme et la sortie pour toute préoccupation potentielle. Utilisez l'étape de données ci-dessous pour examiner les inadéquations potentielles avec le code ci-dessus (les dossiers des patients sont appariés en fonction du patient/bénéficiaire social). Lorsque l'on compare les noms du fichier de cohorte (nom de famille, prénom) avec le fichier vm6 (last_name, first_name), ne correspondent qu'aux trois premières lettres pour réduire les fausses erreurs qui surviennent avec les différences d'orthographe/espacement entre les fichiers.
      Equation 2
    3. Examiner le fichier de données d'erreur (« checkname »). Ignorer les erreurs causées par la ponctuation (O'Reilly vs OReilly). Vérifiez d'autres erreurs préoccupantes lors de l'examen manuel du dossier de santé ou envisagez de rejeter les renseignements pertinents sur les patients et les patients s'il y a des erreurs importantes et si la vérification n'est pas possible.
  5. Extraire les données restantes nécessaires du MDR.
    1. Au besoin, obtenir la race et le sexe à partir de fichiers vm6ben (fichiers pben avant septembre 2002), fusionner avec le fichier de cohorte, et vérifier les erreurs telles qu'elles sont faites ci-dessus :
      Equation 3
    2. Obtenir les données de décès du fichier maître de décès, fusionner avec le fichier de cohorte et vérifier les erreurs telles qu'elles sont faites ci-dessus :
      Equation 4
    3. Obtenir des fichiers de données supplémentaires nécessaires à l'analyse (voir Le Guide de l'utilisateur fonctionnel mDR pour l'emplacement des données et les macros et le code SAS utiles supplémentaires).
      REMARQUE : Les données sont stockées dans des dossiers distincts selon qu'elles ont été directement fournies par le système de soins de santé militaire ou livrées ailleurs et facturées au système de soins de santé militaire. Les fichiers d'exemple sont affichés ci-dessous.
      CAPER - soins directs, dossiers ambulatoires de l'exercice 2004-présent
      SADR - soins directs, dossiers ambulatoires de 1998 à 2005
      SIDR - soins directs, hospitalisations (soins directs) à partir de 1989-présent
      TEDI - soins facturés, dossiers de réclamation séminence institutionnelle s'exercice 2001-présent
      HCSRI - soins facturés, réclamations institutionnelles fy 1994-2005
      TEDNI - soins facturés, réclamations non institutionnelles fy 2001-présent
      HCSRNI - soins facturés, réclamations non institutionnelles fy 1994-2005
      PDTS - dossier de pharmacie avec prescriptions individuelles fy 2002-présent

5. Fusion de données et construction de fichiers summatifs

  1. Que les données soient obtenues d'un analyste de données ou obtenues directement à partir du MDR comme cela a été fait à la section 4 ci-dessus, les fichiers de données devront être résumés et fusionnés pour former le fichier d'analyse. Tout au long du processus, utilisez des méthodes qui améliorent l'exactitude des données, y compris les vérifications d'erreurs et l'examen des journaux et de la sortie comme cela a également été discuté précédemment.
    1. Lors de la fusion des données, utilisez au moins deux identifiants de patients lorsque cela est possible pour assurer une correspondance solide (comme le numéro de dossier médical et la date de naissance), car des erreurs peuvent exister dans n'importe quel domaine. Après la fusion des données, examinez les données pour assurer les résultats attendus. Exécutez le code pour vous assurer que les trois premières lettres du nom correspondent en plus d'un autre identifiant ou deux est utile pour vérifier les correspondances appropriées (voir l'étape 4.5.1).
      REMARQUE : Le nom de famille peut ne pas correspondre si le patient a été marié pendant la période en question. Des variations mineures peuvent également exister dans les champs de noms en raison d'apostrophes ou d'espacements ainsi que de fautes de frappe.
    2. Portez une attention particulière aux correspondances aux étapes terminales du processus, comme la définition des patients qui ont obtenu des résultats.
  2. Extraire les comorbidités de base à l'aide des codes ICD-9-CM ou ICD-10-CM de la période précédant la date de l'indice, la date à laquelle le patient est considéré comme entrant dans l'étude. En général, utilisez 12 mois avant la date de l'indice pour définir les comorbidités.
    1. S'assurer que les patients ont été éligibles au système de santé militaire pendant la période de référence (peut être vérifié mensuellement dans le fichier vm6ben).
    2. Rechercher des codes de diagnostic de base dans les dossiers ambulatoires et/ou hospitaliers afin d'établir les comorbidités de base au cours de la période de référence de 12 mois précédant la date de l'indice. Utiliser les codes ICD-9-CM ou ICD-10-CM établis à la section 1. Si vous utilisez les comorbidités Elixhauser, utilisez le logiciel disponible de HCUP, en veillant à modifier les noms des variables de diagnostic et des fichiers au besoin. (https://www.hcup-us.ahrq.gov/toolssoftware/comorbidity/comorbidity.jsp#download)
  3. Rechercher les dossiers des patients hospitalisés et/ou des patients hospitalisés après la date de l'index pour les résultats d'intérêt définis par les codes ICD-9-CM ou ICD-10-CM, tels que l'hospitalisation pour infarctus du myocarde comme diagnostic primaire (recherche de 410,x1 dans SIDR).
  4. Fixer une date de fin à l'étude pour tous les patients comme limite pour le suivi pour les patients qui n'ont pas démontré les résultats de l'intérêt. Déterminer quels patients doivent être censurés avant la fin de l'étude.
    1. Rechercher le fichier vm6ben pour s'assurer de l'admissibilité aux soins de santé jusqu'à la date de fin de l'étude.; autrement, censurer le patient au moment de la perte d'admissibilité.
    2. S'il est important de limiter l'étude aux utilisateurs actifs du système de santé indépendamment de l'admissibilité, tels que les utilisateurs actifs de la pharmacie, puis de déterminer le dernier contact de soins de santé (comme le dernier remplissage des médicaments) dans les fichiers de données et de censurer les patients à cette date.
      REMARQUE : Soyez prudent en utilisant les rencontres téléphoniques, car elles peuvent être présentes dans le dossier de santé après qu'un décès s'est produit ou si le bénéficiaire a quitté le système de soins de santé d'une autre manière.

6. Correspondre à l'indice national de mortalité (NDI)

  1. Une fois que la cohorte complète est identifiée, envoyez l'information à l'indice national de décès pour qu'elle corresponde si la mortalité est un point final.
    1. Tout d'abord, inclure l'intention de faire correspondre à l'IND dans les demandes de données MDR et l'approbation de la CISR. Assurer l'approbation et compléter toutes les étapes de cryptage des données effectuées avant d'envoyer des informations de santé protégées (PHI) à la NDI pour l'appariement.
  2. Le formulaire de demande de l'indice national de décès (IND) et les directives pour demander des données sur la mort de l'Indice national de décès peuvent être trouvés ici : https://www.cdc.gov/nchs/ndi/index.htm.
  3. Envoyez les données sur un CD protégé par mot de passe par courrier de nuit au NDI. Les résultats seront renvoyés environ 2 semaines plus tard de la même manière.
  4. Après avoir reçu les résultats de l'IND, examinez les correspondances partielles pour en faire l'objet d'une inclusion ou d'une exclusion potentielle.
    1. "Chapitre 4 - Évaluation de la sortie NDI" fournit un aperçu utile de l'examen des résultats et peut être trouvé sur la même page Web: https://www.cdc.gov/nchs/ndi/index.htm. Les correspondances sur le numéro de sécurité sociale offrent généralement le match le plus fort.
    2. Au besoin, recoupez les décès dans l'indice de décès de la sécurité sociale et/ou dans le sous-système de localisation des dossiers d'identification des bénéficiaires du ministère des Anciens Combattants (BIRLS) afin d'améliorer l'exactitude. Sachez que les militaires qui meurent à l'étranger ne se présenteront probablement pas à une recherche NDI, mais sont souvent reconnus dans le fichier de l'état vital du MDR ou dans le BIRLS VA.
  5. Fusionner le dossier de décès avec le fichier de cohorte principal après avoir terminé l'examen.

7. De-identifiant les données

  1. Une fois que toutes les informations nécessaires sont acquises, désidentifier les fichiers de données pour aider à protéger PHI. Générez un identifiant patient aléatoire pour chaque patient à l'aide de "ranuni" (voir le Guide de l'utilisateur fonctionnel mDR). Supprimer le numéro social du patient, le numéro de dossier médical, la date de naissance (après l'âge de calcul), etc., des fichiers de données. Si nécessaire (et approuvé), entreposez une clé qui relie l'identifiant aléatoire du patient à l'ICP en toute sécurité sur le nœud SCE.

8. Calcul de la propension score18,19,26

  1. Utiliser la régression logistique pour modéliser la probabilité du traitement (proc logistique dans SAS).
    1. Spécifiez le fichier de données ("dat" dans l'exemple).
    2. Utilisez l'instruction de classe pour spécifier des variables catégoriques. Utilisez "ref ' first" pour spécifier la valeur la plus basse (comme 0) comme valeur de référence.
    3. Dans l'énoncé de modèle, spécifiez la variable de traitement comme variable dépendante (Rx) et fixez la valeur de l'« événement » comme valeur pour recevoir le traitement (1 dans ce cas).
    4. Inclure tous les prédicteurs possibles de recevoir un traitement comme covariables dans le modèle, surtout s'ils pouvaient être des prédicteurs de l'issue (comme la mort). Considérez si les interactions entre les termes peuvent avoir un impact sur le traitement. Incluez-les dans le modèle en utilisant un « ô » (comme le mâle ckd) ou utilisez la syntaxe ci-dessous en plaçant « ' ' ' ' ' ' ' ' ' ' ' ' ' ' ' ' ' ' ' ' ' ' ' ' ' ' ' ' ' ' ' ' ' ' ' ' ' ' ' ' ' ' ' ' ' ' ' ' ' ' ' ' ' ' ' ' ' ' ' ' ' ' ' ' ' ' ' ' ' ' ' ' ' ' ' ' ' ' ' ' ' ' ' ' ' ' ' ' ' ' ' ' ' ' ' ' ' ' ' ' ' ' ' ' ' ' ' ' ' ' ' ' ' ' ' ' ' ' ' ' ' ' ' ' ' ' ' ' ' ' ' ' ' ' ' ' ' ' ' ' ' ' ' ' '
    5. Utilisez l'instruction de sortie pour spécifier que la probabilité prévue de traitement (prob) sera définie par "ps" et la sortie au fichier "ps_data".
      Equation 5
      NOTE: Variables dans le modèle: mâle: sexe masculin (binaire), ckd: maladie rénale chronique (binaire), foie: maladie chronique du foie (binaire), diabète (binaire), copd: maladie pulmonaire obstructive chronique (binaire), chf: insuffisance cardiaque (binaire), cad: maladie coronarienne (binaire), cvd : maladie cérébrovasculaire (binaire), tampon : maladie artérielle périphérique (binaire), âge (continu).
  2. Calculer les pondérations à partir de la probabilité prévue (score de propension). Si le patient a reçu le traitement (Rx '1), alors le poids de score de propension est 1/(score de propension). Si le patient n'a pas reçu le traitement, alors le poids de score de propension est 1/(1 - score de propension).
    Equation 6
  3. Stabilisez le score de propension en le divisant par le poids moyen. Dans le code ci-dessous, Proc signifie que le poids moyen est disponible dans la variable « mn_wt » dans le fichier de données « m ». L'ensemble de données ci-dessous qui conserve le mn_wt du fichier de données "m" calcule ensuite les scores de propension stabilisés (st_ps_weight) pour chaque observation.
    Equation 7
  4. Vérifier l'équilibrage après l'application de la probabilité inverse de pondération du traitement.
    1. La macro stddiff simplifie l'informatique standardisée différences moyennes pour les covariables avant et après la pondération dans SAS. Le code pour la macro peut être trouvé ici: http://www.lerner.ccf.org/qhs/software/lib/stddiff.sas.
    2. Calculez la différence de moyenne normalisée avant la pondération. Comme avec toutes les macros, le code macro doit être exécuté dans SAS avant de l'appeler. Un exemple d'instruction d'appel est ci-dessous avec les covariables d'intérêt.
      Equation 8
      Inds - jeu de données d'entrée, groupvar - variable qui définit les groupes d'étude, charvars - variables catégoriques, numvars - variables continues, stdfmt - format de différence normalisée, outds - ensemble de données de sortie.
    3. Appelez à nouveau la macro stddiff pour calculer la différence moyenne normalisée après pondération. "Wtvar" spécifie la variable contenant le score de propension standardisé et est ajouté à l'instruction d'appel macro. Si les différences normalisées sont toutes inférieures ou égales à 0,1, alors l'équilibrage est considéré comme réussi.
      Equation 9
  5. Le TSA avant et après la pondération peut être signalé en format tabulaire ou graphique. Pour les directions pour l'utilisation d'une macro SAS pour générer une parcelle, s'il vous plaît voir les matériaux supplémentaires.
  6. Les données corrigées de l'IPTW peuvent maintenant être utilisées dans une analyse univariée après avoir assuré l'équilibrage des facteurs de confusion mesurés.

9. Création du modèle de résultats et génération d'une parcelle de fonction d'incidence cumulative

  1. Il y a plusieurs façons de tracer l'analyse du temps à l'événement qui en résulte, y compris l'utilisation de proc lifetest pour générer une parcelle de survie. Utilisez l'énoncé de poids pour indiquer le poids de propension normalisé.
  2. Pour générer une parcelle de cif à l'aide d'un poids de propension, utilisez proc phreg.
    1. Dans proc phreg, référencez un fichier covarié pour spécifier les valeurs covariées à utiliser lors de la génération de l'intrigue. Dans ce cas, le fichier covarié ne contient que la seule variable Rx, qui peut être de 1 ou 0.
      Equation 10
    2. Toggle ods graphiques sur. Utilisez des instructions supplémentaires au besoin pour spécifier les fichiers de sortie pour le graphique ou le type de fichier (jpeg, etc.; voir https://support.sas.com/documentation/cdl/en/statug/63962/HTML/default/viewer.htm#statug_odsgraph_sect014.htm).
      Equation 11
    3. Dans la syntaxe proc phreg, utilisez l'état de poids pour spécifier la variable de score de propension standardisée. Spécifiez les valeurs pour les covariables de base à l'aide de l'instruction de référence afin de pouvoir tracer la fonction d'incidence cumulative. Spécifiez les strates à utiliser pour l'intrigue en utilisant "rowid" (dans ce cas RX 1 vs 0). Le nombre de parenthèses suivant la variable de résultats (« événement ») spécifie la valeur (s) de la variable qui devrait être censurée qui devrait inclure la date de censure et tout événement concurrent. Dans ce cas, 0 est censuré et 1 est un véritable événement.
      Equation 12

Subscription Required. Please recommend JoVE to your librarian.

Representative Results

À la fin de l'IPTW, des tableaux ou des parcelles des différences standardisées absolues peuvent être générés à l'aide du code macro stddiff ou du code macro asdplot, respectivement. La figure 1 montre un exemple d'équilibrage approprié dans une grande cohorte de 10 000 participants utilisant la macro asdplot. Après l'application du score de propension, les différences standardisées absolues ont été réduites de manière significative. Le seuil utilisé pour la différence standardisée absolue est quelque peu arbitraire, bien que 0,1 soit souvent utilisé et dénote une différence négligeable entre les deux groupes. Dans une petite cohorte, il est plus difficile d'atteindre un bon équilibre. La figure 2 montre les résultats infructueux d'une tentative d'équilibre des covariations dans une cohorte de 100 participants.

Une fois le score de propension normalisé généré, l'équipe d'étude peut procéder à l'analyse des résultats. L'analyse de survie est souvent utilisée en raison de la nécessité de censurer les participants avec des informations de suivi inégales, et la figure 3 illustre un exemple de l'utilisation du proc phreg avec des pondérations de score de propension normalisées pour générer une parcelle de la fonction d'incidence cumulative (CIF). L'intrigue du CIF dépeint le nombre croissant d'événements au fil du temps. Dans ce cas, le groupe non traité, ou de contrôle (No Rx) a un plus grand nombre d'événements et est comparativement pire que le groupe traité (Rx).

Figure 1
Figure 1 : Exemple d'équilibrage réussi. Dans une grande cohorte (n - 10 000), l'IPTW a atteint l'équilibre des covariables avec toutes les différences standardisées absolues réduisant à moins de 0,1. Veuillez cliquer ici pour voir une version plus grande de ce chiffre.

Figure 2
Figure 2 : Exemple d'équilibrage infructueux. Dans une petite cohorte (n - 100), l'IPTW n'a pas été en mesure d'atteindre l'équilibre des covariables avec de nombreuses différences standardisées absolues restant supérieures à 0,1. Veuillez cliquer ici pour voir une version plus grande de ce chiffre.

Figure 3
Figure 3 : Exemple de parcelle cumulative de la fonction d'incidence comparant les groupes de traitement. Au fil du temps, l'incidence cumulative de la mortalité augmente dans les deux groupes, bien qu'elle soit plus élevée dans le groupe non traité (No Rx). Ainsi, dans cet exemple, le groupe traité a amélioré la survie. Veuillez cliquer ici pour voir une version plus grande de ce chiffre.

Matériel supplémentaire. S'il vous plaît cliquez ici pour voir ce fichier (Clic droit pour télécharger).

Subscription Required. Please recommend JoVE to your librarian.

Discussion

Les analyses rétrospectives à l'aide de grands ensembles de données administratives offrent une solution de rechange efficace et rentable lorsque des essais contrôlés randomisés ne sont pas réalisables. L'ensemble de données approprié dépendra de la population et des variables d'intérêt, mais le MDR est une option attrayante qui n'a pas les restrictions d'âge vu avec les données de l'assurance-maladie. Avec n'importe quel ensemble de données, il est important d'être intimement familier avec sa mise en page et dictionnaire de données. Il faut veiller à ce que les données complètes soient saisies et que les données soient appariées et fusionnées avec précision.

Les codes de diagnostic devraient être définis à l'aide de la littérature existante et d'une compréhension approfondie du système de codage de la CIM-9-CM et de la CIM-10-CM afin de maximiser la valeur des diagnostics assignés. Les ensembles existants de codes de comorbidité, y compris l'Elixhauser27 ou l'indice de comorbidité charlson raffiné28,29, peuvent être utilisés pour définir les conditions comorbides qui peuvent influencer le résultat de l'intérêt. De même, les algorithmes de codage validés dans les données administratives et devraient être exploités. La validation devrait rester un domaine de recherche active, car il y a un apprentissage continu sur l'utilisation optimale des algorithmes de codage ICD-9-CM et ICD-10-CM afin de maximiser la classification précise d'un large éventail de maladies.

Les scores de propension peuvent être utilisés pour remédier au biais inhérent à toute analyse rétrospective. La pondération ou l'appariement efficace du score de propension devrait réduire la différence standardisée absolue (TSA) inférieure au seuil souhaité, généralement fixé à 0,1. Un équilibre approprié permet d'assurer la comparabilité des groupes de traitement en ce qui concerne les facteurs de confusion connus, et des techniques de score de propension à l'emploi appropriées ont été utilisées pour reproduire avec succès les résultats d'essais randomisés. Une fois correctement équilibrés, les groupes de traitement peuvent être comparés à l'analyse univariée de temps-à-événement ou d'autres.

Même avec un équilibre approprié, il y a un risque de confusion résiduelle3, de sorte que l'équipe d'enquête devrait limiter l'effet des confusions non mesurées. En outre, si les effets des covariations sur la sélection du traitement sont forts, le biais peut encore rester30. Dans les petites cohortes, il est peu probable que les scores de propension réduisent complètement le TSA en dessous de 0,1 pour toutes les variables et un ajustement de régression peut être utilisé pour aider à éliminer le déséquilibre résiduel31. L'ajustement de régression peut également être utilisé dans l'analyse des sous-groupes lorsque l'équilibre approprié n'est plus assuré.

Lorsqu'elle est effectuée correctement, la recherche avec des données administratives fournit des réponses opportunes à d'importantes questions cliniques en l'absence d'essais cliniques randomisés. Bien qu'il soit impossible d'éliminer tous les biais des études observationnelles, les biais peuvent être limités en utilisant des scores de propension et en restant des analyses méticuleuses.

Subscription Required. Please recommend JoVE to your librarian.

Disclosures

Les auteurs n'ont rien à révéler.

Acknowledgments

La recherche rapportée dans cette publication a été soutenue par le National Center for Advancing Translational Sciences des National Institutes of Health sous le numéro de prix UL1 TR002345. Le contenu est uniquement de la responsabilité des auteurs et ne représente pas nécessairement les vues officielles des National Institutes of Health.

Avertissement: En outre, les opinions exprimées dans cet article sont celles de l'auteur seulement et ne doivent pas être interprétées comme représentant en aucune façon celles du gouvernement des États-Unis, du Département de la Défense des États-Unis (DoD) ou du Département des États-Unis du Armée. L'identification de produits spécifiques ou d'instruments scientifiques est considérée comme faisant partie intégrante de l'effort scientifique et ne constitue pas une approbation ou une approbation implicite de la part de l'auteur, du DoD, ou d'un organisme constituant.

Materials

Name Company Catalog Number Comments
CD Burner (for NDI Request)
Computer
Putty.exe Putty.org
SAS 9.4 SAS Institute Cary, NC
WinSCP or other FTP software https://winscp.net/eng/index.php

DOWNLOAD MATERIALS LIST

References

  1. Concato, J., Shah, N., Horwitz, R. I. Randomized, controlled trials, observational studies, and the hierarchy of research designs. New England Journal of Medicine. 342 (25), 1887-1892 (2000).
  2. Austin, P. C., Platt, R. W. Survivor treatment bias, treatment selection bias, and propensity scores in observational research. Journal of Clinical Epidemiology. 63 (2), 136-138 (2010).
  3. Sturmer, T., Wyss, R., Glynn, R. J., Brookhart, M. A. Propensity scores for confounder adjustment when assessing the effects of medical interventions using nonexperimental study designs. Journal of Internal Medicine. 275 (6), 570-580 (2014).
  4. Schermerhorn, M. L., et al. Long-Term Outcomes of Abdominal Aortic Aneurysm in the Medicare Population. New England Journal of Medicine. 373 (4), 328-338 (2015).
  5. Williams, R. J. II, et al. A Propensity-Matched Analysis Between Standard Versus Tapered Oral Vancomycin Courses for the Management of Recurrent Clostridium difficile Infection. Open Forum Infectious Diseases. 4 (4), (2017).
  6. Mitchell, J. D., et al. Impact of Statins on Cardiovascular Outcomes Following Coronary Artery Calcium Scoring. Journal of the American College of Cardiology. 72 (25), 3233-3242 (2018).
  7. Rush, T., McGeary, M., Sicignano, N., Buryk, M. A. A plateau in new onset type 1 diabetes: Incidence of pediatric diabetes in the United States Military Health System. Pediatric Diabetes. 19 (5), 917-922 (2018).
  8. Rhon, D. I., Greenlee, T. A., Marchant, B. G., Sissel, C. D., Cook, C. E. Comorbidities in the first 2 years after arthroscopic hip surgery: substantial increases in mental health disorders, chronic pain, substance abuse and cardiometabolic conditions. British Journal of Sports Medicine. , (2018).
  9. Mitchell, J., Paisley, R., Moon, P., Novak, E., Villines, T. Coronary Artery Calcium Score and Long-term Risk of Death, Myocardial Infarction and Stroke: The Walter Reed Cohort Study. Journal of the American College of Cardiology: Cardiovascular Imaging. , (2017).
  10. McCormick, N., Lacaille, D., Bhole, V., Avina-Zubieta, J. A. Validity of myocardial infarction diagnoses in administrative databases: a systematic review. PLoS ONE. 9 (3), e92286 (2014).
  11. Huo, J., Yang, M., Tina Shih, Y. -C. Sensitivity of Claims-Based Algorithms to Ascertain Smoking Status More Than Doubled with Meaningful Use. Value in Health. , Available from: https://doi.org/10.1016/j.jval.2017.09.002 (2017).
  12. Nayan, M., et al. The value of complementing administrative data with abstracted information on smoking and obesity: A study in kidney cancer. Canadian Urological Association Journal. 11 (6), 167-171 (2017).
  13. Birman-Deych, E., et al. Accuracy of ICD-9-CM codes for identifying cardiovascular and stroke risk factors. Medical Care. 43 (5), 480-485 (2005).
  14. Preen, D. B., Holman, C. D., Spilsbury, K., Semmens, J. B., Brameld, K. J. Length of comorbidity lookback period affected regression model performance of administrative health data. Journal of Clinical Epidemiology. 59 (9), 940-946 (2006).
  15. Rector, T. S., et al. Specificity and sensitivity of claims-based algorithms for identifying members of Medicare+Choice health plans that have chronic medical conditions. Health Services Research. 39 (6 Pt 1), 1839-1857 (2004).
  16. Hernán, M. A., et al. Observational studies analyzed like randomized experiments: an application to postmenopausal hormone therapy and coronary heart disease. Epidemiology (Cambridge, Mass.). 19 (6), 766-779 (2008).
  17. Austin, P. C. The relative ability of different propensity score methods to balance measured covariates between treated and untreated subjects in observational studies. Medical Decision Making. 29 (6), 661-677 (2009).
  18. Robins, J. M., Hernan, M. A., Brumback, B. Marginal structural models and causal inference in epidemiology. Epidemiology. 11 (5), 550-560 (2000).
  19. Robins, J. Marginal structural models. 1997 Proceedings of the American Statistical Association, section on Bayesian statistical science. , 1-10 (1998).
  20. Thoemmes, F., Ong, A. D. A Primer on Inverse Probability of Treatment Weighting and Marginal Structural Models. Emerging Adulthood. 4 (1), 40-59 (2016).
  21. Xu, S., et al. Use of stabilized inverse propensity scores as weights to directly estimate relative risk and its confidence intervals. Value in Health: the Journal of the International Society for Pharmacoeconomics and Outcomes Research. 13 (2), 273-277 (2010).
  22. Cowper, D. C., Kubal, J. D., Maynard, C., Hynes, D. M. A primer and comparative review of major US mortality databases. Annals of Epidemiology. 12 (7), 462-468 (2002).
  23. Skopp, N. A., et al. Evaluation of a methodology to validate National Death Index retrieval results among a cohort of U.S. service members. Annals of epidemiology. 27 (6), 397-400 (2017).
  24. Buck, C. J. 2015 ICD-9-CM for Hospitals, Volumes 1, 2, & 3, Professional Edition. , Elsevier Saunders. (2015).
  25. Buck, C. J. 2018 ICD-10-CM for Hospitals, Professional Edition. , Elsevier Saunders. (2018).
  26. Guo, S., Fraser, W. M. Propensity Score Analysis: Statistical Methods and Applications, Second Edition. , Sage Publications. (2015).
  27. Elixhauser, A., Steiner, C., Harris, D. R., Coffey, R. M. Comorbidity measures for use with administrative data. Medical Care. 36 (1), 8-27 (1998).
  28. Charlson, M. E., Pompei, P., Ales, K. L., MacKenzie, C. R. A new method of classifying prognostic comorbidity in longitudinal studies: development and validation. Journal of Chronic Diseases. 40 (5), 373-383 (1987).
  29. Deyo, R. A., Cherkin, D. C., Ciol, M. A. Adapting a clinical comorbidity index for use with ICD-9-CM administrative databases. Journal of Clinical Epidemiology. 45 (6), 613-619 (1992).
  30. Austin, P. C., Stuart, E. A. The performance of inverse probability of treatment weighting and full matching on the propensity score in the presence of model misspecification when estimating the effect of treatment on survival outcomes. Statistical Methods in Medical Research. 26 (4), 1654-1670 (2017).
  31. Austin, P. C. Balance diagnostics for comparing the distribution of baseline covariates between treatment groups in propensity-score matched samples. Statistics in Medicine. 28 (25), 3083-3107 (2009).

Tags

Médecine Numéro 155 probabilité inverse de pondération du traitement score de propension indice national de décès Dépôt de données du système de santé militaire biais sélection de traitement confusion données volumineuses
Probabilité inverse de pondération du traitement (score de propension) à l'aide du référentiel de données du système de santé militaire et de l'indice national de décès
Play Video
PDF DOI DOWNLOAD MATERIALS LIST

Cite this Article

Mitchell, J. D., Gage, B. F.,More

Mitchell, J. D., Gage, B. F., Fergestrom, N., Novak, E., Villines, T. C. Inverse Probability of Treatment Weighting (Propensity Score) using the Military Health System Data Repository and National Death Index. J. Vis. Exp. (155), e59825, doi:10.3791/59825 (2020).

Less
Copy Citation Download Citation Reprints and Permissions
View Video

Get cutting-edge science videos from JoVE sent straight to your inbox every month.

Waiting X
Simple Hit Counter