Waiting
Login processing...

Trial ends in Request Full Access Tell Your Colleague About Jove
Click here for the English version

Medicine

Omvendt sandsynlighed for behandling vægtning (tilbøjelighed score) ved hjælp af det militære sundheds system data repository og national Death index

Published: January 8, 2020 doi: 10.3791/59825

Summary

Når randomiserede kontrollerede forsøg er ikke gennemførlige, en omfattende sundhedspleje datakilde som det militære sundheds system data repository giver et attraktivt alternativ til retrospektive analyser. Inkorporering af dødelighedsdata fra det nationale dødstal og afbalancering af forskelle mellem grupper ved hjælp af tilbøjelighed vægtning hjælper med at reducere bias iboende i retrospektive designs.

Abstract

Når randomiserede kontrollerede forsøg ikke er gennemførlige, giver retrospektive undersøgelser ved hjælp af Big data et effektivt og omkostningseffektivt alternativ, selv om de er i risiko for behandling udvælgelse bias. Behandling udvælgelse bias forekommer i en ikke-randomiseret undersøgelse, når behandlingen udvælgelse er baseret på præ-behandling egenskaber, der også er forbundet med resultatet. Disse forbehandlings karakteristika, eller confounders, kan påvirke vurderingen af en behandlings virkning på udfaldet. Tilbøjelighed scorer minimerer denne skævhed ved at afbalancere de kendte konfoundere mellem behandlingsgrupperne. Der er et par tilgange til at udføre tilbøjelighed score analyser, herunder stratificering af tilbøjeligheden score, tilbøjelighed matching, og inverse sandsynlighed for behandling vægtning (IPTW). Beskrevet her er brugen af IPTW til at afbalancere baseline-comorbiditeter i en kohorte af patienter inden for det amerikanske militær Health System data repository (MDR). MDR er en relativt optimal datakilde, da den indeholder en indesluttet kohorte, hvor næsten fuldstændige oplysninger om patient-og ambulante tjenester er tilgængelige for støtteberettigede modtagere. Nedenstående er brugen af MDR suppleret med oplysninger fra det nationale dødstal for at tilvejebringe solide dødelighedsdata. Der er også forslag til brug af administrative data. Endelig, protokollen deler en SAS-kode for at bruge iptw til at afbalancere kendte konfoundere og plot den kumulative incidens funktion for resultatet af interesse.

Introduction

Randomiserede, placebo-kontrollerede forsøg er den stærkeste undersøgelse design for at kvantificere effekten af behandlingen, men de er ikke altid muligt på grund af omkostninger og tid krav eller en mangel på ligevægt mellem behandlingsgrupper1. I disse tilfælde, en retrospektiv kohorte design ved hjælp af store administrative data ("Big data") ofte giver et effektivt og omkostningseffektivt alternativ, selv om manglen på randomisering introducerer behandling udvælgelse bias2. Behandling udvælgelse bias forekommer i ikke-randomiserede undersøgelser, når behandlingen beslutning er afhængig af præ-behandling egenskaber, der er forbundet med resultatet af interesse. Disse egenskaber er kendt som forstyrrende faktorer.

Fordi tilbøjelighed scorer minimere denne bias ved at afbalancere de kendte konfoundere mellem behandlingsgrupper, er de blevet stadig mere populære3. Propensity scores er blevet brugt til at sammenligne kirurgiske tilgange4 og medicinske regimer5. For nylig har vi brugt en tilbøjelighed analyse af data fra de Forenede Staters militære sundheds system data repository (MDR) til at vurdere effekten af statiner i primær forebyggelse af kardiovaskulære resultater baseret på tilstedeværelsen og sværhedsgraden af koronararterie calcium6.

MDR, udnyttet mindre hyppigt end Medicare og VA datasæt til forskningsformål, indeholder omfattende administrative og medicinske krav oplysninger fra indlæggelse og ambulant tjenester, der ydes til aktiv tjeneste militær, pensionister, og andre Department of Defense (DoD) sundhedsydelser modtagere og deres pårørende. Databasen omfatter tjenester, der leveres på verdensplan på amerikanske militær behandlingsanlæg eller på civile anlæg, der faktureres til Forsvarsministeriet. Databasen indeholder komplette apotek data siden oktober 1, 2001. Laboratoriedata er tilgængelige fra 2009, men er kun begrænset til militære behandlingsanlæg. Inden for MDR er kohorter blevet defineret med metoder, herunder brug af diagnoser koder (f. eks. diabetes mellitus7) eller procedure koder (f. eks. artroskopisk kirurgi8). Alternativt kan en eksternt defineret kohorte af støtteberettigede modtagere, såsom et register, matches med MDR for at opnå baseline-og opfølgningsdata9. I modsætning til Medicare omfatter MDR patienter i alle aldre. Det er også mindre partisk over for mænd end VA-databasen, da den omfatter pårørende. Adgangen til MDR er dog begrænset. Generelt kan kun undersøgere, der er medlemmer af det militære sundheds system, anmode om adgang, analogt med krav om brug af VA-databasen. Ikke-statslige forskere, der søger adgang til militære sundhedssystemer data skal gøre det gennem en datadeling aftale under tilsyn af en regering sponsor.

Når du bruger et administrativt datasæt, er det vigtigt at huske på begrænsningerne og styrkerne ved administrativ kodning. Følsomheden og specificiteten af koden kan variere baseret på den relaterede diagnose, om det er en primær eller sekundær diagnose, eller om det er en indlæggelse eller ambulant fil. Patient koder for akut myokardieinfarkt er generelt præcist rapporteret med positive Prædikative værdier over 90%10, men tobaksrygning er ofte under kodet11. En sådan under kodning kan eller kan ikke have en meningsfuld virkning på undersøgelsens resultater12. Desuden kan flere koder for en given tilstand eksistere med varierende niveauer af korrelation til den pågældende sygdom13. Et efterforskningshold bør udføre en omfattende litteratursøgning og gennemgang af den internationale sygdomsklassifikation, niende revision, klinisk modifikation (ICD-9-CM) og/eller ICD-10-CM-kodnings manualer for at sikre, at de relevante koder indgår i undersøgelsen.

Der kan anvendes flere metoder til at forbedre diagnosticerings kodernes følsomhed og nøjagtighed for at definere comorbiditet betingelser. En passende "look-back" periode bør medtages for at etablere baseline comorbidities. Se-back-perioden omfatter de hospitals-og ambulante ydelser, der er leveret forud for indrejse i studiet. En periode på et år kan være optimal14. Derudover, kræver to separate krav i stedet for en enkelt krav kan øge specificitet, samtidig supplere kodning data med farmaceutiske data kan forbedre følsomhed15. Vælg manuelle diagram revisioner på en del af dataene kan bruges til at verificere nøjagtigheden af kodnings strategien.

Når komorbiditeter er blevet defineret og vurderet for den pågældende kohorte, kan der anvendes en tilbøjelighed til at afbalancere forskelle i kovariater mellem behandlingsgrupperne. Den tilbøjelighed score er afledt af sandsynligheden for, at en patient er tildelt en behandling baseret på kendte kovariater. Regnskab for denne tilbøjelighed behandling reducerer virkningen, at kovariaterne har på behandling opgave og hjælper med at generere en mere retvisende estimat af behandlingseffekten på resultatet. Mens tilbøjeligheder scorer ikke nødvendigvis giver overlegne resultater til multivariat modeller, de giver mulighed for vurdering af, om de behandlede og ubehandlede grupper er sammenlignelige efter anvendelse af tilbøjelighed score3. Undersøgelsens undersøgere kan analysere de absolutte standardiserede forskelle i kovariater før og efter tilbøjelighed matching eller omvendt sandsynlighed for behandling vægtning (iptw) for at sikre kendte konfoundere har været afbalanceret mellem grupperne. Vigtigere, ukendte konfoundere kan ikke være afbalanceret, og man bør være opmærksom på potentialet for resterende confounding.

Når henrettet korrekt, selv om, tilbøjelighed scores er et kraftfuldt værktøj, der kan forudsige og replikere resultater af randomiserede kontrollerede forsøg16. Af de tilgængelige tilbøjeligheder-score teknikker, matching og IPTW er generelt foretrukket17. Inden for IPTW vægtes patienterne med deres tilbøjelighed eller sandsynlighed for behandling. Stabiliserende vægte anbefales generelt over rå vægte, mens trimning af vægtene også kan betragtes som18,19,20,21.

Når studiegrupperne er afbalancerede, kan de følges indtil resultatet af interesse. Undersøgelser, der udnytter administrative data, kan være interesserede i resultater såsom tilbagetagelsesrater og analyser af tid til begivenhed. I undersøgelser, der er interesseret i dødelighed, indeholder det militære sundhedssystems data lager et felt for vital status, der kan forstærkes yderligere ved hjælp af national Death Index (NDI)22,23. NDI er en centraliseret database over døds rekord oplysninger fra statskontorer, der forvaltes af Center for Disease Control. Efterforskere kan anmode om grundlæggende vitale status og/eller specifik dødsårsag baseret på dødsattest.

Den følgende protokol beskriver processen med at gennemføre en administrativ database undersøgelse ved hjælp af MDR suppleret med dødelighed oplysninger fra NDI. Det beskriver brugen af IPTW til at balancere baseline forskelle mellem to behandlingsgrupper, herunder SAS kode og eksempel output.

Subscription Required. Please recommend JoVE to your librarian.

Protocol

Følgende protokol følger retningslinjerne fra vores institutionelle etiske udvalg for menneskerettigheder.

1. definition af kohorten

  1. Fastlægge og klart definere inklusions-og udelukkelseskriterierne for den planlagte kohorte ved hjælp af enten 1) et register eller 2) datapunkter, der kan udvindes fra MDR, såsom administrative koder for diagnoser eller procedurer (dvs. alle patienter med mere end to ambulante diagnoser eller en indlæggelse diagnose af atrieflimren).
    1. Hvis du bruger en registreringsdatabase, skal du inkludere to eller flere patient-id'er til nøjagtig matchning med det militære sundhedssystems data lager, såsom det medicinske rekord nummer (angivet i forskellige datasæt som patuniq og edipn), fulde navn, fødselsdato og/eller sponsorens CPR-nummer.
      Bemærk: som med alle undersøgelser, der udnytter personlige helbredsoplysninger, er sikkerhedsforanstaltninger påkrævet og skal overholdes. Korrekt kryptering og datastyring skal anvendes i løbet af indsamlingsprocessen, og oplysningerne bør de identificeres snarest muligt.
      Bemærk: ved henvisning til sponsorens CPR-nummer (sponssn) er alle patienter opført med hensyn til deres forhold til det militære medlem (eller sponsor), herunder en identifikator for sponsor, ægtefælle og børn. Vær opmærksom på, at Relations koden og sponsorens CPR-nummer kan ændre sig med tiden i datasættet, når patienterne bliver voksne og bliver gift eller skilt. Således, flere patient-id'er bidrage til at sikre nøjagtighed.
    2. Hvis du definerer kohorterne gennem administrativ kodning, skal du udføre en omfattende litteratursøgning for at identificere tidligere undersøgelser, der potentielt har valideret interesse koderne. Gennemgå ICD-9-CM24 og/eller ICD-10-cm25 manualer for at tydeliggøre kode definitioner og nabo koder for at sikre, at der anvendes et passende interval af koder. Derudover bør du gennemgå de Krydsreferencetabeller, der er inkluderet i vejledningerne, til overvejelse af yderligere koder for inklusion/udelukkelse. Tidligere valideringsundersøgelser indeholder rapporter om positiv prædiktiv værdi, følsomhed og specificitet for forskellige administrative kodnings strategier. Disse støtte i optimering af kohorte udvælgelse samt resultat identifikation.
  2. Bestem, om der er begrænsninger (f. eks. baseret på alder) på den ønskede kohorte eller andre udelukkelseskriterier for at inkludere i data anmodningen.
  3. Definer studieperioden til at inkludere tid før indeks datoen for indsamling af baseline kovariater (normalt 12 måneder i administrative data Research) samt undersøgelsens slutdato.

2. definition af kovariater og resultater

  1. Definer administrative koder for forstyrrende betingelser gennem litteratursøgninger og brug af ICD-9-cm24 og/eller ICD-10-cm25 manualer som udført i trin 1.1.2 ovenfor.
  2. Bestem andre nødvendige kovariater, herunder demografi, medicin og laboratoriedata.
  3. Gennemse tilgængelige datafelter i MDR-dataordbogen her: https://Health.mil/Military-Health-topics/Technology/support-Areas/mdr-m2-ICD-Functional-References-and-Specification-Documents.

3. indgivelse af en anmodning om MDR

  1. Indhente godkendelse fra institutions undersøgelsesudvalget.
  2. Fuldfør et program for datadelings aftaler, der kan findes her: https://Health.mil/Military-Health-topics/Privacy-and-Civil-Liberties/submit-a-data-Sharing-Application?type=All#RefFeed. Som en del af programmet skal du angive datafelter og filer, der anmodes om, på DRT Military Health System data repository (MDR)-udtrækninger (sammenkædet fra ansøgningsformular). Angiv, om teamet anmoder en dataanalytiker om at levere de rå data, eller om teamet skal have adgang til MDR direkte. Yderligere angive, om anmodningen er for en engangs data pull eller hvis regelmæssige trækker anmodes dagligt, månedligt eller årligt.
    Bemærk: for at få MDR data ved enhver metode, skal der være en sponsor, der er en statslig medarbejder (aktiv tjeneste militær eller GS), som normalt er medlem af investigator team.
  3. Hvis du får adgang til MDR direkte, skal du udfylde "MDR-godkendelses anmodningsformularen" og "MDR CS 2875 form", der kan findes her: https://Health.mil/Military-Health-topics/Technology/support-Areas/mdr-m2-ICD-Functional-References-and-Specification-Documents.

4. adgang til MDR og udvinding af relevante data

  1. Hvis du har adgang til MDR direkte, Følg instruktionerne for at få adgang til og bruge MDR herunder softwarekrav og eksempel SAS-programmer, der er tilgængelige i "MDR brugervejledning" og "MDR funktionel guide" findes her: https://Health.mil/Military-Health-topics/Technology/support-Areas/mdr-m2-ICD-Functional-References-and-Specification-Documents.
    Bemærk: filer gemmes i SAS-format og tilgås via en UNIX Shell generelt ved hjælp af Putty. exe samt et FTP-program. Kendskab til SAS er påkrævet.
  2. For et nyttigt overblik over MDR setup, gennemgå DOD guide for DOD forskere om brug af MHS data https://Health.mil/reference-Center/publications/2012/10/10/guide-for-DoD-Researchers-on-using-MHS-data.
  3. Som gjort i trin 2,3, gennemgå MDR data dictionary for detaljerede oplysninger om alle tilgængelige data filer https://Health.mil/Military-Health-topics/Technology/support-Areas/mdr-m2-ICD-Functional-References-and-Specification-Documents.
    Bemærk: ikke alle datafiler omfatter alle patient-id'er til matchning/fletning. Dataordbogen hjælper med at liste id'er, der er tilgængelige for hver datafil. DOD ID-nummer, også kaldet "patuniq" eller "edipn", er nødvendig for at udtrække apotek oplysninger, for eksempel. Det er derfor vigtigt at have alle relevante patient-id'er i data mining-trinnet for at sikre evnen til at matche alle patientoplysninger på tværs af flere år og flere datasæt. Det er vigtigt at gentage, at iboende i forskning, der involverer PHI, streng overholdelse af databeskyttelsesprocedurer er påkrævet efter at erhverve nødvendige godkendelse, og PHI bør destrueres, efter at det ikke længere er nødvendigt.
  4. Indhente de nødvendige patient-id'er for kohorten ved at få adgang til VM6 begunstigede data (Sep. 2002 – nu) eller pben-fil (Sep. 2000 – Sep 2002).
    1. Brug makroen nedenfor eller et lignende program til at matche VM6 data med kohorte filen. I dette tilfælde kan koden bruges som skrevet til at finde patientjournal numre (MRNs) for en given patient social, der allerede er i en kohorte fil. Brug forskellige variabelnavne i VM6 data Draw og kohorte filer til patient navne og fødselsdatoer for at hjælpe med at kontrollere for fejl senere. For at beskytte PHI skal du opbevare dataene med patient-id'er på tjenestenoden i det område, der er angivet som en del af data anmodningen (Se MDR-brugervejledning).
      Bemærk: MRNs kaldes DOD ID-nummeret, PATUNIQ eller EDIPN i MDR).
      Equation 1
    2. Da database indgange aldrig er helt fri for fejl, udføre fejlkontrol efter hvert større skridt ud over at kontrollere programloggen og output for eventuelle problemer. Brug nedenstående data trin til at gennemgå potentielle uoverensstemmelser med ovenstående kode (patient filer matches baseret på patientens/beneficiantens sociale). Når du sammenligner navne fra kohorte filen (efter navn, fornavn) med VM6-filen (last_name, first_name), skal du kun matche de første tre bogstaver for at reducere falske fejl, der opstår med forskelle i stavning/afstand mellem filer.
      Equation 2
    3. Gennemse fejl datafil ("checkname"). Ignorer fejl, som skyldes tegnsætning (O'Reilly vs. OReilly). Kontroller andre problematiske fejl med manuel gennemgang af helbreds journen, eller Overvej at kassere relevante patient/patientoplysninger, hvis der er væsentlige fejl, og hvis det ikke er muligt at kontrollere.
  5. Udtrække de resterende nødvendige data fra MDR.
    1. Hvis det er nødvendigt, få race og sex fra vm6ben filer (pben filer før september 2002), fusionere med kohorte fil, og kontrollere for fejl som gjort ovenfor:
      Equation 3
    2. Indhente døds data fra døds Master filen, fusionere med kohorte filen, og kontrollere for fejl som gjort ovenfor:
      Equation 4
    3. Indhente yderligere datafiler, der skal bruges til analyse (Se MDR funktionel brugervejledning for dataplacering og yderligere nyttige SAS-makroer og-kode).
      Bemærk: data lagres i separate filer, afhængigt af om det var direkte leveret af militært sundhedsvæsen eller leveret andetsteds og faktureret til det militære sundhedsvæsen. Eksempelfiler er vist nedenfor.
      CAPER – direkte pleje, ambulante filer fra fy 2004 – nuværende
      SADR – direkte pleje, ambulante filer fra 1998 – 2005
      SIDR – direkte pleje, hospitalsindlæggelse (direkte pleje) fra 1989 – nuværende
      TEDI – faktureret pleje, institutionelle krav filer fy 2001 – nuværende
      HCSRI – faktureret pleje, institutionelle krav i 1994 – 2005
      TEDNI-faktureret pleje, ikke-institutionelle krav fy 2001-nuværende
      HCSRNI – faktureret pleje, ikke-institutionelle krav fy 1994 – 2005
      PDTS – apotek fil med individuelle recepter fy 2002 – nu

5. fletning af data og opbygning af summativ filer

  1. Hvorvidt data er indhentet fra en dataanalytiker eller indhentet direkte fra mdr som gjort i afsnit 4 ovenfor, datafiler skal summeres og fusioneret sammen til at danne analyse filen. Gennem hele processen, udnytte metoder, der forbedrer data nøjagtighed, herunder fejlkontrol og gennemgang af logfiler og output som også tidligere drøftet.
    1. Når du fletter data, skal du bruge mindst to patient-id'er, når det er muligt, for at sikre et stærkt match (f. eks. helbredsjournal nummer og fødselsdato), da der kan være fejl i alle felter. Gennemse dataene efter data fletningen for at sikre de forventede resultater. Kør koden for at sikre, at de første tre bogstaver i navnet matcher ud over et andet id eller to, er nyttigt til at verificere korrekte matches (Se trin 4.5.1).
      Bemærk: efter navnet matcher muligvis ikke, hvis patienten var gift i den pågældende periode. Mindre variationer kan også eksistere i navnefelter på grund af apostroffer eller mellemrum samt slåfejl.
    2. Vær særlig opmærksom på kampe ved Terminal trin i processen, såsom at definere patienter, der havde resultater.
  2. Uddrag baseline komorbiditeter ved hjælp af ICD-9-cm eller ICD-10-cm koder fra perioden før indeks datoen, den dato, hvor patienten anses for at komme ind i studiet. Brug generelt 12 måneder før indeks datoen til at definere komorbiditeter.
    1. Sørg for, at patienterne var berettiget til det militære sundhedssystem i den oprindelige periode (kan verificeres månedligt i vm6ben-filen).
    2. Søg efter baseline diagnosekoder i ambulant og/eller indlæggelse filer for at etablere baseline komorbiditeter i den oprindelige 12-måneders periode forud for indeks datoen. Brug ICD-9-CM-eller ICD-10-CM-koder, der er fastlagt i afsnit 1. Hvis du bruger Elixhauser comorbidities, skal du bruge tilgængelig software fra HCUP, så du er sikker på at ændre navnene på diagnose variabler og filer efter behov. (https://www.hcup-US.AHRQ.gov/toolssoftware/comorbidity/comorbidity.jsp#download)
  3. Søg i patient og/eller indlæggelse filer efter indeks datoen for resultater af interesse defineret ved ICD-9-cm eller ICD-10-cm koder, såsom hospitalsindlæggelse for myokardieinfarkt som primær diagnose (Søg efter 410. x1 i Sidr).
  4. Angiv en slutdato for studiet for alle patienter som en cutoff til opfølgning for patienter, der ikke har påvist resultatet af interesse. Afgøre, hvilke patienter der skal censureres før studiets afslutning.
    1. Søg vm6ben fil for at sikre berettigelse til sundhedspleje gennem undersøgelsens slutdato.; ellers censurere patienten på tidspunktet for tab af støtteberettigelse.
    2. Hvis det er vigtigt at begrænse undersøgelsen til aktive brugere af sundhedssystemet uafhængigt af berettigelse, såsom aktive brugere af apoteket, derefter bestemme den sidste sundhedspleje kontakt (såsom sidste medicin fylde) i datafilerne og censurere de patienter på denne dato.
      Bemærk: Vær forsigtig med at bruge telefonmøder, da de kan være til stede i helbreds journen, efter at en død har fundet sted, eller hvis modtageren har forladt sundhedsvæsenet på en anden måde.

6. match til national Death Index (NDI)

  1. Når hele kohorten er identificeret, skal du sende oplysningerne til det nationale døds indeks for at matche, hvis MORTALITET er et endepunkt.
    1. Medtag først hensigten om at matche til NDI i anmodningerne om MDR-data og IRB-godkendelse. Sørg for godkendelse, og Gennemfør alle data krypterings trin, før du sender beskyttede sundhedsoplysninger (PHI) til NDI til matchning.
  2. "National Death Index (NDI) ansøgningsskema" og anvisninger for at anmode om døds data fra det nationale døds indeks kan findes her: https://www.CDC.gov/NCHS/NDI/index.htm.
  3. Send data på en password-beskyttet CD ved overnight mail til NDI. Resultaterne vil blive sendt tilbage ca 2 uger senere på samme måde.
  4. Efter at have modtaget NDI resultater, gennemgå delvise kampe for potentiel inklusion/udelukkelse.
    1. "Kapitel 4-vurdering af NDI output" giver et nyttigt overblik over gennemgang af resultater og kan findes på samme webside: https://www.CDC.gov/NCHS/NDI/index.htm. Kampe på CPR-nummer generelt giver den stærkeste match.
    2. Når det er nødvendigt, krydstjekke dødsfald i Social Security Death index og/eller Veterans Affairs beneficianten identifikation Records Locator delsystem (BIRLS) for at forbedre nøjagtighed. Vær opmærksom på, at servicemedlemmer, der dør oversøiske vil sandsynligvis ikke dukke op på en NDI søgning, men er ofte anerkendt i MDR vital status fil eller i VA BIRLS.
  5. Flet døds filen med hoved kohorte fil efter afslutningen af anmeldelsen.

7. de-identificerende data

  1. Når alle nødvendige oplysninger er erhvervet, de-identificere datafiler til at hjælpe med at beskytte PHI. Opret en tilfældig patientidentifikation for hver patient ved hjælp af "ranuni" (Se MDR funktionel brugervejledning). Fjern patientens sociale, sygejournal nummer, fødselsdato (efter computer alder), etc., fra datafiler. Hvis det er nødvendigt (og godkendt), skal du gemme en nøgle, der forbinder det tilfældige patient-id til PHI sikkert på SCE-noden.

8. beregning af tilbøjeligheden score18,19,26

  1. Brug logistisk regression til at modellere sandsynligheden for behandling (proc Logistic in SAS).
    1. Angiv datafilen ("dat" i eksemplet).
    2. Brug klasse opgørelse til at angive kategoriske variabler. Brug "ref = First" til at angive den laveste værdi (f. eks. 0) som referenceværdi.
    3. I model opgørelsen skal du angive behandlings variablen som den afhængige variabel (RX) og angive værdien for "hændelsen" som værdien for modtagelse af behandling (1 i dette tilfælde).
    4. Inkluder eventuelle prædiktorer for at modtage behandling som kovariater i modellen, især hvis de kan være forudsigere af resultatet (f. eks. død). Overvej, om interaktioner mellem termer kan påvirke behandlingen. Medtag dem i modellen ved hjælp af en "*" (f. eks. en mandlig * CKD), eller brug den syntaks, der er vist nedenfor, til at placere "|" mellem kovariater og "@ 2" i slutningen for at angive alle 2 x 2 interaktioner, alt efter hvad der er relevant for den specifikke model.
    5. Brug output-sætningen til at angive, at den forventede sandsynlighed for behandling (prob) vil blive defineret af "PS" og output til filen "ps_data".
      Equation 5
      Bemærk: variabler i model: mandlig: mandlig sex (binær), CKD: kronisk nyresygdom (binær), lever: kronisk leversygdom (binær), diabetes (binær), KOL: kronisk obstruktiv lungesygdom (binær), CHF: hjertesvigt (binær), CAD: koronararteriesygdom (binær), CVD: cerebrovaskulær sygdom (binær), pad: perifer arteriel sygdom (binær), alder (kontinuerlig).
  2. Beregn vægte fra den forventede sandsynlighed (tilbøjelighed score). Hvis patienten fik behandling (RX = 1), er tilbøjeligheden vægt 1/(tilbøjelighed score). Hvis patienten ikke har modtaget behandling, er tilbøjeligheden vægt 1/(1-tilbøjelighed score).
    Equation 6
  3. Stabilisere tilbøjelighed score ved at dividere det med den gennemsnitlige vægt. I koden nedenfor betyder proc output den gennemsnitlige vægt i variablen "mn_wt" i datafilen "m." De data, der er angivet nedenfor, som bevarer mn_wt fra datafilen "m", beregner derefter de stabiliserede tilbøjelighed scores (st_ps_weight) for hver observation.
    Equation 7
  4. Kontroller afbalancering efter at have anvendt den inverse sandsynlighed for behandlings vægtning.
    1. Stddiff-makroen forenkler beregning af standardiserede middel forskelle for kovariater før og efter vægtning i SAS. Koden for makroen kan findes her: http://www.Lerner.CCF.org/qhs/software/lib/stddiff.SAS.
    2. Beregn den standardiserede middel forskel før vægtning. Som med alle makroer skal makrokoden køres i SAS, før den kaldes. Et eksempel på en kalde erklæring er nedenfor med de kovariater af interesse.
      Equation 8
      Inds-inputdatasæt, groupvar-variabel, der definerer studiegrupperne, charvars – kategoriske variabler, numvars – kontinuerlige variabler, stdfmt – format af standardiseret forskel, outds – output datasæt.
    3. Kald stddiff-makroen igen for at beregne den standardiserede middel forskel efter vægtning. "Wtvar" angiver den variabel, der indeholder det standardiserede tilbøjelighed-resultat, og føjes til sætningen for makro opkaldet. Hvis de standardiserede forskelle er mindre end eller lig med 0,1, anses afvejningen for at være vellykket.
      Equation 9
  5. ASD før og efter vægtning kan rapporteres i tabel-eller grafformat. For anvisninger til at udnytte en SAS-makro til at generere et plot, se venligst de supplerende materialer.
  6. De IPTW-justerede data kan nu anvendes i en univariat analyse efter sikring af afbalancering af målte confounders.

9. oprettelse af resultat modellen og generering af en afbildning af kumulativ forekomst funktion

  1. Der er et par måder, som den resulterende analyse af tid og hændelser kan afbildes på, herunder brug af proc lifetest til at generere et overlevelses plot. Brug vægt sætningen til at angive den standardiserede tilbøjelighed vægt.
  2. Brug proc phreg til at generere et cif-plot med en tilbøjelighed vægt.
    1. I proc phreg skal du referere til en kovariatfil for at angive kovariat værdier, der skal bruges ved generering af plottet. I dette tilfælde indeholder kovariat-filen kun den enkelte variabel RX, som kan være 1 eller 0.
      Equation 10
    2. Slå ODS-grafik til. Brug yderligere udsagn efter behov for at angive output filer til grafen eller filtype (JPEG, etc.; se https://support.SAS.com/Documentation/CDL/en/statug/63962/HTML/default/Viewer.htm#statug_odsgraph_sect014.htm).
      Equation 11
    3. I syntaksen for proc phreg skal du bruge vægt sætningen til at angive den standardiserede variabel for tendens score. Angiv værdier for baseline-kovariater ved hjælp af den oprindelige sætning for at kunne afbilde den kumulative forekomst funktion. Angiv de Strata, som skal bruges til plottet, ved hjælp af "RowId" (i dette tilfælde RX 1 vs. 0). Tallet i parentes efter resultat variablen ("Event") angiver værdien (-erne) for den variabel, der skal censureres, og som skal inkludere censornings datoen og eventuelle konkurrerende begivenheder. I dette tilfælde er 0 censureret og 1 er en sand begivenhed.
      Equation 12

Subscription Required. Please recommend JoVE to your librarian.

Representative Results

Når IPTW er fuldført, kan tabeller eller plot af de absolutte standardiserede forskelle genereres ved hjælp af henholdsvis stddiff-makrokoden eller makrokoden asdplot. Figur 1 viser et eksempel på passende afbalancering i en stor kohorte af 10.000 deltagere ved hjælp af asdplot-makroen. Efter anvendelse af tilbøjeligheden score, de absolutte standardiserede forskelle blev reduceret betydeligt. Den cutoff, der anvendes til den absolutte standardiserede forskel er noget vilkårlig, selv om 0,1 er ofte brugt og betegner ubetydelig forskel mellem de to grupper. I en lille kohorte er det vanskeligere at opnå en korrekt afbalancering. Figur 2 viser de mislykkede resultater af forsøget på at afbalancere kovariater i en kohorte af 100 deltagere.

Når den standardiserede tilbøjelighed score genereres, kan studie teamet fortsætte med resultatanalyse. Overlevelse analyse er ofte ansat på grund af behovet for at censurere deltagere med ujævn opfølgning information, og figur 3 skildrer et eksempel på brugen af proc phreg med standardiseret tilbøjelighed score vægte til at generere en kumulativ incidens funktion (cif) plot. CIF-plottet skildrer det stigende antal begivenheder over tid. I dette tilfælde, den ubehandlet, eller kontrol, gruppe (ingen RX) har et større antal hændelser og er forholdsvis værre end den behandlede gruppe (RX).

Figure 1
Figur 1: eksempel på vellykket afbalancering. I en stor kohorte (n = 10.000) opnåede IPTW afbalancering af kovariaterne med alle absolutte standardiserede forskelle, der reducerede til mindre end 0,1. Venligst klik her for at se en større version af dette tal.

Figure 2
Figur 2: eksempel på mislykket afbalancering. I en lille kohorte (n = 100) var IPTW ikke i stand til at opnå afbalancering af kovariaterne med mange absolutte standardiserede forskelle, der forblev større end 0,1. Venligst klik her for at se en større version af dette tal.

Figure 3
Figur 3: eksempel på kumulativ forekomst funktion plot sammenligning af behandlingsgrupper. Over tid øges den kumulative forekomst af dødelighed i begge grupper, selv om den er højere i den ubehandlede gruppe (ingen RX). Således, i dette eksempel, den behandlede gruppe har forbedret overlevelse. Venligst klik her for at se en større version af dette tal.

Supplerende materialer. Klik venligst her for at se denne fil (Højreklik for at downloade).

Subscription Required. Please recommend JoVE to your librarian.

Discussion

Retrospektive analyser ved hjælp af store administrative datasæt giver et effektivt og omkostningseffektivt alternativ, når randomiserede, kontrollerede forsøg ikke er gennemførlige. Det relevante datasæt vil afhænge af populationen og variabler af interesse, men MDR er en attraktiv mulighed, der ikke har aldersbegrænsninger set med Medicare data. Med alle datasæt er det vigtigt at være fortrolig med dets layout og dataordbog. Der skal udvises forsigtighed undervejs for at sikre, at komplette data registreres, og at dataene matches nøjagtigt og flettes.

Koder for diagnoser bør defineres ved hjælp af eksisterende litteratur og en grundig forståelse af ICD-9-CM og ICD-10-CM kodningssystem for at maksimere værdien af de tildelte diagnoser. Eksisterende sæt af comorbiditetskoder, herunder elixhauser27 eller raffineret charlson comorbiditet index28,29, kan bruges til at definere komorbide forhold, der kan påvirke resultatet af interesse. Ligeledes validerede kodnings algoritmer i administrative data og bør udnyttes. Validering bør forblive et område med aktiv forskning, da der er fortsat læring om optimal anvendelse af ICD-9-CM og ICD-10-CM kodning algoritmer til at maksimere nøjagtig klassificering af en bred vifte af sygdomme.

Propensity scores kan bruges til at afhjælpe den skævhed, der er iboende i enhver retrospektiv analyse. Effektiv tilbøjelighed score vægtning eller matchning bør reducere den absolutte standardisere forskellen (ASD) under den ønskede tærskel, generelt sat til 0,1. Passende afbalancering hjælper med at sikre sammenlignelighed af behandlingsgrupperne med hensyn til kendte confounders, og passende ansat tilbøjelighed score teknikker er blevet brugt til succes replikere randomiserede forsøg resultater. Når det er korrekt afbalanceret, kan behandlingsgrupperne sammenlignes med univariat time-to-Event eller anden analyse.

Selv med passende afbalancering, der er potentiale for resterende forstyrrende3, så efterforskningsholdet bør begrænse effekten af umålte confounders. Desuden, hvis virkningerne af kovariaterne på behandlingen udvælgelse er stærke, bias kan stadig forblive30. I små kohorter, tilbøjeligheden scores er usandsynligt, at fuldt ud at reducere ASD under 0,1 for alle variabler og regression justering kan anvendes til at hjælpe med at fjerne resterende ubalance31. Regressions justering kan også bruges i undergruppeanalyse, når passende balance ikke længere er sikret.

Når det gøres korrekt, forskning med administrative data giver rettidige svar på vigtige kliniske spørgsmål i fravær af randomiserede kliniske forsøg. Selv om det er umuligt at fjerne alle bias fra observationsstudier, bias kan begrænses ved hjælp af tilbøjelighed scorer og resterende omhyggelige analyser.

Subscription Required. Please recommend JoVE to your librarian.

Disclosures

Forfatterne har intet at afsløre.

Acknowledgments

Forskning rapporteret i denne publikation blev støttet af det nationale center for fremme translational Sciences af National Institutes of Health under tildeling nummer UL1 TR002345. Indholdet er udelukkende ansvaret for forfatterne og ikke nødvendigvis repræsenterer de officielle synspunkter af de nationale institutter for sundhed.

Disclaimer: Desuden er de synspunkter, der er udtrykt i denne artikel, er de af forfatteren kun og bør ikke fortolkes til at repræsentere på nogen måde, at de amerikanske regering, det amerikanske Department of Defense (DoD), eller de Forenede Staters Department of the Hær. Identifikationen af specifikke produkter eller videnskabelige instrumentering betragtes som en integrerende del af den videnskabelige bestræbelse og udgør ikke godkendelse eller underforstået påtegning fra forfatteren, DoD, eller nogen komponent agentur.

Materials

Name Company Catalog Number Comments
CD Burner (for NDI Request)
Computer
Putty.exe Putty.org
SAS 9.4 SAS Institute Cary, NC
WinSCP or other FTP software https://winscp.net/eng/index.php

DOWNLOAD MATERIALS LIST

References

  1. Concato, J., Shah, N., Horwitz, R. I. Randomized, controlled trials, observational studies, and the hierarchy of research designs. New England Journal of Medicine. 342 (25), 1887-1892 (2000).
  2. Austin, P. C., Platt, R. W. Survivor treatment bias, treatment selection bias, and propensity scores in observational research. Journal of Clinical Epidemiology. 63 (2), 136-138 (2010).
  3. Sturmer, T., Wyss, R., Glynn, R. J., Brookhart, M. A. Propensity scores for confounder adjustment when assessing the effects of medical interventions using nonexperimental study designs. Journal of Internal Medicine. 275 (6), 570-580 (2014).
  4. Schermerhorn, M. L., et al. Long-Term Outcomes of Abdominal Aortic Aneurysm in the Medicare Population. New England Journal of Medicine. 373 (4), 328-338 (2015).
  5. Williams, R. J. II, et al. A Propensity-Matched Analysis Between Standard Versus Tapered Oral Vancomycin Courses for the Management of Recurrent Clostridium difficile Infection. Open Forum Infectious Diseases. 4 (4), (2017).
  6. Mitchell, J. D., et al. Impact of Statins on Cardiovascular Outcomes Following Coronary Artery Calcium Scoring. Journal of the American College of Cardiology. 72 (25), 3233-3242 (2018).
  7. Rush, T., McGeary, M., Sicignano, N., Buryk, M. A. A plateau in new onset type 1 diabetes: Incidence of pediatric diabetes in the United States Military Health System. Pediatric Diabetes. 19 (5), 917-922 (2018).
  8. Rhon, D. I., Greenlee, T. A., Marchant, B. G., Sissel, C. D., Cook, C. E. Comorbidities in the first 2 years after arthroscopic hip surgery: substantial increases in mental health disorders, chronic pain, substance abuse and cardiometabolic conditions. British Journal of Sports Medicine. , (2018).
  9. Mitchell, J., Paisley, R., Moon, P., Novak, E., Villines, T. Coronary Artery Calcium Score and Long-term Risk of Death, Myocardial Infarction and Stroke: The Walter Reed Cohort Study. Journal of the American College of Cardiology: Cardiovascular Imaging. , (2017).
  10. McCormick, N., Lacaille, D., Bhole, V., Avina-Zubieta, J. A. Validity of myocardial infarction diagnoses in administrative databases: a systematic review. PLoS ONE. 9 (3), e92286 (2014).
  11. Huo, J., Yang, M., Tina Shih, Y. -C. Sensitivity of Claims-Based Algorithms to Ascertain Smoking Status More Than Doubled with Meaningful Use. Value in Health. , Available from: https://doi.org/10.1016/j.jval.2017.09.002 (2017).
  12. Nayan, M., et al. The value of complementing administrative data with abstracted information on smoking and obesity: A study in kidney cancer. Canadian Urological Association Journal. 11 (6), 167-171 (2017).
  13. Birman-Deych, E., et al. Accuracy of ICD-9-CM codes for identifying cardiovascular and stroke risk factors. Medical Care. 43 (5), 480-485 (2005).
  14. Preen, D. B., Holman, C. D., Spilsbury, K., Semmens, J. B., Brameld, K. J. Length of comorbidity lookback period affected regression model performance of administrative health data. Journal of Clinical Epidemiology. 59 (9), 940-946 (2006).
  15. Rector, T. S., et al. Specificity and sensitivity of claims-based algorithms for identifying members of Medicare+Choice health plans that have chronic medical conditions. Health Services Research. 39 (6 Pt 1), 1839-1857 (2004).
  16. Hernán, M. A., et al. Observational studies analyzed like randomized experiments: an application to postmenopausal hormone therapy and coronary heart disease. Epidemiology (Cambridge, Mass.). 19 (6), 766-779 (2008).
  17. Austin, P. C. The relative ability of different propensity score methods to balance measured covariates between treated and untreated subjects in observational studies. Medical Decision Making. 29 (6), 661-677 (2009).
  18. Robins, J. M., Hernan, M. A., Brumback, B. Marginal structural models and causal inference in epidemiology. Epidemiology. 11 (5), 550-560 (2000).
  19. Robins, J. Marginal structural models. 1997 Proceedings of the American Statistical Association, section on Bayesian statistical science. , 1-10 (1998).
  20. Thoemmes, F., Ong, A. D. A Primer on Inverse Probability of Treatment Weighting and Marginal Structural Models. Emerging Adulthood. 4 (1), 40-59 (2016).
  21. Xu, S., et al. Use of stabilized inverse propensity scores as weights to directly estimate relative risk and its confidence intervals. Value in Health: the Journal of the International Society for Pharmacoeconomics and Outcomes Research. 13 (2), 273-277 (2010).
  22. Cowper, D. C., Kubal, J. D., Maynard, C., Hynes, D. M. A primer and comparative review of major US mortality databases. Annals of Epidemiology. 12 (7), 462-468 (2002).
  23. Skopp, N. A., et al. Evaluation of a methodology to validate National Death Index retrieval results among a cohort of U.S. service members. Annals of epidemiology. 27 (6), 397-400 (2017).
  24. Buck, C. J. 2015 ICD-9-CM for Hospitals, Volumes 1, 2, & 3, Professional Edition. , Elsevier Saunders. (2015).
  25. Buck, C. J. 2018 ICD-10-CM for Hospitals, Professional Edition. , Elsevier Saunders. (2018).
  26. Guo, S., Fraser, W. M. Propensity Score Analysis: Statistical Methods and Applications, Second Edition. , Sage Publications. (2015).
  27. Elixhauser, A., Steiner, C., Harris, D. R., Coffey, R. M. Comorbidity measures for use with administrative data. Medical Care. 36 (1), 8-27 (1998).
  28. Charlson, M. E., Pompei, P., Ales, K. L., MacKenzie, C. R. A new method of classifying prognostic comorbidity in longitudinal studies: development and validation. Journal of Chronic Diseases. 40 (5), 373-383 (1987).
  29. Deyo, R. A., Cherkin, D. C., Ciol, M. A. Adapting a clinical comorbidity index for use with ICD-9-CM administrative databases. Journal of Clinical Epidemiology. 45 (6), 613-619 (1992).
  30. Austin, P. C., Stuart, E. A. The performance of inverse probability of treatment weighting and full matching on the propensity score in the presence of model misspecification when estimating the effect of treatment on survival outcomes. Statistical Methods in Medical Research. 26 (4), 1654-1670 (2017).
  31. Austin, P. C. Balance diagnostics for comparing the distribution of baseline covariates between treatment groups in propensity-score matched samples. Statistics in Medicine. 28 (25), 3083-3107 (2009).

Tags

Medicin inverse sandsynlighed for behandling vægtning tilbøjelighed score nationale døds indeks militære sundheds system data repository bias behandling udvælgelse confounding Big data
Omvendt sandsynlighed for behandling vægtning (tilbøjelighed score) ved hjælp af det militære sundheds system data repository og national Death index
Play Video
PDF DOI DOWNLOAD MATERIALS LIST

Cite this Article

Mitchell, J. D., Gage, B. F.,More

Mitchell, J. D., Gage, B. F., Fergestrom, N., Novak, E., Villines, T. C. Inverse Probability of Treatment Weighting (Propensity Score) using the Military Health System Data Repository and National Death Index. J. Vis. Exp. (155), e59825, doi:10.3791/59825 (2020).

Less
Copy Citation Download Citation Reprints and Permissions
View Video

Get cutting-edge science videos from JoVE sent straight to your inbox every month.

Waiting X
Simple Hit Counter