Waiting
Login processing...

Trial ends in Request Full Access Tell Your Colleague About Jove
Click here for the English version

Medicine

Inverse sannsynlighet for behandling vekting (hang resultat) ved hjelp av Military Health system data repository og National Death index

Published: January 8, 2020 doi: 10.3791/59825

Summary

Når randomiserte kontrollerte studier ikke er gjennomførbart, en omfattende helsevesenet datakilde som Military Health system data repository gir et attraktivt alternativ for retrospektiv analyser. Innlemme dødelighet data fra den nasjonale døds indeks og balansere forskjellene mellom grupper ved hjelp av tilbøyelighet vekting bidrar til å redusere fordommer iboende retrospektiv design.

Abstract

Når randomiserte kontrollerte forsøk ikke er gjennomførbart, gir retrospektiv studier med store data en effektiv og kostnadseffektiv alternativ, selv om de er i faresonen for behandling utvalg bias. Behandling utvalg bias oppstår i en ikke-randomisert studie når behandlingen utvalg er basert på pre-behandling egenskaper som også er knyttet til utfallet. Disse pre-behandling egenskaper, eller confounders, kan påvirke evalueringen av en behandling effekt på utfallet. Tilbøyelighet score minimere denne bias ved å balansere den kjente confounders mellom behandlingsgrupper. Det er noen tilnærminger til å utføre tilbøyelighet score analyser, inkludert stratifying av tilbøyelighet score, tilbøyelighet matchende, og inverse sannsynligheten for behandling vekting (IPTW). Beskrevet her er bruken av IPTW å balansere Baseline komorbiditeter i en kohort av pasienter i US Military Health system data repository (MDR). MDR er en relativt optimal datakilde, siden det gir en inneholdt kohort der nesten komplett informasjon om inn-og polikliniske tjenester er tilgjengelig for kvalifiserte mottakere. Skissert nedenfor er bruken av MDR supplert med informasjon fra den nasjonale døds indeks for å gi robust dødelighet data. Det følger også med forslag til bruk av administrative data. Til slutt deler protokollen en SAS-kode for bruk av IPTW for å balansere kjente confounders og plotte den kumulative forekomst funksjonen for utfallet av interesse.

Introduction

Randomiserte, placebo-kontrollerte forsøk er den sterkeste studien design for å kvantifisere effekten av behandlingen, men de er ikke alltid mulig på grunn av kostnader og tid krav eller mangel på equipoise mellom behandling grupper1. I disse tilfellene gir en retrospektiv kohort design ved hjelp av store administrative data ("store data") ofte et effektivt og kostnadseffektivt alternativ, selv om mangelen på tilfeldig innfører en valg for behandling av bias2. Behandling utvalg bias oppstår i ikke-randomiserte studier når behandlingen vedtaket er avhengig av pre-behandling egenskaper som er knyttet til utfallet av interesse. Disse egenskapene er kjent som forvirrende faktorer.

Fordi tilbøyelighet score minimere denne bias ved å balansere den kjente confounders mellom behandling grupper, har de blitt stadig mer populært3. Tilbøyelighet score har blitt brukt til å sammenligne kirurgiske tilnærminger4 og medisinske regimer5. Nylig har vi brukt en tilbøyelighet analyse av data fra USAs militære Health system data repository (MDR) for å vurdere effekten av statiner i primær forebygging av kardiovaskulære utfall basert på tilstedeværelse og alvorlighetsgraden av koronar arterie kalsium6.

Den MDR, benyttet sjeldnere enn Medicare og VA datasett for forskningsformål, inneholder omfattende administrative og medisinske krav informasjon fra institusjon og polikliniske tjenester som tilbys for aktiv tjeneste militære, pensjonister og andre Department of Defense (DoD) helsetjenester begunstiget og deres pårørende. Databasen omfatter tjenester som tilbys over hele verden på amerikanske militære behandlingstilbud eller på sivile anlegg fakturert til DoD. Databasen inneholder komplette apotek data siden 1. oktober 2001. Laboratoriedata er tilgjengelig fra 2009, men er kun begrenset til militære behandlingsfasiliteter. I MDR er kohorter definert med metoder som inkluderer bruk av diagnosekoder (f.eks. diabetes mellitus7) eller prosedyre koder (f.eks. artroskopisk kirurgi8). Alternativt kan en eksternt definert kohort av kvalifiserte mottakere, for eksempel et register, samsvare med MDR for å skaffe Baseline-og oppfølgings data9. I motsetning til Medicare inkluderer MDR pasienter i alle aldre. Det er også mindre forutinntatt mot menn enn VA databasen siden den inneholder avhengige. Tilgang til MDR er imidlertid begrenset. Vanligvis bare undersøkere som er medlemmer av Military Health system kan be om tilgang, analoge til krav til bruk av VA-databasen. Ikke-statlige forskere som søker tilgang til militære helse systemer data må gjøre det gjennom en datadeling avtale under tilsyn av en regjering sponsor.

Når du bruker et administrativt datasett, er det viktig å huske på begrensningene i tillegg til sterke sider ved administrativ koding. Følsomheten og spesifisitet av koden kan variere basert på den relaterte diagnosen, enten det er en primær eller sekundær diagnose, eller om det er en institusjon eller poliklinisk fil. Innlagte koder for akutt hjerteinfarkt er generelt nøyaktig rapportert med positive prediktiv verdier over 90%10, men tobakksbruk er ofte undercoded11. Slike undercoding kan eller ikke kan ha en meningsfull effekt på en studieresultater12. I tillegg kan det finnes flere koder for en gitt betingelse med varierende grad av korrelasjon til den aktuelle sykdommen13. En undersøkende team bør utføre en omfattende litteratursøk og gjennomgang av den internasjonale klassifisering av sykdom, niende revisjon, klinisk modifisering (ICD-9-CM) og/eller ICD-10-CM koding håndbøker for å sikre at de riktige kodene er inkludert i studien.

Flere metoder kan anvendes for å forbedre følsomheten og nøyaktigheten av diagnostiske koder for å definere komorbide forhold. En passende "Look-Back"-periode bør inkluderes for å etablere Baseline-komorbiditeter. Perioden for tilbakeblikk inkluderer innleggelse og polikliniske tjenester som ble gitt før studie bidraget. En periode på ett år kan være optimal14. I tillegg krever to separate krav i stedet for et enkelt krav kan øke spesifisitet, mens supplere koding data med farmasøytiske data kan forbedre følsomhet15. Velg revisjoner av manuelle diagrammer på en del av dataene kan brukes til å verifisere nøyaktigheten av kodings strategien.

Når komorbiditeter er definert og vurdert for den aktuelle kohort, kan en tilbøyelighet score brukes til å balansere forskjeller i kovariatene mellom behandlingsgrupper. Tilbøyelighet poengsum er avledet fra sannsynligheten for at en pasient er tildelt en behandling basert på kjente kovariatene. Regnskap for denne tilbøyelighet behandling reduserer effekten at kovariatene har på behandling oppdrag og bidrar til å generere et truer estimat av behandlingseffekt på utfallet. Mens tilbøyelighet score ikke nødvendigvis gi overlegne resultater til multivariabel modeller, gjør de tillater for vurdering av om de behandlede og ubehandlede grupper er sammenlignbare etter påføring av tilbøyelighet score3. Studier etterforskere kan analysere de absolutte standardiserte forskjellene i kovariatene før og etter tilbøyelighet matchende eller inverse sannsynligheten for behandling vekting (IPTW) for å sikre kjente confounders har vært balansert mellom grupper. Viktigere, ukjent confounders kan ikke være balansert, og man bør være klar over potensialet for resterende forvirrende.

Når henrettet riktig, skjønt, tilbøyelighet score er et kraftig verktøy som kan forutsi og gjenskape resultatene av randomiserte kontrollerte studier16. Av de tilgjengelige tilbøyelighet-score teknikker, matchende og IPTW er generelt foretrukket17. Innenfor IPTW, pasienter er vektet etter deres tilbøyelighet eller sannsynlighet for behandling. Stabiliserings vekter anbefales vanligvis over rå vekter, mens trimming av vektene kan også betraktes som18,19,20,21.

Når studiegruppene er balansert, kan de følges til utfallet av interesse. Studier som bruker administrative data kan være interessert i resultater som tilbaketaking priser og tids-til-hendelse-analyser. I studier som er interessert i dødelighet, inneholder det militære helsesystemet data repository et felt for Vital status som kan bli ytterligere forsterket ved hjelp av National Death index (NDI)22,23. Den NDI er en sentralisert database med døden posten informasjon fra statlige kontorer som forvaltes av Center for Disease Control. Etterforskerne kan be om grunnleggende Vital status og/eller spesifikk dødsårsak basert på dødsattesten.

Følgende protokoll beskriver prosessen med å utføre en administrativ database undersøkelse ved hjelp av MDR forsterket med dødelighet informasjon fra NDI. Det detaljer bruken av IPTW å balansere Baseline forskjeller mellom to behandlingsgrupper inkludert SAS-kode og eksempel produksjon.

Subscription Required. Please recommend JoVE to your librarian.

Protocol

Følgende protokoll følger retningslinjene for våre institusjonelle menneskelige etikk komiteer.

1. definere kohort

  1. Bestem og Definer tydelig kriteriene for inkludering og ekskludering for den planlagte kohort med enten 1) et register eller 2) datapunkter som kan trekkes ut fra MDR, for eksempel administrative koder for diagnoser eller prosedyrer (dvs. alle pasienter med mer enn to polikliniske diagnoser eller en døgn diagnose av atrieflimmer).
    1. Hvis benytter en register, inkludere to eller flere pasient kjennemerke for akkurat passer med det militær sunnhet system data omplasserer som legeundersøkelse fortegnelse antallet (katalogiseret inne annerledes data apparater idet patuniq og edipn), fullt navn, fødselsdato, og/eller sponsor ' sosiale garanti antallet.
      Merk: som med alle studier som bruker personlig helseinformasjon, er sikringstiltak nødvendig og må overholdes. Riktig kryptering og datahåndtering må være ansatt under innsamlingsprosessen, og informasjon bør identifiseres så raskt som mulig.
      NOTE: Når henvisning sponsoren ' sosiale garanti antallet (sponssn), alle pasienter er katalogiseret med hensyn til deres slektskap å det militær medlem (eller sponsor), inkluderer en kjennemerke for sponsoren, Spouse, og barn. Vær oppmerksom på at forholdet koden og sponsor personnummer kan endres over tid i datasettet når pasientene blir voksne og gifte eller skilt. Dermed bidrar flere pasient identifikatorer til å sikre nøyaktigheten.
    2. Hvis du definerer kohorter gjennom administrativ koding, utfører du et omfattende litteratursøk for å identifisere tidligere studier som potensielt har validert kodene av interesse. Review ICD-9-CM24 og/eller ICD-10-cm25 håndbøker for å avklare kode definisjoner og nærliggende koder for å sikre at riktig utvalg av koder blir brukt. I tillegg kan du se gjennom kryssreferansetabellene som er inkludert i håndbøkene for vurdering av tilleggskoder for inkludering/ekskludering. Tidligere validering studier inneholder rapporter om positiv prediktiv verdi, følsomhet og spesifisitet for ulike administrative koding strategier. Disse hjelper til med optimalisering av kohort valg samt identifisering av utfall.
  2. Bestem om det er restriksjoner (f.eks. basert på alder) på ønsket kohort eller andre kriterier for ekskludering som skal inkluderes i data forespørselen.
  3. Definer studieperioden slik at den inkluderer tid før indeks dato for innsamling av Baseline-kovariatene (vanligvis 12 måneder i administrativ data forskning), i tillegg til studie sluttdato.

2. definere kovariatene og utfall

  1. Definere administrative koder for forvirrende forhold gjennom litteratursøk og bruk av ICD-9-CM24 og/eller ICD-10-cm25 manualer som gjort i trinn 1.1.2 ovenfor.
  2. Bestem andre nødvendige kovariatene inkludert demografi, medisinering, og laboratoriedata.
  3. Se gjennom tilgjengelige datafelter i MDR data Dictionary her: https://Health.mil/Military-Health-topics/Technology/Support-areas/MDR-m2-ICD-Functional-References-and-Specification-Documents.

3. sende en forespørsel om MDR

  1. Innhente godkjennelse fra den institusjonelle Review Board.
  2. Fullfør en data Delings avtale program som du finner her: https://Health.mil/Military-Health-topics/Privacy-and-Civil-Liberties/submit-a-data-Sharing-Application?type=all#RefFeed. Som en del av programmet, angi datafelt og filer som blir forespurt på DRT Military Health system data repository (MDR) utdrag regneark (koblet fra søknadsskjema). Angi om gruppen ber om en data analytiker som leverer rådata, eller om teamet skal få tilgang til MDR direkte. Ytterligere Spesifiser om forespørselen er for en en gangs data pull eller hvis vanlige trekker forespørres daglig, månedlig eller årlig.
    Merk: for å få MDR-data ved en hvilken som helst metode, må det være en sponsor som er en statlig ansatt (aktiv plikt militær eller GS), som vanligvis er medlem av etterforsker teamet.
  3. Hvis du åpner MDR direkte, må du fylle ut skjemaet "MDR-Autorisasjons forespørsel" og "MDR CS 2875 skjema" som du finner her: https://Health.mil/Military-Health-topics/Technology/Support-areas/MDR-m2-ICD-Functional-References-and-Specification-Documents.

4. få tilgang til MDR og trekke ut relevante data

  1. Hvis du får tilgang til MDR direkte, følger du instruksjonene for å få tilgang til og bruke MDR inkludert programvarekrav og eksempel SAS-programmer som er tilgjengelige i "MDR Brukerhåndbok" og "MDR-funksjonell veiledning" funnet her: https://Health.mil/Military-Health-topics/Technology/Support-areas/MDR-m2-ICD-Functional-References-and-Specification-Documents.
    Merk: filene er lagret i SAS-format og tilgang til gjennom et UNIX Shell vanligvis bruker PuTTY. exe samt en FTP-program. Kunnskap om SAS er nødvendig.
  2. For en nyttig oversikt over MDR oppsett, gjennomgå DOD guide for DOD forskere på å bruke MHS data https://Health.mil/Reference-Center/Publications/2012/10/10/guide-for-DoD-Researchers-on-using-MHS-data.
  3. Som gjort i trinn 2,3, kan du se gjennom MDR data Dictionary for detaljert informasjon om alle tilgjengelige data filer https://Health.mil/Military-Health-topics/Technology/Support-areas/MDR-m2-ICD-Functional-References-and-Specification-Documents.
    Merk: ikke alle datafiler inneholder alle pasient identifikatorer for MATCHING/sammenslåing. Dataordlisten hjelper med å liste opp identifikatorer som er tilgjengelige for hver datafil. Den DOD ID-nummer, også referert til som "patuniq" eller "edipn", er nødvendig for å trekke ut apotek informasjon, for eksempel. Det er derfor viktig å ha alle relevante pasient koder i data utvinnings trinnet for å sikre evnen til å matche all pasientinformasjon over flere år og flere datasett. Det er viktig å gjenta at iboende i forskning som involverer PHI, streng overholdelse av datasikring prosedyrer er nødvendig etter å anskaffe nødvendig godkjenning, og PHI bør ødelegges etter at det ikke lenger er nødvendig.
  4. Innhente nødvendige pasient koder for kohort ved å få tilgang til vm6 mottakerdata (Sep 2002 – nå) eller pben-fil (Sep 2000 – Sep 2002).
    1. Bruk makroen under eller et lignende program til å matche vm6-data med kohort filen. I dette tilfellet kan koden brukes som skrevet for å finne pasientens medisinske postnumre (MRNs) for en gitt pasient sosial som allerede er i en kohort fil. Bruk forskjellige variabelnavn i vm6 data Draw-og kohort filer for Pasientnavn og bursdager for å se etter feil senere. Hvis du vil beskytte PHI, lagrer du dataene med pasient-ID-er på service-noden i det angitte området som en del av data forespørselen (se MDR-brukerhåndbok).
      Merk: MRNs er referert til som DOD ID-nummer, PATUNIQ eller EDIPN i MDR).
      Equation 1
    2. Som database oppføringer er aldri helt fri for feil, utføre feil sjekker etter hvert stort skritt i tillegg til å sjekke programmet loggen og utgang for eventuelle bekymringer. Bruk data trinnet nedenfor til å gå gjennom potensielle uoverensstemmelser med koden ovenfor (pasient filer blir matchet basert på pasientens/begunstiget sosial). Når du sammenligner navn fra kohort filen (etter navn, Fornavn) med vm6-filen (last_name, first_name), må du bare matche de tre første bokstavene for å redusere falske feil som oppstår med forskjeller i stavemåte/mellomrom mellom filer.
      Equation 2
    3. Gå gjennom feil datafil ("checkname"). Ignorer feil som forårsakes av tegnsetting (o ' Reilly vs. OReilly). Sjekk andre feil av bekymring med manuell gjennomgang av helse-posten eller vurdere å kaste relevant pasient/pasient-informasjon hvis betydelige feil finnes, og hvis verifisering ikke er mulig.
  5. Pakk ut de resterende nødvendige dataene fra MDR.
    1. Hvis nødvendig, få rase og sex fra vm6ben filer (pben filer før september 2002), fusjonere med kohort filen, og se etter feil som gjort ovenfor:
      Equation 3
    2. Få tak i døds data fra døds mesteren, slå sammen med kohort filen og se etter feil som er gjort ovenfor:
      Equation 4
    3. Skaff flere datafiler som kreves for analyse (se MDR-funksjonell Brukerhåndbok for dataplassering og ytterligere nyttige SAS-makroer og-koder).
      Merk: data lagres i separate filer avhengig av om det var direkte levert av militært helsevesen eller levert andre steder og fakturert til det militære helsevesenet. Eksempel filer vises nedenfor.
      Et PÅFUNN – direkte pleie, polikliniske filer fra FY 2004 – til stede
      SADR – direkte pleie, polikliniske filer fra 1998 – 2005
      SIDR – direkte pleie, institusjon sykehusinnleggelser (direkte pleie) fra 1989 – til stede
      TEDI-fakturert omsorg, institusjonelle krav filer FY 2001-Present
      HCSRI – fakturert omsorg, institusjonelle krav FY 1994 – 2005
      TEDNI-fakturert omsorg, ikke-institusjonelle krav FY 2001-Present
      HCSRNI-fakturert omsorg, ikke-institusjonelle krav FY 1994-2005
      PDTER-apotek fil med individuelle resepter FY 2002-Present

5. fletting av data og bygging av summative filer

  1. Enten data hentes fra en data analytiker eller hentes direkte fra MDR som gjort i punkt 4 ovenfor, vil datafiler trenge summert og flettes sammen for å danne analyse filen. Gjennom hele prosessen, bruke metoder som forbedrer data nøyaktighet, inkludert feil sjekker og gjennomgang av logger og output som også tidligere diskutert.
    1. Når du fletter data, må du bruke minst to pasient koder når det er mulig for å sikre en sterk match (for eksempel medisinsk rekord nummer og fødselsdato), siden feil kan eksistere i et hvilket som helst felt. Når du har flettet data, kan du se gjennom dataene for å sikre forventede resultater. Kjør koden for å sikre at de tre første bokstavene i navnet samsvarer i tillegg til en annen identifikator eller to er nyttig for å bekrefte riktig samsvar (se trinn 4.5.1).
      Merk: etter navnet stemmer kanskje ikke overens med pasienten i løpet av den aktuelle tidsperioden. Mindre variasjoner kan også eksistere i Navne felter på grunn av apostrofer eller mellomrom i tillegg til skrivefeil.
    2. Vær spesielt oppmerksom på kamper på Terminal trinn i prosessen som definerer pasienter som hadde utfall.
  2. Pakk Baseline komorbiditeter ved hjelp av ICD-9-CM eller ICD-10-CM koder fra perioden før indeks dato, datoen pasienten anses som inn i studien. Bruk vanligvis 12 måneder før indeks dato for å definere komorbiditeter.
    1. Sørg for at pasientene hadde rett til militær helsevesenet i løpet av Baseline-perioden (kan verifiseres månedlig i vm6ben-filen).
    2. Søk i grunnlinje diagnosekoder i polikliniske og/eller innleggelse filer for å etablere Baseline komorbiditeter i løpet av den planlagte 12-måneders perioden før indeks dato. Bruk ICD-9-CM-eller ICD-10-CM-kodene som er fastsatt i avsnitt 1. Hvis du bruker Elixhauser komorbiditeter, bruke tilgjengelig programvare fra HCUP, og pass på å endre navnene på diagnosen variabler og filer etter behov. (https://www.hcup-US.AHRQ.gov/toolssoftware/comorbidity/comorbidity.jsp#download)
  3. Søk institusjon og/eller innleggelse filer etter indeks dato for utfall av interesse definert av ICD-9-CM eller ICD-10-CM koder, for eksempel sykehusinnleggelse for hjerteinfarkt som primærdiagnose (Søk etter 410. X1 i SIDR).
  4. Angi en sluttdato for studien for alle pasienter som en grense for oppfølging for pasienter som ikke har vist utfallet av interesse. Bestem hvilke pasienter som må sensurert før studie slutt.
    1. Søk vm6ben fil for å sikre kvalifikasjon for helsetjenester gjennom studiet sluttdato.; ellers sensurere pasienten på tidspunktet for tap av kvalifisering.
    2. Hvis det er viktig å begrense studien til aktive brukere av helsevesenet, uavhengig av berettigelse, for eksempel aktive brukere av apoteket, deretter bestemme den siste helsevesenet kontakt (for eksempel siste medisinering fyll) i datafiler og sensurere pasientene på Denne datoen.
      Merk: Vær forsiktig med å bruke telefonmøter, som de kan være til stede i helse-posten etter en død har skjedd, eller hvis mottakeren har gått ut av helsevesenet på en annen måte.

6. match til nasjonal døds indeks (NDI)

  1. Når hele kohort er identifisert, sender du informasjonen til den nasjonale døds indeksen for å finne samsvar hvis dødelighet er et sluttpunkt.
    1. Ta først med den hensikt å samsvare med NDI i forespørslene om MDR-data og IRB-godkjenning. Sikre godkjenning og fullføre alle data krypterings trinn fullført før du sender beskyttet helseinformasjon (PHI) til NDI for samsvarende.
  2. Den "National Death index (NDI) søknadsskjema" og retninger for å be om døds data fra National Death index finner du her: https://www.CDC.gov/NCHS/NDI/index.htm.
  3. Send dataene på en passordbeskyttet CD ved overnatting e-post til NDI. Resultatene vil bli sendt tilbake ca 2 uker senere på samme måte.
  4. Når du har mottatt NDI-resultatene, kan du gjennomgå delvise samsvar for potensiell inkludering/ekskludering.
    1. "Kapittel 4-vurdere NDI output" gir en nyttig oversikt over resultatene og kan bli funnet på samme nettside: https://www.CDC.gov/NCHS/NDI/index.htm. Treff på personnummer generelt gir den sterkeste kampen.
    2. Når det er nødvendig, kryss-sjekk dødsfall i Social Security Death Index og/eller Veterans Affairs begunstiget Identification Records Locator Subsystem (BIRLS) for å forbedre nøyaktigheten. Vær oppmerksom på at service-medlemmer som dør utenlands vil sannsynligvis ikke vises på en NDI søk, men er ofte anerkjent i MDR Vital status filen eller i VA BIRLS.
  5. Slå sammen døds filen med den viktigste kohort filen etter at gjennomgangen er fullført.

7. de-identifiserende data

  1. Når all nødvendig informasjon er anskaffet, de-identifisere datafiler for å beskytte PHI. Generer en tilfeldig pasient-ID for hver pasient ved hjelp av "ranuni" (se MDR-funksjonell brukerhåndbok). Fjern pasientens sosiale, medisinske postnummer, fødselsdato (etter databehandlings alder), etc., fra datafiler. Hvis nødvendig (og godkjent), lagre en nøkkel som kobler tilfeldig pasient-ID til PHI sikkert på SCE-noden.

8. Computing tilbøyelighet score18,19,26

  1. Bruk logistisk regresjon til å modellere sannsynligheten for behandling (prosedyre logistikk i SAS).
    1. Angi datafilen ("dat" i eksemplet).
    2. Bruk klasse utdrag for å angi kategorisk variabler. Bruk "ref = First" for å angi den laveste verdien (for eksempel 0) som referanseverdi.
    3. I modell setningen angir du behandlings variabelen som den avhengige variabelen (RX), og angir verdien for "hendelsen" som verdien for mottak av behandling (1 i dette tilfellet).
    4. Inkluder eventuelle prediktorer behandling som kovariatene i modellen, spesielt hvis de kan være prediktorer av utfallet (som død). Vurder om interaksjoner mellom begreper kan påvirke behandlingen. Ta dem med i modellen ved å bruke en "*" (for eksempel hann * CKD) eller bruk syntaksen som vist under plassere "|" mellom kovariatene og "@ 2" på slutten for å angi alle 2 x 2 interaksjoner, avhengig av den spesifikke modellen.
    5. Bruk utdata-setningen til å angi at den anslåtte sannsynligheten for behandling (prob) vil bli definert av "PS" og utdata til filen "ps_data."
      Equation 5
      Merk: variabler i modell: mann: mannlig sex (binært), CKD: kronisk nyresykdom (binær), lever: kronisk leversykdom (binære), diabetes (binær), KOLS: kronisk obstruktiv lungesykdom (binær), CHF: hjertesvikt (binær), CAD: koronar arteriesykdom (binær), CVD: cerebrovaskulær sykdom (binær), pad: perifer arteriell sykdom (binær), alder (kontinuerlig).
  2. Beregn vekter fra anslått sannsynlighet (tilbøyelighet score). Hvis pasienten fikk behandling (RX = 1), så tilbøyelighet score vekt er 1/(hang score). Hvis pasienten ikke fikk behandling, så tilbøyelighet score vekt er 1/(1-hang score).
    Equation 6
  3. Stabilisere tilbøyelighet score ved å dele den med gjennomsnittlig vekt. I koden nedenfor betyr prosedyre output gjennomsnittlig vekt i variabelen "mn_wt" i datafilen "m." Datasettet nedenfor som beholder mn_wt fra datafilen "m" deretter beregner stabilisert tilbøyelighet score (st_ps_weight) for hver observasjon.
    Equation 7
  4. Kontroller balansering etter at den inverse sannsynligheten for behandlings vekting er brukt.
    1. Den stddiff makroen forenkler databehandlings standardiserte gjennomsnittlige forskjeller for kovariatene før og etter vekting i SAS. Du finner koden for makroen her: http://www.Lerner.CCF.org/qhs/Software/lib/stddiff.SAS.
    2. Beregn den standardiserte gjennomsnitts forskjellen før vekting. Som med alle makroer, bør makrokoden kjøres i SAS før du kaller den. Et eksempel på en anrops erklæring er under med kovariatene av interesse.
      Equation 8
      Religioner-input datasett, groupvar som definerer studien grupper, charvars-kategorisk variabler, numvars-kontinuerlig variabler, stdfmt-format av standardisert forskjell, outds-output datasett.
    3. Ring stddiff-makroen på nytt for å beregne den standardiserte gjennomsnitts forskjellen etter vekting. "Wtvar" angir variabelen som inneholder standardisert tilbøyelighet score og legges til makro samtalen setningen. Hvis de standardiserte forskjellene er alle mindre enn eller lik 0,1, anses balansering som vellykket.
      Equation 9
  5. ASD før og etter vekting kan rapporteres i tabellform eller graf format. Hvis du vil ha informasjon om hvordan du bruker en SAS-makro til å generere et plott, kan du se tilleggsmaterialene.
  6. IPTW-justerte data kan nå brukes i en univariate analyse etter å sikre balansering av målte confounders.

9. opprette utfallet modellen og generere et plott av kumulativ forekomst funksjon

  1. Det er noen måter som resulterende tid-til-hendelse-analyse kan tegnes inn, blant annet ved hjelp av prosedyre lifetest å generere en overlevelse tomten. Bruk vekt setningen for å indikere den standardiserte tilbøyelighet vekten.
  2. For å generere en CIF plot ved hjelp av en tilbøyelighet vekt, bruke prosedyrer phreg.
    1. I prosedyre phreg refererer du til en kovariat fil for å angi kovariat verdier som skal brukes ved generering av plottet. I dette tilfellet inneholder kovariat-filen bare én variabel RX, som kan være 1 eller 0.
      Equation 10
    2. Vis/Skjul ODS-grafikk. Bruk flere uttalelser etter behov for å angi utdatafiler for grafen eller filtypen (JPEG, etc.; se https://support.sas.com/Documentation/CDL/en/statug/63962/HTML/default/Viewer.htm#statug_odsgraph_sect014.htm).
      Equation 11
    3. I prosedyren phreg syntaks, bruk vekt setningen for å angi standardisert tilbøyelighet score variabel. Angi verdier for grunnlinje kovariatene ved hjelp av grunnlinje setningen for å kunne tegne den kumulative forekomst funksjonen. Angi lag som skal brukes til plottet ved hjelp av "ROWID" (i dette tilfellet RX 1 vs. 0). Tallet i parentes etter utfallet variabelen ("hendelse") spesifiserer verdien (e) av variabelen som skal være sensurert som bør inkludere sensur dato og eventuelle konkurrerende hendelser. I dette tilfellet er 0 sensurert og 1 er en sann hendelse.
      Equation 12

Subscription Required. Please recommend JoVE to your librarian.

Representative Results

Ved fullføring av IPTW, tabeller eller tomter av absolutte standardiserte forskjeller kan genereres ved hjelp av stddiff makrokode eller asdplot makrokoden, henholdsvis. Figur 1 viser et eksempel på riktig balansering i en stor kohort av 10 000 deltakere som bruker asdplot makroen. Etter påføring av tilbøyelighet score, ble den absolutte standardiserte forskjellene redusert betraktelig. Grensen som brukes for den absolutte standardiserte forskjellen er noe vilkårlig, men 0,1 er ofte brukt og betegner ubetydelig forskjell mellom de to gruppene. I en liten kohort er riktig balansering vanskeligere å oppnå. Figur 2 viser de mislykkede resultatene av å forsøke å balansere kovariatene i en kohort av 100 deltakere.

Når standardisert tilbøyelighet score er generert, kan studien teamet fortsette med utfallet analyse. Survival analyse er ofte ansatt på grunn av behovet for å sensurere deltakere med ujevn oppfølging informasjon, og Figur 3 viser et eksempel på bruk av prosedyrer phreg med standardisert tilbøyelighet score vekter for å generere en kumulativ forekomst funksjon (CIF) plot. CIF-plottet viser det økende antallet hendelser over tid. I dette tilfellet er ubehandlet, eller kontroll, gruppe (no RX) har et større antall hendelser og er forholdsvis verre enn den behandlede gruppen (RX).

Figure 1
Figur 1: eksempel på vellykket balansering. I en stor kohort (n = 10 000) oppnådde IPTW balansering av kovariatene med alle absolutte standardiserte forskjeller, noe som reduserte til mindre enn 0,1. Vennligst klikk her for å se en større versjon av dette tallet.

Figure 2
Figur 2: eksempel på mislykket balansering. I en liten kohort (n = 100) var IPTW ikke i stand til å oppnå balansering av kovariatene med mange absolutte standardiserte forskjeller som gjenstår større enn 0,1. Vennligst klikk her for å se en større versjon av dette tallet.

Figure 3
Figur 3: eksempel på Funksjonsplott for kumulativ forekomst som sammenligner behandlingsgrupper. Over tid øker den kumulative forekomsten av dødelighet i begge gruppene, selv om den er høyere i ubehandlet gruppe (ingen RX). Derfor, i dette eksempelet, har den behandlede gruppen forbedret overlevelse. Vennligst klikk her for å se en større versjon av dette tallet.

Supplerende materialer. Vennligst klikk her for å se denne filen (Høyreklikk for å laste ned).

Subscription Required. Please recommend JoVE to your librarian.

Discussion

Retrospektiv analyse ved hjelp av store administrative datasett gir et effektivt og kostnadseffektivt alternativ når randomiserte kontrollerte forsøk ikke er gjennomførbart. Det riktige datasettet vil avhenge av befolkningen og variablene av interesse, men MDR er et attraktivt alternativ som ikke har aldersbegrensninger sett med Medicare-data. Med alle datasett er det viktig å være intimt kjent med sin layout og data ordbok. Det bør utvises forsiktighet underveis for å sikre at fullstendige data fanges opp, og data blir nøyaktig matchet og slått sammen.

Koder for diagnoser bør defineres ved hjelp av eksisterende litteratur og en grundig forståelse av ICD-9-CM og ICD-10-CM kodesystem for å maksimere verdien av den tildelte diagnoser. Eksisterende sett med komorbiditet koder, inkludert Elixhauser27 eller raffinerte Charlson komorbiditet index28,29, kan brukes til å definere komorbide tilstander som kan påvirke utfallet av interesse. Likeledes, validert koding algoritmer i administrative data og bør utnyttes. Validering bør være et område av aktiv forskning, som det er fortsatt læring på optimal bruk av ICD-9-CM og ICD-10-CM koding algoritmer for å maksimere nøyaktig klassifisering av et bredt spekter av sykdommer.

Tilbøyelighet score kan brukes til å ta opp skjevhet som ligger i noen retrospektiv analyse. Effektiv tilbøyelighet score vekting eller matchende bør redusere absolutt standardisere forskjellen (ASD) under ønsket terskel, vanligvis satt til 0,1. Hensiktsmessig balansering bidrar til å sikre sammenlignbarhet av behandling grupper med hensyn til kjente confounders, og hensiktsmessig ansatt tilbøyelighet score teknikker har blitt brukt til å gjenskape randomiserte rettssaken resultater. Når den er riktig balansert, kan behandlingsgruppene sammenlignes med univariate tid-til-hendelse eller annen analyse.

Selv med riktig balansering, er det potensial for resterende forvirrende3, så undersøkende team bør begrense effekten av unmeasured confounders. I tillegg, hvis effekten av kovariatene på valg av behandling er sterk, kan bias fortsatt være30. I små kohorter, er tilbøyelighet score usannsynlig å fullt redusere ASD under 0,1 for alle variabler og regresjon justering kan benyttes for å fjerne resterende ubalanse31. Regresjon justering kan også brukes i undergruppeanalyse når riktig balanse er ikke lenger sikret.

Når gjort riktig, forskning med administrative data gir betimelig svar på viktige kliniske spørsmål i fravær av randomiserte kliniske studier. Mens det er umulig å fjerne alle bias fra observasjonsstudier, kan bias begrenses ved hjelp av tilbøyelighet score og gjenværende grundige analyser.

Subscription Required. Please recommend JoVE to your librarian.

Disclosures

Forfatterne har ingenting å avsløre.

Acknowledgments

Forskning rapportert i denne publikasjonen ble støttet av National Center for fremmarsj translational Sciences i National Institutes of Health under Award Number UL1 TR002345. Innholdet er utelukkende ansvaret til forfatterne og representerer ikke nødvendigvis den offisielle synspunktene til National Institutes of Health.

Disclaimer: i tillegg synspunktene i denne artikkelen er de av forfatteren bare og bør ikke tolkes til å representere på noen måte de av USAs regjering, USA Department of Defense (DoD), eller USA Department of the Hæren. Identifisering av spesifikke produkter eller vitenskapelig instrumentering er ansett som en integrert del av den vitenskapelige bestrebe og utgjør ikke tilslutning eller implisitt tilslutning fra forfatteren, DoD, eller noen komponent byrå.

Materials

Name Company Catalog Number Comments
CD Burner (for NDI Request)
Computer
Putty.exe Putty.org
SAS 9.4 SAS Institute Cary, NC
WinSCP or other FTP software https://winscp.net/eng/index.php

DOWNLOAD MATERIALS LIST

References

  1. Concato, J., Shah, N., Horwitz, R. I. Randomized, controlled trials, observational studies, and the hierarchy of research designs. New England Journal of Medicine. 342 (25), 1887-1892 (2000).
  2. Austin, P. C., Platt, R. W. Survivor treatment bias, treatment selection bias, and propensity scores in observational research. Journal of Clinical Epidemiology. 63 (2), 136-138 (2010).
  3. Sturmer, T., Wyss, R., Glynn, R. J., Brookhart, M. A. Propensity scores for confounder adjustment when assessing the effects of medical interventions using nonexperimental study designs. Journal of Internal Medicine. 275 (6), 570-580 (2014).
  4. Schermerhorn, M. L., et al. Long-Term Outcomes of Abdominal Aortic Aneurysm in the Medicare Population. New England Journal of Medicine. 373 (4), 328-338 (2015).
  5. Williams, R. J. II, et al. A Propensity-Matched Analysis Between Standard Versus Tapered Oral Vancomycin Courses for the Management of Recurrent Clostridium difficile Infection. Open Forum Infectious Diseases. 4 (4), (2017).
  6. Mitchell, J. D., et al. Impact of Statins on Cardiovascular Outcomes Following Coronary Artery Calcium Scoring. Journal of the American College of Cardiology. 72 (25), 3233-3242 (2018).
  7. Rush, T., McGeary, M., Sicignano, N., Buryk, M. A. A plateau in new onset type 1 diabetes: Incidence of pediatric diabetes in the United States Military Health System. Pediatric Diabetes. 19 (5), 917-922 (2018).
  8. Rhon, D. I., Greenlee, T. A., Marchant, B. G., Sissel, C. D., Cook, C. E. Comorbidities in the first 2 years after arthroscopic hip surgery: substantial increases in mental health disorders, chronic pain, substance abuse and cardiometabolic conditions. British Journal of Sports Medicine. , (2018).
  9. Mitchell, J., Paisley, R., Moon, P., Novak, E., Villines, T. Coronary Artery Calcium Score and Long-term Risk of Death, Myocardial Infarction and Stroke: The Walter Reed Cohort Study. Journal of the American College of Cardiology: Cardiovascular Imaging. , (2017).
  10. McCormick, N., Lacaille, D., Bhole, V., Avina-Zubieta, J. A. Validity of myocardial infarction diagnoses in administrative databases: a systematic review. PLoS ONE. 9 (3), e92286 (2014).
  11. Huo, J., Yang, M., Tina Shih, Y. -C. Sensitivity of Claims-Based Algorithms to Ascertain Smoking Status More Than Doubled with Meaningful Use. Value in Health. , Available from: https://doi.org/10.1016/j.jval.2017.09.002 (2017).
  12. Nayan, M., et al. The value of complementing administrative data with abstracted information on smoking and obesity: A study in kidney cancer. Canadian Urological Association Journal. 11 (6), 167-171 (2017).
  13. Birman-Deych, E., et al. Accuracy of ICD-9-CM codes for identifying cardiovascular and stroke risk factors. Medical Care. 43 (5), 480-485 (2005).
  14. Preen, D. B., Holman, C. D., Spilsbury, K., Semmens, J. B., Brameld, K. J. Length of comorbidity lookback period affected regression model performance of administrative health data. Journal of Clinical Epidemiology. 59 (9), 940-946 (2006).
  15. Rector, T. S., et al. Specificity and sensitivity of claims-based algorithms for identifying members of Medicare+Choice health plans that have chronic medical conditions. Health Services Research. 39 (6 Pt 1), 1839-1857 (2004).
  16. Hernán, M. A., et al. Observational studies analyzed like randomized experiments: an application to postmenopausal hormone therapy and coronary heart disease. Epidemiology (Cambridge, Mass.). 19 (6), 766-779 (2008).
  17. Austin, P. C. The relative ability of different propensity score methods to balance measured covariates between treated and untreated subjects in observational studies. Medical Decision Making. 29 (6), 661-677 (2009).
  18. Robins, J. M., Hernan, M. A., Brumback, B. Marginal structural models and causal inference in epidemiology. Epidemiology. 11 (5), 550-560 (2000).
  19. Robins, J. Marginal structural models. 1997 Proceedings of the American Statistical Association, section on Bayesian statistical science. , 1-10 (1998).
  20. Thoemmes, F., Ong, A. D. A Primer on Inverse Probability of Treatment Weighting and Marginal Structural Models. Emerging Adulthood. 4 (1), 40-59 (2016).
  21. Xu, S., et al. Use of stabilized inverse propensity scores as weights to directly estimate relative risk and its confidence intervals. Value in Health: the Journal of the International Society for Pharmacoeconomics and Outcomes Research. 13 (2), 273-277 (2010).
  22. Cowper, D. C., Kubal, J. D., Maynard, C., Hynes, D. M. A primer and comparative review of major US mortality databases. Annals of Epidemiology. 12 (7), 462-468 (2002).
  23. Skopp, N. A., et al. Evaluation of a methodology to validate National Death Index retrieval results among a cohort of U.S. service members. Annals of epidemiology. 27 (6), 397-400 (2017).
  24. Buck, C. J. 2015 ICD-9-CM for Hospitals, Volumes 1, 2, & 3, Professional Edition. , Elsevier Saunders. (2015).
  25. Buck, C. J. 2018 ICD-10-CM for Hospitals, Professional Edition. , Elsevier Saunders. (2018).
  26. Guo, S., Fraser, W. M. Propensity Score Analysis: Statistical Methods and Applications, Second Edition. , Sage Publications. (2015).
  27. Elixhauser, A., Steiner, C., Harris, D. R., Coffey, R. M. Comorbidity measures for use with administrative data. Medical Care. 36 (1), 8-27 (1998).
  28. Charlson, M. E., Pompei, P., Ales, K. L., MacKenzie, C. R. A new method of classifying prognostic comorbidity in longitudinal studies: development and validation. Journal of Chronic Diseases. 40 (5), 373-383 (1987).
  29. Deyo, R. A., Cherkin, D. C., Ciol, M. A. Adapting a clinical comorbidity index for use with ICD-9-CM administrative databases. Journal of Clinical Epidemiology. 45 (6), 613-619 (1992).
  30. Austin, P. C., Stuart, E. A. The performance of inverse probability of treatment weighting and full matching on the propensity score in the presence of model misspecification when estimating the effect of treatment on survival outcomes. Statistical Methods in Medical Research. 26 (4), 1654-1670 (2017).
  31. Austin, P. C. Balance diagnostics for comparing the distribution of baseline covariates between treatment groups in propensity-score matched samples. Statistics in Medicine. 28 (25), 3083-3107 (2009).

Tags

Medisin invers sannsynlighet for behandling vekting tilbøyelighet score nasjonal død indeks Military Health system data repository bias behandling utvalg forvirrende Big data
Inverse sannsynlighet for behandling vekting (hang resultat) ved hjelp av Military Health system data repository og National Death index
Play Video
PDF DOI DOWNLOAD MATERIALS LIST

Cite this Article

Mitchell, J. D., Gage, B. F.,More

Mitchell, J. D., Gage, B. F., Fergestrom, N., Novak, E., Villines, T. C. Inverse Probability of Treatment Weighting (Propensity Score) using the Military Health System Data Repository and National Death Index. J. Vis. Exp. (155), e59825, doi:10.3791/59825 (2020).

Less
Copy Citation Download Citation Reprints and Permissions
View Video

Get cutting-edge science videos from JoVE sent straight to your inbox every month.

Waiting X
Simple Hit Counter