Waiting
Login processing...

Trial ends in Request Full Access Tell Your Colleague About Jove
Click here for the English version

Medicine

Omvänd sannolikhet för behandling viktning (benägenhet poäng) med hjälp av militära hälso-och sjukvårdssystemet data arkivet och nationella death index

Published: January 8, 2020 doi: 10.3791/59825

Summary

När randomiserade kontrollerade studier inte är genomförbara, en omfattande hälso-och sjukvårdsdata källa som det militära hälsosystemet dataarkivet ger ett attraktivt alternativ för retrospektiva analyser. Att införliva Dödlighetsdata från det nationella döds indexet och balansera skillnader mellan grupper med hjälp av benägenhet viktning bidrar till att minska biaser som är förknippade med retroaktiva konstruktioner.

Abstract

När randomiserade kontrollerade studier inte är genomförbara, retrospektiva studier med Big data ger ett effektivt och kostnadseffektivt alternativ, även om de är i riskzonen för val av behandling bias. Behandling val bias förekommer i en icke-randomiserad studie när val av behandling är baserat på pre-behandling egenskaper som också är förknippade med resultatet. Dessa pre-behandling egenskaper, eller confounders, kan påverka utvärderingen av en behandling effekt på resultatet. Benägenheten Poäng minimera denna bias genom att balansera de kända störfaktorer mellan behandlingsgrupper. Det finns några metoder för att utföra benägenheten Poäng analyser, inklusive stratifiering av benägenheten poäng, benägenhet matchning, och omvänd sannolikhet för behandling viktning (IPTW). Beskrivs här är användningen av iptw att balansera baseline samsjuklighet i en kohort av patienter inom den amerikanska militären Health system data repository (Mdr). MDR är en relativt optimal datakälla, eftersom den tillhandahåller en innesluten kohort där nästan fullständig information om patienter och öppenvården finns tillgänglig för berättigade stödmottagare. Nedan beskrivs användningen av MDR kompletterad med information från National death index för att tillhandahålla robusta Dödlighetsdata. Det finns också förslag på hur du använder administrativa data. Slutligen delar protokollet en SAS-kod för att använda iptw för att balansera kända störfaktorer och rita den kumulativa incidensen funktion för resultatet av intresse.

Introduction

Randomiserade, placebokontrollerade studier är den starkaste studiedesign för att kvantifiera effekten av behandling, men de är inte alltid genomförbart på grund av kostnader och tids krav eller brist på Equipoise mellan behandlingsgrupperna1. I dessa fall, en retrospektiv kohort design med storskaliga administrativa data ("Big data") ofta ger ett effektivt och kostnadseffektivt alternativ, även om avsaknaden av randomisering införs behandling val bias2. Behandling val bias förekommer i icke-randomiserade studier när behandlingen beslut är beroende av pre-behandling egenskaper som är förknippade med resultatet av intresse. Dessa egenskaper är kända som confounding faktorer.

Eftersom benägenheten Poäng minimera denna bias genom att balansera de kända störfaktorer mellan behandlingsgrupper, har de blivit alltmer populära3. Benägenheten Poäng har använts för att jämföra kirurgiska metoder4 och medicinska regimer5. Nyligen har vi använt en benägenhet analys av data från Förenta staternas militära Health system data repository (MDR) för att bedöma effekten av statiner i primär prevention av kardiovaskulära resultat baserat på förekomst och svårighetsgrad av kranskärls kalcium6.

Den MDR, utnyttjas mindre ofta än Medicare och VA datauppsättningar för forskningsändamål, innehåller omfattande administrativa och medicinska påståenden information från sluten och öppenvården tjänster som tillhandahålls för aktiv tjänst militär, pensionärer och andra Department of Defense (DoD) vårdtagare och deras anhöriga. Databasen omfattar tjänster som tillhandahålls över hela världen på amerikanska militära behandlingsanläggningar eller på civila anläggningar faktureras DoD. Databasen innehåller kompletta apoteks data sedan den 1 oktober 2001. Laboratoriedata finns tillgänglig från 2009 men är endast begränsad till militära behandlingsanläggningar. Inom MDR har kohorter definierats med metoder inklusive användning av diagnoskoder (t. ex. diabetes mellitus7) eller procedur koder (t. ex. artroskopisk kirurgi8). Alternativt kan en externt definierad kohort av stödberättigade stödmottagare, till exempel ett register, matchas med MDR för att erhålla baslinje-och uppföljningsdata9. Till skillnad från Medicare omfattar MDR patienter i alla åldrar. Det är också mindre partisk mot män än VA databas eftersom det omfattar anhöriga. Tillgången till MDR är dock begränsad. I allmänhet kan endast utredare som är medlemmar i det militära hälsosystemet begära tillgång, analogt med kraven för användning av VA-databasen. Icke-statliga forskare som söker tillgång till militära hälso-och sjukvårdssystem uppgifter måste göra detta genom ett avtal om datadelning under överinseende av en statlig sponsor.

När du använder någon administrativ datauppsättning, är det viktigt att komma ihåg begränsningarna samt styrkor av administrativ kodning. Känsligheten och specificiteten av koden kan variera beroende på den relaterade diagnosen, oavsett om det är en primär eller sekundär diagnos, eller om det är en sluten eller öppenvården fil. Inpatient koder för akut hjärtinfarkt är i allmänhet korrekt rapporterade med positiva prediktiva värden över 90%10, men tobaksbruk är ofta Underkodade11. Sådan under kodning kan eller inte kan ha en meningsfull effekt på en studieresultat12. Dessutom kan flera koder för ett givet tillstånd förekomma med varierande nivåer av korrelation till sjukdomen i fråga13. En undersökande grupp bör utföra en omfattande litteratursökning och granskning av den internationella sjukdomsklassifikationen, nionde revideringen, klinisk modifiering (ICD-9-CM) och/eller ICD-10-CM kodnings handböcker för att säkerställa att lämpliga koder ingår i studien.

Flera metoder kan användas för att förbättra känsligheten och noggrannheten hos de diagnostiska koderna för att definiera comorbida villkor. En lämplig "Look-Back"-period bör inkluderas för att fastställa sjukdomstillstånd vid baseline. Återblick perioden omfattar sluten vård och öppenvården tjänster som tillhandahålls före studiestart. En period på ett år kan vara optimalt14. Dessutom, kräver två separata påståenden i stället för ett enda anspråk kan öka specificitet, samtidigt komplettera kodning data med farmaceutiska data kan förbättra känslighet15. Välj manuella diagram granskningar på en del av uppgifterna kan användas för att kontrollera kodnings strategins noggrannhet.

När komorbiditeter har definierats och bedömts för kohort i fråga, kan en benägenhet poäng användas för att balansera skillnader i kovariater mellan behandlingsgrupperna. Benägenheten poängen härleds från sannolikheten att en patient tilldelas en behandling baserad på kända kovariater. Redovisning för denna benägenhet behandling minskar den effekt som kovariaterna har på behandlings uppdrag och hjälper till att generera en sannare uppskattning av behandlingseffekten på resultatet. Även benägenhet poäng inte nödvändigtvis ger överlägsna resultat till multivariat modeller, de gör det möjligt för bedömning av om de behandlade och obehandlade grupperna är jämförbara efter att ha tillämpat benägenheten Poäng3. Studie utredare kan analysera de absoluta standardiserade skillnaderna i kovariater före och efter benägenheten matchning eller omvänd sannolikhet för behandling viktning (iptw) för att säkerställa kända störfaktorer har balanserat mellan grupperna. Viktigt, okända störfaktorer kanske inte balanserad, och man bör vara medveten om potentialen för kvarvarande confounding.

När den körs korrekt, men, benägenhet poäng är ett kraftfullt verktyg som kan förutsäga och replikera resultaten av randomiserade kontrollerade prövningar16. Av de tillgängliga benägenheten-Poäng tekniker, matchning och IPTW är i allmänhet föredrog17. Inom IPTW viktas patienterna med sin benägenhet eller sannolikhet för behandling. Stabiliserande vikter rekommenderas generellt över rå vikter, medan trimning av vikterna också kan betraktas som18,19,20,21.

När studiegrupperna är balanserade, kan de följas tills resultatet av intresse. Studier som utnyttjar administrativa uppgifter kan vara intresserade av resultat såsom återtagande grad och tids-till-händelse-analyser. I studier som är intresserade av dödlighet innehåller det militära hälsosystemet data arkivet ett område för Vital status som kan förstärkas ytterligare med hjälp av National death index (NDI)22,23. NDI är en centraliserad databas med döds rekordinformation från statliga kontor som förvaltas av centrum för sjukdomsbekämpning. Utredarna kan begära grundläggande Vital status och/eller specifik dödsorsak baserat på dödsattesten.

I följande protokoll beskrivs processen för att genomföra en administrativ databasstudie med hjälp av MDR förstärkt med dödlighet information från NDI. Det specificerar användningen av IPTW att balansera baseline skillnader mellan två behandlingsgrupper inklusive SAS-kod och exempel output.

Subscription Required. Please recommend JoVE to your librarian.

Protocol

Följande protokoll följer riktlinjerna från våra institutionella mänskliga etikkommittéer.

1. definition av kohort

  1. Fastställa och tydligt definiera inkluderingskriterier och uteslutningskriterier för den planerade kohorten med antingen 1) ett register eller 2) datapunkter som kan extraheras från MDR såsom administrativa koder för diagnoser eller procedurer (dvs. alla patienter med mer än två öppenvården diagnostiseras eller en sluten diagnos av förmaksflimmer).
    1. Om du använder ett register, inkludera två eller flera patient identifierare för korrekt matchning med den militära Health system dataarkivet såsom journalnummer (anges i olika data uppsättningar som patuniq och edipn), fullständigt namn, födelsedatum, och/eller sponsorns personnummer.
      Obs: som med alla studier som utnyttjar personlig hälsoinformation, är skyddsåtgärder krävs och måste följas. Korrekt kryptering och datahantering måste användas under insamlingsprocessen, och information bör avidentifierade så snart som möjligt.
      Anmärkning: vid hänvisning till sponsorns personnummer (sponssn) listas alla patienter med avseende på deras förhållande till den militära medlemmen (eller sponsorn), inklusive en identifierare för sponsorn, maken och barnen. Tänk på att Relations koden och sponsorns personnummer kan ändras med tiden i datauppsättningen när patienter blir vuxna och gifter sig eller är skilda. Därför hjälper flera patient identifierare till att säkerställa noggrannhet.
    2. Om du definierar kohorterna genom administrativ kodning, utför en omfattande litteratursökning för att identifiera tidigare studier som potentiellt har validerat koderna av intresse. Granska ICD-9-CM24 och/eller ICD-10-cm25 manualer för att klargöra kod definitioner och angränsande koder för att säkerställa ett lämpligt intervall av koder som används. Dessutom granskar korsreferenstabellerna som ingår i manualerna för att ta hänsyn till ytterligare koder för inkludering/uteslutning. Tidigare valideringsstudier innehåller rapporter om positivt prediktivt värde, känslighet och specificitet för olika administrativa kodnings strategier. Dessa stöd i optimering av kohort urval samt resultat identifiering.
  2. Bestäm om det finns begränsningar (t. ex. baserat på ålder) på önskad kohort eller andra uteslutningskriterier som ska inkluderas i begäran om data.
  3. Definiera studieperioden att inkludera tid före index datum för insamling av baseline kovariater (i allmänhet 12 månader i administrativ data forskning) samt studiens slutdatum.

2. definiera kovariater och utfall

  1. Definiera administrativa koder för confounding villkor genom litteratursökningar och användning av ICD-9-CM24 och/eller ICD-10-cm25 manualer som gjort i steg 1.1.2 ovan.
  2. Bestäm andra nödvändiga kovariater inklusive demografi, medicinering och laboratoriedata.
  3. Granska tillgängliga datafält i dataordlistan MDR här: https://Health.mil/Military-Health-topics/Technology/support-Areas/Mdr-m2-ICD-Functional-References-and-Specification-Documents.

3. inlämning av en begäran om MDR

  1. Inhämta godkännande från den institutionella prövnings nämnden.
  2. Fyll i ett program för data delningsavtal som finns här: https://Health.mil/Military-Health-topics/Privacy-and-Civil-Liberties/Submit-a-data-sharing-Application?Type=all#RefFeed. Som en del av programmet, ange datafält och filer som begärs på den DRT militära Health system data repository (MDR) extraktioner kalkylbladet (länkad från ansökningsformuläret). Ange om teamet begär en dataanalytiker leverera rådata eller om teamet kommer åt MDR direkt. Ange ytterligare om begäran är för en engångs data pull eller om vanliga handtag begärs dagligen, månad eller år.
    Anmärkning: för att få MDR data med någon metod, måste det finnas en sponsor som är en statlig anställd (aktiv plikt militär eller GS), som vanligtvis är medlem i prövaren laget.
  3. Om tillgång till MDR direkt, Fyll i "MDR auktorisering begäran form" och "MDR CS 2875 form" som kan hittas här: https://Health.mil/Military-Health-topics/Technology/support-Areas/Mdr-m2-ICD-Functional-References-and-Specification-Documents.

4. åtkomst till MDR och extrahering av relevanta data

  1. Om åtkomst till MDR direkt, följ instruktionerna för att komma åt och använda MDR inklusive programvarukrav och exempel SAS-program som finns i "MDR User ' s guide" och "MDR funktionell guide" finns här: https://Health.mil/Military-Health-topics/Technology/support-Areas/Mdr-m2-ICD-Functional-References-and-Specification-Documents.
    Obs: filer sparas i SAS-format och nås via ett UNIX-skal i allmänhet med hjälp av PuTTY. exe samt ett FTP-program. Kunskap om SAS krävs.
  2. För en användbar översikt över MDR setup, granska DOD guide för DOD forskare om hur du använder MHS data https://Health.mil/Reference-Center/publications/2012/10/10/guide-for-DoD-Researchers-on-using-MHS-data.
  3. Som gjort i steg 2,3, granska den MDR data Dictionary för detaljerad information om alla tillgängliga datafiler https://Health.mil/Military-Health-topics/Technology/support-Areas/Mdr-m2-ICD-Functional-References-and-Specification-Documents.
    Obs: alla datafiler innehåller inte alla patient identifierare för matchning/sammanslagning. Dataordlistan hjälper till att lista identifierare som är tillgängliga för varje datafil. Den DOD ID-nummer, även kallad "patuniq" eller "edipn", behövs för att extrahera apoteks information, till exempel. Att ha alla lämpliga patient identifierare i data utvinnings steget är därför viktigt för att säkerställa förmågan att matcha all patientinformation över flera år och flera datamängder. Det är viktigt att upprepa att inneboende i forskning som involverar PHI, strikt efterlevnad av dataskydd förfaranden krävs efter att ha förvärvat nödvändigt godkännande, och PHI bör förstöras efter det inte längre behövs.
  4. Inhämta nödvändiga patient identifierare för kohorten genom att få tillgång till VM6 förmånsdata (sep 2002 – idag) eller pben-fil (Sep 2000 – sep 2002).
    1. Använd makrot nedan eller ett liknande program för att matcha VM6 data till kohort filen. I detta fall kan koden användas som skriftligt för att hitta patienters journalnummer (MRNs) för en given patient social som redan finns i en kohort fil. Använd olika variabelnamn i VM6 data Draw-och kohortfiler för patient namn och födelsedatum för att söka efter fel senare. För att skydda PHI, lagra data med patient identifierare på tjänstnoden i det utrymme som tillhandahålls som en del av begäran om data (se MDR användarhandbok).
      Anmärkning: MRNs kallas DOD ID-nummer, PATUNIQ eller EDIPN i MDR).
      Equation 1
    2. Som databasposter är aldrig helt fri från fel, utföra felkontroller efter varje större steg förutom att kontrollera programloggen och utdata för eventuella problem. Använd data steget nedan för att granska eventuella felmatchningar med koden ovan (patientfiler matchas baserat på patientens/mottagarens sociala). När du jämför namn från kohort filen (efternamn, förnamn) med filen VM6 (last_name, first_name), matchar bara de tre första bokstäverna för att minska Felaktiga fel som uppstår med skillnader i stavning/mellanrum mellan filer.
      Equation 2
    3. Granska fel datafilen ("check Name"). Ignorera fel som orsakas av skiljetecken (o ' Reilly vs. OReilly). Kontrollera andra fel som oroar med manuell granskning av hälsojournal eller överväga att kasta relevant patient/patientinformation om det finns betydande fel och om verifiering inte är möjlig.
  5. Extrahera återstående nödvändiga data från MDR.
    1. Om det behövs, få ras och kön från vm6ben filer (pben filer före september 2002), sammanfoga med kohort filen och kontrollera om fel som gjorts ovan:
      Equation 3
    2. Hämta döds data från Death Master-filen, sammanfoga med kohort filen och kontrollera om det finns fel enligt ovan:
      Equation 4
    3. Hämta ytterligare datafiler som behövs för analys (se MDR funktionella Användarhandbok för datalokalisering och ytterligare användbara SAS-makron och kod).
      Obs: data lagras i separata filer beroende på om det var direkt tillhandahålls av militär sjukvårdssystemet eller levereras någon annanstans och faktureras till den militära hälso-och sjukvårdssystemet. Exempel filer visas nedan.
      CAPER-direkt vård, öppenvården filer från fy 2004-nutid
      SADR – direkt vård, öppenvårds filer från 1998 – 2005
      SIDR-direkt vård, sluten sjukhusinläggningar (direkt vård) från 1989-nutid
      TEDI-fakturerad vård, institutionella fordran filer fy 2001-nutid
      HCSRI-fakturerad omsorg, institutionella påståenden fy 1994 – 2005
      TEDNI – fakturerad vård, icke-institutionella påståenden fy 2001 – nutid
      HCSRNI – fakturerad vård, icke-institutionella fordringar fy 1994 – 2005
      PDTS-apotek fil med individuella recept fy 2002-nutid

5. sammanfoga data och konstruera summativa filer

  1. Oavsett om data erhålls från en dataanalytiker eller erhålls direkt från MDR som gjort i avsnitt 4 ovan, kommer datafiler behöva summeras och slås samman för att bilda analys filen. Genom hela processen, använda metoder som förbättrar data noggrannhet, inklusive felkontroller och översyn av loggar och utdata som också tidigare diskuterats.
    1. Vid sammanslagning av data, Använd minst två patient identifierare när det är möjligt för att säkerställa en stark matchning (såsom journalnummer och födelsedatum), eftersom fel kan förekomma i alla fält. När datasammanfogning, granska data för att säkerställa förväntat resultat. Kör koden för att säkerställa att de tre första bokstäverna i namnet matchar förutom en annan identifierare eller två är användbart för att kontrollera korrekt matchningar (se steg 4.5.1).
      Obs: efter namnet kanske inte matchar om patienten var gift under den aktuella tidsperioden. Mindre variationer kan också förekomma i namnfälten på grund av apostrofer eller mellanrum samt stavfel.
    2. Ägna särskild uppmärksamhet åt matchningar vid terminalsteg i processen, till exempel att definiera patienter som har utfall.
  2. Extrahera baseline-komorbiditeter med hjälp av ICD-9-CM eller ICD-10-CM koder från perioden före index datum, det datum då patienten anses gå in i studien. I allmänhet använder 12 månader före index datum för att definiera comorbidities.
    1. Se till att patienterna hade rätt till det militära sjukvårdssystemet under baslinjeperioden (kan verifieras varje månad i vm6ben-filen).
    2. Sök efter baslinje diagnoskoder i öppenvården och/eller i patientjournaler för att fastställa sjukdoms värden vid baseline under den 12-månadersperiod som gäller före index. Använd ICD-9-CM eller ICD-10-CM koder som fastställs i avsnitt 1. Om du använder Elixhauser comorbidities, använda tillgänglig programvara från HCUP, att se till att ändra namnen på diagnostik variabler och filer efter behov. (https://www.hcup-US.AHRQ.gov/toolssoftware/comorbidity/comorbidity.jsp#download)
  3. Sök sluten och/eller sluten filer efter index datum för resultat av ränta som definieras av ICD-9-CM eller ICD-10-CM koder, såsom sjukhusvård för hjärtinfarkt som primär diagnos (Sök efter 410. x1 i SIDR).
  4. Ange ett slutdatum för studien för alla patienter som en cutoff för uppföljning för patienter som inte har visat resultat av intresse. Ta reda på vilka patienter som behöver censureras före studiens.
    1. Sök vm6ben fil för att säkerställa berättigande till hälso-och sjukvård genom studiens slutdatum.; Annars, censurera patienten vid tidpunkten för förlust av behörighet.
    2. Om det är viktigt att begränsa studien till aktiva användare av hälso-och sjukvårdssystemet oberoende av stödberättigande, såsom aktiva användare av apoteket, sedan bestämma den sista sjukvården kontakt (såsom sista medicinering fylla) inom datafiler och censurera patienterna vid Detta datum.
      Obs: var försiktig med telefon möten, eftersom de kan vara närvarande i hälsojournal efter en död har inträffat eller om stödmottagaren har avslutat sjukvårdssystemet på ett annat sätt.

6. match till National death index (NDI)

  1. När hela kohort identifieras, skicka information till National death index för matchning om dödlighet är en Endpoint.
    1. Inkludera först avsikten att matcha NDI i begäran om MDR-data och IRB-godkännande. Säkerställ godkännande och slutför alla data krypterings steg som slutförts innan du skickar skyddad hälsoinformation (PHI) till NDI för matchning.
  2. "National death index (NDI) ansökningsblankett" och anvisningar för att begära döds data från National death index finns här: https://www.CDC.gov/NCHS/NDI/index.htm.
  3. Skicka data på en lösenordsskyddad CD med övernattning post till NDI. Resultaten kommer att skickas tillbaka cirka 2 veckor senare på samma sätt.
  4. Efter att ha fått NDI resultat, granska partiella matchningar för potentiell inkludering/uteslutning.
    1. "Kapitel 4-bedömning NDI output" ger en användbar översikt över granska resultaten och kan hittas på samma webbsida: https://www.CDC.gov/NCHS/NDI/index.htm. Matcher på personnummer ger i allmänhet den starkaste matchen.
    2. Vid behov, korskontrol lera dödsfall i socialförsäkringssystemet death index och/eller Veterans Affairs förmånstagaren identifiering Records Locator Subsystem (BIRLS) att förbättra noggrannheten. Var medveten om att service medlemmar som dör utomlands kommer sannolikt inte att dyka upp på en NDI sökning men ofta erkänns i MDR Vital status fil eller i VA BIRLS.
  5. Sammanfoga döds filen med huvud kohort fil efter avslutad granskning.

7. avdentifierande uppgifter

  1. När all nödvändig information förvärvas, de-identifiera datafiler för att skydda PHI. Generera en slumpmässig patient identifierare för varje patient med hjälp av "ranuni" (se MDR funktions bruksanvisning). Ta bort patientens sociala, journalnummer, födelsedatum (efter databehandling ålder), etc., från datafiler. Om det behövs (och godkänns), lagra en nyckel som kopplar den slumpmässiga patient identifieraren till PHI säkert på SCE-noden.

8. beräkning av benägenheten Poäng18,19,26

  1. Använd Logistic regression för att modellera sannolikheten för behandling (PROC Logistic i SAS).
    1. Ange datafilen ("dat" i exemplet).
    2. Använd Class-uttryck för att ange kategoriska variabler. Använd "ref = First" för att ange det lägsta värdet (t. ex. 0) som referensvärde.
    3. I den modell instruktionen, ange variabeln behandling som den beroende variabeln (RX) och ange värdet för den "händelse" som värde för att ta emot behandling (1 i det här fallet).
    4. Inkludera alla möjliga prediktorer för att ta emot behandling som kovariater i modellen, särskilt om de kan vara prediktorer för utfallet (t. ex. dödsfall). Överväg om interaktioner mellan termer kan påverka behandlingen. Inkludera dem i modellen med hjälp av en "*" (t. ex. manliga * CKD) eller Använd syntaxen som visas nedan placera "|" mellan kovariater och "@ 2" i slutet för att ange alla 2 x 2 interaktioner, som passar för den specifika modellen.
    5. Använd output-uttrycket för att ange att den förväntade sannolikheten för behandling (prob) kommer att definieras av "PS" och utdata till filen "ps_data".
      Equation 5
      ANMÄRKNINGAR: variabler i modell: man: manligt kön (binär), CKD: kronisk njursjukdom (binär), lever: kronisk leversjukdom (binär), diabetes (binär), kol: kronisk obstruktiv lungsjukdom (binär), CHF: hjärtsvikt (binär), CAD: kranskärlssjukdom (binär), CVD: cerebrovaskulär sjukdom (binär), pad: perifer arteriell sjukdom (binär), ålder (kontinuerlig).
  2. Beräkna vikter från förväntad sannolikhet (benägenhet poäng). Om patienten fick behandling (RX = 1), då benägenheten Poäng vikt är 1/(benägenhet poäng). Om patienten inte fick behandling, då benägenheten Poäng vikt är 1/(1-benägenhet poäng).
    Equation 6
  3. Stabilisera benägenheten genom att dividera den med medelvikten. I koden nedan betyder proc matar ut medelvikten till variabeln "mn_wt" i datafilen "m". Datauppsättningen nedan som behåller mn_wt från datafilen "m" beräknar sedan den stabiliserade benägenheten Poäng (st_ps_weight) för varje observation.
    Equation 7
  4. Verifiera balansering efter att ha tillämpat den omvända sannolikheten för behandling viktning.
    1. Den stddiff makro förenklar Computing standardiserade medel skillnader för kovariater före och efter viktning i SAS. Koden för makrot finns här: http://www.Lerner.CCF.org/QHS/Software/lib/stddiff.SAS.
    2. Beräkna den standardiserade medelskillnaden före viktning. Som med alla makron ska makrokoden köras i SAS innan den anropas. Ett exempel på Call-uttryck är nedan med kovariaterna av intresse.
      Equation 8
      INDS-input data set, groupvar-variabel som definierar studiegrupper, charvars-kategoriska variabler, numvars-kontinuerliga variabler, stdfmt-format av standardiserad skillnad, outds-output datauppsättning.
    3. Anropa stddiff-makrot igen för att beräkna den standardiserade medelskillnaden efter viktning. "Wtvar" anger variabeln som innehåller den standardiserade benägenheten Poäng och läggs till makro Call-uttrycket. Om de standardiserade skillnaderna är alla mindre än eller lika med 0,1, då balanseringen anses framgångsrik.
      Equation 9
  5. ASD före och efter viktning kan rapporteras i tabell-eller grafformat. För anvisningar om hur du använder ett SAS-makro för att skapa en tomt, se kompletterande material.
  6. IPTW-justerade data kan nu användas i en univariat analys efter att balansera uppmätta confounders.

9. skapa en resultat modell och generera en sammantagen sammanvägd förekomst funktion

  1. Det finns några sätt att den resulterande tids-till-händelse-analys kan ritas, inklusive att använda proc lifetest för att generera en överlevnad tomt. Använd viktnings uttrycket för att indikera den standardiserade benägenhet vikten.
  2. För att generera en cif tomt med en benägenhet vikt, Använd proc phreg.
    1. I proc phreg, referera en kovariat fil för att ange kovariat värden som ska användas när du genererar tomten. I det här fallet innehåller kovariatfilen endast den enda variabeln RX, som kan vara 1 eller 0.
      Equation 10
    2. Växla ODS-grafik på. Använd ytterligare uttalanden som behövs för att ange utdatafiler för grafen eller filtyp (JPEG, etc., se https://support.sas.com/documentation/CDL/en/statug/63962/HTML/default/Viewer.htm#statug_odsgraph_sect014.htm).
      Equation 11
    3. I syntaxen proc phreg använder du viktnings instruktionen för att ange variabeln för standardiserade benägenhets poäng. Ange värden för baseline-kovariater med hjälp av baslinje uttrycket för att kunna rita den kumulativa incidensfunktionen. Ange skikt som ska användas för tomten med hjälp av "ROWID" (i detta fall RX 1 kontra 0). Siffran inom parentes efter variabeln utfall ("händelse") anger värdet (-erna) för variabeln som ska censureras, vilket bör innefatta censureringsdatum och eventuella konkurrerande händelser. I det här fallet är 0 censurerad och 1 är en sann händelse.
      Equation 12

Subscription Required. Please recommend JoVE to your librarian.

Representative Results

Efter slutförandet av IPTW, tabeller eller tomter av de absoluta standardiserade skillnader kan genereras med hjälp av den stddiff makrokod eller asdplot makrokod, respektive. Figur 1 visar ett exempel på lämplig balansering i en stor kohort av 10 000 deltagare med hjälp av asdplot Macro. Efter tillämpning av benägenheten poäng, de absoluta standardiserade skillnaderna reducerades betydligt. Den cutoff som används för den absoluta standardiserade skillnaden är något godtyckligt, men 0,1 används ofta och betecknar försumbar skillnad mellan de två grupperna. I en liten kohort är det svårare att uppnå korrekt balansering. Figur 2 visar de misslyckade resultaten av försök att balansera kovariater i en kohort av 100 deltagare.

När den standardiserade benägenheten Poäng genereras, kan studiegruppen gå vidare med resultatanalys. Överlevnadsanalys är ofta anställd på grund av behovet av att censurera deltagare med ojämn uppföljningsinformation, och figur 3 visar ett exempel på användning av proc phreg med standardiserade benägenhet poäng vikter för att generera en kumulativ incidens funktion (cif) tomt. CIF-handlingen skildrar det ökande antalet händelser över tiden. I detta fall, den obehandlade, eller kontroll, grupp (ingen RX) har ett större antal händelser och är jämförelsevis värre än den behandlade gruppen (RX).

Figure 1
Figur 1: exempel på framgångsrik balansering. I en stor kohort (n = 10 000), uppnådde IPTW balansering av kovariaterna med alla absoluta standardiserade skillnader minska till mindre än 0,1. Vänligen klicka här för att se en större version av denna siffra.

Figure 2
Figur 2: exempel på misslyckad balansering. I en liten kohort (n = 100), IPTW kunde inte uppnå balansering av kovariater med många absoluta standardiserade skillnader som återstår större än 0,1. Vänligen klicka här för att se en större version av denna siffra.

Figure 3
Figur 3: exempel på kumulativ incidens funktion komplott jämföra behandlingsgrupper. Över tid, den kumulativa incidensen av dödlighet ökar i båda grupperna, även om det är högre i obehandlad grupp (ingen RX). I detta exempel har den behandlade gruppen förbättrat överlevnaden. Vänligen klicka här för att se en större version av denna siffra.

Kompletterande material. Vänligen klicka här för att se denna fil (Högerklicka för att ladda ner).

Subscription Required. Please recommend JoVE to your librarian.

Discussion

Retrospektiva analyser med stora administrativa dataset ger ett effektivt och kostnadseffektivt alternativ när randomiserade kontrollerade studier inte är genomförbara. Den lämpliga datamängden kommer att bero på befolkningen och variabler av intresse, men MDR är ett attraktivt alternativ som inte har åldersbegränsningar ses med Medicare data. Med någon datauppsättning, är det viktigt att vara intimt förtrogen med sin layout och dataordbok. Försiktighet bör iakttas på vägen för att säkerställa att kompletta data fångas, och data matchas korrekt och slås samman.

Koder för diagnoser bör definieras med hjälp av befintlig litteratur och en grundlig förståelse av ICD-9-CM och ICD-10-CM kodningssystem för att maximera värdet av de tilldelade diagnoserna. Befintliga uppsättningar av comorbiditet koder, inklusive Elixhauser27 eller raffinerade charlson samsjuklighet index28,29, kan användas för att definiera comorbida villkor som kan påverka resultatet av intresse. Likaså validerade kodnings algoritmer i administrativa data och bör utnyttjas. Validering bör förbli ett område av aktiv forskning, eftersom det finns fortsatt lärande om optimal användning av ICD-9-CM och ICD-10-CM kodning algoritmer för att maximera korrekt klassificering av ett brett spektrum av sjukdomar.

Benägenheten Poäng kan användas för att ta itu med bias inneboende i någon retrospektiv analys. Effektiv benägenheten Poäng viktning eller matchning bör minska den absoluta standardisera skillnaden (ASD) under den önskade tröskeln, i allmänhet satt till 0,1. Lämplig balansering bidrar till att säkerställa jämförbarhet av behandlingsgrupperna med avseende på kända confounders, och lämpligt anställda benägenheten Poäng tekniker har använts för att framgångsrikt replikera randomiserade försöksresultat. När väl balanserade, behandlingsgrupperna kan jämföras med univariat tid till händelse eller annan analys.

Även med lämplig balansering, det finns potential för kvarvarande confounding3, så utredningsgruppen bör begränsa effekten av ouppmätta confounders. Dessutom, om effekterna av kovariaterna på val av behandling är starka, bias kan fortfarande vara30. I små kohorter, benägenheten poängen är osannolikt att helt minska ASD under 0,1 för alla variabler och regression justering kan användas för att ta bort resterande obalans31. Regressions justering kan också användas i subgruppsanalys när lämplig balans inte längre är säkerställd.

När det görs på rätt sätt, forskning med administrativa data ger lägligt svar på viktiga kliniska frågor i avsaknad av randomiserade kliniska prövningar. Även om det är omöjligt att ta bort all bias från observationsstudier, bias kan begränsas med hjälp av benägenhet poäng och återstående noggranna analyser.

Subscription Required. Please recommend JoVE to your librarian.

Disclosures

Författarna har inget att avslöja.

Acknowledgments

Forskning som rapporteras i denna publikation stöddes av National Center for framryckande translationella vetenskaper av National Institutes of Health under tilldelnings nummer UL1 TR002345. Innehållet är uteslutande författarnas ansvar och representerar inte nödvändigtvis de officiella åsikter som finns hos National Institutes of Health.

Disclaimer: Dessutom, de åsikter som uttrycks i denna artikel är de av författaren endast och bör inte tolkas som företräder på något sätt de av USA: s regering, Förenta staternas försvarsdepartementet (DoD), eller Förenta staternas Department of the Armén. Identifieringen av specifika produkter eller vetenskaplig instrumentering anses vara en integrerad del av den vetenskapliga strävan och utgör inte godkännande eller underförstått godkännande av författaren, DoD, eller någon komponent byrå.

Materials

Name Company Catalog Number Comments
CD Burner (for NDI Request)
Computer
Putty.exe Putty.org
SAS 9.4 SAS Institute Cary, NC
WinSCP or other FTP software https://winscp.net/eng/index.php

DOWNLOAD MATERIALS LIST

References

  1. Concato, J., Shah, N., Horwitz, R. I. Randomized, controlled trials, observational studies, and the hierarchy of research designs. New England Journal of Medicine. 342 (25), 1887-1892 (2000).
  2. Austin, P. C., Platt, R. W. Survivor treatment bias, treatment selection bias, and propensity scores in observational research. Journal of Clinical Epidemiology. 63 (2), 136-138 (2010).
  3. Sturmer, T., Wyss, R., Glynn, R. J., Brookhart, M. A. Propensity scores for confounder adjustment when assessing the effects of medical interventions using nonexperimental study designs. Journal of Internal Medicine. 275 (6), 570-580 (2014).
  4. Schermerhorn, M. L., et al. Long-Term Outcomes of Abdominal Aortic Aneurysm in the Medicare Population. New England Journal of Medicine. 373 (4), 328-338 (2015).
  5. Williams, R. J. II, et al. A Propensity-Matched Analysis Between Standard Versus Tapered Oral Vancomycin Courses for the Management of Recurrent Clostridium difficile Infection. Open Forum Infectious Diseases. 4 (4), (2017).
  6. Mitchell, J. D., et al. Impact of Statins on Cardiovascular Outcomes Following Coronary Artery Calcium Scoring. Journal of the American College of Cardiology. 72 (25), 3233-3242 (2018).
  7. Rush, T., McGeary, M., Sicignano, N., Buryk, M. A. A plateau in new onset type 1 diabetes: Incidence of pediatric diabetes in the United States Military Health System. Pediatric Diabetes. 19 (5), 917-922 (2018).
  8. Rhon, D. I., Greenlee, T. A., Marchant, B. G., Sissel, C. D., Cook, C. E. Comorbidities in the first 2 years after arthroscopic hip surgery: substantial increases in mental health disorders, chronic pain, substance abuse and cardiometabolic conditions. British Journal of Sports Medicine. , (2018).
  9. Mitchell, J., Paisley, R., Moon, P., Novak, E., Villines, T. Coronary Artery Calcium Score and Long-term Risk of Death, Myocardial Infarction and Stroke: The Walter Reed Cohort Study. Journal of the American College of Cardiology: Cardiovascular Imaging. , (2017).
  10. McCormick, N., Lacaille, D., Bhole, V., Avina-Zubieta, J. A. Validity of myocardial infarction diagnoses in administrative databases: a systematic review. PLoS ONE. 9 (3), e92286 (2014).
  11. Huo, J., Yang, M., Tina Shih, Y. -C. Sensitivity of Claims-Based Algorithms to Ascertain Smoking Status More Than Doubled with Meaningful Use. Value in Health. , Available from: https://doi.org/10.1016/j.jval.2017.09.002 (2017).
  12. Nayan, M., et al. The value of complementing administrative data with abstracted information on smoking and obesity: A study in kidney cancer. Canadian Urological Association Journal. 11 (6), 167-171 (2017).
  13. Birman-Deych, E., et al. Accuracy of ICD-9-CM codes for identifying cardiovascular and stroke risk factors. Medical Care. 43 (5), 480-485 (2005).
  14. Preen, D. B., Holman, C. D., Spilsbury, K., Semmens, J. B., Brameld, K. J. Length of comorbidity lookback period affected regression model performance of administrative health data. Journal of Clinical Epidemiology. 59 (9), 940-946 (2006).
  15. Rector, T. S., et al. Specificity and sensitivity of claims-based algorithms for identifying members of Medicare+Choice health plans that have chronic medical conditions. Health Services Research. 39 (6 Pt 1), 1839-1857 (2004).
  16. Hernán, M. A., et al. Observational studies analyzed like randomized experiments: an application to postmenopausal hormone therapy and coronary heart disease. Epidemiology (Cambridge, Mass.). 19 (6), 766-779 (2008).
  17. Austin, P. C. The relative ability of different propensity score methods to balance measured covariates between treated and untreated subjects in observational studies. Medical Decision Making. 29 (6), 661-677 (2009).
  18. Robins, J. M., Hernan, M. A., Brumback, B. Marginal structural models and causal inference in epidemiology. Epidemiology. 11 (5), 550-560 (2000).
  19. Robins, J. Marginal structural models. 1997 Proceedings of the American Statistical Association, section on Bayesian statistical science. , 1-10 (1998).
  20. Thoemmes, F., Ong, A. D. A Primer on Inverse Probability of Treatment Weighting and Marginal Structural Models. Emerging Adulthood. 4 (1), 40-59 (2016).
  21. Xu, S., et al. Use of stabilized inverse propensity scores as weights to directly estimate relative risk and its confidence intervals. Value in Health: the Journal of the International Society for Pharmacoeconomics and Outcomes Research. 13 (2), 273-277 (2010).
  22. Cowper, D. C., Kubal, J. D., Maynard, C., Hynes, D. M. A primer and comparative review of major US mortality databases. Annals of Epidemiology. 12 (7), 462-468 (2002).
  23. Skopp, N. A., et al. Evaluation of a methodology to validate National Death Index retrieval results among a cohort of U.S. service members. Annals of epidemiology. 27 (6), 397-400 (2017).
  24. Buck, C. J. 2015 ICD-9-CM for Hospitals, Volumes 1, 2, & 3, Professional Edition. , Elsevier Saunders. (2015).
  25. Buck, C. J. 2018 ICD-10-CM for Hospitals, Professional Edition. , Elsevier Saunders. (2018).
  26. Guo, S., Fraser, W. M. Propensity Score Analysis: Statistical Methods and Applications, Second Edition. , Sage Publications. (2015).
  27. Elixhauser, A., Steiner, C., Harris, D. R., Coffey, R. M. Comorbidity measures for use with administrative data. Medical Care. 36 (1), 8-27 (1998).
  28. Charlson, M. E., Pompei, P., Ales, K. L., MacKenzie, C. R. A new method of classifying prognostic comorbidity in longitudinal studies: development and validation. Journal of Chronic Diseases. 40 (5), 373-383 (1987).
  29. Deyo, R. A., Cherkin, D. C., Ciol, M. A. Adapting a clinical comorbidity index for use with ICD-9-CM administrative databases. Journal of Clinical Epidemiology. 45 (6), 613-619 (1992).
  30. Austin, P. C., Stuart, E. A. The performance of inverse probability of treatment weighting and full matching on the propensity score in the presence of model misspecification when estimating the effect of treatment on survival outcomes. Statistical Methods in Medical Research. 26 (4), 1654-1670 (2017).
  31. Austin, P. C. Balance diagnostics for comparing the distribution of baseline covariates between treatment groups in propensity-score matched samples. Statistics in Medicine. 28 (25), 3083-3107 (2009).

Tags

Medicin omvänd sannolikhet för behandling viktning benägenhet poäng National death index militära hälso system data arkivet bias val av behandling confounding stordata
Omvänd sannolikhet för behandling viktning (benägenhet poäng) med hjälp av militära hälso-och sjukvårdssystemet data arkivet och nationella death index
Play Video
PDF DOI DOWNLOAD MATERIALS LIST

Cite this Article

Mitchell, J. D., Gage, B. F.,More

Mitchell, J. D., Gage, B. F., Fergestrom, N., Novak, E., Villines, T. C. Inverse Probability of Treatment Weighting (Propensity Score) using the Military Health System Data Repository and National Death Index. J. Vis. Exp. (155), e59825, doi:10.3791/59825 (2020).

Less
Copy Citation Download Citation Reprints and Permissions
View Video

Get cutting-edge science videos from JoVE sent straight to your inbox every month.

Waiting X
Simple Hit Counter