Medicine

Inverse waarschijnlijkheid van weging van de behandeling (propensity Score) met behulp van de militaire gezondheid systeem data repository en National Death index

Published: January 8, 2020 doi: 10.3791/59825

Joshua D. Mitchell¹, Brian F. Gage², Nicole Fergestrom³, Eric Novak¹, Todd C. Villines⁴

¹Cardiovascular Division, Washington University School of Medicine, ²General Medical Sciences, Washington University School of Medicine, ³Center for Advancing Population Science, Medical College of Wisconsin, ⁴Cardiology Service, Department of Medicine, Walter Reed National Military Medical Center

Summary

Wanneer gerandomiseerde gecontroleerde proeven niet haalbaar zijn, een uitgebreide gezondheidszorg gegevensbron zoals de militaire gezondheid systeem data repository biedt een aantrekkelijk alternatief voor retrospectieve analyses. Het opnemen van sterfte gegevens uit de nationale overlijdens index en het balanceren van verschillen tussen groepen die gebruik maken van de neiging om de vooroordelen te verminderen, inherent aan retrospectieve ontwerpen.

Abstract

Wanneer gerandomiseerde gecontroleerde proeven zijn niet haalbaar, retrospectieve studies met behulp van Big data bieden een efficiënt en kosteneffectief alternatief, hoewel ze in gevaar voor behandeling selectie bias. Behandeling selectie bias treedt op in een niet-gerandomiseerde studie wanneer de behandeling selectie is gebaseerd op voor behandeling kenmerken die ook worden geassocieerd met de uitkomst. Deze voorbehandelings kenmerken, of medeoprichters, kunnen de evaluatie van het effect van een behandeling op de uitkomst beïnvloeden. Propensity scores minimaliseren deze bias door het balanceren van de bekende medeoprichters tussen behandelingsgroepen. Er zijn een aantal benaderingen voor het uitvoeren van neiging score analyses, met inbegrip van stratificatie door de neiging score, neiging matching, en inverse waarschijnlijkheid van behandeling weging (iptw). Hier beschreven is het gebruik van IPTW voor het balanceren van Baseline comorbiditeiten in een cohort van patiënten binnen de Amerikaanse militaire gezondheidszorgsysteem data repository (MDR). De MDR is een relatief optimale gegevensbron, omdat het een ingesloten cohort biedt waarin bijna volledige informatie over zieken-en poliklinische diensten beschikbaar is voor in aanmerking komende begunstigden. Hieronder wordt het gebruik van de MDR aangevuld met informatie uit de National Death index om robuuste sterftecijfers te verstrekken. Ook zijn er suggesties voor het gebruik van administratieve gegevens. Ten slotte deelt het protocol een SAS-code voor het gebruik van IPTW om bekende medeoprichters in evenwicht te brengen en de cumulatieve incidentie functie voor het resultaat van de rente te tekenen.

Introduction

Gerandomiseerde, placebo-gecontroleerde proeven zijn de sterkste studie ontwerp te kwantificeren werkzaamheid van de behandeling, maar ze zijn niet altijd haalbaar als gevolg van kosten en tijd eisen of een gebrek aan Equipoise tussen behandelingsgroepen¹. In deze gevallen biedt een retrospectief cohort ontwerp met grootschalige administratieve gegevens ("Big Data") vaak een efficiënt en kosteneffectief alternatief, hoewel het gebrek aan randomisatie de behandelings selectie bias²introduceert. Behandeling selectie bias treedt op in niet-gerandomiseerde studies wanneer het behandelings besluit afhankelijk is van voor behandeling kenmerken die zijn gekoppeld aan de uitkomst van de rente. Deze kenmerken staan bekend als verstorende factoren.

Omdat neiging scores deze bias minimaliseren door het balanceren van de bekende medeoprichters tussen behandelingsgroepen, zijn ze steeds populairder geworden³. Propensity scores zijn gebruikt om te vergelijken chirurgische benaderingen⁴ en medische regimes⁵. Onlangs hebben we een neiging analyse van gegevens van de Verenigde Staten militaire Health System data repository (MDR) gebruikt om het effect van statines in primaire preventie van cardiovasculaire uitkomsten te beoordelen op basis van de aanwezigheid en ernst van coronaire arteriële calcium⁶.

De MDR, minder frequent gebruikt dan de datasets van Medicare en VA voor onderzoeksdoeleinden, bevat uitgebreide administratieve en medische claims informatie van zieken-en ambulante diensten die worden aangeboden voor actieve militaire, gepensioneerden en andere ministerie van defensie (DoD) zorg begunstigden en hun afhankelijke personen. De database omvat diensten die wereldwijd worden geleverd bij Amerikaanse militaire behandelingsinstallaties of bij civiele faciliteiten die aan het DoD worden gefactureerd. De database bevat volledige apotheek gegevens sinds 1 oktober 2001. Laboratoriumgegevens zijn beschikbaar vanaf 2009, maar zijn slechts beperkt tot militaire behandelingsfaciliteiten. Binnen de MDR zijn cohorten gedefinieerd met methoden zoals het gebruik van diagnosecodes (bijv. diabetes mellitus⁷) of procedure codes (bijv. arthroscopische chirurgie⁸). Als alternatief kan een extern gedefinieerd cohort van in aanmerking komende begunstigden, zoals een register, worden gekoppeld aan de MDR om basis-en opvolgings gegevens te verkrijgen⁹. In tegenstelling tot Medicare omvat de MDR patiënten van alle leeftijden. Het is ook minder bevooroordeeld ten opzichte van mannetjes dan de VA-database, omdat het afhankelijke personen bevat. De toegang tot de MDR is echter beperkt. Over het algemeen kunnen alleen onderzoekers die lid zijn van het militaire gezondheidszorgstelsel toegang vragen, analoog aan de vereisten voor het gebruik van de VA-database. Niet-overheids onderzoekers die toegang willen tot de gegevens van de militaire gezondheidsstelsels moeten dit doen via een overeenkomst voor het delen van gegevens onder toezicht van een regerings sponsor.

Wanneer u een administratieve gegevensset gebruikt, is het belangrijk om rekening te houden met de beperkingen en sterke punten van de administratieve codering. De gevoeligheid en specificiteit van de code kan variëren op basis van de gerelateerde diagnose, of het nu een primaire of secundaire diagnose is, of of het een intramurale of poliklinisch bestand is. Inpatient codes voor acuut myocardinfarct worden over het algemeen nauwkeurig gerapporteerd met positieve voorspellende waarden van meer dan 90%¹⁰, maar het gebruik van tabak is vaak ondergecodeerd¹¹. Dergelijke undercoding kan al dan niet een zinvol effect hebben op de resultaten van een studie¹². Bovendien kunnen verschillende codes voor een bepaalde aandoening bestaan met verschillende correlatie niveaus met de ziekte in kwestie¹³. Een onderzoeksteam moet een uitgebreid onderzoek naar de literatuur en een overzicht van de internationale classificatie van ziekte, negende revisie, klinische modificatie (ICD-9-CM) en/of ICD-10-CM Codeer handleidingen uitvoeren om ervoor te zorgen dat de juiste codes in het onderzoek worden opgenomen.

Verschillende methoden kunnen worden gebruikt om de gevoeligheid en nauwkeurigheid van de diagnostische codes voor het definiëren van comorbide voorwaarden te verbeteren. Er moet een passende "Terugblik" periode worden opgenomen om de comorbiditeiten op baseline vast te stellen. De terugblik periode omvat de klinische en ambulante diensten die voorafgaand aan de studie binnenkomen. Een periode van één jaar kan een optimale¹⁴zijn. Bovendien, vereisen twee afzonderlijke claims in plaats van een enkele claim kan de specificiteit te verhogen, terwijl het aanvullen van codering gegevens met farmaceutische gegevens gevoeligheid kan verbeteren¹⁵. Selecteer Handmatige grafiek audits op een deel van de gegevens kunnen worden gebruikt om de nauwkeurigheid van de coderings strategie te controleren.

Zodra de comorbiditeiten zijn gedefinieerd en beoordeeld voor de betrokken cohort, kan een neiging tot het beoordelen van de verschillen in covariaten tussen behandelingsgroepen worden gebruikt. De neiging score is afgeleid van de waarschijnlijkheid dat een patiënt wordt toegewezen aan een behandeling op basis van bekende covariaten. De administratieve verwerking van deze neiging vermindert het effect dat de covarianten hebben op de behandeling toewijzing en helpt bij het genereren van een waarheidsgetrouwe schatting van het behandelingseffect op de uitkomst. Hoewel neiging scores niet noodzakelijkerwijs superieure resultaten bieden aan multivariate modellen, kunnen ze wel beoordelen of de behandelde en onbehandelde groepen vergelijkbaar zijn na het aanbrengen van de neiging score³. Onderzoeksonderzoekers kunnen de absolute gestandaardiseerde verschillen in covariaten voor en na de aanpassing van de neiging of de inverse waarschijnlijkheid van behandelings weging (iptw) analyseren om ervoor te zorgen dat bekende medeoprichters evenwichtig zijn verdeeld tussen groepen. Belangrijk is dat onbekende medeoprichters niet in evenwicht zijn, en men moet zich bewust zijn van het potentieel voor residuele verstoring.

Wanneer goed uitgevoerd, hoewel, neiging scores zijn een krachtig hulpmiddel dat kan voorspellen en repliceren resultaten van gerandomiseerde gecontroleerde proeven¹⁶. Van de beschikbare propensity-Score technieken, matching en IPTW hebben over het algemeen de voorkeur¹⁷. Binnen IPTW worden patiënten gewogen aan de hand van hun neiging of waarschijnlijkheid van behandeling. Stabiliserende gewichten worden over het algemeen aanbevolen over ruwe gewichten, terwijl het trimmen van de gewichten ook kan worden beschouwd als¹⁸^,¹⁹^,²⁰^,²¹.

Zodra studiegroepen evenwichtig zijn, kunnen ze worden gevolgd tot het resultaat van de interesse. Studies met administratieve gegevens kunnen geïnteresseerd zijn in uitkomsten zoals overname percentages en time-to-Event analyses. In studies die geïnteresseerd zijn in het sterfelijk leven bevat de data repository van het militaire gezondheidszorgsysteem een veld voor vitale status dat verder kan worden aangevuld met behulp van de National Death index (NDI)²²^,²³. De NDI is een gecentraliseerde database van Death recordinformatie van staats kantoren die wordt beheerd door het centrum voor Ziektecontrole. Onderzoekers kunnen de fundamentele vitale status en/of specifieke doodsoorzaak opvragen op basis van het overlijdensattest.

In het volgende protocol wordt het proces van het uitvoeren van een administratieve database-studie met de MDR aangevuld met mortaliteits informatie van de NDI. Het maakt gebruik van IPTW voor het balanceren van basislijn verschillen tussen twee behandelgroepen, waaronder SAS-code en voorbeelduitvoer.

Subscription Required. Please recommend JoVE to your librarian.

Protocol

Het volgende protocol volgt de richtsnoeren van onze institutionele commissies voor menselijke ethiek.

1. het definiëren van de cohort

Bepaal de inclusie-en uitsluitingscriteria van het geplande cohort met behulp van 1) een register of 2) gegevenspunten die kunnen worden geëxtraheerd uit de MDR, zoals administratieve codes voor diagnoses of procedures (d.w.z. alle patiënten met meer dan twee patiënt diagnoses of een intramurale diagnose van boezemfibrilleren).
1. Als u een register gebruikt, u twee of meer patiënt-id's opnemen voor nauwkeurige afstemming met de gegevensopslagplaats van het militaire gezondheidssysteem, zoals het medische recordnummer (vermeld in verschillende gegevenssets als patuniq en edipn), volledige naam, geboortedatum en/of het sociale-zekerheidsnummer van de sponsor.
  Opmerking: zoals bij alle studies met behulp van persoonlijke gezondheidsinformatie zijn veiligheidsmaatregelen vereist en moeten ze worden nageleefd. De juiste versleuteling en gegevensbeheer moeten tijdens het inzamelings proces worden uitgevoerd en de informatie moet zo snel mogelijk worden opgespoord.
  Opmerking: bij het verwijzen naar het sociale-zekerheidsnummer van de sponsor (sponssn), worden alle patiënten vermeld met betrekking tot hun relatie met het militair lid (of sponsor), met inbegrip van een identificatie voor de sponsor, echtgenoot en kinderen. Houd er rekening mee dat de relatie code en het socialezekerheidsnummer van de sponsor in de loop van de tijd in de gegevensset kunnen veranderen wanneer patiënten volwassenen worden en trouwen of gescheiden raken. Zo helpen meerdere patiënt identificatoren om nauwkeurigheid te garanderen.
2. Als u de cohorten definieert door middel van administratieve codering, voert u een uitgebreide literatuur zoekopdracht uit om eerdere studies te identificeren die mogelijk de codes van belang hebben gevalideerd. Beoordeling ICD-9-CM²⁴ en/of ICD-10-cm²⁵ handleidingen om code definities en naburige codes te verduidelijken om ervoor te zorgen dat het juiste bereik van codes wordt gebruikt. Controleer ook de kruisverwijzingstabellen in de handleidingen voor aanvullende codes voor opname/uitsluiting. Eerdere validatiestudies bevatten meldingen van positieve voorspellende waarde, gevoeligheid en specificiteit voor verschillende administratieve coderings strategieën. Deze hulp bij het optimaliseren van cohort selectie en uitkomst identificatie.
Bepaal of er beperkingen zijn (bijvoorbeeld op basis van leeftijd) op de gewenste cohort of andere uitsluitingscriteria om in de gegevensaanvraag op te nemen.
Definieer de studieperiode om tijd vóór de index datum op te nemen voor het verzamelen van Baseline covarianten (over het algemeen 12 maanden in administratief gegevens onderzoek) en de einddatum van de studie.

2. definiëren van covarianten en uitkomsten

Definieer administratieve codes voor verstorende voorwaarden via literatuur zoekacties en het gebruik van de ICD-9-CM²⁴ en/of ICD-10-cm²⁵ handleidingen zoals gedaan in stap 1.1.2 hierboven.
Bepaal andere noodzakelijke covarianten, waaronder demografische gegevens, medicatie en laboratorium data.
Bekijk de beschikbare gegevensvelden in de MDR-Gegevenswoordenlijst hier: https://Health.mil/Military-Health-topics/Technology/Support-areas/MDR-m2-ICD-functional-References-and-Specification-Documents.

3. indiening van een verzoek voor de MDR

De goedkeuring van de Raad voor institutionele toetsing verkrijgen.
Voltooi een overeenkomst voor het delen van gegevens die u hier vinden: https://Health.mil/Military-Health-topics/privacy-and-civil-liberties/submit-a-Data-Sharing-Application?type=all#RefFeed. Geef als onderdeel van de toepassing gegevensvelden en bestanden op die worden aangevraagd in het DRT-werkblad voor extracties van de militaire Health System-data repository (MDR) (gekoppeld vanuit het aanvraagformulier). Geef op of het team een gegevensanalist aanvraagt die de onbewerkte gegevens levert of dat het team rechtstreeks toegang heeft tot de MDR. Verder specificeren of de aanvraag is voor een eenmalige gegevens pull of als regelmatig trekt dagelijks, maandelijks of jaarlijks worden aangevraagd.
Opmerking: om MDR-gegevens op een willekeurige manier te verkrijgen, moet er een sponsor zijn die een overheidsmedewerker is (actief militair of GS), die meestal lid is van het onderzoekers team.
Als u rechtstreeks toegang hebt tot de MDR, vult u het MDR-machtigings aanvraagformulier en MDR CS 2875-formulier in dat u hier vinden: https://Health.mil/Military-Health-topics/Technology/Support-areas/MDR-m2-ICD-functional-References-and-Specification-Documents.

4. toegang tot de MDR en het extraheren van relevante gegevens

Als u rechtstreeks toegang hebt tot de MDR, volgt u de instructies voor toegang tot en gebruik van de MDR, inclusief softwarevereisten en voorbeelden van SAS-Programma's die beschikbaar zijn in de "MDR-Gebruikershandleiding" en "MDR-functionele gids" hier: https://Health.mil/Military-Health-topics/Technology/Support-areas/MDR-m2-ICD-functional-References-and-Specification-Documents.
Opmerking: bestanden worden opgeslagen in SAS-formaat en toegankelijk via een Unix-shell in het algemeen met behulp van putty. exe, evenals een FTP-programma. Kennis van SAS is vereist.
Raadpleeg voor een handig overzicht van de MDR-installatie de DOD-handleiding voor DOD-onderzoekers over het gebruik van MHS-gegevens https://Health.mil/Reference-Center/Publications/2012/10/10/Guide-for-DoD-researchers-on-using-MHS-data.
Zoals u in stap 2,3 hebt gedaan, controleert u de MDR-Gegevenswoordenlijst voor gedetailleerde informatie over alle beschikbare gegevensbestanden https://Health.mil/Military-Health-topics/Technology/Support-areas/MDR-m2-ICD-functional-References-and-Specification-Documents.
Opmerking: niet alle gegevensbestanden bevatten alle patiëntenidentificatoren voor matching/samenvoegen. De gegevenswoordenlijst helpt lijst-id's die beschikbaar voor elk gegevensbestand zijn. Het DOD-ID-nummer, ook wel aangeduid als "patuniq" of "edipn", is nodig om informatie over de apotheek te extraheren, bijvoorbeeld. Het is daarom belangrijk om alle patiënt identificatoren in de data mining stap te hebben om alle patiënteninformatie in meerdere jaren en meerdere datasets te kunnen afstemmen. Het is belangrijk om te herhalen dat inherent aan onderzoek dat betrekking heeft op PHI, strikte naleving van de procedures voor gegevensbescherming nodig is na het verwerven van de noodzakelijke goedkeuring, en dat PHI moet worden vernietigd nadat het niet meer nodig is.
Verkrijg de nodige patiëntenidentificatoren voor de cohort door de vm6 begunstigde gegevens (sep 2002 – heden) of pben-bestand (sep 2000 – sep. 2002) te openen.
1. Gebruik de onderstaande macro of een soortgelijk programma om vm6 gegevens te koppelen aan het cohort bestand. In dit geval kan de code worden gebruikt als geschreven om patiëntenmedische record nummers (Mrn's) te vinden voor een bepaalde patiënt die al in een cohort bestand staat. Gebruik verschillende variabelenamen in de vm6 data draw-en cohort-bestanden voor patiëntennamen en geboortedatums om later te controleren op fouten. Om PHI te beschermen, bewaart u de gegevens met patiënt-id's op het serviceknooppunt in de ruimte die is opgegeven als onderdeel van de gegevensaanvraag (Zie MDR-gebruikershandleiding).
  Opmerking: Mrn's worden het DOD-ID-nummer, PATUNIQ of EDIPN in de MDR genoemd).
2. Als database-items nooit volledig vrij van fouten zijn, voert u foutcontroles na elke belangrijke stap naast het controleren van het programma logboek en de uitvoer voor mogelijke problemen. Gebruik de gegevens stap hieronder om mogelijke mismatches met de bovenstaande code te bekijken (patiënt bestanden worden afgestemd op de patiënt/begunstigde Social). Bij het vergelijken van namen uit het cohort bestand (achternaam, voornaam) met het bestand vm6 (last_name, first_name), komt alleen overeen met de eerste drie letters om fout fouten die ontstaan met verschillen in spelling/afstand tussen bestanden te verminderen.
3. Bekijk foutgegevens bestand ("CheckName"). Negeer fouten veroorzaakt door leestekens (O'Reilly versus OReilly). Controleer andere fouten van bezorgdheid met handmatige beoordeling van het gezondheidsdossier of overweeg de relevante patiënt/patiëntinformatie te verwijderen als er significante fouten zijn en als verificatie niet mogelijk is.
Extraheer de resterende benodigde gegevens uit de MDR.
1. Indien nodig, het verkrijgen van RAS en seks van vm6ben bestanden (pben bestanden vóór september 2002), samen te voegen met het cohort-bestand, en controleer op fouten zoals hierboven gedaan:
2. Verkrijg doods gegevens uit het Death master-bestand, voeg ze samen met het cohort bestand en controleer op fouten zoals hierboven gedaan:
3. Aanvullende gegevensbestanden verkrijgen die nodig zijn voor analyse (Zie de functionele gebruikershandleiding van MDR voor gegevenslocatie en extra nuttige SAS-macro's en-code).
  Opmerking: gegevens worden opgeslagen in afzonderlijke bestanden, afhankelijk van of deze rechtstreeks zijn verstrekt door een militair gezondheidszorgsysteem of elders worden geleverd en worden gefactureerd aan het militaire gezondheidszorgsysteem. Voorbeeldbestanden worden hieronder weergegeven.
  CAPER – direct Care, poliklinische dossiers van FY 2004 – heden
  SADR – direct Care, poliklinische dossiers van 1998 – 2005
  Sidr – direct Care, intramurale hospitalisaties (directe verzorging) vanaf 1989 – heden
  TEDI – gefactureerde zorg, institutionele claim bestanden fy 2001 – heden
  HCSRI – gefactureerde zorg, institutionele claims fy 1994 – 2005
  TEDNI – gefactureerde zorg, niet-institutionele claims fy 2001 – heden
  HCSRNI – gefactureerde zorg, niet-institutionele claims fy 1994 – 2005
  PDTS – apotheek bestand met individuele recepten fy 2002 – heden

5. gegevens samenvoegen en summatieve bestanden opbouwen

Of gegevens afkomstig zijn van een Data-analist of rechtstreeks zijn verkregen van de MDR zoals beschreven in sectie 4 hierboven, gegevensbestanden moeten worden gesommeerd en samengevoegd om het analyse bestand te vormen. Gedurende het hele proces, gebruik maken van methoden die de nauwkeurigheid van gegevens te verbeteren, met inbegrip van foutcontroles en herziening van logs en uitvoer zoals ook eerder besproken.
1. Bij het samenvoegen van gegevens, gebruik ten minste twee patiënt-id's indien mogelijk om een sterke match (zoals medische recordnummer en geboortedatum) te garanderen, omdat er fouten kunnen bestaan in elk veld. Nadat de gegevens samenvoegen, Controleer de gegevens om te controleren of de verwachte resultaten. Voer de code om ervoor te zorgen dat de eerste drie letters van de naam naast een andere id of twee is handig om te controleren of de juiste overeenkomsten (zie stap 4.5.1).
  Opmerking: de achternaam kan niet overeenkomen als de patiënt in de betreffende periode getrouwd is. Kleine variaties kunnen ook bestaan in naamvelden als gevolg van apostroffen of spatiëring en typfouten.
2. Bijzondere aandacht besteden aan wedstrijden bij terminale stappen in het proces, zoals het definiëren van patiënten die resultaten hadden.
Het uitpakken van comorbiditeiten op baseline met behulp van ICD-9-CM of ICD-10-CM codes uit de periode vóór de index datum, de datum waarop de patiënt wordt beschouwd als het invoeren van de studie. Gebruik over het algemeen 12 maanden voorafgaand aan de index datum om comorbiditeiten te definiëren.
1. Zorg ervoor dat patiënten in aanmerking kwamen voor het militaire gezondheidszorgsysteem tijdens de baseline periode (kan maandelijks worden geverifieerd in het vm6ben bestand).
2. Zoek Baseline diagnosecodes in poliklinische en/of intramurale bestanden om de baseline comorbiditeiten vast te stellen tijdens de baseline 12-maanden voorafgaand aan de index datum. Gebruik de ICD-9-CM-of ICD-10-CM-codes die zijn vastgesteld in sectie 1. Als je Elixhauser comorbidities gebruikt, gebruik dan de beschikbare software van HCUP, zodat je de namen van de diagnose variabelen en bestanden zo nodig aanpast. (https://www.HCUP-US.AHRQ.gov/toolssoftware/comorbidity/comorbidity.jsp#download)
Zoek naar intramurale-en/of intramurale-bestanden na de index datum voor de uitkomsten van de rente die zijn gedefinieerd door ICD-9-cm of ICD-10-cm-codes, zoals hospitalisatie voor myocardinfarct als primaire diagnose (zoek naar 410. x1 in Sidr).
Stel een einddatum voor de studie in voor alle patiënten als een cutoff voor follow-up voor patiënten die de uitkomst van de interesse niet hebben aangetoond. Bepaal welke patiënten moeten worden gecensureerd vóór het einde van de studie.
1. Zoek vm6ben bestand om te zorgen voor geschiktheid voor gezondheidszorg via de einddatum van de studie.; anders, censureren de patiënt op het moment van verlies van geschiktheid.
2. Als het belangrijk is om de studie te beperken tot actieve gebruikers van het gezondheidszorgsysteem, onafhankelijk van de subsidiabiliteit, zoals actieve gebruikers van de apotheek, bepaal dan het laatste contact met de gezondheidszorg (zoals de laatste medicatie vulling) binnen de gegevensbestanden en censureren de patiënten op die datum.
  Opmerking: Wees voorzichtig met telefonische ontmoetingen, omdat deze aanwezig kunnen zijn in het gezondheidsdossier nadat een overlijden heeft plaatsgevonden of als de begunstigde het gezondheidszorgstelsel op een andere manier heeft verlaten.

6. match met de National Death index (NDI)

Zodra de volledige cohort is geïdentificeerd, stuurt u de informatie naar de National Death index voor matching als sterfte een eindpunt is.
1. Neem eerst de intentie op om overeen te gaan met de NDI in de aanvragen voor MDR-gegevens en IRB-goedkeuring. Zorg voor goedkeuring en voltooi alle gegevensversleutelings stappen die zijn voltooid voordat u beschermde gezondheidsinformatie (PHI) naar de NDI verzendt voor afstemming.
De National Death index (NDI) aanvraagformulier en de aanwijzingen voor het aanvragen van overlijden gegevens uit de National Death index u hier vinden: https://www.CDC.gov/NCHS/NDI/index.htm.
Verstuur de gegevens op een met een wachtwoord beveiligde CD via overnight mail naar de NDI. De resultaten zullen ongeveer 2 weken later op dezelfde manier worden teruggestuurd.
Nadat u de NDI-resultaten hebt ontvangen, controleert u gedeeltelijke overeenkomsten voor mogelijke inclusie/uitsluiting.
1. "Hoofdstuk 4-het beoordelen van de NDI-output" biedt een handig overzicht van het beoordelen van resultaten en kan worden gevonden op dezelfde webpagina: https://www.CDC.gov/NCHS/NDI/index.htm. Overeenkomsten op sociaal-zekerheidsnummer bieden in het algemeen de sterkste overeenkomst.
2. Indien nodig, cross-check sterfgevallen in de sociale zekerheid Death index en/of veteranen Affairs begunstigde identificatie records Locator subsysteem (BIRLS) om de nauwkeurigheid te verbeteren. Houd er rekening mee dat service leden die overzee sterven waarschijnlijk niet worden weergegeven op een NDI-zoekopdracht, maar vaak worden herkend in het MDR Vital status-bestand of in de VA BIRLS.
Voeg het Death-bestand samen met het hoofd cohort bestand na het voltooien van de beoordeling.

7. de-identificerende gegevens

Zodra alle benodigde informatie is verkregen, de-Identificeer de-gegevensbestanden om te helpen beschermen van de PHI. Genereer een willekeurige patiëntenidentificator voor elke patiënt met behulp van "ranuni" (Zie de functionele gebruikershandleiding van MDR). Verwijder patiënt sociaal, medisch recordnummer, geboortedatum (na de computer leeftijd), enz., uit gegevensbestanden. Indien nodig (en goedgekeurd), sla een sleutel die de willekeurige patiënt-id op de PHI veilig op het knooppunt SCE koppelt.

8. het berekenen van de neiging score¹⁸^,¹⁹^,²⁶

Gebruik logistieke regressie om de kans op behandeling te modelleren (proc Logistic in SAS).
1. Geef het gegevensbestand op (' dat ' in het voorbeeld).
2. Gebruik class statement om Categorische variabelen op te geven. Gebruik "Ref = First" om de laagste waarde (zoals 0) op te geven als de referentiewaarde.
3. Geef in de instructie model de behandelings variabele op als de afhankelijke variabele (RX) en stel de waarde voor de gebeurtenis in als de waarde voor het ontvangen van de behandeling (1 in dit geval).
4. Alle mogelijke voorspellers van het ontvangen van de behandeling als covarianten in het model opnemen, vooral als ze kunnen voorspellers van de uitkomst (zoals overlijden). Overweeg of interacties tussen termen van invloed kunnen zijn op de behandeling. Neem ze op in het model met behulp van een "*" (zoals mannelijk * CKD) of gebruik de onderstaande syntaxis om "|" tussen covarianten en "@ 2" aan het einde te plaatsen om alle 2 x 2 interacties op te geven, afhankelijk van het specifieke model.
5. Gebruik de instructie output om op te geven dat de voorspelde waarschijnlijkheid van behandeling (prob) wordt gedefinieerd door "PS" en uitvoer naar het bestand "ps_data."
  
  Opmerking: variabelen in het model: mannelijk: mannelijk geslacht (binair), CKD: chronische nierziekte (binair), lever: chronische leverziekte (binair), diabetes (binair), COPD: chronische obstructieve longziekte (binair), CHF: hartfalen (binair), CAD: coronaire hartziekte (binair), CVD: cerebrovasculaire ziekte (binair), pad: perifere arteriële ziekte (binair), leeftijd (continu).
Bereken gewichten van de voorspelde waarschijnlijkheid (propensity Score). Als de patiënt een behandeling kreeg (RX = 1), dan is het neiging score gewicht 1/(neiging score). Als de patiënt geen behandeling heeft ontvangen, dan is het gewicht van de neiging score 1/(1-neiging score).
Stabiliseer de neiging van de neiging door het te delen door het gemiddelde gewicht. In de onderstaande code betekent proc het gemiddelde gewicht in de variabele "mn_wt" in het gegevensbestand "m". De onderstaande gegevens die de mn_wt van het gegevensbestand "m" behouden, berekent vervolgens de gestabiliseerde neiging scores (st_ps_weight) voor elke waarneming.
Controleer de balans na het toepassen van de inverse waarschijnlijkheid van weging van de behandeling.
1. De stddiff macro vereenvoudigt het berekenen van gestandaardiseerde gemiddelde verschillen voor covarianten voor en na weging in SAS. De code voor de macro u hier vinden: http://www.Lerner.CCF.org/QHS/software/lib/stddiff.SAS.
2. Bereken het gestandaardiseerde gemiddelde verschil voor weging. Net als bij alle macro's moet de macrocode worden uitgevoerd in SAS voordat deze wordt opgeroepen. Een voorbeeld van een call-instructie is hieronder met de covarianten van belang.
  
  Inds-invoergegevensset, groupvar-variabele die de studiegroepen definieert, charvars-Categorische variabelen, numvars-continue variabelen, stdfmt – indeling van gestandaardiseerde verschil, outds – uitvoergegevensset.
3. Roep de stddiff-macro opnieuw op om het gestandaardiseerde gemiddelde verschil na weging te berekenen. "Wtvar" specificeert de variabele die de gestandaardiseerde neiging score bevat en wordt toegevoegd aan de macro Call statement. Als de gestandaardiseerde verschillen allemaal kleiner dan of gelijk zijn aan 0,1, wordt de afweging als geslaagd beschouwd.
De ASD voor en na weging kan worden gerapporteerd in tabel-of grafiekindeling. Raadpleeg de aanvullende materialenvoor aanwijzingen voor het gebruik van een SAS-macro om een plot te genereren.
De IPTW-gecorrigeerde gegevens kunnen nu worden gebruikt in een univariate-analyse, na een afweging van gemeten medeoprichters.

9. het resultaat model maken en een plot van cumulatieve incidentie functie genereren

Er zijn een aantal manieren waarop de resulterende time-to-Event-analyse kan worden uitgezet, inclusief het gebruik van proc lifetest om een overlevings plot te genereren. Gebruik de gewichtsaanduiding om het gestandaardiseerde neiging gewicht aan te geven.
Gebruik proc phreg om een cif-plot te genereren met een neiging gewicht.
1. Verwijs in proc phreg naar een covariabele-bestand om de covariabele-waarden op te geven die moeten worden gebruikt bij het genereren van de plot. In dit geval bevat het covariabele-bestand alleen de enkelvoudige variabele RX, die 1 of 0 kan zijn.
2. Schakel ODS-afbeeldingen in. Gebruik desgewenst aanvullende instructies om uitvoerbestanden op te geven voor de grafiek of het bestandstype (JPEG, enzovoort; Zie https://support.SAS.com/documentation/CDL/en/statug/63962/html/default/viewer.htm#statug_odsgraph_sect014.htm).
3. Gebruik in de syntaxis proc phreg de instructie Weight om de gestandaardiseerde neiging score variabele op te geven. Geef waarden op voor Baseline covarianten met behulp van de baseline-instructie om de cumulatieve incidentie functie te kunnen uitzetten. Specificeer de Strata om te gebruiken voor het plot met behulp van "rowid" (in dit geval RX 1 vs. 0). Het getal tussen haakjes dat volgt op de uitkomstvariabele ("gebeurtenis") specificeert de waarde (n) van de variabele die moet worden gecensureerd, die de censuur datum en eventuele concurrerende gebeurtenissen moet omvatten. In dit geval wordt 0 gecensureerd en 1 is een waar evenement.

Subscription Required. Please recommend JoVE to your librarian.

Representative Results

Na voltooiing van IPTW kunnen tabellen of plots van de absolute gestandaardiseerde verschillen worden gegenereerd met respectievelijk de macrocode stddiff of de macrocode asdplot. Afbeelding 1 toont een voorbeeld van een passende afweging in een grote cohort van 10.000 deelnemers die de macro asdplot gebruiken. Na toepassing van de neiging score werden de absolute gestandaardiseerde verschillen significant verlaagd. De cutoff gebruikt voor het absolute gestandaardiseerde verschil is enigszins arbitrair, hoewel 0,1 vaak wordt gebruikt en duidt op verwaarloosbaar verschil tussen de twee groepen. In een kleine cohort is een goede afweging moeilijker te bereiken. Figuur 2 toont de mislukte resultaten van een poging om covarianten in een cohort van 100 deelnemers te balanceren.

Zodra de gestandaardiseerde neiging score wordt gegenereerd, kan het onderzoeksteam overgaan tot uitkomst analyse. Overlevingsanalyse wordt vaak gebruikt vanwege de noodzaak om deelnemers te censureren met ongelijke opvolgings informatie, en Figuur 3 toont een voorbeeld van het gebruik van proc phreg met gestandaardiseerde neiging score gewichten om een cumulatieve incidentie functie (cif)-plot te genereren. Het CIF-plot toont het toenemend aantal gebeurtenissen in de loop van de tijd. In dit geval, de onbehandelde, of controlegroep (geen RX) heeft een groter aantal gebeurtenissen en is relatief slechter dan de behandelde groep (RX).

Afbeelding 1: voorbeeld van een geslaagde taakverdeling. In een grote cohort (n = 10.000) bereikte iptw het balanceren van de covarianten met alle absolute gestandaardiseerde verschillen die tot minder dan 0,1 reduceren. Klik hier om een grotere versie van dit cijfer te bekijken.

Afbeelding 2: voorbeeld van mislukte taakverdeling. In een kleine cohort (n = 100) kon IPTW geen evenwicht bereiken tussen de covariaten met veel absolute gestandaardiseerde verschillen die groter waren dan 0,1. Klik hier om een grotere versie van dit cijfer te bekijken.

Figuur 3: voorbeeld van cumulatieve incidentie functie plot vergelijken van behandelgroepen. Na verloop van tijd neemt de cumulatieve incidentie van sterfte toe in beide groepen, hoewel deze hoger is in de onbehandelde groep (geen RX). Zo heeft de behandelde groep in dit voorbeeld de overleving verbeterd. Klik hier om een grotere versie van dit cijfer te bekijken.

Aanvullende materialen. Klik hier om dit bestand te bekijken (Klik met de rechtermuisknop om te downloaden).

Subscription Required. Please recommend JoVE to your librarian.

Discussion

Retrospectieve analyses met behulp van grote administratieve gegevenssets bieden een efficiënt en kosteneffectief alternatief wanneer gerandomiseerde gecontroleerde proeven niet haalbaar zijn. De juiste gegevensset is afhankelijk van de populatie en de variabelen die van belang zijn, maar de MDR is een aantrekkelijke optie die niet de leeftijdsbeperkingen heeft die worden gezien met Medicare-gegevens. Met elke gegevensset is het belangrijk om nauw vertrouwd te zijn met de lay-out en data dictionary. Zorg moet worden genomen langs de weg om ervoor te zorgen dat de volledige gegevens worden vastgelegd, en de gegevens worden nauwkeurig afgestemd en samengevoegd.

Codes voor diagnoses moeten worden gedefinieerd met behulp van bestaande literatuur en een grondig begrip van het ICD-9-CM en ICD-10-CM coderingssysteem om de waarde van de toegewezen diagnoses te maximaliseren. Bestaande sets van comorbiditeits codes, met inbegrip van de elixhauser²⁷ of verfijnde charlson comorbiditeit index²⁸^,²⁹, kunnen worden gebruikt voor het definiëren van comorbide voorwaarden die van invloed kunnen zijn op de uitkomst van de rente. Evenzo, gevalideerde coderingsalgoritmen in administratieve gegevens en moeten worden benut. Validatie moet een gebied van actief onderzoek blijven, want er is voortdurend leren over het optimale gebruik van ICD-9-CM en ICD-10-CM coderingsalgoritmen om de nauwkeurige classificatie van een breed scala aan ziekten te maximaliseren.

Propensity scores kunnen worden gebruikt om de bias die inherent zijn aan een retrospectieve analyse aan te pakken. Effectieve neiging score weging of matching moet het absolute standaardiseren verschil (ASD) verminderen onder de gewenste drempel, doorgaans ingesteld op 0,1. Een passende afweging zorgt voor de vergelijkbaarheid van de behandelgroepen met betrekking tot bekende medeoprichters, en op passende wijze toegepaste neiging score technieken zijn gebruikt om gerandomiseerde proefresultaten met succes te repliceren. Eenmaal goed uitgebalanceerd, kunnen de behandelgroepen worden vergeleken met univariate time-to-event of andere analyses.

Zelfs met een passende afweging is er potentieel voor de resterende verstorende³, dus het onderzoeksteam moet het effect van ongemeten medeoprichters beperken. Bovendien, als de effecten van de covarianten op de selectie van de behandeling sterk zijn, kan bias nog steeds³⁰blijven. In kleine cohorten is het onwaarschijnlijk dat de neiging tot het verminderen van de ASD onder 0,1 voor alle variabelen en regressie aanpassing kan worden gebruikt om te helpen verwijderen resterende onevenwichtigheid³¹. Regressie aanpassing kan ook worden gebruikt in subgroepanalyse wanneer het juiste saldo niet meer wordt gegarandeerd.

Wanneer correct gedaan, onderzoek met administratieve gegevens biedt tijdige antwoorden op belangrijke klinische vragen in de afwezigheid van gerandomiseerde klinische proeven. Hoewel het onmogelijk is om alle bias van observationele studies te verwijderen, kan bias worden beperkt door gebruik te maken van neiging scores en resterende nauwgezette analyses.

Subscription Required. Please recommend JoVE to your librarian.

Disclosures

De auteurs hebben niets te onthullen.

Acknowledgments

Het onderzoek dat in deze uitgave werd gerapporteerd, werd gesteund door het nationaal centrum voor de bevordering van translationele Wetenschappen van de National Institutes of Health onder het Awardnummer UL1 TR002345. De inhoud is uitsluitend de verantwoordelijkheid van de auteurs en vertegenwoordigt niet noodzakelijkerwijs de officiële standpunten van de National Institutes of Health.

Disclaimer: Bovendien zijn de in dit artikel uitgedrukte standpunten alleen die van de auteur en mogen deze niet worden opgevat als representeren op enigerlei wijze die van de regering van de Verenigde Staten, het ministerie van defensie van de Verenigde Staten (DoD) of het Amerikaanse ministerie van de Leger. De identificatie van specifieke producten of wetenschappelijke instrumenten wordt beschouwd als een integraal onderdeel van het wetenschappelijk streven en vormt geen goedkeuring of impliciete goedkeuring van de auteur, het DoD of een andere componentinstantie.

Materials

Name	Company	Catalog Number	Comments
CD Burner (for NDI Request)
Computer
Putty.exe	Putty.org
SAS 9.4	SAS Institute Cary, NC
WinSCP or other FTP software	https://winscp.net/eng/index.php