Waiting
로그인 처리 중...

Trial ends in Request Full Access Tell Your Colleague About Jove
Click here for the English version

Medicine

Probabilità inversa di ponderazione del trattamento (Punteggio di propensione) utilizzando l'archivio dati del sistema sanitario militare e l'indice nazionale di morte

Published: January 8, 2020 doi: 10.3791/59825

Summary

Quando gli studi controllati randomizzati non sono fattibili, una fonte completa di dati sanitari come il Military Health System Data Repository fornisce un'alternativa interessante per le analisi retrospettive. L'incorporazione dei dati sulla mortalità derivanti dall'indice nazionale di mortalità e il bilanciamento delle differenze tra i gruppi che utilizzano la ponderazione della propensione aiuta a ridurre i pregiudizi inerenti ai progetti retrospettivi.

Abstract

Quando gli studi controllati randomizzati non sono fattibili, gli studi retrospettivi che utilizzano i big data forniscono un'alternativa efficiente ed economica, anche se sono a rischio di distorsione della selezione del trattamento. La distorsione della selezione del trattamento si verifica in uno studio non randomizzato quando la selezione del trattamento si basa su caratteristiche pre-trattamento che sono associate anche al risultato. Queste caratteristiche di pre-trattamento, o confondenti, possono influenzare la valutazione dell'effetto di un trattamento sul risultato. I punteggi di propensione riducono al minimo questa distorsione bilanciando i confondenti noti tra i gruppi di trattamento. Esistono alcuni approcci per eseguire analisi del punteggio di propensione, tra cui la stratificazione in base al punteggio di propensione, alla corrispondenza della propensione e alla probabilità inversa di ponderazione del trattamento (IPTW). Descritto qui è l'uso di IPTW per bilanciare le comorbilità di base in una coorte di pazienti all'interno del repository di dati del sistema sanitario militare degli Stati Uniti (MDR). L'MDR è una fonte di dati relativamente ottimale, in quanto fornisce una coorte contenuta in cui sono disponibili informazioni quasi complete sui servizi ospedalieri e ambulatoriali per i beneficiari idonei. Di seguito è descritto l'uso della MDR integrato con le informazioni dell'indice nazionale di mortalità per fornire dati solidi sulla mortalità. Sono inoltre forniti suggerimenti per l'utilizzo di dati amministrativi. Infine, il protocollo condivide un codice SAS per l'utilizzo di IPTW per bilanciare i confondenti noti e tracciare la funzione di incidenza cumulativa per il risultato dell'interesse.

Introduction

Randomizzati, studi controllati con placebo sono il più forte disegno di studio per quantificare l'efficacia del trattamento, ma non sono sempre fattibili a causa di requisiti di costi e tempi o una mancanza di equipoise tra i gruppi di trattamento1. In questi casi, un progetto di coorte retrospettivo che utilizza dati amministrativi su larga scala ("big data") spesso fornisce un'alternativa efficiente ed economica, anche se la mancanza di randomizzazione introduce la distorsione della selezione del trattamento2. La distorsione della selezione del trattamento si verifica negli studi non randomizzati quando la decisione di trattamento dipende dalle caratteristiche pre-trattamento associate all'esito di interesse. Queste caratteristiche sono note come fattori di confusione.

Poiché i punteggi di propensione riducono al minimo questa distorsione bilanciando i confondenti noti tra i gruppi di trattamento, sono diventati sempre più popolari3. I punteggi di propensione sono stati utilizzati per confrontare gli approcci chirurgici4 e regimi medici5. Recentemente, abbiamo utilizzato un'analisi della propensione dei dati dal Repository dati del sistema sanitario militare degli Stati Uniti (MDR) per valutare l'effetto delle statine nella prevenzione primaria degli esiti cardiovascolari in base alla presenza e alla gravità del calcio coronario6.

L'MDR, utilizzato meno frequentemente dei set di dati Medicare e VA a scopo di ricerca, contiene informazioni complete sulle indicazioni amministrative e mediche dei servizi ospedalieri e ambulatoriali forniti per i beneficiari sanitari del Dipartimento della Difesa (DoD) in servizio attivo e i loro familiari a carico. Il database include servizi forniti in tutto il mondo presso strutture militari statunitensi o presso strutture civili fatturate al DoD. Il database include i dati completi della farmacia dal 1 ottobre 2001. I dati di laboratorio sono disponibili a partire dal 2009, ma sono limitati solo alle strutture di trattamento militare. All'interno della MDR, le coorti sono state definite con metodi come l'uso di codici diagnostici (ad esempio, diabete mellito7) o codici di procedura (ad esempio, chirurgia artroscopica8). In alternativa, una coorte definita esternamente di beneficiari idonei, ad esempio un registro, può essere abbinata all'MDR per ottenere dati di base e di follow-up9. A differenza di Medicare, l'MDR include pazienti di tutte le età. È anche meno di parte nei confronti dei maschi rispetto al database VA poiché include i dipendenti. L'accesso all'MDR è tuttavia limitato. In generale, solo gli investigatori che sono membri del sistema sanitario militare possono richiedere l'accesso, analogamente ai requisiti per l'uso del database VA. I ricercatori non governativi che chiedono l'accesso ai dati dei sistemi sanitari militari devono farlo attraverso un accordo di condivisione dei dati sotto la supervisione di uno sponsor governativo.

Quando si utilizza un set di dati amministrativi, è importante tenere a mente le limitazioni e i punti di forza della codifica amministrativa. La sensibilità e la specificità del codice possono variare in base alla diagnosi correlata, sia che si tratti di una diagnosi primaria o secondaria, o se si tratta di un file ospedaliero o ambulatoriale. I codici ospedalieri per l'infarto miocardico acuto sono generalmente riportati con precisione con valori predittivi positivi superiori al 90%10, ma l'uso del tabacco è spesso sottocodificato11. Tale sottocodifica può o non può avere un effetto significativo sui risultati di uno studio12. Inoltre, possono esistere diversi codici per una determinata condizione con diversi livelli di correlazione alla malattia nella domanda13. Un team investigativo deve eseguire una ricerca e una revisione completa della letteratura completa della classificazione internazionale della malattia, della nona revisione, della modifica clinica (ICD-9-CM) e/o dei manuali di codifica ICD-10-CM per garantire che i codici appropriati siano inclusi nello studio.

Diversi metodi possono essere impiegati per migliorare la sensibilità e l'accuratezza dei codici diagnostici per definire le condizioni comorbid. Occorre includere un periodo adeguato di "look-back" per stabilire le comorbilità di base. Il periodo di riflessione comprende i servizi ospedalieri e ambulatoriali forniti prima dell'ingresso nello studio. Un periodo di un anno può essere ottimale14. Inoltre, che richiedono due rivendicazioni separate invece di una singola affermazione può aumentare la specificità, mentre il completamento dei dati di codifica con dati farmaceutici può migliorare la sensibilità15. Selezionare i controlli grafici manuali su una parte dei dati può essere utilizzato per verificare l'accuratezza della strategia di codifica.

Una volta definite e valutate le comorbilità per la coorte in questione, può essere utilizzato un punteggio di propensione per bilanciare le differenze nelle covarie tra i gruppi di trattamento. Il punteggio di propensione deriva dalla probabilità che un paziente sia assegnato a un trattamento basato su covari noti. La contabilità di questo trattamento di propensione riduce l'effetto che i covariati hanno sull'assegnazione del trattamento e aiuta a generare una stima più fedele dell'effetto del trattamento sul risultato. Sebbene i punteggi di propensione non forniscano necessariamente risultati superiori ai modelli multivariati, consentono di valutare se i gruppi trattati e non trattati sono comparabili dopo aver applicato il punteggio di propensione3. I ricercatori di studio possono analizzare le differenze standardizzate assolute nei covariati prima e dopo la corrispondenza della propensione o della probabilità inversa di ponderazione del trattamento (IPTW) per garantire che i confondenti noti siano stati bilanciati tra i gruppi. È importante sottolineare che i confondenti sconosciuti potrebbero non essere bilanciati e si dovrebbe essere consapevoli del potenziale conforto residuo.

Se eseguiti correttamente, però, i punteggi di propensione sono un potente strumento in grado di prevedere e replicare i risultati di prove controllate randomizzate16. Delle tecniche di propensione-punteggio disponibili, corrispondenza e IPTW sono generalmente preferiti17. All'interno di IPTW, i pazienti sono ponderati in base alla loro propensione o probabilità di trattamento. I pesi stabilizzanti sono generalmente raccomandati rispetto ai pesi grezzi, mentre il taglio dei pesi può anche essere considerato18,19,20,21.

Una volta che i gruppi di studio sono equilibrati, possono essere seguiti fino all'esito di interesse. Gli studi che utilizzano dati amministrativi possono essere interessati a risultati quali tassi di riammissione e analisi del time-to-event. Negli studi interessati alla mortalità, il Military Health System Data Repository include un campo per lo status vitale che può essere ulteriormente aumentato utilizzando l'indice nazionale di mortalità (NDI)22,23. L'NDI è un database centralizzato di informazioni di record di morte dagli uffici statali gestito dal Center for Disease Control. Gli investigatori possono richiedere lo status vitale di base e/o la causa specifica del decesso in base al certificato di morte.

Il protocollo seguente descrive in dettaglio il processo di conduzione di uno studio amministrativo sul database utilizzando l'MDR aumentata con informazioni sulla mortalità da parte dell'NDI. Descrive in dettaglio l'uso di IPTW per bilanciare le differenze di base tra due gruppi di trattamento, tra cui il codice SAS e l'output di esempio.

Subscription Required. Please recommend JoVE to your librarian.

Protocol

Il seguente protocollo segue le linee guida dei nostri comitati istituzionali per l'etica umana.

1. Definizione della coorte

  1. Determinare e definire chiaramente i criteri di inclusione ed esclusione della coorte pianificata utilizzando 1) un registro o 2) punti dati che possono essere estratti dall'MDR, come i codici amministrativi per le diagnosi o le procedure (cioè tutti i pazienti con più di due diagnosi ambulatoriali o una diagnosi ambulatoriale di fibrillazione atriale).
    1. Se si utilizza un registro, includere due o più identificatori di pazienti per una corrispondenza accurata con l'archivio dati del sistema sanitario militare, ad esempio il numero di registrazione medica (elencato in set di dati diversi come patuniq e edipn), il nome completo, la data di nascita e/o il numero di previdenza sociale dello sponsor.
      NOTA: Come per tutti gli studi che utilizzano le informazioni sanitarie personali, sono necessarie misure di salvaguardia e devono essere rispettate. Durante il processo di raccolta devono essere impiegate una corretta crittografia e una corretta gestione dei dati e le informazioni devono essere de-identificate il prima possibile.
      NOTA: quando si fa riferimento al numero di previdenza sociale dello sponsor (sponssn), tutti i pazienti sono elencati in relazione al loro rapporto con il membro militare (o sponsor), incluso un identificatore per lo sponsor, il coniuge e i figli. Essere consapevoli del fatto che il codice di relazione e il numero di previdenza sociale dello sponsor possono cambiare nel tempo nel set di dati quando i pazienti diventano adulti e si sposano o divorziano. Pertanto, più identificatori di pazienti contribuiscono a garantire l'accuratezza.
    2. Se si definiscono le coorti tramite codifica amministrativa, eseguire una ricerca completa della letteratura per identificare gli studi precedenti che hanno potenzialmente convalidato i codici di interesse. Esaminare i manuali ICD-9-CM24 e/o ICD-10-CM25 per chiarire le definizioni dei codici e i codici adiacenti per assicurarsi che venga utilizzata la gamma appropriata di codici. Inoltre, esaminare le tabelle di riferimento incrociato incluse nei manuali per l'esame di codici aggiuntivi per l'inclusione/esclusione. Studi di convalida precedenti contengono rapporti di valore predittivo positivo, sensibilità e specificità per varie strategie di codifica amministrativa. Questi aiuti nell'ottimizzazione della selezione della coorte e nell'identificazione dei risultati.
  2. Determinare se esistono restrizioni (ad esempio, in base all'età) sulla coorte desiderata o su altri criteri di esclusione da includere nella richiesta di dati.
  3. Definire il periodo di studio in modo da includere il tempo precedente alla data dell'indice per la raccolta dei covari di base (generalmente 12 mesi nella ricerca sui dati amministrativi) e la data di fine dello studio.

2. Definizione di coviti e risultati

  1. Definire i codici amministrativi per confondere le condizioni attraverso le ricerche in letteratura e l'utilizzo dei manuali ICD-9-CM24 e/o ICD-10-CM25 come fatto nel passaggio 1.1.2 precedente.
  2. Determinare altri covariati necessari, tra cui dati demografici, farmaci e di laboratorio.
  3. Esaminare i campi dati disponibili nel dizionario dei dati MDR qui: https://health.mil/Military-Health-Topics/Technology/Support-Areas/MDR-M2-ICD-Functional-References-and-Specification-Documents.

3. Invio di una richiesta per l'MDR

  1. Ottenere l'approvazione dell'Institutional Review Board.
  2. Completare un'applicazione per l'accordo di condivisione dati che è disponibile qui: https://health.mil/Military-Health-Topics/Privacy-and-Civil-Liberties/Submit-a-Data-Sharing-Application?type=All#RefFeed. Come parte dell'applicazione, specificare i campi di dati e i file richiesti nel foglio di lavoro Estratti mDR (MDR) Military Health System Repository (MDR) (collegato dal modulo di domanda di applicazione). Specificare se il team richiede a un analista di dati i dati non elaborati o se accederà direttamente all'MDR. Specificare inoltre se la richiesta è per un pull di dati una tantera o se i pull regolari vengono richiesti giornalmente, mensilmente o annualmente.
    NOTA: Per ottenere i dati MDR con qualsiasi metodo, ci deve essere uno sponsor che è un dipendente governativo (militare in servizio attivo o GS), che di solito è un membro del team investigatore.
  3. Se si accede direttamente all'MDR, compilare il "Modulo di richiesta di autorizzazione MDR" e "MDR CS 2875 Form" che è disponibile qui: https://health.mil/Military-Health-Topics/Technology/Support-Areas/MDR-M2-ICD-Functional-References-and-Specification-Documents.

4. Accesso all'MDR ed estrazione dei dati pertinenti

  1. Se si accede direttamente all'MDR, seguire le istruzioni per accedere e utilizzare l'MDR, inclusi i requisiti software e i programmi SAS di esempio disponibili nella "Guida dell'utente MDR" e nella "Guida funzionale MDR" disponibili qui: https://health.mil/Military-Health-Topics/Technology/Support-Areas/MDR-M2-ICD-Functional-References-and-Specification-Documents.
    NOTA: I file vengono salvati in formato SAS e vi si accede tramite una shell unix generalmente utilizzando putty.exe così come un programma ftp. È richiesta la conoscenza della sAS.
  2. Per una panoramica utile della configurazione MDR, consultare la Guida DOD per i ricercatori DOD sull'utilizzo di MHS Data https://health.mil/Reference-Center/Publications/2012/10/10/Guide-for-DoD-Researchers-on-Using-MHS-Data.
  3. Come fatto nel passaggio 2.3, esaminare il dizionario dei dati MDR per informazioni dettagliate su tutti i file di dati disponibili https://health.mil/Military-Health-Topics/Technology/Support-Areas/MDR-M2-ICD-Functional-References-and-Specification-Documents.
    NOTA: non tutti i file di dati includono tutti gli identificatori dei pazienti per la corrispondenza/unione. Il dizionario dei dati consente di elencare gli identificatori disponibili per ogni file di dati. Il numero ID DOD, noto anche come "patuniq" o "edipn", è necessario per estrarre le informazioni della farmacia, per esempio. Avere tutti gli identificatori di pazienti appropriati nella fase di data mining è quindi importante per garantire la capacità di abbinare tutte le informazioni sui pazienti in più anni e più set di dati. È importante ribadire che inerente alla ricerca che coinvolge l'IFI, è necessaria una rigorosa aderenza alle procedure di salvaguardia dei dati dopo l'acquisizione dell'approvazione necessaria e l'IFP dovrebbe essere distrutto dopo che non è più necessario.
  4. Ottenere gli identificativi dei pazienti necessari per la coorte accedendo ai dati del beneficiario vm6 (set 2002-oggi) o al file pben (set 2000-sep 2002).
    1. Utilizzare la macro seguente o un programma simile per far corrispondere i dati vm6 al file di coorte. In questo caso, il codice può essere utilizzato come scritto per trovare i numeri di registrazione medica del paziente (MRN) per un determinato paziente sociale che è già in un file di coorte. Utilizzare nomi di variabili diversi nei file di estrazione dati e coorte vm6 per i nomi dei pazienti e le date di nascita per verificare la presenza di errori in un secondo momento. Per salvaguardare l'interfaccia DI accesso encefanome, archiviare i dati con gli identificatori dei pazienti nel nodo del servizio nello spazio fornito come parte della richiesta di dati (vedere il Manuale dell'utente MDR).
      NOTA: le RM sono denominate numero ID DOD, PATUNIQ o EDIPN nell'MDR.
      Equation 1
    2. Poiché le voci del database non sono mai completamente prive di errori, eseguire controlli degli errori dopo ogni passaggio principale oltre a controllare il registro del programma e l'output per eventuali problemi potenziali. Utilizzare il passaggio dati riportato di seguito per esaminare le potenziali mancate corrispondenze con il codice precedente (i file del paziente vengono confrontati in base al social del paziente/beneficiario). Quando si confrontano i nomi del file di coorte (cognome, nome) con il file vm6 (last_name, first_name), corrisponde solo alle prime tre lettere per ridurre i falsi errori che sorgono con le differenze di ortografia/spaziatura tra i file.
      Equation 2
    3. Esaminare il file di dati di errore ("checkname"). Ignorare gli errori causati dalla punteggiatura (O'Reilly vs. Controllare altri errori di preoccupazione con la revisione manuale della cartella clinica o considerare l'eliminazione delle informazioni rilevanti sul paziente/paziente se esistono errori significativi e se la verifica non è possibile.
  5. Estrarre i dati rimanenti necessari dall'MDR.
    1. Se necessario, ottenere razza e sesso dai file vm6ben (file pben prima di settembre 2002), unire con il file di coorte e verificare la presenza di errori come fatto sopra:
      Equation 3
    2. Ottenere i dati di morte dal file master della morte, unire con il file di coorte, e controllare gli errori come fatto sopra:
      Equation 4
    3. Ottenere file di dati aggiuntivi necessari per l'analisi (vedere il Manuale dell'utente funzionale MDR per la posizione dei dati e ulteriori utili macro e codice SAS).
      NOTA: I dati vengono memorizzati in file separati a seconda che siano stati forniti direttamente dal sistema sanitario militare o consegnati altrove e fatturati al sistema sanitario militare. I file di esempio sono illustrati di seguito.
      CAPER – assistenza diretta, fascicoli ambulatoriali dal fy 2004-oggi
      SADR – assistenza diretta, fascicoli ambulatoriali dal 1998 al 2005
      SIDR – assistenza diretta, ricovero ospedaliero ospedaliero (assistenza diretta) dal 1989 al momento
      TEDI – assistenza fatturata, file di reclamo istituzionali fy 2001-presente
      HCSRI – assistenza fatturata, sinistri istituzionali fy 1994-2005
      TEDNI – assistenza fatturata, sinistri non istituzionali fy 2001-oggi
      HCSRNI – assistenza fatturata, sinistri non istituzionali fy 1994-2005
      PDTS – file farmacia con prescrizioni individuali fy 2002-presente

5. Unire i dati e costruire file sommativi

  1. Se i dati sono ottenuti da un analista di dati o ottenuti direttamente dall'MDR come fatto nella sezione 4 sopra, i file di dati avranno bisogno di sommato e uniti insieme per formare il file di analisi. Durante tutto il processo, utilizzare metodi che migliorano l'accuratezza dei dati, inclusi i controlli degli errori e la revisione dei log e dell'output come descritto in precedenza.
    1. Quando si uniscono i dati, utilizzare almeno due identificatori di paziente quando possibile per garantire una corrispondenza forte (come il numero di registrazione medica e la data di nascita), poiché possono esistere errori in qualsiasi campo. Dopo l'unione dei dati, esaminare i dati per verificare i risultati previsti. Eseguire il codice per assicurarsi che le prime tre lettere del nome corrispondano oltre a un altro identificatore o due è utile per verificare le corrispondenze appropriate (vedere il passaggio 4.5.1).
      NOTA: Il cognome potrebbe non corrispondere se il paziente è stato sposato durante il periodo di tempo in questione. Possono esistere anche variazioni minori nei campi dei nomi a causa di apostrofi o spaziature e di battitura.
    2. Prestare particolare attenzione alle partite nelle fasi terminali del processo, ad esempio definire i pazienti che hanno avuto esiti.
  2. Estrarre le comorbilità della linea di base utilizzando i codici ICD-9-CM o ICD-10-CM dal periodo precedente la data dell'indice, la data in cui il paziente viene considerato come l'ingresso nello studio. In genere, utilizzare 12 mesi prima della data dell'indice per definire le comorbilità.
    1. Assicurarsi che i pazienti abbiano avuto l'idoneità per il sistema sanitario militare durante il periodo di riferimento (può essere verificato mensilmente nel file vm6ben).
    2. Cerca i codici di diagnosi di base nei fascicoli ambulatoriali e/o ospedalieri per stabilire le comorbilità di base durante il periodo di riferimento di 12 mesi prima della data dell'indice. Utilizzare i codici ICD-9-CM o ICD-10-CM stabiliti nella sezione 1. Se si utilizzano le comorbilità Elixhauser, utilizzare il software disponibile da HCUP, assicurandosi di modificare i nomi delle variabili di diagnosi e dei file in base alle esigenze. (https://www.hcup-us.ahrq.gov/toolssoftware/comorbidity/comorbidity.jsp#download)
  3. Cercare nei fascicoli ospedalieri e/o ospedalieri dopo la data dell'indice gli esiti di interesse definiti dai codici ICD-9-CM o ICD-10-CM, come il ricovero in ospedale per l'infarto miocardico come diagnosi primaria (ricerca di 410.x1 in SIDR).
  4. Impostare una data di fine dello studio per tutti i pazienti come un cutoff per il follow-up per i pazienti che non hanno dimostrato l'esito dell'interesse. Determinare quali pazienti devono essere censurati prima della fine dello studio.
    1. Cerca il file vm6ben per garantire l'ammissibilità all'assistenza sanitaria attraverso la data di fine dello studio.; in caso contrario, censurare il paziente al momento della perdita di ammissibilità.
    2. Se è importante limitare lo studio agli utenti attivi del sistema sanitario indipendentemente dall'ammissibilità, come gli utenti attivi della farmacia, determinare l'ultimo contatto sanitario (come l'ultimo riempimento dei farmaci) all'interno dei file di dati e censurare i pazienti a quella data.
      NOTA: Fare attenzione utilizzando incontri telefonici, in quanto possono essere presenti nella documentazione sanitaria dopo che si è verificato un decesso o se il beneficiario è uscito dal sistema sanitario in un altro modo.

6. Corrispondenza con l'indice nazionale di mortalità (NDI)

  1. Una volta identificata la coorte completa, inviare le informazioni all'indice nazionale di mortalità per la corrispondenza se la mortalità è un endpoint.
    1. In primo luogo, includere l'intenzione di abbinare l'NDI nelle richieste di dati MDR e l'approvazione IRB. Assicurarsi che l'approvazione e completare tutti i passaggi di crittografia dei dati completati prima di inviare informazioni sanitarie protette (PHI) all'NDI per la corrispondenza.
  2. Il "Modulo di domanda dell'Indice Nazionale della Morte (NDI)" e le indicazioni per richiedere i dati di morte dall'Indice Nazionale della Morte sono disponibili qui: https://www.cdc.gov/nchs/ndi/index.htm.
  3. Inviare i dati su un CD protetto da password per posta durante la notte all'NDI. I risultati saranno rispediti indietro circa 2 settimane più tardi nello stesso modo.
  4. Dopo aver ricevuto i risultati NDI, esaminare le corrispondenze parziali per la potenziale inclusione/esclusione.
    1. "Capitolo 4 - Valutazione dell'output NDI" fornisce un'utile panoramica della revisione dei risultati e può essere trovata sulla stessa pagina web: https://www.cdc.gov/nchs/ndi/index.htm. Le corrispondenze sul numero di previdenza sociale forniscono generalmente la corrispondenza più forte.
    2. Se necessario, controlla i decessi incrociati nell'Indice di morte della previdenza sociale e/o nei Veterans Affairs Beneficiary Identification Records Locator Subsystem (BIRLS) per migliorare la precisione. Tenere presente che i membri del servizio che muoiono all'estero probabilmente non verranno visualizzati in una ricerca NDI, ma sono spesso riconosciuti nel file di stato vitale MDR o nel VA BIRLS.
  5. Unire il file di morte con il file di coorte principale dopo aver completato la revisione.

7. De-identificazione dei dati

  1. Una volta acquisite tutte le informazioni necessarie, de-identificare i file di dati per proteggere PHI. Generare un identificatore casuale del paziente per ogni paziente utilizzando "ranuni" (vedere la Guida dell'utente funzionale MDR). Rimuovere il numero sociale del paziente, il numero di registrazione medica, la data di nascita (dopo l'età di calcolo), ecc., dai file di dati. Se necessario (e approvato), memorizzare una chiave che collega l'identificatore casuale del paziente all'IFI in modo sicuro sul nodo SCE.

8. Calcolo del punteggio di propensione18,19,26

  1. Utilizzare la regressione logistica per modellare la probabilità di trattamento (proc logistico in SAS).
    1. Specificare il file di dati ("dat" nell'esempio).
    2. Utilizzare l'istruzione class per specificare le variabili di categoria. Utilizzare "ref - primo" per specificare il valore più basso (ad esempio 0) come valore di riferimento.
    3. Nell'istruzione model, specificare la variabile di trattamento come variabile dipendente (Rx) e impostare il valore per l'"evento" come valore per il trattamento di ricezione (1 in questo caso).
    4. Includere eventuali predittori del trattamento come covariati nel modello, soprattutto se potrebbero essere predittori del risultato (come la morte). Valutare se le interazioni tra i termini possono influenzare il trattamento. Includerli nel modello utilizzando un carattere "" (ad esempio maschio ckd) o utilizzare la sintassi illustrata di seguito posizionando il carattere "" tra i covariati e il carattere "" alla fine per specificare tutte le 2 x 2 interazioni, a seconda del modello specifico.
    5. Utilizzare l'istruzione di output per specificare che la probabilità prevista di trattamento (prob) verrà definita da "ps" e l'output nel file "ps_data".
      Equation 5
      NOTA: Variabili nel modello: maschio: sesso maschile (binario), ckd: malattia renale cronica (binario), fegato: malattia epatica cronica (binario), diabete (binario), copd: broncopneumopatia cronica ostruttiva (binaria), chf: insufficienza cardiaca (binaria), cad: malattia coronarica (binario), cvd: malattia cerebrovascolare (binaria), pad: malattia arteriosa periferica (binaria), età (continua).
  2. Calcolare i pesi dalla probabilità prevista (punteggio di propensione). Se il paziente ha ricevuto il trattamento (Rx - 1), il peso del punteggio di propensione è 1/(punteggio di propensione). Se il paziente non ha ricevuto il trattamento, il peso del punteggio di propensione è 1/(1 - punteggio di propensione).
    Equation 6
  3. Stabilizzare il punteggio di propensione dividendolo per il peso medio. Nel codice seguente, Proc significa restituisce il peso medio nella variabile "mn_wt" nel file di dati "m". Il set di dati riportato di seguito che mantiene il mn_wt dal file di dati "m" calcola quindi i punteggi di propensione stabilizzati (st_ps_weight) per ogni osservazione.
    Equation 7
  4. Verificare il bilanciamento dopo aver applicato la probabilità inversa di ponderazione del trattamento.
    1. La macro stddiff semplifica il calcolo standardizzato significano differenze per i covariti prima e dopo la ponderazione in SAS. Il codice per la macro è disponibile qui: http://www.lerner.ccf.org/qhs/software/lib/stddiff.sas.
    2. Calcolare la differenza media standardizzata prima della ponderazione. Come con tutte le macro, il codice della macro deve essere eseguito in SAS prima di chiamarlo. Un'istruzione di chiamata di esempio è riportata di seguito con i covaridi di interesse.
      Equation 8
      Inds - set di dati di input, groupvar - variabile che definisce i gruppi di studio, charvars – variabili categoriche, numvars – variabili continue, stdfmt – formato di differenza standardizzata, outds – set di dati di output.
    3. Chiamare nuovamente la macro stddiff per calcolare la differenza media standardizzata dopo la ponderazione. "Wtvar" specifica la variabile contenente il punteggio di propensione standardizzato e viene aggiunto all'istruzione di chiamata di macro. Se le differenze standardizzate sono tutte minori o uguali a 0,1, il bilanciamento è considerato riuscito.
      Equation 9
  5. L'ASD prima e dopo la ponderazione può essere riportato in formato tabulare o grafico. Per istruzioni sull'utilizzo di una macro SAS per generare un grafico, vedere i Materiali supplementari.
  6. I dati regolati dall'IPTW possono ora essere utilizzati in un'analisi univariata dopo aver assicurato il bilanciamento dei confondenti misurati.

9. Creazione del modello di risultato e generazione di un grafico di funzione di incidenza cumulativa

  1. Ci sono alcuni modi in cui l'analisi del tempo-evento risultante può essere tracciata, tra cui l'utilizzo di proc lifetest per generare un grafico di sopravvivenza. Utilizzare l'istruzione di peso per indicare il peso della propensione standardizzata.
  2. Per generare un grafico cif utilizzando un peso di propensione, utilizzare proc phreg.
    1. In proc phreg, fare riferimento a un file covariato per specificare i valori covariati da utilizzare durante la generazione del grafico. In questo caso, il file covariato contiene solo la singola variabile Rx, che può essere 1 o 0.
      Equation 10
    2. Attiva ods grafica. Utilizzare istruzioni aggiuntive in base alle esigenze per specificare i file di output per il grafico o il tipo di file (jpeg e così via; vedere https://support.sas.com/documentation/cdl/en/statug/63962/HTML/default/viewer.htm#statug_odsgraph_sect014.htm).
      Equation 11
    3. Nella sintassi proc phreg, utilizzare l'istruzione weight per specificare la variabile di punteggio di propensietà standardizzata. Specificare i valori per le covariate di base utilizzando l'istruzione di base per poter tracciare la funzione di incidenza cumulativa. Specificare gli strati da utilizzare per il grafico utilizzando "rowid" (in questo caso RX 1 contro 0). Il numero tra parentesi che segue la variabile di risultato ("evento") specifica i valori della variabile che deve essere censurata che dovrebbe includere la data di censura e gli eventuali eventi concorrenti. In questo caso, 0 è censurato e 1 è un evento vero.
      Equation 12

Subscription Required. Please recommend JoVE to your librarian.

Representative Results

Al termine di IPTW, tabelle o grafici delle differenze standardizzate assolute possono essere generate utilizzando rispettivamente il codice macro stddiff o il codice macro asdplot. Nella figura 1 viene illustrato un esempio di bilanciamento appropriato in una coorte di grandi dimensioni composta da 10.000 partecipanti che utilizzano la macro asdplot. Dopo l'applicazione del punteggio di propensione, le differenze standardizzate assolute sono state ridotte in modo significativo. Il cutoff utilizzato per la differenza standardizzata assoluta è in qualche modo arbitrario, anche se 0,1 viene spesso utilizzato e denota una differenza trascurabile tra i due gruppi. In una piccola coorte, un corretto bilanciamento è più difficile da raggiungere. La figura 2 mostra i risultati non riusciti del tentativo di bilanciare i covari in una coorte di 100 partecipanti.

Una volta generato il punteggio di propensione standardizzato, il team di studio può procedere con l'analisi dei risultati. L'analisi di sopravvivenza è spesso impiegata a causa della necessità di censurare i partecipanti con informazioni di follow-up irregolari, e Figura 3 raffigura un esempio dell'uso di proc phreg con pesi punteggio di propensione standardizzati per generare una funzione di incidenza cumulativa (CIF) grafico. Il grafico CIF descrive il numero crescente di eventi nel tempo. In questo caso, il gruppo non trattato, o controllo, (No Rx) ha un numero maggiore di eventi ed è relativamente peggiore del gruppo trattato (Rx).

Figure 1
Figura 1: Esempio di bilanciamento riuscito. In una grande coorte (n - 10.000), IPTW ha raggiunto il bilanciamento dei covariati con tutte le differenze standardizzate assolute riducendo a meno di 0,1. Fare clic qui per visualizzare una versione più grande di questa figura.

Figure 2
Figura 2: Esempio di bilanciamento non riuscito. In una piccola coorte (n - 100), IPTW non è stato in grado di raggiungere il bilanciamento dei covariati con molte differenze standardizzate assolute rimanendo maggiori di 0,1. Fare clic qui per visualizzare una versione più grande di questa figura.

Figure 3
Figura 3: Esempio di grafico della funzione di incidenza cumulativa che confronta i gruppi di trattamento. Nel corso del tempo, l'incidenza cumulativa della mortalità aumenta in entrambi i gruppi, anche se è più alta nel gruppo non trattato (No Rx). Così, in questo esempio, il gruppo trattato ha migliorato la sopravvivenza. Fare clic qui per visualizzare una versione più grande di questa figura.

Materiali supplementari. Fare clic qui per visualizzare questo file (fare clic con il pulsante destro del mouse per scaricare).

Subscription Required. Please recommend JoVE to your librarian.

Discussion

Le analisi retrospettive che utilizzano set di dati amministrativi di grandi dimensioni forniscono un'alternativa efficiente ed economica quando le sperimentazioni controllate randomizzate non sono fattibili. Il set di dati appropriato dipenderà dalla popolazione e dalle variabili di interesse, ma l'MDR è un'opzione interessante che non prevede le restrizioni di età osservate con i dati Medicare. Con qualsiasi set di dati, è importante avere una profonda familiarità con il layout e il dizionario dei dati. È necessario prestare attenzione lungo la strada per garantire che i dati completi vengano acquisiti e che i dati vengano abbinati e uniti in modo accurato.

I codici per le diagnosi devono essere definiti utilizzando la letteratura esistente e una conoscenza approfondita del sistema di codifica ICD-9-CM e ICD-10-CM per massimizzare il valore delle diagnosi assegnate. I gruppi esistenti di codici di comorbilità, tra cui l'Elixhauser27 o l'indice di comorbilità Charlson raffinato28,29, possono essere utilizzati per definire condizioni comorbide che possono influenzare l'esito dell'interesse. Analogamente, gli algoritmi di codifica convalidati nei dati amministrativi e devono essere utilizzati. La convalida dovrebbe rimanere un'area di ricerca attiva, in quanto si continua a imparare l'uso ottimale degli algoritmi di codifica ICD-9-CM e ICD-10-CM per massimizzare la classificazione accurata di un'ampia gamma di malattie.

I punteggi di propensione possono essere utilizzati per affrontare la distorsione insita in qualsiasi analisi retrospettiva. La ponderazione o la corrispondenza effettiva del punteggio di propensione dovrebbe ridurre la differenza standardizzante assoluta (ASD) al di sotto della soglia desiderata, generalmente impostata su 0,1. Un adeguato bilanciamento aiuta a garantire la comparabilità dei gruppi di trattamento per quanto riguarda i confondenti noti e sono state utilizzate tecniche di punteggio di propensietà impiegate in modo appropriato per replicare con successo i risultati casualizzati dello studio. Una volta adeguatamente bilanciati, i gruppi di trattamento possono essere confrontati con univariate time-to-event o altre analisi.

Anche con un adeguato bilanciamento, c'è il potenziale per la confondere residua3, quindi il team investigativo dovrebbe limitare l'effetto di confondenti non misurati. Inoltre, se gli effetti dei covariati sulla selezione del trattamento sono forti, la distorsione può rimanere ancora30. Nelle piccole coorti, è improbabile che i punteggi di propensione riducano completamente l'ASD al di sotto di 0,1 per tutte le variabili e l'adeguamento alla regressione può essere impiegato per contribuire a rimuovere lo squilibrio residuo31. La regolazione della regressione può essere utilizzata anche nell'analisi dei sottogruppi quando il saldo appropriato non è più garantito.

Se eseguita correttamente, la ricerca con dati amministrativi fornisce risposte tempestive a importanti domande cliniche in assenza di studi clinici randomizzati. Mentre è impossibile rimuovere tutti i pregiudizi dagli studi osservazionali, i pregiudizi possono essere limitati utilizzando i punteggi di propensione e le analisi meticolose rimanenti.

Subscription Required. Please recommend JoVE to your librarian.

Disclosures

Gli autori non hanno nulla da rivelare.

Acknowledgments

La ricerca riportata in questa pubblicazione è stata supportata dal National Center for Advancing Translational Sciences dei National Institutes of Health sotto il Award Number UL1 TR002345. Il contenuto è di esclusiva responsabilità degli autori e non rappresenta necessariamente le opinioni ufficiali dei National Institutes of Health.

Disclaimer: Inoltre, le opinioni espresse in questo articolo sono quelle solo dell'autore e non devono essere interpretate per rappresentare in alcun modo quelle del governo degli Stati Uniti, del Dipartimento della Difesa degli Stati Uniti (DoD), o del Dipartimento degli Stati Uniti del Esercito. L'identificazione di prodotti specifici o strumentazione scientifica è considerata parte integrante dello sforzo scientifico e non costituisce l'approvazione o l'approvazione implicita da parte dell'autore, del Dad o di qualsiasi agenzia di componenti.

Materials

Name Company Catalog Number Comments
CD Burner (for NDI Request)
Computer
Putty.exe Putty.org
SAS 9.4 SAS Institute Cary, NC
WinSCP or other FTP software https://winscp.net/eng/index.php

DOWNLOAD MATERIALS LIST

References

  1. Concato, J., Shah, N., Horwitz, R. I. Randomized, controlled trials, observational studies, and the hierarchy of research designs. New England Journal of Medicine. 342 (25), 1887-1892 (2000).
  2. Austin, P. C., Platt, R. W. Survivor treatment bias, treatment selection bias, and propensity scores in observational research. Journal of Clinical Epidemiology. 63 (2), 136-138 (2010).
  3. Sturmer, T., Wyss, R., Glynn, R. J., Brookhart, M. A. Propensity scores for confounder adjustment when assessing the effects of medical interventions using nonexperimental study designs. Journal of Internal Medicine. 275 (6), 570-580 (2014).
  4. Schermerhorn, M. L., et al. Long-Term Outcomes of Abdominal Aortic Aneurysm in the Medicare Population. New England Journal of Medicine. 373 (4), 328-338 (2015).
  5. Williams, R. J. II, et al. A Propensity-Matched Analysis Between Standard Versus Tapered Oral Vancomycin Courses for the Management of Recurrent Clostridium difficile Infection. Open Forum Infectious Diseases. 4 (4), (2017).
  6. Mitchell, J. D., et al. Impact of Statins on Cardiovascular Outcomes Following Coronary Artery Calcium Scoring. Journal of the American College of Cardiology. 72 (25), 3233-3242 (2018).
  7. Rush, T., McGeary, M., Sicignano, N., Buryk, M. A. A plateau in new onset type 1 diabetes: Incidence of pediatric diabetes in the United States Military Health System. Pediatric Diabetes. 19 (5), 917-922 (2018).
  8. Rhon, D. I., Greenlee, T. A., Marchant, B. G., Sissel, C. D., Cook, C. E. Comorbidities in the first 2 years after arthroscopic hip surgery: substantial increases in mental health disorders, chronic pain, substance abuse and cardiometabolic conditions. British Journal of Sports Medicine. , (2018).
  9. Mitchell, J., Paisley, R., Moon, P., Novak, E., Villines, T. Coronary Artery Calcium Score and Long-term Risk of Death, Myocardial Infarction and Stroke: The Walter Reed Cohort Study. Journal of the American College of Cardiology: Cardiovascular Imaging. , (2017).
  10. McCormick, N., Lacaille, D., Bhole, V., Avina-Zubieta, J. A. Validity of myocardial infarction diagnoses in administrative databases: a systematic review. PLoS ONE. 9 (3), e92286 (2014).
  11. Huo, J., Yang, M., Tina Shih, Y. -C. Sensitivity of Claims-Based Algorithms to Ascertain Smoking Status More Than Doubled with Meaningful Use. Value in Health. , Available from: https://doi.org/10.1016/j.jval.2017.09.002 (2017).
  12. Nayan, M., et al. The value of complementing administrative data with abstracted information on smoking and obesity: A study in kidney cancer. Canadian Urological Association Journal. 11 (6), 167-171 (2017).
  13. Birman-Deych, E., et al. Accuracy of ICD-9-CM codes for identifying cardiovascular and stroke risk factors. Medical Care. 43 (5), 480-485 (2005).
  14. Preen, D. B., Holman, C. D., Spilsbury, K., Semmens, J. B., Brameld, K. J. Length of comorbidity lookback period affected regression model performance of administrative health data. Journal of Clinical Epidemiology. 59 (9), 940-946 (2006).
  15. Rector, T. S., et al. Specificity and sensitivity of claims-based algorithms for identifying members of Medicare+Choice health plans that have chronic medical conditions. Health Services Research. 39 (6 Pt 1), 1839-1857 (2004).
  16. Hernán, M. A., et al. Observational studies analyzed like randomized experiments: an application to postmenopausal hormone therapy and coronary heart disease. Epidemiology (Cambridge, Mass.). 19 (6), 766-779 (2008).
  17. Austin, P. C. The relative ability of different propensity score methods to balance measured covariates between treated and untreated subjects in observational studies. Medical Decision Making. 29 (6), 661-677 (2009).
  18. Robins, J. M., Hernan, M. A., Brumback, B. Marginal structural models and causal inference in epidemiology. Epidemiology. 11 (5), 550-560 (2000).
  19. Robins, J. Marginal structural models. 1997 Proceedings of the American Statistical Association, section on Bayesian statistical science. , 1-10 (1998).
  20. Thoemmes, F., Ong, A. D. A Primer on Inverse Probability of Treatment Weighting and Marginal Structural Models. Emerging Adulthood. 4 (1), 40-59 (2016).
  21. Xu, S., et al. Use of stabilized inverse propensity scores as weights to directly estimate relative risk and its confidence intervals. Value in Health: the Journal of the International Society for Pharmacoeconomics and Outcomes Research. 13 (2), 273-277 (2010).
  22. Cowper, D. C., Kubal, J. D., Maynard, C., Hynes, D. M. A primer and comparative review of major US mortality databases. Annals of Epidemiology. 12 (7), 462-468 (2002).
  23. Skopp, N. A., et al. Evaluation of a methodology to validate National Death Index retrieval results among a cohort of U.S. service members. Annals of epidemiology. 27 (6), 397-400 (2017).
  24. Buck, C. J. 2015 ICD-9-CM for Hospitals, Volumes 1, 2, & 3, Professional Edition. , Elsevier Saunders. (2015).
  25. Buck, C. J. 2018 ICD-10-CM for Hospitals, Professional Edition. , Elsevier Saunders. (2018).
  26. Guo, S., Fraser, W. M. Propensity Score Analysis: Statistical Methods and Applications, Second Edition. , Sage Publications. (2015).
  27. Elixhauser, A., Steiner, C., Harris, D. R., Coffey, R. M. Comorbidity measures for use with administrative data. Medical Care. 36 (1), 8-27 (1998).
  28. Charlson, M. E., Pompei, P., Ales, K. L., MacKenzie, C. R. A new method of classifying prognostic comorbidity in longitudinal studies: development and validation. Journal of Chronic Diseases. 40 (5), 373-383 (1987).
  29. Deyo, R. A., Cherkin, D. C., Ciol, M. A. Adapting a clinical comorbidity index for use with ICD-9-CM administrative databases. Journal of Clinical Epidemiology. 45 (6), 613-619 (1992).
  30. Austin, P. C., Stuart, E. A. The performance of inverse probability of treatment weighting and full matching on the propensity score in the presence of model misspecification when estimating the effect of treatment on survival outcomes. Statistical Methods in Medical Research. 26 (4), 1654-1670 (2017).
  31. Austin, P. C. Balance diagnostics for comparing the distribution of baseline covariates between treatment groups in propensity-score matched samples. Statistics in Medicine. 28 (25), 3083-3107 (2009).

Tags

Medicina Numero 155 probabilità inversa di ponderazione del trattamento punteggio di propensione indice di mortalità nazionale Repository dati del sistema sanitario militare bias selezione del trattamento confusione big data
Probabilità inversa di ponderazione del trattamento (Punteggio di propensione) utilizzando l'archivio dati del sistema sanitario militare e l'indice nazionale di morte
Play Video
PDF DOI DOWNLOAD MATERIALS LIST

Cite this Article

Mitchell, J. D., Gage, B. F.,More

Mitchell, J. D., Gage, B. F., Fergestrom, N., Novak, E., Villines, T. C. Inverse Probability of Treatment Weighting (Propensity Score) using the Military Health System Data Repository and National Death Index. J. Vis. Exp. (155), e59825, doi:10.3791/59825 (2020).

Less
Copy Citation Download Citation Reprints and Permissions
View Video

Get cutting-edge science videos from JoVE sent straight to your inbox every month.

Waiting X
Simple Hit Counter