Waiting
Login processing...

Trial ends in Request Full Access Tell Your Colleague About Jove
Click here for the English version

Medicine

Probabilidad Inversa de Ponderación del Tratamiento (Puntuación de Propensidad) usando el Repositorio de Datos del Sistema de Salud Militar y el Índice Nacional de Muerte

Published: January 8, 2020 doi: 10.3791/59825

Summary

Cuando los ensayos controlados aleatorios no son factibles, una fuente de datos integral de atención médica como el Repositorio de Datos del Sistema de Salud Militar proporciona una alternativa atractiva para los análisis retrospectivos. La incorporación de datos de mortalidad del índice nacional de mortalidad y el equilibrio entre los grupos que utilizan la ponderación de la propensión ayuda a reducir los sesgos inherentes a los diseños retrospectivos.

Abstract

Cuando los ensayos controlados aleatorios no son factibles, los estudios retrospectivos que utilizan big data proporcionan una alternativa eficiente y rentable, aunque están en riesgo de sesgo de selección de tratamiento. El sesgo de selección del tratamiento se produce en un estudio no aleatorio cuando la selección del tratamiento se basa en características previas al tratamiento que también están asociadas con el resultado. Estas características previas al tratamiento, o los fundadores, pueden influir en la evaluación del efecto de un tratamiento en el resultado. Las puntuaciones de propensión minimizan este sesgo equilibrando a los confundistas conocidos entre los grupos de tratamiento. Existen algunos enfoques para realizar análisis de puntuación de propensión, incluida la estratificación por la puntuación de propensión, la coincidencia de propensión y la probabilidad inversa de ponderación del tratamiento (IPTW). Aquí se describe el uso de IPTW para equilibrar las comorbilidades basales en una cohorte de pacientes dentro del Repositorio de Datos del Sistema de Salud Militar de los Estados Unidos (MDR). El MDR es una fuente de datos relativamente óptima, ya que proporciona una cohorte contenida en la que se dispone de información casi completa sobre los servicios de hospitalización y ambulatorios para los beneficiarios elegibles. A continuación se describe el uso del MDR complementado con información del índice nacional de mortalidad para proporcionar datos sólidos sobre mortalidad. También se proporcionan sugerencias para el uso de datos administrativos. Por último, el protocolo comparte un código SAS para utilizar IPTW para equilibrar a los fundadores conocidos y trazar la función de incidencia acumulativa para el resultado de interés.

Introduction

Los ensayos aleatorios controlados con placebo son el diseño de estudio más fuerte para cuantificar la eficacia del tratamiento, pero no siempre son factibles debido a los requisitos de costo y tiempo o la falta de equipoise entre los grupos de tratamiento1. En estos casos, un diseño de cohorte retrospectiva utilizando datos administrativos a gran escala ("big data") a menudo proporciona una alternativa eficiente y rentable, aunque la falta de aleatorización introduce el sesgo de selección de tratamiento2. El sesgo de selección del tratamiento se produce en estudios no aleatorios cuando la decisión del tratamiento depende de las características previas al tratamiento asociadas con el resultado de interés. Estas características se conocen como factores de confunción.

Debido a que las puntuaciones de propensión minimizan este sesgo equilibrando a los cofundadores conocidos entre los grupos de tratamiento, se han vuelto cada vez más populares3. Las puntuaciones de propensión se han utilizado para comparar los enfoques quirúrgicos4 y los regímenes médicos5. Recientemente, hemos utilizado un análisis de propensión de datos del Repositorio de Datos del Sistema de Salud Militar de los Estados Unidos (MDR) para evaluar el efecto de las estatinas en la prevención primaria de los resultados cardiovasculares basados en la presencia y gravedad del calcio de la arteria coronaria6.

El MDR, utilizado con menos frecuencia que los conjuntos de datos de Medicare y VA con fines de investigación, contiene información completa de reclamos administrativos y médicos de los servicios hospitalarios y ambulatorios proporcionados para militares en servicio activo, jubilados y otros beneficiarios de atención médica del Departamento de Defensa (DoD) y sus dependientes. La base de datos incluye servicios prestados en todo el mundo en instalaciones de tratamiento militar de Los Estados Unidos o en instalaciones civiles facturadas al DoD. La base de datos incluye datos completos de farmacia desde el 1 de octubre de 2001. Los datos de laboratorio están disponibles a partir de 2009, pero sólo se limitan a las instalaciones de tratamiento militar. Dentro del MDR, las cohortes se han definido con métodos que incluyen el uso de códigos de diagnóstico (por ejemplo, diabetes mellitus7) o códigos de procedimiento (por ejemplo, cirugía artroscópica8). Alternativamente, una cohorte de beneficiarios definidos externamente, como un registro, puede ser emparejado con el MDR para obtener datos de línea de base y seguimiento9. A diferencia de Medicare, el MDR incluye pacientes de todas las edades. También es menos sesgado hacia los hombres que la base de datos VA ya que incluye dependientes. Sin embargo, el acceso al MDR es limitado. Generalmente, sólo los investigadores que son miembros del Sistema de Salud Militar pueden solicitar acceso, análogo a los requisitos para el uso de la base de datos del VA. Los investigadores no gubernamentales que deseen acceder a los datos de los sistemas de salud militar deben hacerlo a través de un acuerdo de intercambio de datos bajo la supervisión de un patrocinador gubernamental.

Al utilizar cualquier conjunto de datos administrativos, es importante tener en cuenta las limitaciones, así como las fortalezas de la codificación administrativa. La sensibilidad y especificidad del código puede variar en función del diagnóstico relacionado, si se trata de un diagnóstico primario o secundario, o si se trata de un archivo de hospitalización o ambulatorio. Los códigos de hospitalización para el infarto agudo de miocardio generalmente se notifican con precisión con valores predictivos positivos superiores al 90%10,pero el consumo de tabaco a menudo está subcodificado11. Dicha subcodificación puede o no tener un efecto significativo en los resultados de un estudio12. Además, pueden existir varios códigos para una condición determinada con diferentes niveles de correlación con la enfermedad en la pregunta13. Un equipo de investigación debe realizar una búsqueda y revisión exhaustiva de la clasificación de la enfermedad, la novena revisión, la modificación clínica (ICD-9-CM) y/o los manuales de codificación ICD-10-CM para garantizar que los códigos apropiados se incluyan en el estudio.

Se pueden emplear varios métodos para mejorar la sensibilidad y precisión de los códigos de diagnóstico para definir condiciones comorbilidades. Debería incluirse un período adecuado de "revisión" para establecer comorbilidades basales. El período de búsqueda incluye los servicios de hospitalización y ambulatorio según los servicios para pacientes hospitalizados y ambulatorios proporcionados antes de la entrada al estudio. Un período de un año puede ser óptimo14. Además, requerir dos notificaciones separadas en lugar de una sola reclamación puede aumentar la especificidad, mientras que la suplementación de datos de codificación con datos farmacéuticos puede mejorar la sensibilidad15. Las auditorías de gráficos manuales seleccionados en una parte de los datos se pueden utilizar para verificar la precisión de la estrategia de codificación.

Una vez definidas y evaluadas las comorbilidades para la cohorte en cuestión, se puede utilizar una puntuación de propensión para equilibrar las diferencias en las covariables entre los grupos de tratamiento. La puntuación de propensión se deriva de la probabilidad de que un paciente sea asignado a un tratamiento basado en covariables conocidas. La contabilidad de este tratamiento de propensión reduce el efecto que las covariables tienen en la asignación del tratamiento y ayuda a generar una estimación más verdadera del efecto del tratamiento en el resultado. Si bien las puntuaciones de propensión no proporcionan necesariamente resultados superiores a los modelos multivariantes, sí permiten evaluar si los grupos tratados y no tratados son comparables después de aplicar la puntuación de propensión3. Los investigadores del estudio pueden analizar las diferencias estandarizadas absolutas en las covariables antes y después de la coincidencia de la propensión o la probabilidad inversa de ponderación del tratamiento (IPTW) para garantizar que los fundadores conocidos se hayan equilibrado entre grupos. Es importante destacar que los confundistas desconocidos pueden no estar equilibrados, y uno debe ser consciente del potencial de confunción residual.

Cuando se ejecuta correctamente, sin embargo, las puntuaciones de propensión son una poderosa herramienta que puede predecir y replicar los resultados de ensayos controlados aleatorios16. De las técnicas de puntuación de propensión disponibles, el emparejamiento y el IPTW son generalmente preferidos17. Dentro de IPTW, los pacientes se ponderan por su propensión o probabilidad de tratamiento. Los pesos estabilizadores se recomiendan generalmente sobre los pesos brutos, mientras que el recorte de los pesos también se puede considerar18,19,20,21.

Una vez equilibrados los grupos de estudio, se pueden seguir hasta el resultado de interés. Los estudios que utilizan datos administrativos pueden estar interesados en resultados tales como tasas de readmisión y análisis de tiempo a evento. En estudios interesados en la mortalidad, el Repositorio de Datos del Sistema De Salud Militar incluye un campo para el estatus vital que se puede aumentar aún más utilizando el índice nacional de mortalidad (NDI)22,23. El NDI es una base de datos centralizada de información de registros de defunción de las oficinas estatales que es administrada por el Centro para el Control de Enfermedades. Los investigadores pueden solicitar el estado vital básico y/o la causa específica de la muerte basado en el certificado de defunción.

El siguiente protocolo detalla el proceso de realizar un estudio administrativo de la base de datos utilizando el MDR aumentado con información de mortalidad del NDI. Detalla el uso de IPTW para equilibrar las diferencias de línea de base entre dos grupos de tratamiento, incluido el código SAS y la salida de ejemplo.

Subscription Required. Please recommend JoVE to your librarian.

Protocol

El siguiente protocolo sigue las directrices de nuestros comités institucionales de ética humana.

1. Definición de la cohorte

  1. Determinar y definir claramente los criterios de inclusión y exclusión de la cohorte planificada utilizando 1) un registro o 2) puntos de datos que se pueden extraer del MDR, como códigos administrativos para diagnósticos o procedimientos (es decir, todos los pacientes con más de dos diagnósticos ambulatorios o un diagnóstico hospitalario de fibrilación auricular).
    1. Si utiliza un registro, incluya dos o más identificadores de pacientes para una coincidencia precisa con el Repositorio de Datos del Sistema de Salud Militar, como el número de registro médico (listado en diferentes conjuntos de datos como patuniq y edipn), nombre completo, fecha de nacimiento y/o número de seguro social del patrocinador.
      NOTA: Al igual que con todos los estudios que utilizan información de salud personal, se requieren salvaguardias y deben cumplirse. El cifrado adecuado y la gestión de datos deben emplearse durante el proceso de recopilación, y la información debe ser desidentificada tan pronto como sea posible.
      NOTA: Al hacer referencia al número de seguro social del patrocinador (sponssn), todos los pacientes se enumeran con respecto a su relación con el miembro militar (o patrocinador), incluido un identificador para el patrocinador, cónyuge e hijos. Tenga en cuenta que el código de relación y el número de seguro social del patrocinador pueden cambiar con el tiempo en el conjunto de datos cuando los pacientes se convierten en adultos y se casan o se divorcian. Por lo tanto, varios identificadores de paciente sayudan a garantizar la precisión.
    2. Si define las cohortes a través de la codificación administrativa, realice una búsqueda exhaustiva de la literatura para identificar estudios previos que potencialmente han validado los códigos de interés. Revise los manuales ICD-9-CM24 y/o ICD-10-CM25 para aclarar las definiciones de código y los códigos vecinos para asegurarse de que se está utilizando el rango adecuado de códigos. Además, revise las tablas de referencias cruzadas incluidas en los manuales para el examen de códigos adicionales para la inclusión/exclusión. Los estudios de validación previa contienen informes de valor predictivo positivo, sensibilidad y especificidad para diversas estrategias de codificación administrativa. Estas ayudan en la optimización de la selección de cohortes, así como la identificación de resultados.
  2. Determine si hay restricciones (por ejemplo, en función de la edad) en la cohorte deseada u otros criterios de exclusión que se incluirán en la solicitud de datos.
  3. Definir el período de estudio para incluir el tiempo anterior a la fecha del índice para la recolección de covariables de referencia (generalmente 12 meses en la investigación de datos administrativos), así como la fecha de finalización del estudio.

2. Definición de covariables y resultados

  1. Definir códigos administrativos para las condiciones de confunción a través de búsquedas de literatura y el uso de los manuales ICD-9-CM24 y/o ICD-10-CM25 como se hace en el paso 1.1.2 anterior.
  2. Determine otras covariables necesarias, incluyendo datos demográficos, medicamentos y datos de laboratorio.
  3. Revise los campos de datos disponibles en el Diccionario de datos MDR aquí: https://health.mil/Military-Health-Topics/Technology/Support-Areas/MDR-M2-ICD-Functional-References-and-Specification-Documents.

3. Presentar una solicitud para el MDR

  1. Obtener la aprobación de la Junta de Revisión Institucional.
  2. Complete una aplicación de acuerdo de intercambio de datos que se puede encontrar aquí: https://health.mil/Military-Health-Topics/Privacy-and-Civil-Liberties/Submit-a-Data-Sharing-Application?type=All#RefFeed. Como parte de la aplicación, especifique los campos de datos y los archivos que se solicitan en la hoja de cálculo Extracciones del repositorio de datos del sistema de salud militar (MDR) DRT (vinculada desde el formulario de solicitud). Especifique si el equipo solicita a un analista de datos que proporcione los datos sin procesar o si el equipo accederá al MDR directamente. Especifique más si la solicitud es para una extracción de datos de una sola vez o si se solicitan extracciones regulares diariamente, mensualmente o anualmente.
    NOTA: Para obtener datos de MDR por cualquier método, debe haber un patrocinador que sea un empleado del gobierno (militar activo o GS), que suele ser miembro del equipo de investigadores.
  3. Si accede al MDR directamente, complete el "Formulario de Solicitud de Autorización MDR" y "Formulario MDR CS 2875" que se pueden encontrar aquí: https://health.mil/Military-Health-Topics/Technology/Support-Areas/MDR-M2-ICD-Functional-References-and-Specification-Documents.

4. Acceder al MDR y extraer datos relevantes

  1. Si accede directamente al MDR, siga las instrucciones para acceder y utilizar el MDR, incluidos los requisitos de software y los programas SAS de ejemplo que están disponibles en la "Guía del usuario de MDR" y la "Guía funcional de MDR" que se encuentran aquí: https://health.mil/Military-Health-Topics/Technology/Support-Areas/MDR-M2-ICD-Functional-References-and-Specification-Documents.
    NOTA: Los archivos se guardan en formato SAS y se accede a través de un shell unix generalmente utilizando putty.exe, así como un programa ftp. Se requiere conocimiento de SAS.
  2. Para obtener una visión general útil de la configuración de MDR, revise la Guía doD para investigadores del DOD sobre el uso de https://health.mil/Reference-Center/Publications/2012/10/10/Guide-for-DoD-Researchers-on-Using-MHS-Datade datos MHS.
  3. Como se hace en el paso 2.3, revise el Diccionario de datos MDR para obtener información detallada sobre todos los archivos de datos disponibles https://health.mil/Military-Health-Topics/Technology/Support-Areas/MDR-M2-ICD-Functional-References-and-Specification-Documents.
    NOTA: No todos los archivos de datos incluyen todos los identificadores de pacientes para la coincidencia / fusión. El diccionario de datos ayuda a enumerar los identificadores que están disponibles para cada archivo de datos. El número de IDENTIFICACIÓN del DOD, también conocido como "patuniq" o "edipn", es necesario para extraer información de farmacia, por ejemplo. Por lo tanto, es importante tener todos los identificadores de paciente adecuados en el paso de minería de datos para garantizar la capacidad de hacer coincidir toda la información del paciente a lo largo de varios años y varios conjuntos de datos. Es importante reiterar que inherente a la investigación que involucra la PHI, se requiere un estricto cumplimiento de los procedimientos de salvaguardia de datos después de adquirir la aprobación necesaria, y la PHI debe ser destruida después de que ya no sea necesaria.
  4. Obtener los identificadores de paciente necesarios para la cohorte accediendo a los datos del beneficiario vm6 (Sep 2002–presente) o al archivo pben (Sep 2000–Sep 2002).
    1. Utilice la macro siguiente o un programa similar para hacer coincidir los datos vm6 con el archivo de cohorte. En este caso, el código se puede utilizar como escrito para encontrar números de registro médico del paciente (MRN) para una determinada social del paciente que ya está en un archivo de cohorte. Utilice diferentes nombres de variables en los archivos de extensión y cohorte de datos vm6 para los nombres de pacientes y fechas de nacimiento para ayudar a comprobar si hay errores más adelante. Para proteger la PHI, almacene los datos con identificadores de paciente en el nodo de servicio en el espacio proporcionado como parte de la solicitud de datos (consulte la Guía del usuario de MDR).
      NOTA: Los MRN se conocen como el número de ID de DOD, PATUNIQ o EDIPN en el MDR).
      Equation 1
    2. Como las entradas de la base de datos nunca están completamente libres de errores, realice comprobaciones de errores después de cada paso importante, además de comprobar el registro del programa y la salida para cualquier inquietud potencial. Utilice el paso de datos que se indica a continuación para revisar posibles discrepancias con el código anterior (los archivos del paciente se comparan en función de la red social del paciente/beneficiario). Al comparar nombres del archivo de cohorte (apellido, nombre) con el archivo vm6 (last_name, first_name), solo haga coincidir en las tres primeras letras para reducir los errores falsos que surgen con las diferencias en la ortografía/espaciado entre archivos.
      Equation 2
    3. Revisar el archivo de datos de error ("nombredecomprobación"). Ignore los errores causados por la puntuación (O'Reilly vs. Compruebe otros errores de preocupación con la revisión manual del registro de salud o considere descartar la información relevante del paciente/paciente si existen errores significativos y si la verificación no es posible.
  5. Extraiga los datos necesarios restantes del MDR.
    1. Si es necesario, obtenga la raza y el sexo de los archivos vm6ben (archivos pben anteriores a septiembre de 2002), combine con el archivo de cohorte y compruebe si hay errores como se ha hecho anteriormente:
      Equation 3
    2. Obtenga datos de muerte del archivo maestro de muerte, combine con el archivo de cohorte y compruebe si hay errores como se ha hecho anteriormente:
      Equation 4
    3. Obtenga archivos de datos adicionales necesarios para el análisis (consulte la Guía del usuario funcional de MDR para la ubicación de datos y el código y macros SAS útiles adicionales).
      NOTA: Los datos se almacenan en archivos separados dependiendo de si fueron proporcionados directamente por el sistema de atención médica militar o entregados en otro lugar y facturados al sistema de atención médica militar. Los archivos de ejemplo se muestran a continuación.
      CAPER – atención directa, archivos ambulatorios de fy 2004–presente
      SADR – atención directa, archivos ambulatorios de 1998-2005
      SIDR – atención directa, hospitalizaciones hospitalarias (atención directa) a partir de 1989-presente
      TEDI – cuidado facturado, expedientes de reclamos institucionales fy 2001–presente
      HCSRI – cuidado facturado, reclamaciones institucionales fy 1994–2005
      TEDNI – cuidado facturado, reclamos no institucionales fy 2001–presente
      HCSRNI – cuidado facturado, reclamos no institucionales fy 1994–2005
      PDTS – archivo de farmacia con recetas individuales fy 2002–presente

5. Fusión de datos y construcción de archivos sumativos

  1. Si los datos se obtienen de un analista de datos u obtienen directamente del MDR como se hace en la sección 4 anterior, los archivos de datos necesitarán sumados y fusionados para formar el archivo de análisis. A lo largo del proceso, utilice métodos que mejoren la precisión de los datos, incluidas las comprobaciones de errores y la revisión de los registros y la salida, como también se ha explicado anteriormente.
    1. Al combinar datos, utilice al menos dos identificadores de paciente cuando sea posible para garantizar una coincidencia sólida (como el número de registro médico y la fecha de nacimiento), ya que pueden existir errores en cualquier campo. Después de la combinación de datos, revise los datos para asegurarse de que los resultados esperados. Ejecute el código para asegurarse de que las tres primeras letras del nombre coinciden además de otro identificador o dos es útil para comprobar las coincidencias adecuadas (consulte el paso 4.5.1).
      NOTA: El apellido puede no coincidir si el paciente estuvo casado durante el período de tiempo en cuestión. También pueden existir variaciones menores en los campos de nombre debido a apóstrofos o espaciado, así como errores tipográficos.
    2. Preste especial atención a los partidos en los pasos terminales del proceso, como la definición de pacientes que tuvieron resultados.
  2. Extraiga las comorbilidades basales utilizando códigos ICD-9-CM o ICD-10-CM del período anterior a la fecha del índice, la fecha en que se considera que el paciente entra en el estudio. Generalmente, utilice 12 meses antes de la fecha del índice para definir comorbilidades.
    1. Asegúrese de que los pacientes tuvieran elegibilidad para el sistema de salud militar durante el período de referencia (se puede verificar mensualmente en el archivo vm6ben).
    2. Buscar códigos de diagnóstico de línea base en archivos ambulatorios y/o hospitalizados para establecer comorbilidades basales durante el período basal de 12 meses antes de la fecha del índice. Utilice los códigos ICD-9-CM o ICD-10-CM establecidos en la sección 1. Si utiliza comorbilidades de Elixhauser, utilice el software disponible de HCUP, asegurándose de modificar los nombres de las variables de diagnóstico y los archivos según sea necesario. (https://www.hcup-us.ahrq.gov/toolssoftware/comorbidity/comorbidity.jsp#download)
  3. Buscar archivos hospitalizados y/o hospitalizados después de la fecha del índice para los resultados de interés definidos por los códigos ICD-9-CM o ICD-10-CM, como la hospitalización para el infarto de miocardio como diagnóstico primario (búsqueda de 410.x1 en SIDR).
  4. Establecer una fecha de finalización del estudio para todos los pacientes como un corte para el seguimiento de los pacientes que no han demostrado el resultado de interés. Determine qué pacientes deben ser censurados antes del final del estudio.
    1. Busque el archivo vm6ben para garantizar la elegibilidad para la atención médica hasta la fecha de finalización del estudio.; de lo contrario, censurar al paciente en el momento de la pérdida de elegibilidad.
    2. Si es importante limitar el estudio a los usuarios activos del sistema de salud independientemente de la elegibilidad, como los usuarios activos de la farmacia, entonces determine el último contacto de atención médica (como el último llenado de medicamentos) dentro de los archivos de datos y censore a los pacientes en esa fecha.
      NOTA: Tenga cuidado al usar encuentros telefónicos, ya que pueden estar presentes en el registro de salud después de que se haya producido una muerte o si el beneficiario ha salido del sistema de salud de otra manera.

6. Coincidir con el índice nacional de muerte (NDI)

  1. Una vez identificada la cohorte completa, envíe la información al índice nacional de mortalidad para que coincida si la mortalidad es una variable.
    1. En primer lugar, incluya la intención de hacer coincidir el NDI en las solicitudes de datos MDR y aprobación de IRB. Garantice la aprobación y complete todos los pasos de cifrado de datos completados antes de enviar información de salud protegida (PHI) al NDI para que coincida.
  2. El "Formulario de Solicitud del Índice Nacional de Muerte (NDI)" y las instrucciones para solicitar datos de muerte del Índice Nacional de Muerte se pueden encontrar aquí: https://www.cdc.gov/nchs/ndi/index.htm.
  3. Envíe los datos en un CD protegido por contraseña por correo nocturno al NDI. Los resultados se enviarán de vuelta aproximadamente 2 semanas más tarde de la misma manera.
  4. Después de recibir los resultados de NDI, revise las coincidencias parciales para detectar posibles coincidencias/exclusiones.
    1. "Capítulo 4 - Evaluación de la producción NDI" proporciona una visión general útil de la revisión de los resultados y se puede encontrar en la misma página web: https://www.cdc.gov/nchs/ndi/index.htm. Los partidos en el número de la seguridad social generalmente proporcionan la coincidencia más fuerte.
    2. Cuando sea necesario, coteje las muertes en el índice de muertedel del Seguro Social y/o en el subsistema de localización de registros de identificación de beneficiarios (BIRLS) para mejorar la precisión. Tenga en cuenta que los miembros del servicio que mueren en el extranjero probablemente no aparecerán en una búsqueda NDI, pero a menudo se reconocen en el archivo de estado vital MDR o en el VA BIRLS.
  5. Combine el archivo de función con el archivo de cohorte principal después de completar la revisión.

7. Datos de des-identificación

  1. Una vez que se adquiera toda la información necesaria, desidentifique los archivos de datos para ayudar a proteger la PHI. Generar un identificador aleatorio del paciente para cada paciente usando "ranuni" (consulte la Guía del usuario funcional de MDR). Retire el número de registro social, médico, fecha de nacimiento (después de la edad de cálculo), etc., de los archivos de datos. Si es necesario (y aprobado), almacene una clave que vincule el identificador aleatorio del paciente a la PHI de forma segura en el nodo SCE.

8. Calcular la puntuación de propensión18,19,26

  1. Utilice la regresión logística para modelar la probabilidad de tratamiento (proc logistic en SAS).
    1. Especifique el archivo de datos ("dat" en el ejemplo).
    2. Utilice la instrucción class para especificar variables categóricas. Utilice "ref á first" para especificar el valor más bajo (por ejemplo, 0) como valor de referencia.
    3. En la instrucción de modelo, especifique la variable de tratamiento como la variable dependiente (Rx) y establezca el valor del "evento" como el valor para recibir el tratamiento (1 en este caso).
    4. Incluya los posibles predictores de recibir tratamiento como covariables en el modelo, especialmente si podrían ser predictores del resultado (como la muerte). Considere si las interacciones entre términos pueden afectar el tratamiento. Incluirlos en el modelo mediante un "*" (como male*ckd) o utilizar la sintaxis que se muestra a continuación colocando "" entre las covariables y "2" al final para especificar todas las interacciones de 2 x 2, según corresponda para el modelo específico.
    5. Utilice la instrucción de salida para especificar que la probabilidad de tratamiento pronosticada (prob) se definirá por "ps" y se aplicará al archivo "ps_data."
      Equation 5
      NOTA: Variables en el modelo: masculino: sexo masculino (binario), ckd: enfermedad renal crónica (binaria), hígado: enfermedad hepática crónica (binaria), diabetes (binaria), copd: enfermedad pulmonar obstructiva crónica (binaria), chf: insuficiencia cardíaca (binaria), cad: enfermedad de las arterias coronarias (binario), cvd: enfermedad cerebrovascular (binaria), pad: enfermedad arterial periférica (binaria), edad (continua).
  2. Calcular pesos a partir de la probabilidad pronosticada (puntuación de propensión). Si el paciente recibió tratamiento (Rx 1), entonces el peso de la puntuación de propensión es 1/(puntuación de propensión). Si el paciente no recibió tratamiento, entonces la puntuación de propensión es 1/(1 - puntuación de propensión).
    Equation 6
  3. Estabilice la puntuación de propensión dividiéndola por el peso medio. En el código siguiente, Proc significa que el peso medio en la variable "mn_wt" en el archivo de datos "m." El conjunto de datos siguiente que conserva el mn_wt del archivo de datos "m" calcula las puntuaciones de propensión estabilizadas (st_ps_weight) para cada observación.
    Equation 7
  4. Verifique el equilibrio después de aplicar la probabilidad inversa de ponderación del tratamiento.
    1. La macro stddiff simplifica la computación de las diferencias medias estandarizadas para las covariables antes y después de la ponderación en SAS. El código de la macro se puede encontrar aquí: http://www.lerner.ccf.org/qhs/software/lib/stddiff.sas.
    2. Calcule la diferencia media estandarizada antes de la ponderación. Al igual que con todas las macros, el código de macro debe ejecutarse en SAS antes de llamarlo. A continuación se muestra una instrucción de llamada de ejemplo con las covariables de interés.
      Equation 8
      Inds - conjunto de datos de entrada, groupvar - variable que define los grupos de estudio, charvars – variables categóricas, numvars – variables continuas, stdfmt – formato de diferencia estandarizada, outds – conjunto de datos de salida.
    3. Llame a la macro stddiff de nuevo para calcular la diferencia media estandarizada después de la ponderación. "Wtvar" especifica la variable que contiene la puntuación de propensión estandarizada y se agrega a la instrucción de llamada de macro. Si las diferencias estandarizadas son todas menores o iguales a 0,1, el equilibrio se considera correcto.
      Equation 9
  5. El TEA antes y después de la ponderación se puede notificar en formato tabular o gráfico. Para obtener instrucciones para utilizar una macro SAS para generar una gráfica, consulte Materiales suplementarios.
  6. Los datos ajustados por IPTW ahora se pueden utilizar en un análisis univariado después de garantizar el equilibrio de los confundistas medidos.

9. Crear el modelo de resultados y generar una gráfica de la función de incidencia acumulativa

  1. Hay algunas maneras en que se puede trazar el análisis de tiempo de evento resultante, incluido el uso de la prueba de vida proc para generar una gráfica de supervivencia. Utilice la declaración de peso para indicar el peso de propensión estandarizado.
  2. Para generar una gráfica cif utilizando un peso de propensión, utilice proc phreg.
    1. En proc phreg, haga referencia a un archivo de covariable para especificar los valores de covariable que se utilizarán al generar el trazado. En este caso, el archivo de covariable solo contiene la variable única Rx, que puede ser 1 o 0.
      Equation 10
    2. Activa los gráficos de ods. Utilice instrucciones adicionales según sea necesario para especificar archivos de salida para el tipo de gráfico o archivo (jpeg, etc.; consulte https://support.sas.com/documentation/cdl/en/statug/63962/HTML/default/viewer.htm#statug_odsgraph_sect014.htm).
      Equation 11
    3. En la sintaxis proc phreg, utilice la instrucción weight para especificar la variable de puntuación de propensión estandarizada. Especifique valores para covariables de línea base utilizando la instrucción de línea base para poder trazar la función de incidencia acumulativa. Especifique los estratos que se utilizarán para el trazado utilizando "rowid" (en este caso RX 1 frente a 0). El número entre paréntesis que sigue a la variable de resultado ("evento") especifica los valores de la variable que se deben censurar, que deben incluir la fecha de censura y cualquier evento competidor. En este caso, 0 es censurado y 1 es un evento verdadero.
      Equation 12

Subscription Required. Please recommend JoVE to your librarian.

Representative Results

Al finalizar IPTW, se pueden generar tablas o gráficas de las diferencias estandarizadas absolutas utilizando el código de macro stddiff o el código de macro asdplot, respectivamente. La Figura 1 muestra un ejemplo de equilibrio adecuado en una gran cohorte de 10.000 participantes que utilizan la macro asdplot. Después de la aplicación de la puntuación de propensión, las diferencias estandarizadas absolutas se redujeron significativamente. El límite utilizado para la diferencia estandarizada absoluta es algo arbitrario, aunque a menudo se utiliza 0.1 y denota una diferencia insignificante entre los dos grupos. En una cohorte pequeña, el equilibrio adecuado es más difícil de lograr. La Figura 2 muestra los resultados fallidos de intentar equilibrar las covariables en una cohorte de 100 participantes.

Una vez que se genera la puntuación de propensión estandarizada, el equipo de estudio puede proceder con el análisis de resultados. El análisis de supervivencia se emplea a menudo debido a la necesidad de censurar a los participantes con información de seguimiento desigual, y la Figura 3 muestra un ejemplo del uso de proc phreg con pesos de puntuación de propensión estandarizados para generar una gráfica de función de incidencia acumulativa (CIF). La gráfica CIF representa el número creciente de eventos a lo largo del tiempo. En este caso, el grupo no tratado o control (Sin Rx) tiene un mayor número de eventos y es comparativamente peor que el grupo tratado (Rx).

Figure 1
Figura 1: Ejemplo de equilibrio correcto. En una cohorte grande (n a 10.000), IPTW logró el equilibrio de las covariables con todas las diferencias estandarizadas absolutas reduciendo a menos de 0,1. Haga clic aquí para ver una versión más grande de esta figura.

Figure 2
Figura 2: Ejemplo de equilibrio incorrecto. En una cohorte pequeña (n a 100), IPTW no pudo lograr el equilibrio de las covariables con muchas diferencias estandarizadas absolutas que siguen siendo mayores que 0,1. Haga clic aquí para ver una versión más grande de esta figura.

Figure 3
Figura 3: Ejemplo de gráfica de función de incidencia acumulativa que compara los grupos de tratamiento. Con el tiempo, la incidencia acumulada de mortalidad aumenta en ambos grupos, aunque es mayor en el grupo no tratado (No Rx). Por lo tanto, en este ejemplo, el grupo tratado ha mejorado la supervivencia. Haga clic aquí para ver una versión más grande de esta figura.

Materiales Suplementarios. Haga clic aquí para ver este archivo (haga clic con el botón derecho para descargar).

Subscription Required. Please recommend JoVE to your librarian.

Discussion

Los análisis retrospectivos que utilizan grandes conjuntos de datos administrativos proporcionan una alternativa eficiente y rentable cuando los ensayos controlados aleatorios no son factibles. El conjunto de datos adecuado dependerá de la población y las variables de interés, pero el MDR es una opción atractiva que no tiene las restricciones de edad vistas con los datos de Medicare. Con cualquier conjunto de datos, es importante estar íntimamente familiarizado con su diseño y diccionario de datos. Se debe tener cuidado para garantizar que se capturen los datos completos y que los datos coincidan y se combinen con precisión.

Los códigos para diagnósticos deben definirse utilizando la literatura existente y una comprensión exhaustiva del sistema de codificación ICD-9-CM e ICD-10-CM para maximizar el valor de los diagnósticos asignados. Los conjuntos existentes de códigos de comorbilidad, incluido el Elixhauser27 o el refinado índice de comorbilidad De Charlson28,29, se pueden utilizar para definir condiciones comorbilidades que pueden influir en el resultado de interés. Del mismo modo, los algoritmos de codificación validados en los datos administrativos y deben aprovecharse. La validación debe seguir siendo un área de investigación activa, ya que hay un aprendizaje continuo sobre el uso óptimo de los algoritmos de codificación ICD-9-CM e ICD-10-CM para maximizar la clasificación precisa de una amplia gama de enfermedades.

Las puntuaciones de propensión se pueden utilizar para abordar el sesgo inherente a cualquier análisis retrospectivo. La ponderación o la coincidencia efectivas de la puntuación de propensión deben reducir la diferencia de estandarización absoluta (TEA) por debajo del umbral deseado, generalmente establecida en 0,1. El equilibrio adecuado ayuda a garantizar la comparabilidad de los grupos de tratamiento con respecto a los confundistas conocidos, y se han utilizado técnicas de puntuación de propensión adecuadamente empleadas para replicar con éxito los resultados aleatorios del ensayo. Una vez debidamente equilibrados, los grupos de tratamiento se pueden comparar con univariado tiempo de evento u otro análisis.

Incluso con un equilibrio adecuado, existe la posibilidad de confundir los residuos3, por lo que el equipo de investigación debe limitar el efecto de los confundistas no medidos. Además, si los efectos de las covariables en la selección del tratamiento son fuertes, el sesgo todavía puede permanecer30. En las cohortes pequeñas, es poco probable que las puntuaciones de propensión reduzcan completamente el TEA por debajo de 0,1 para todas las variables y se pueda emplear un ajuste de regresión para ayudar a eliminar el desequilibrio residual31. El ajuste de regresión también se puede utilizar en el análisis de subgrupos cuando el saldo adecuado ya no está asegurado.

Cuando se hace correctamente, la investigación con datos administrativos proporciona respuestas oportunas a preguntas clínicas importantes en ausencia de ensayos clínicos aleatorios. Si bien es imposible eliminar todo sesgo de los estudios observacionales, el sesgo puede limitarse mediante el uso de puntuaciones de propensión y análisis meticulosos restantes.

Subscription Required. Please recommend JoVE to your librarian.

Disclosures

Los autores no tienen nada que revelar.

Acknowledgments

La investigación reportada en esta publicación fue apoyada por el Centro Nacional para el Avance de las Ciencias Traslacionales de los Institutos Nacionales de Salud bajo el Premio Número UL1 TR002345. El contenido es responsabilidad exclusiva de los autores y no representa necesariamente los puntos de vista oficiales de los Institutos Nacionales de Salud.

Descargo de responsabilidad: Además, las opiniones expresadas en este artículo son las del autor solamente y no deben interpretarse como representar de ninguna manera las del Gobierno de los Estados Unidos, el Departamento de Defensa de los Estados Unidos (DoD), o el Departamento de los Estados Unidos de la Ejército. La identificación de productos específicos o instrumentación científica se considera una parte integral del esfuerzo científico y no constituye un respaldo o respaldo implícito por parte del autor, Departamento de Identidad o cualquier agencia de componentes.

Materials

Name Company Catalog Number Comments
CD Burner (for NDI Request)
Computer
Putty.exe Putty.org
SAS 9.4 SAS Institute Cary, NC
WinSCP or other FTP software https://winscp.net/eng/index.php

DOWNLOAD MATERIALS LIST

References

  1. Concato, J., Shah, N., Horwitz, R. I. Randomized, controlled trials, observational studies, and the hierarchy of research designs. New England Journal of Medicine. 342 (25), 1887-1892 (2000).
  2. Austin, P. C., Platt, R. W. Survivor treatment bias, treatment selection bias, and propensity scores in observational research. Journal of Clinical Epidemiology. 63 (2), 136-138 (2010).
  3. Sturmer, T., Wyss, R., Glynn, R. J., Brookhart, M. A. Propensity scores for confounder adjustment when assessing the effects of medical interventions using nonexperimental study designs. Journal of Internal Medicine. 275 (6), 570-580 (2014).
  4. Schermerhorn, M. L., et al. Long-Term Outcomes of Abdominal Aortic Aneurysm in the Medicare Population. New England Journal of Medicine. 373 (4), 328-338 (2015).
  5. Williams, R. J. II, et al. A Propensity-Matched Analysis Between Standard Versus Tapered Oral Vancomycin Courses for the Management of Recurrent Clostridium difficile Infection. Open Forum Infectious Diseases. 4 (4), (2017).
  6. Mitchell, J. D., et al. Impact of Statins on Cardiovascular Outcomes Following Coronary Artery Calcium Scoring. Journal of the American College of Cardiology. 72 (25), 3233-3242 (2018).
  7. Rush, T., McGeary, M., Sicignano, N., Buryk, M. A. A plateau in new onset type 1 diabetes: Incidence of pediatric diabetes in the United States Military Health System. Pediatric Diabetes. 19 (5), 917-922 (2018).
  8. Rhon, D. I., Greenlee, T. A., Marchant, B. G., Sissel, C. D., Cook, C. E. Comorbidities in the first 2 years after arthroscopic hip surgery: substantial increases in mental health disorders, chronic pain, substance abuse and cardiometabolic conditions. British Journal of Sports Medicine. , (2018).
  9. Mitchell, J., Paisley, R., Moon, P., Novak, E., Villines, T. Coronary Artery Calcium Score and Long-term Risk of Death, Myocardial Infarction and Stroke: The Walter Reed Cohort Study. Journal of the American College of Cardiology: Cardiovascular Imaging. , (2017).
  10. McCormick, N., Lacaille, D., Bhole, V., Avina-Zubieta, J. A. Validity of myocardial infarction diagnoses in administrative databases: a systematic review. PLoS ONE. 9 (3), e92286 (2014).
  11. Huo, J., Yang, M., Tina Shih, Y. -C. Sensitivity of Claims-Based Algorithms to Ascertain Smoking Status More Than Doubled with Meaningful Use. Value in Health. , Available from: https://doi.org/10.1016/j.jval.2017.09.002 (2017).
  12. Nayan, M., et al. The value of complementing administrative data with abstracted information on smoking and obesity: A study in kidney cancer. Canadian Urological Association Journal. 11 (6), 167-171 (2017).
  13. Birman-Deych, E., et al. Accuracy of ICD-9-CM codes for identifying cardiovascular and stroke risk factors. Medical Care. 43 (5), 480-485 (2005).
  14. Preen, D. B., Holman, C. D., Spilsbury, K., Semmens, J. B., Brameld, K. J. Length of comorbidity lookback period affected regression model performance of administrative health data. Journal of Clinical Epidemiology. 59 (9), 940-946 (2006).
  15. Rector, T. S., et al. Specificity and sensitivity of claims-based algorithms for identifying members of Medicare+Choice health plans that have chronic medical conditions. Health Services Research. 39 (6 Pt 1), 1839-1857 (2004).
  16. Hernán, M. A., et al. Observational studies analyzed like randomized experiments: an application to postmenopausal hormone therapy and coronary heart disease. Epidemiology (Cambridge, Mass.). 19 (6), 766-779 (2008).
  17. Austin, P. C. The relative ability of different propensity score methods to balance measured covariates between treated and untreated subjects in observational studies. Medical Decision Making. 29 (6), 661-677 (2009).
  18. Robins, J. M., Hernan, M. A., Brumback, B. Marginal structural models and causal inference in epidemiology. Epidemiology. 11 (5), 550-560 (2000).
  19. Robins, J. Marginal structural models. 1997 Proceedings of the American Statistical Association, section on Bayesian statistical science. , 1-10 (1998).
  20. Thoemmes, F., Ong, A. D. A Primer on Inverse Probability of Treatment Weighting and Marginal Structural Models. Emerging Adulthood. 4 (1), 40-59 (2016).
  21. Xu, S., et al. Use of stabilized inverse propensity scores as weights to directly estimate relative risk and its confidence intervals. Value in Health: the Journal of the International Society for Pharmacoeconomics and Outcomes Research. 13 (2), 273-277 (2010).
  22. Cowper, D. C., Kubal, J. D., Maynard, C., Hynes, D. M. A primer and comparative review of major US mortality databases. Annals of Epidemiology. 12 (7), 462-468 (2002).
  23. Skopp, N. A., et al. Evaluation of a methodology to validate National Death Index retrieval results among a cohort of U.S. service members. Annals of epidemiology. 27 (6), 397-400 (2017).
  24. Buck, C. J. 2015 ICD-9-CM for Hospitals, Volumes 1, 2, & 3, Professional Edition. , Elsevier Saunders. (2015).
  25. Buck, C. J. 2018 ICD-10-CM for Hospitals, Professional Edition. , Elsevier Saunders. (2018).
  26. Guo, S., Fraser, W. M. Propensity Score Analysis: Statistical Methods and Applications, Second Edition. , Sage Publications. (2015).
  27. Elixhauser, A., Steiner, C., Harris, D. R., Coffey, R. M. Comorbidity measures for use with administrative data. Medical Care. 36 (1), 8-27 (1998).
  28. Charlson, M. E., Pompei, P., Ales, K. L., MacKenzie, C. R. A new method of classifying prognostic comorbidity in longitudinal studies: development and validation. Journal of Chronic Diseases. 40 (5), 373-383 (1987).
  29. Deyo, R. A., Cherkin, D. C., Ciol, M. A. Adapting a clinical comorbidity index for use with ICD-9-CM administrative databases. Journal of Clinical Epidemiology. 45 (6), 613-619 (1992).
  30. Austin, P. C., Stuart, E. A. The performance of inverse probability of treatment weighting and full matching on the propensity score in the presence of model misspecification when estimating the effect of treatment on survival outcomes. Statistical Methods in Medical Research. 26 (4), 1654-1670 (2017).
  31. Austin, P. C. Balance diagnostics for comparing the distribution of baseline covariates between treatment groups in propensity-score matched samples. Statistics in Medicine. 28 (25), 3083-3107 (2009).

Tags

Medicina Número 155 probabilidad inversa de ponderación del tratamiento puntuación de propensión índice nacional de muerte Repositorio de Datos del Sistema de Salud Militar sesgo selección de tratamiento confunción big data
Probabilidad Inversa de Ponderación del Tratamiento (Puntuación de Propensidad) usando el Repositorio de Datos del Sistema de Salud Militar y el Índice Nacional de Muerte
Play Video
PDF DOI DOWNLOAD MATERIALS LIST

Cite this Article

Mitchell, J. D., Gage, B. F.,More

Mitchell, J. D., Gage, B. F., Fergestrom, N., Novak, E., Villines, T. C. Inverse Probability of Treatment Weighting (Propensity Score) using the Military Health System Data Repository and National Death Index. J. Vis. Exp. (155), e59825, doi:10.3791/59825 (2020).

Less
Copy Citation Download Citation Reprints and Permissions
View Video

Get cutting-edge science videos from JoVE sent straight to your inbox every month.

Waiting X
Simple Hit Counter