Waiting
Login processing...

Trial ends in Request Full Access Tell Your Colleague About Jove
Click here for the English version

Medicine

Probabilidade inversa de ponderação do tratamento (Escore de propensão) utilizando o Repositório de Dados do Sistema De Saúde Militar e o Índice Nacional de Óbitos

Published: January 8, 2020 doi: 10.3791/59825

Summary

Quando os ensaios clínicos randomizados controlados não são viáveis, uma fonte abrangente de dados de cuidados de saúde, como o Repositório de Dados do Sistema De Saúde Militar, oferece uma alternativa atraente para análises retrospectivas. A incorporação de dados de mortalidade do índice nacional de óbitos e o equilíbrio das diferenças entre grupos que usam ponderação de propensão ajudam a reduzir os vieses inerentes aos projetos retrospectivos.

Abstract

Quando os ensaios clínicos randomizados controlados não são viáveis, estudos retrospectivos usando big data fornecem uma alternativa eficiente e econômica, embora estejam em risco de viés de seleção de tratamento. Viés de seleção de tratamento ocorre em um estudo não randomizado quando a seleção do tratamento é baseada em características pré-tratamento que também estão associadas ao desfecho. Essas características pré-tratamento, ou confundidores, podem influenciar a avaliação do efeito de um tratamento no resultado. Os escores de propensão minimizam esse viés equilibrando os conhecidos confundidores entre os grupos de tratamento. Existem algumas abordagens para a realização de análises de escore de propensão, incluindo estratificação pelo escore de propensão, correspondência de propensão e probabilidade inversa de ponderação do tratamento (IPTW). Descrito aqui é o uso do IPTW para equilibrar comorbidades básicas em uma coorte de pacientes dentro do Repositório de Dados do Sistema Militar de Saúde dos EUA (MDR). O MDR é uma fonte de dados relativamente ideal, pois fornece uma coorte contida na qual informações quase completas sobre serviços de internação e ambulatório estão disponíveis para beneficiários elegíveis. Descrito abaixo está o uso do MDR complementado com informações do índice nacional de óbitos para fornecer dados de mortalidade robustos. Também são fornecidas sugestões para o uso de dados administrativos. Finalmente, o protocolo compartilha um código SAS para o uso do IPTW para equilibrar os fundadores conhecidos e traçar a função de incidência cumulativa para o resultado do interesse.

Introduction

Ensaios randomizados controlados por placebo são o projeto de estudo mais forte para quantificar a eficácia do tratamento, mas nem sempre são viáveis devido a requisitos de custo e tempo ou falta de equipoise entre os grupos de tratamento1. Nesses casos, um projeto retrospectivo de coorte usando dados administrativos em larga escala ("big data") muitas vezes fornece uma alternativa eficiente e econômica, embora a falta de randomização introduz viés de seleção de tratamento2. Viés de seleção de tratamento ocorre em estudos não randomizados quando a decisão do tratamento depende de características pré-tratamento que estão associadas ao resultado de interesse. Essas características são conhecidas como fatores de confusão.

Como os escores de propensão minimizam esse viés equilibrando os conhecidos confundidores entre grupos de tratamento, eles se tornaram cada vez mais populares3. Os escores de propensão têm sido usados para comparar abordagens cirúrgicas4 e regimes médicos5. Recentemente, usamos uma análise de propensão de dados do Repositório de Dados do Sistema De Saúde Militar dos Estados Unidos (MDR) para avaliar o efeito das estatinas na prevenção primária de desfechos cardiovasculares com base na presença e gravidade do cálcio da artéria coronária6.

O MDR, utilizado com menos frequência do que os conjuntos de dados medicare e va para fins de pesquisa, contém informações abrangentes de reclamações administrativas e médicas de serviços de internação e ambulatoriais fornecidos para militares de serviço ativo, aposentados e outros beneficiários de saúde do Departamento de Defesa (DoD) e seus dependentes. O banco de dados inclui serviços prestados em todo o mundo em instalações de tratamento militar dos EUA ou em instalações civis faturadas ao DoD. O banco de dados inclui dados completos da farmácia desde 1º de outubro de 2001. Os dados laboratoriais estão disponíveis a partir de 2009, mas limitam-se apenas a instalações de tratamento militar. Dentro do MDR, as coortes foram definidas com métodos que incluem o uso de códigos de diagnóstico (por exemplo, diabetes mellitus7)ou códigos de procedimento (por exemplo, cirurgia artroscópica8). Alternativamente, uma coorte de beneficiários elegíveis definidos externamente, como um registro, pode ser combinada com o MDR para obter dados de linha de base e acompanhamento9. Ao contrário do Medicare, o MDR inclui pacientes de todas as idades. Também é menos tendencioso em relação aos homens do que o banco de dados va, uma vez que inclui dependentes. O acesso ao MDR é limitado, no entanto. Geralmente, apenas os investigadores que são membros do Sistema Militar de Saúde podem solicitar acesso, análogo aos requisitos para uso do banco de dados va. Pesquisadores não governamentais que buscam acesso aos dados dos Sistemas De Saúde Militar devem fazê-lo por meio de um acordo de compartilhamento de dados a supervisão de um patrocinador do governo.

Ao usar qualquer conjunto de dados administrativos, é importante ter em mente as limitações, bem como os pontos fortes da codificação administrativa. A sensibilidade e especificidade do código podem variar com base no diagnóstico relacionado, seja um diagnóstico primário ou secundário ou se é um arquivo de internação ou ambulatorial. Os códigos de internação para infarto agudo do miocárdio são geralmente relatados com precisão com valores preditivos positivos acima de 90%10,mas o uso de tabaco é muitas vezes subestimado11. Essa subcodificação pode ou não ter um efeito significativo sobre os resultados de um estudo12. Além disso, vários códigos para uma determinada condição podem existir com diferentes níveis de correlação com a doença na questão13. Uma equipe de investigação deve realizar uma pesquisa e revisão abrangente da literatura da Classificação Internacional de Doenças, Nona Revisão, Modificação Clínica (ICD-9-CM) e/ou manuais de codificação ICD-10-CM para garantir que os códigos apropriados sejam incluídos no estudo.

Vários métodos podem ser utilizados para melhorar a sensibilidade e precisão dos códigos de diagnóstico para definir as condições de comórbida. Um período apropriado de "olhar para trás" deve ser incluído para estabelecer comorbidades de base. O período de retorno inclui os serviços de internação e ambulatórios prestados antes da entrada do estudo. Um período de um ano pode ser ideal14. Além disso, exigir duas reivindicações separadas em vez de uma única reivindicação pode aumentar a especificidade, enquanto a suplementação de dados de codificação com dados farmacêuticos pode melhorar a sensibilidade15. Selecione auditorias de gráficos manuais em uma parte dos dados podem ser usados para verificar a precisão da estratégia de codificação.

Uma vez que as comorbidades tenham sido definidas e avaliadas para a coorte em questão, um escore de propensão pode ser usado para equilibrar diferenças nas covariates entre os grupos de tratamento. O escore de propensão é derivado da probabilidade de que um paciente seja atribuído a um tratamento baseado em covariadas conhecidas. A contabilização desse tratamento de propensão reduz o efeito que as covariates têm na atribuição do tratamento e ajuda a gerar uma estimativa mais verdadeira do efeito do tratamento no resultado. Embora os escores de propensão não forneçam necessariamente resultados superiores aos modelos multivariados, eles permitem a avaliação de se os grupos tratados e não tratados são comparáveis após a aplicação da pontuação de propensão3. Os investigadores do estudo podem analisar as diferenças padronizadas absolutas em covariates antes e depois da propensão correspondente ou probabilidade inversa de ponderação do tratamento (IPTW) para garantir que os fundadores conhecidos tenham sido equilibrados entre os grupos. Importante, os confundidores desconhecidos não podem ser equilibrados, e um deve estar ciente do potencial para a confusão residual.

Quando executado corretamente, porém, as pontuações de propensão são uma ferramenta poderosa que pode prever e replicar resultados de ensaios clínicos randomizados controlados16. Das técnicas disponíveis de pontuação de propensão, correspondência e IPTW são geralmentepreferidos 17. Dentro do IPTW, os pacientes são ponderados por sua propensão ou probabilidade de tratamento. Os pesos de estabilização são recomendados geralmente sobre pesos crus, quando o aparamento dos pesos puder igualmente ser considerado18,19,20,21.

Uma vez que os grupos de estudo são equilibrados, eles podem ser seguidos até o resultado de interesse. Estudos utilizando dados administrativos podem estar interessados em resultados como taxas de readmissão e análises de tempo para evento. Em estudos interessados em mortalidade, o Repositório de Dados do Sistema Militar de Saúde inclui um campo de status vital que pode ser aumentado ainda mais usando o índice nacional de óbitos (NDI)22,23. O NDI é um banco de dados centralizado de informações de registro de óbitos de escritórios estaduais que é gerenciado pelo Centro de Controle de Doenças. Os investigadores podem solicitar status vital básico e/ou causa específica de morte com base na certidão de óbito.

O protocolo a seguir detalha o processo de realização de um estudo administrativo de banco de dados usando o MDR aumentado com informações de mortalidade do NDI. Ele detalha o uso do IPTW para equilibrar as diferenças de base entre dois grupos de tratamento, incluindo código SAS e saída de exemplo.

Subscription Required. Please recommend JoVE to your librarian.

Protocol

O seguinte protocolo segue as diretrizes de nossos comitês institucionais de ética humana.

1. Definindo a coorte

  1. Determinar e definir claramente os critérios de inclusão e exclusão da coorte planejada usando 1) um registro ou 2) pontos de dados que podem ser extraídos do MDR, como códigos administrativos para diagnósticos ou procedimentos (ou seja, todos os pacientes com mais de dois diagnósticos ambulatoriais ou um diagnóstico hospitalar de fibrilação atrial).
    1. Se usar um registro, inclua dois ou mais identificadores de pacientes para correspondência precisa com o Repositório de Dados do Sistema De Saúde Militar, como número de registro médico (listado em diferentes conjuntos de dados como patuniq e edipn), nome completo, data de nascimento e/ou número de segurança social do patrocinador.
      NOTA: Tal como acontece com todos os estudos que utilizam informações pessoais de saúde, são necessárias salvaguardas e devem ser respeitadas. A criptografia adequada e o gerenciamento de dados devem ser empregados durante o processo de coleta, e as informações devem ser desidentificadas o mais rápido possível.
      NOTA: Ao referenciar o número de segurança social do patrocinador (sponssn), todos os pacientes são listados no que diz respeito à sua relação com o membro militar (ou patrocinador), incluindo um identificador para o patrocinador, cônjuge e filhos. Esteja ciente de que o código de relacionamento e o número de segurança social do patrocinador podem mudar ao longo do tempo no conjunto de dados quando os pacientes se tornam adultos e se casam ou se divorciam. Assim, vários identificadores de pacientes ajudam a garantir a precisão.
    2. Se definir as coortes por meio de codificação administrativa, realize uma pesquisa abrangente de literatura para identificar estudos anteriores que potencialmente validaram os códigos de interesse. Analise os manuais ICD-9-CM24 e/ou ICD-10-CM25 para esclarecer definições de código e códigos vizinhos para garantir que a gama adequada de códigos esteja sendo usada. Além disso, revise as tabelas de referência cruzada incluídas nos manuais para consideração de códigos adicionais para inclusão/exclusão. Estudos prévios de validação contêm relatos de valor preditivo positivo, sensibilidade e especificidade para várias estratégias administrativas de codificação. Estes auxílios na otimização da seleção de coorte, bem como a identificação de resultados.
  2. Determinar se existem restrições (por exemplo, com base na idade) na coorte desejada ou outros critérios de exclusão para incluir na solicitação de dados.
  3. Defina o período de estudo para incluir o tempo anterior à data do índice para coleta de covariates de base (geralmente 12 meses em pesquisa administrativa de dados), bem como a data de término do estudo.

2. Definição de covariates e resultados

  1. Defina códigos administrativos para condições de confusão por meio de pesquisas e uso de literatura dos manuais ICD-9-CM24 e/ou ICD-10-CM25, como feito na etapa 1.1.2 acima.
  2. Determine outras covariates necessárias, incluindo dados demográficos, medicamentos e laboratoriais.
  3. Analise os campos de dados disponíveis no MDR Data Dictionary aqui: https://health.mil/Military-Health-Topics/Technology/Support-Areas/MDR-M2-ICD-Functional-References-and-Specification-Documents.

3. Apresentar um pedido para o MDR

  1. Obter aprovação do Conselho de Revisão Institucional.
  2. Complete um aplicativo de acordo de compartilhamento de dados que pode ser encontrado aqui: https://health.mil/Military-Health-Topics/Privacy-and-Civil-Liberties/Submit-a-Data-Sharing-Application?type=All#RefFeed. Como parte do aplicativo, especifique os campos de dados e arquivos que estão sendo solicitados na planilha de Extrações do Repositório de Dados do Sistema De Saúde Militar da DRT (MDR) (vinculada a partir do formulário de inscrição). Especifique se a equipe está solicitando que um analista de dados forneça os dados brutos ou se a equipe acessará o MDR diretamente. Especificar ainda se a solicitação é para uma tração de dados única ou se os pulls regulares são solicitados diariamente, mensalmente ou anualmente.
    NOTA: Para obter dados de MDR por qualquer método, deve haver um patrocinador que seja um funcionário do governo (militar ativo ou GS), que geralmente é membro da equipe de investigadores.
  3. Se acessar o MDR diretamente, preencha o "Formulário de Solicitação de Autorização mdr" e o "Formulário MDR CS 2875" que podem ser encontrados aqui: https://health.mil/Military-Health-Topics/Technology/Support-Areas/MDR-M2-ICD-Functional-References-and-Specification-Documents.

4. Acesso ao MDR e extração de dados relevantes

  1. Se acessar o MDR diretamente, siga as instruções para acessar e usar o MDR, incluindo requisitos de software e exemplo de programas SAS que estão disponíveis no "Guia do Usuário MDR" e "Guia Funcional MDR" encontrado aqui: https://health.mil/Military-Health-Topics/Technology/Support-Areas/MDR-M2-ICD-Functional-References-and-Specification-Documents.
    NOTA: Os arquivos são salvos em formato SAS e acessados através de um shell unix geralmente usando putty.exe, bem como um programa ftp. O conhecimento do SAS é necessário.
  2. Para uma visão geral útil da configuração do MDR, reveja o Guia do DoD para Pesquisadores do DOD sobre o uso de dados mhs https://health.mil/Reference-Center/Publications/2012/10/10/Guide-for-DoD-Researchers-on-Using-MHS-Data.
  3. Como feito na etapa 2.3, revise o Dicionário de Dados MDR para obter informações detalhadas sobre todos os arquivos de dados disponíveis https://health.mil/Military-Health-Topics/Technology/Support-Areas/MDR-M2-ICD-Functional-References-and-Specification-Documents.
    NOTA: Nem todos os arquivos de dados incluem todos os identificadores do paciente para correspondência/fusão. O dicionário de dados ajuda a listar identificadores disponíveis para cada arquivo de dados. O número do DOD ID, também conhecido como "patuniq" ou "edipn", é necessário para extrair informações de farmácia, por exemplo. Ter todos os identificadores de pacientes apropriados na etapa de mineração de dados é, portanto, importante para garantir a capacidade de combinar todas as informações do paciente em vários anos e vários conjuntos de dados. É importante reiterar que inerente à pesquisa que envolve a PHI, é necessária a adesão rigorosa aos procedimentos de proteção de dados após a aquisição da aprovação necessária, e a PHI deve ser destruída depois que ela não for mais necessária.
  4. Obtenha identificadores de pacientes necessários para a coorte acessando os dados beneficiários do vm6 (vep 2002-presente) ou arquivo pben (de 2000 a 2002).
    1. Use a macro abaixo ou um programa semelhante para combinar dados vm6 com o arquivo de coorte. Neste caso, o código pode ser usado como escrito para encontrar números de registro médico do paciente (MRNs) para um paciente dado social que já está em um arquivo de coorte. Use nomes variáveis diferentes no sorteio de dados vm6 e arquivos de coorte para nomes de pacientes e datas de nascimento para ajudar a verificar se há erros mais tarde. Para proteger a PHI, guarde os dados com identificadores de pacientes no nó de serviço no espaço fornecido como parte da solicitação de dados (consulte o Guia do Usuário de MDR).
      NOTA: MRNs são referidos como o número de identificação DOD, PATUNIQ ou EDIPN no MDR).
      Equation 1
    2. Como as entradas do banco de dados nunca estão completamente livres de erros, realize verificações de erro após cada passo importante, além de verificar o registro e a saída do programa em busca de possíveis preocupações. Use a etapa de dados abaixo para revisar possíveis incompatibilidades com o código acima (os arquivos do paciente são combinados com base no paciente/beneficiário social). Ao comparar nomes do arquivo de coorte (sobrenome, primeiro nome) com o arquivo vm6 (last_name, first_name), apenas corresponda às três primeiras letras para reduzir erros falsos que surgem com diferenças na ortografia/espaçamento entre os arquivos.
      Equation 2
    3. Reveja o arquivo de dados de erro ("checkname"). Ignorar erros causados pela pontuação (O'Reilly vs OReilly). Verifique outros erros de preocupação com a revisão manual do registro de saúde ou considere descartar informações relevantes de pacientes/pacientes se houver erros significativos e se a verificação não for possível.
  5. Extraia os dados restantes necessários do MDR.
    1. Se necessário, obtenha raça e sexo a partir de arquivos vm6ben (arquivos pben antes de setembro de 2002), mesclar com o arquivo de coorte e verificar se há erros feitos acima:
      Equation 3
    2. Obter dados de óbito do arquivo mestre da morte, fundir-se com o arquivo de coorte e verificar se há erros feitos acima:
      Equation 4
    3. Obter arquivos de dados adicionais necessários para análise (consulte o Guia do Usuário Funcional do MDR para localização de dados e macros e código SAS úteis adicionais).
      NOTA: Os dados são armazenados em arquivos separados, dependendo se ele foi fornecido diretamente pelo sistema de saúde militar ou entregue em outro lugar e faturado para o sistema de saúde militar. Exemplo de arquivos são mostrados abaixo.
      CAPER - atendimento direto, arquivos ambulatoriais a partir do ano fiscal de 2004-presente
      SADR - atendimento direto, arquivos ambulatoriais de 1998 a 2005
      SIDR - atendimento direto, internações (atendimento direto) de 1989 a presente
      TEDI - cuidados faturados, arquivos de reivindicação institucional fy 2001-presente
      HCSRI - cuidados faturados, reivindicações institucionais fy 1994-2005
      TEDNI - cuidados faturados, reivindicações não-institucionais fy 2001-presente
      HCSRNI - cuidados faturados, reivindicações não-institucionais fy 1994-2005
      PDTS - arquivo de farmácia com prescrições individuais fy 2002-presente

5. Fusão de dados e construção de arquivos sumativos

  1. Se os dados são obtidos de um analista de dados ou obtidos diretamente do MDR como feito na seção 4 acima, os arquivos de dados precisarão de sumaacoplado e fundido sumalado para formar o arquivo de análise. Ao longo do processo, utilize métodos que melhorem a precisão dos dados, incluindo verificações de erro e revisão de logs e saída, como também discutido anteriormente.
    1. Ao fundir dados, use pelo menos dois identificadores do paciente quando possível para garantir uma correspondência forte (como número de registro médico e data de nascimento), uma vez que os erros podem existir em qualquer campo. Após a fusão dos dados, revise os dados para garantir os resultados esperados. Executar o código para garantir que as três primeiras letras do nome correspondam, além de outro identificador ou dois, é útil para verificar as correspondências adequadas (ver passo 4.5.1).
      NOTA: O sobrenome pode não corresponder se o paciente foi casado durante o período de tempo em questão. Pequenas variações também podem existir em campos de nome devido a apóstrofos ou espaçamento, bem como erros de digitação.
    2. Preste especial atenção às correspondências em etapas terminais no processo, como a definição de pacientes que tiveram resultados.
  2. Extraia comorbidades basal usando códigos ICD-9-CM ou ICD-10-CM a partir do período anterior à data do índice, a data em que o paciente é considerado como participante do estudo. Geralmente, use 12 meses antes da data do índice para definir comorbidades.
    1. Certifique-se de que os pacientes tinham elegibilidade para o sistema de saúde militar durante o período de base (pode ser verificado mensalmente no arquivo vm6ben).
    2. Pesquise códigos de diagnóstico de base em arquivos ambulatoriais e/ou internados para estabelecer comorbidades básicas durante o período de linha de base de 12 meses antes da data do índice. Use códigos ICD-9-CM ou ICD-10 CM estabelecidos na seção 1. Se estiver usando comorbidades elixhauser, use o software disponível do HCUP, certificando-se de modificar os nomes das variáveis de diagnóstico e arquivos conforme necessário. (https://www.hcup-us.ahrq.gov/toolssoftware/comorbidity/comorbidity.jsp#download)
  3. Pesquise arquivos de internação e/ou internação após a data do índice para resultados de interesse definidos por códigos ICD-9-CM ou ICD-10-CM, como hospitalização por infarto do miocárdio como diagnóstico primário (pesquisa de 410,x1 no SIDR).
  4. Definir uma data de término do estudo para todos os pacientes como um ponto de corte para o acompanhamento para pacientes que não demonstraram o resultado do interesse. Determine quais pacientes precisam ser censurados antes do final do estudo.
    1. Pesquisa vm6ben arquivo para garantir a elegibilidade para cuidados de saúde através da data de término do estudo.; caso contrário, censurar o paciente no momento da perda de elegibilidade.
    2. Se é importante limitar o estudo aos usuários ativos do sistema de saúde independenteda de elegibilidade, como usuários ativos da farmácia, então determine o último contato com os cuidados de saúde (como o último preenchimento de medicamentos) dentro dos arquivos de dados e censure os pacientes Essa data.
      NOTA: Tenha cuidado usando encontros telefônicos, pois eles podem estar presentes no registro de saúde após a morte ocorreu ou se o beneficiário saiu do sistema de saúde de outra maneira.

6. Jogo ao índice nacional da morte (NDI)

  1. Uma vez que a coorte completa é identificada, envie as informações para o índice nacional de óbitos para correspondência se a mortalidade for um ponto final.
    1. Em primeiro lugar, inclua a intenção de corresponder ao NDI nas solicitações de dados de MDR e aprovação do IRB. Garantir a aprovação e concluir todas as etapas de criptografia de dados concluídas antes de enviar informações de saúde protegidas (PHI) para o NDI para correspondência.
  2. O "National Death Index (NDI) Formulário de Aplicação" e instruções para solicitar dados de morte do Índice Nacional de Morte pode ser encontrado aqui: https://www.cdc.gov/nchs/ndi/index.htm.
  3. Envie os dados em um CD protegido por senha por correio noturno para o NDI. Os resultados serão enviados de volta aproximadamente 2 semanas depois da mesma maneira.
  4. Após receber os resultados do NDI, revise correspondências parciais para potencial inclusão/exclusão.
    1. "Capítulo 4 - Avaliação da Saída ndi" fornece uma visão geral útil da revisão dos resultados e pode ser encontrada na mesma página: https://www.cdc.gov/nchs/ndi/index.htm. Os jogos no número da segurança social fornecem geralmente o fósforo o mais forte.
    2. Quando necessário, verifique as mortes no Índice de Óbitoda da Seguridade Social e/ou no Subsistema localizador de registros de identificação beneficiários de assuntos de veteranos (BIRLS) para melhorar a precisão. Esteja ciente de que os membros do serviço que morrem no exterior provavelmente não vai aparecer em uma pesquisa NDI, mas muitas vezes são reconhecidos no arquivo de status mdr vital ou no VA BIRLS.
  5. Mesclar o arquivo de morte com o arquivo principal da coorte depois de completar a revisão.

7. Dados de desidentificação

  1. Uma vez adquiridas todas as informações necessárias, desime os arquivos de dados para ajudar a proteger a PHI. Gerar um identificador de pacientes aleatório para cada paciente usando "ranuni" (ver Guia do Usuário Funcional de RM). Remover o número do registro social, médico do paciente, data de nascimento (após a idade da computação), etc., dos arquivos de dados. Se necessário (e aprovado), armazenar uma chave que liga o identificador de pacientes aleatórios para o PHI com segurança no nó SCE.

8. Computando a pontuação de propensão18,19,26

  1. Use regressão logística para modelar a probabilidade de tratamento (proc logistic in SAS).
    1. Especifique o arquivo de dados ("dat" no exemplo).
    2. Use a indicação da classe para especificar variáveis categóricas. Use "ref = primeiro" para especificar o menor valor (como 0) como o valor de referência.
    3. Na declaração do modelo, especifique a variável de tratamento como a variável dependente (Rx) e defina o valor para o "evento" como valor para receber tratamento (1 neste caso).
    4. Inclua quaisquer possíveis preditores de receber tratamento como covariadas no modelo, especialmente se eles pudessem ser preditores do resultado (como a morte). Considere se as interações entre os termos podem afetar o tratamento. Inclua-os no modelo usando um "*" (como masculino*ckd) ou use a sintaxe mostrada abaixo colocando "|" entre covariáveis e "@2" no final para especificar todas as 2 x 2 interações, conforme apropriado para o modelo específico.
    5. Use a declaração de saída para especificar que a probabilidade prevista de tratamento (prob) será definida por "ps" e saída para o arquivo "ps_data".
      Equation 5
      NOTA: Variáveis no modelo: sexo masculino: sexo masculino (binário), ckd: doença renal crônica (binário), fígado: doença hepática crônica (binário), diabetes (binário), copd: doença pulmonar obstrutiva crônica (binário), chf: insuficiência cardíaca (binário), cad: doença arterial coronariana (binário), cvd: doença cerebrovascular (binário), almofada: doença arterial periférica (binário), idade (contínua).
  2. Calcule os pesos da probabilidade prevista (escore de propensão). Se o paciente recebeu tratamento (Rx = 1), então o peso do escore de propensão é de 1/(escore de propensão). Se o paciente não recebeu tratamento, então o peso do escore de propensão é de 1/(1 - escore de propensão).
    Equation 6
  3. Estabilizar a pontuação de propensão, dividindo-o pelo peso médio. No código abaixo, o Proc significa que saqueia o peso médio na variável "mn_wt" no arquivo de dados "m". O conjunto de dados abaixo que retém o mn_wt do arquivo de dados "m" em seguida, calcula as pontuações de propensão estabilizada (st_ps_weight) para cada observação.
    Equation 7
  4. Verifique o equilíbrio após a aplicação da probabilidade inversa de ponderação do tratamento.
    1. A macro stddiff simplifica a computação padronizada diferenças médias para covariates antes e depois da ponderação no SAS. O código para a macro pode ser encontrado aqui: http://www.lerner.ccf.org/qhs/software/lib/stddiff.sas.
    2. Calcule a diferença média padronizada antes da ponderação. Tal como acontece com todas as macros, o código macro deve ser executado no SAS antes de chamá-lo. Uma declaração de chamada de exemplo está abaixo com as covariates de interesse.
      Equation 8
      Inds - conjunto de dados de entrada, groupvar - variável que define os grupos de estudo, charvars - variáveis categóricas, numvars - variáveis contínuas, stdfmt - formato de diferença padronizada, outds - conjunto de dados de saída.
    3. Chame a macro stddiff novamente para calcular a diferença média padronizada após a ponderação. "Wtvar" especifica a variável contendo a pontuação de propensão padronizada e é adicionado à declaração de chamada macro. Se as diferenças padronizadas forem todas menores ou iguais a 0,1, o equilíbrio é considerado bem-sucedido.
      Equation 9
  5. O TEA antes e depois da ponderação pode ser relatado em formato tabular ou gráfico. Para direções para a utilização de uma macro SAS para gerar um enredo, consulte os Materiais Suplementares.
  6. Os dados ajustados ao IPTW agora podem ser usados em uma análise unvariada depois de garantir o equilíbrio dos confundidores medidos.

9. Criar o modelo de desfecho e gerar um lote de função de incidência cumulativa

  1. Existem algumas maneiras que a análise resultante do tempo para o evento pode ser traçada, incluindo o uso de proc lifetest para gerar uma trama de sobrevivência. Use a demonstração de peso para indicar o peso padronizado da propensão.
  2. Para gerar uma trama de cif usando um peso de propensão, use proc phreg.
    1. No proc phreg, faz referência a um arquivo covariado para especificar valores covariados a serem utilizados ao gerar o enredo. Neste caso, o arquivo covariado contém apenas o Rx variável única, que pode ser 1 ou 0.
      Equation 10
    2. Toggle ods gráficos em. Use declarações adicionais conforme necessário para especificar arquivos de saída para o gráfico ou tipo de arquivo (jpeg, etc.; veja https://support.sas.com/documentation/cdl/en/statug/63962/HTML/default/viewer.htm#statug_odsgraph_sect014.htm).
      Equation 11
    3. Na sintaxe proc phreg, use a declaração de peso para especificar a variável de pontuação de propensão padronizada. Especifique valores para covariates de base usando a declaração de base para poder traçar a função de incidência cumulativa. Especifique os estratos para usar para o enredo usando "rowid" (neste caso RX 1 vs. 0). O número de parênteses após a variável de saque ("evento") especifica o valor (s) da variável que deve ser censurada, que deve incluir a data de censura e quaisquer eventos concorrentes. Neste caso, 0 é censurado e 1 é um verdadeiro evento.
      Equation 12

Subscription Required. Please recommend JoVE to your librarian.

Representative Results

Após a conclusão do IPTW, tabelas ou parcelas das diferenças padronizadas absolutas podem ser geradas usando o código macro stddiff ou o código macro asdplot, respectivamente. A Figura 1 mostra um exemplo de equilíbrio adequado em uma grande coorte de 10.000 participantes usando a macro asdplot. Após a aplicação do escore de propensão, as diferenças padronizadas absolutas foram reduzidas significativamente. O ponto de corte usado para a diferença padronizada absoluta é um pouco arbitrário, embora 0,1 seja frequentemente usado e denote diferença insignificante entre os dois grupos. Em uma pequena coorte, o equilíbrio adequado é mais difícil de alcançar. A Figura 2 mostra os resultados mal sucedidos da tentativa de equilibrar covariáveis em uma coorte de 100 participantes.

Uma vez gerada a pontuação de propensão padronizada, a equipe do estudo pode prosseguir com a análise de resultados. A análise de sobrevivência é frequentemente empregada devido à necessidade de censurar os participantes com informações de acompanhamento irregulares, e a Figura 3 retrata um exemplo do uso de proc phreg com pesos padronizados de pontuação de propensão para gerar uma trama de função de incidência cumulativa (CIF). O enredo cif retrata o número crescente de eventos ao longo do tempo. Neste caso, o grupo não tratado, ou controle, (No Rx) tem um número maior de eventos e é comparativamente pior do que o grupo tratado (Rx).

Figure 1
Figura 1: Exemplo de equilíbrio bem-sucedido. Em uma grande coorte (n = 10.000), a IPTW alcançou o equilíbrio das covariates com todas as diferenças padronizadas absolutas reduzindo para menos de 0,1. Clique aqui para ver uma versão maior deste número.

Figure 2
Figura 2: Exemplo de equilíbrio mal sucedido. Em uma pequena coorte (n = 100), o IPTW foi incapaz de alcançar o equilíbrio das covariáveis, com muitas diferenças padronizadas absolutas permanecendo superiores a 0,1. Clique aqui para ver uma versão maior deste número.

Figure 3
Figura 3: Exemplo de trama de função de incidência cumulativa comparando grupos de tratamento. Ao longo do tempo, a incidência cumulativa de mortalidade aumenta em ambos os grupos, embora seja maior no grupo não tratado (No Rx). Assim, neste exemplo, o grupo tratado melhorou a sobrevivência. Clique aqui para ver uma versão maior deste número.

Materiais suplementares. Clique aqui para ver este arquivo (Clique certo para baixar).

Subscription Required. Please recommend JoVE to your librarian.

Discussion

Análises retrospectivas usando grandes conjuntos de dados administrativos fornecem uma alternativa eficiente e econômica quando ensaios clínicos randomizados controlados não são viáveis. O conjunto de dados apropriado dependerá da população e das variáveis de interesse, mas o MDR é uma opção atraente que não tem as restrições de idade vistas com dados do Medicare. Com qualquer conjunto de dados, é importante estar intimamente familiarizado com seu layout e dicionário de dados. Os cuidados devem ser tomados ao longo do caminho para garantir que os dados completos sejam capturados e os dados sejam combinados e fundidos com precisão.

Os códigos para diagnósticos devem ser definidos usando a literatura existente e uma compreensão completa do sistema de codificação ICD-9-CM e ICD-10-CM para maximizar o valor dos diagnósticos atribuídos. Os conjuntos existentes de códigos de comorbidade, incluindo o Elixhauser27 ou o refinado índice de comorbidade charlson28,29,podem ser usados para definir condições comórbidas que podem influenciar o resultado do interesse. Da mesma forma, algoritmos de codificação validados em dados administrativos e devem ser aproveitados. A validação deve continuar a ser uma área de pesquisa ativa, pois há aprendizado contínuo sobre o uso ideal de algoritmos de codificação ICD-9-CM e ICD-10-CM para maximizar a classificação precisa de uma ampla gama de doenças.

Os escores de propensão podem ser usados para abordar o viés inerente a qualquer análise retrospectiva. A ponderação ou correspondência de pontuação de propensão eficaz devem reduzir a diferença de padronização absoluta (TEA) abaixo do limite desejado, geralmente fixado em 0,1. O equilíbrio adequado ajuda a garantir a comparabilidade dos grupos de tratamento no que diz respeito aos confundidores conhecidos, e técnicas de pontuação de propensão devidamente empregadas têm sido usadas para replicar com sucesso os resultados de ensaios randomizados. Uma vez devidamente equilibrados, os grupos de tratamento podem ser comparados com o tempo univariada ou outra análise.

Mesmo com o equilíbrio adequado, há potencial para confusão residual 3 , de modoquea equipe de investigação deve limitar o efeito de confundidores não medidos. Além disso, se os efeitos das covariates na seleção de tratamento forem fortes, o viés ainda pode permanecerem 30. Em pequenas coortes, é improvável que os escores de propensão reduzam totalmente o TEA abaixo de 0,1 para todas as variáveis e o ajuste de regressão pode ser empregado para ajudar a remover o desequilíbrio residual31. O ajuste de regressão também pode ser usado na análise do subgrupo quando o equilíbrio adequado não está mais assegurado.

Quando feito corretamente, a pesquisa com dados administrativos fornece respostas oportunas a questões clínicas importantes na ausência de ensaios clínicos randomizados. Embora seja impossível remover todos os preconceitos dos estudos observacionais, o viés pode ser limitado usando escores de propensão e análises meticulosas remanescentes.

Subscription Required. Please recommend JoVE to your librarian.

Disclosures

Os autores não têm nada a divulgar.

Acknowledgments

A pesquisa relatada nesta publicação foi apoiada pelo Centro Nacional de Ciências Translacionais Avançadas dos Institutos Nacionais de Saúde o Prêmio Número UL1 TR002345. O conteúdo é de responsabilidade exclusiva dos autores e não representa necessariamente as opiniões oficiais dos Institutos Nacionais de Saúde.

Aviso: Além disso, as opiniões expressas neste artigo são as do autor apenas e não devem ser interpretadas para representar de forma alguma as do Governo dos Estados Unidos, do Departamento de Defesa dos Estados Unidos (DoD) ou do Departamento de Estados Unidos Exército. A identificação de produtos específicos ou instrumentação científica é considerada parte integrante do esforço científico e não constitui endosso ou endosso implícito por parte do autor, DoD, ou qualquer agência componente.

Materials

Name Company Catalog Number Comments
CD Burner (for NDI Request)
Computer
Putty.exe Putty.org
SAS 9.4 SAS Institute Cary, NC
WinSCP or other FTP software https://winscp.net/eng/index.php

DOWNLOAD MATERIALS LIST

References

  1. Concato, J., Shah, N., Horwitz, R. I. Randomized, controlled trials, observational studies, and the hierarchy of research designs. New England Journal of Medicine. 342 (25), 1887-1892 (2000).
  2. Austin, P. C., Platt, R. W. Survivor treatment bias, treatment selection bias, and propensity scores in observational research. Journal of Clinical Epidemiology. 63 (2), 136-138 (2010).
  3. Sturmer, T., Wyss, R., Glynn, R. J., Brookhart, M. A. Propensity scores for confounder adjustment when assessing the effects of medical interventions using nonexperimental study designs. Journal of Internal Medicine. 275 (6), 570-580 (2014).
  4. Schermerhorn, M. L., et al. Long-Term Outcomes of Abdominal Aortic Aneurysm in the Medicare Population. New England Journal of Medicine. 373 (4), 328-338 (2015).
  5. Williams, R. J. II, et al. A Propensity-Matched Analysis Between Standard Versus Tapered Oral Vancomycin Courses for the Management of Recurrent Clostridium difficile Infection. Open Forum Infectious Diseases. 4 (4), (2017).
  6. Mitchell, J. D., et al. Impact of Statins on Cardiovascular Outcomes Following Coronary Artery Calcium Scoring. Journal of the American College of Cardiology. 72 (25), 3233-3242 (2018).
  7. Rush, T., McGeary, M., Sicignano, N., Buryk, M. A. A plateau in new onset type 1 diabetes: Incidence of pediatric diabetes in the United States Military Health System. Pediatric Diabetes. 19 (5), 917-922 (2018).
  8. Rhon, D. I., Greenlee, T. A., Marchant, B. G., Sissel, C. D., Cook, C. E. Comorbidities in the first 2 years after arthroscopic hip surgery: substantial increases in mental health disorders, chronic pain, substance abuse and cardiometabolic conditions. British Journal of Sports Medicine. , (2018).
  9. Mitchell, J., Paisley, R., Moon, P., Novak, E., Villines, T. Coronary Artery Calcium Score and Long-term Risk of Death, Myocardial Infarction and Stroke: The Walter Reed Cohort Study. Journal of the American College of Cardiology: Cardiovascular Imaging. , (2017).
  10. McCormick, N., Lacaille, D., Bhole, V., Avina-Zubieta, J. A. Validity of myocardial infarction diagnoses in administrative databases: a systematic review. PLoS ONE. 9 (3), e92286 (2014).
  11. Huo, J., Yang, M., Tina Shih, Y. -C. Sensitivity of Claims-Based Algorithms to Ascertain Smoking Status More Than Doubled with Meaningful Use. Value in Health. , Available from: https://doi.org/10.1016/j.jval.2017.09.002 (2017).
  12. Nayan, M., et al. The value of complementing administrative data with abstracted information on smoking and obesity: A study in kidney cancer. Canadian Urological Association Journal. 11 (6), 167-171 (2017).
  13. Birman-Deych, E., et al. Accuracy of ICD-9-CM codes for identifying cardiovascular and stroke risk factors. Medical Care. 43 (5), 480-485 (2005).
  14. Preen, D. B., Holman, C. D., Spilsbury, K., Semmens, J. B., Brameld, K. J. Length of comorbidity lookback period affected regression model performance of administrative health data. Journal of Clinical Epidemiology. 59 (9), 940-946 (2006).
  15. Rector, T. S., et al. Specificity and sensitivity of claims-based algorithms for identifying members of Medicare+Choice health plans that have chronic medical conditions. Health Services Research. 39 (6 Pt 1), 1839-1857 (2004).
  16. Hernán, M. A., et al. Observational studies analyzed like randomized experiments: an application to postmenopausal hormone therapy and coronary heart disease. Epidemiology (Cambridge, Mass.). 19 (6), 766-779 (2008).
  17. Austin, P. C. The relative ability of different propensity score methods to balance measured covariates between treated and untreated subjects in observational studies. Medical Decision Making. 29 (6), 661-677 (2009).
  18. Robins, J. M., Hernan, M. A., Brumback, B. Marginal structural models and causal inference in epidemiology. Epidemiology. 11 (5), 550-560 (2000).
  19. Robins, J. Marginal structural models. 1997 Proceedings of the American Statistical Association, section on Bayesian statistical science. , 1-10 (1998).
  20. Thoemmes, F., Ong, A. D. A Primer on Inverse Probability of Treatment Weighting and Marginal Structural Models. Emerging Adulthood. 4 (1), 40-59 (2016).
  21. Xu, S., et al. Use of stabilized inverse propensity scores as weights to directly estimate relative risk and its confidence intervals. Value in Health: the Journal of the International Society for Pharmacoeconomics and Outcomes Research. 13 (2), 273-277 (2010).
  22. Cowper, D. C., Kubal, J. D., Maynard, C., Hynes, D. M. A primer and comparative review of major US mortality databases. Annals of Epidemiology. 12 (7), 462-468 (2002).
  23. Skopp, N. A., et al. Evaluation of a methodology to validate National Death Index retrieval results among a cohort of U.S. service members. Annals of epidemiology. 27 (6), 397-400 (2017).
  24. Buck, C. J. 2015 ICD-9-CM for Hospitals, Volumes 1, 2, & 3, Professional Edition. , Elsevier Saunders. (2015).
  25. Buck, C. J. 2018 ICD-10-CM for Hospitals, Professional Edition. , Elsevier Saunders. (2018).
  26. Guo, S., Fraser, W. M. Propensity Score Analysis: Statistical Methods and Applications, Second Edition. , Sage Publications. (2015).
  27. Elixhauser, A., Steiner, C., Harris, D. R., Coffey, R. M. Comorbidity measures for use with administrative data. Medical Care. 36 (1), 8-27 (1998).
  28. Charlson, M. E., Pompei, P., Ales, K. L., MacKenzie, C. R. A new method of classifying prognostic comorbidity in longitudinal studies: development and validation. Journal of Chronic Diseases. 40 (5), 373-383 (1987).
  29. Deyo, R. A., Cherkin, D. C., Ciol, M. A. Adapting a clinical comorbidity index for use with ICD-9-CM administrative databases. Journal of Clinical Epidemiology. 45 (6), 613-619 (1992).
  30. Austin, P. C., Stuart, E. A. The performance of inverse probability of treatment weighting and full matching on the propensity score in the presence of model misspecification when estimating the effect of treatment on survival outcomes. Statistical Methods in Medical Research. 26 (4), 1654-1670 (2017).
  31. Austin, P. C. Balance diagnostics for comparing the distribution of baseline covariates between treatment groups in propensity-score matched samples. Statistics in Medicine. 28 (25), 3083-3107 (2009).

Tags

Medicina Edição 155 probabilidade inversa de ponderação do tratamento escore de propensão índice nacional de óbitos Repositório de Dados do Sistema De Saúde Militar viés seleção de tratamento confusão big data
Probabilidade inversa de ponderação do tratamento (Escore de propensão) utilizando o Repositório de Dados do Sistema De Saúde Militar e o Índice Nacional de Óbitos
Play Video
PDF DOI DOWNLOAD MATERIALS LIST

Cite this Article

Mitchell, J. D., Gage, B. F.,More

Mitchell, J. D., Gage, B. F., Fergestrom, N., Novak, E., Villines, T. C. Inverse Probability of Treatment Weighting (Propensity Score) using the Military Health System Data Repository and National Death Index. J. Vis. Exp. (155), e59825, doi:10.3791/59825 (2020).

Less
Copy Citation Download Citation Reprints and Permissions
View Video

Get cutting-edge science videos from JoVE sent straight to your inbox every month.

Waiting X
Simple Hit Counter