Waiting
Login processing...

Trial ends in Request Full Access Tell Your Colleague About Jove
Click here for the English version

Medicine

Обратная вероятность взвешивания лечения (Оценка потенциалности) с использованием хранилища данных военной системы здравоохранения и Национального индекса смерти

Published: January 8, 2020 doi: 10.3791/59825

Summary

Когда рандомизированные контролируемые исследования неосуществимы, всеобъемлющий источник данных здравоохранения, такой как Хранилище данных Военной системы здравоохранения, является привлекательной альтернативой ретроспективному анализу. Включение данных о смертности из национального индекса смертности и балансирование различий между группами, использующими взвешивание склонности, помогает уменьшить предубеждения, присущие ретроспективным проектам.

Abstract

Когда рандомизированные контролируемые исследования неосуществимы, ретроспективные исследования с использованием больших данных обеспечивают эффективную и экономически эффективную альтернативу, хотя они подвержены риску смещения выбора лечения. Предубеждение при отборе лечения происходит в нерандомизированном исследовании, когда выбор лечения основан на предварительных характеристиках лечения, которые также связаны с результатом. Эти предварительные характеристики лечения, или confounders, может повлиять на оценку влияния лечения на результат. Оценка склонности сводит к минимуму эту предвзятость, уравновешивая известных confounders между группами лечения. Существует несколько подходов к проведению анализа оценки склонности, включая стративание по оценке склонности, сопоставление склонности и обратную вероятность взвешивания лечения (IPTW). Описано здесь использование IPTW, чтобы сбалансировать базовые сопутствующие условия в когорте пациентов в рамках военной системы здравоохранения США хранилище данных (MDR). МДР является относительно оптимальным источником данных, поскольку она обеспечивает содержащуюся в когорте группу, в которой для соответствующих бенефициаров предоставляется почти полная информация о стационарных и амбулаторных услугах. Ниже приведено использование МЛУ, дополненного информацией из национального индекса смертности для обеспечения надежных данных о смертности. Также представлены предложения по использованию административных данных. Наконец, протокол разделяет код SAS для использования IPTW для баланса известных confounders и сюжет кумулятивной функции заболеваемости для результата интереса.

Introduction

Рандомизированные, плацебо-контролируемые испытания являются сильнейшим дизайном исследования для количественной оценки эффективности лечения, но они не всегда осуществимы из-за требований к стоимости и времени или отсутствия экипировки между группами лечения1. В этих случаях ретроспективная когорта с использованием крупномасштабных административных данных ("большие данные") часто обеспечивает эффективную и экономически эффективную альтернативу, хотя отсутствие рандомизации вводит предубеждение в выборе лечения2. Предубеждение при отборе лечения происходит в нерандомизированных исследованиях, когда решение о лечении зависит от предварительных характеристик лечения, которые связаны с результатом интереса. Эти характеристики известны как смешанные факторы.

Потому что склонность оценки свести к минимуму эту предвзятость, балансируя известных confounders между группами лечения, они становятся все более популярными3. Оценка склонности была использована для сравнения хирургических подходов4 и медицинских режимов5. В последнее время мы использовали анализ склонности данных из военной системы здравоохранения США хранилище данных (MDR) для оценки влияния статинов в первичной профилактике сердечно-сосудистых исходов на основе наличия и тяжести коронарной артерии кальция6.

MDR, используется реже, чем Medicare и В. А. наборы данных для исследовательских целей, содержит всеобъемлющую информацию административных и медицинских претензий от стационарных и амбулаторных услуг, предоставляемых для активных военных, пенсионеров и других Министерства обороны (МО) медицинских бенефициаров и их иждивенцев. База данных включает услуги, предоставляемые по всему миру на американских военных очистных сооружениях или на гражданских объектах, выставленных министерством обороны. База данных включает полные аптечные данные с 1 октября 2001 года. Лабораторные данные имеются за 2009 год, но ограничиваются только военными очистных сооружениях. В рамках MDR, когорты были определены с методами, включая использование диагнозов коды (например, сахарный диабет7) или процедуры коды (например, артроскопической хирургии8). В качестве альтернативы, внешне определенная когорта подходящих бенефициаров, таких, как реестр, может быть сопоставлена с МДР для получения базовых и последующих данных9. В отличие от Medicare, MDR включает пациентов всех возрастов. Кроме того, она менее предвзята по отношению к мужчинам, чем база данных В. А., поскольку она включает в себя иждивенцев. Однако доступ к МДР ограничен. Как правило, только следователи, которые являются членами военной системы здравоохранения могут запросить доступ, аналогичные требованиям для использования базы данных В. А. Неправительственные исследователи, стремящиеся получить доступ к данным Военных систем здравоохранения, должны делать это на основе соглашения об обмене данными под наблюдением правительственного спонсора.

При использовании любого набора административных данных важно учитывать ограничения, а также сильные стороны административного кодирования. Чувствительность и специфика кода может варьироваться в зависимости от соответствующего диагноза, будь то первичный или вторичный диагноз, или это стационарный или амбулаторный файл. Стационарные коды для острого инфаркта миокарда, как правило, точно сообщили с положительными прогностическими значениями более 90%10, но употребление табака часто занижены11. Такое подкодирование может или не может иметь значимое влияние на результаты исследования12. Кроме того, несколько кодов для данного состояния может существовать с различными уровнями корреляции с болезнью, о котором идет речь13. Следственная группа должна выполнить всеобъемлющий поиск литературы и обзор Международной классификации болезней, девятый пересмотр, клиническое изменение (МКБ-9-СМ) и / или МКБ-10-СМ кодирования руководства для обеспечения того, чтобы соответствующие коды включены в исследование.

Для повышения чувствительности и точности диагностических кодов для определения сопутствующих состояний можно использовать несколько методов. Следует включить соответствующий период "оглядываться назад" для установления базовых сопутствующих мер. Период оглядывания времени включает в себя стационарные и амбулаторные услуги, предоставляемые до вступления в исследование. Период один год может быть оптимальным14. Кроме того, требование двух отдельных претензий вместо одной претензии может увеличить специфичность, в то время как дополнение данных кодирования с фармацевтическими данными может улучшить чувствительность15. Выбор ручных аудитов диаграмм на части данных может быть использован для проверки точности стратегии кодирования.

После того, как сопутствующие отношения были определены и оценены для когорты в вопросе, склонность оценка может быть использована для баланса различий в ковариаты между группами лечения. Оценка склонности вытекает из вероятности того, что пациент усен на лечение на основе известных ковариатов. Учет этой склонности лечения уменьшает влияние, что covariates на назначение лечения и помогает генерировать более правдивую оценку воздействия лечения на результат. Хотя оценки склонности не обязательно обеспечивают превосходные результаты для многовариантных моделей, они позволяют оценить, сопоставимы ли обработанные и необработанные группы после применения оценки склонности3. Исследование исследователи могут проанализировать абсолютные стандартизированные различия в ковариаты до и после склонности соответствия или обратной вероятности взвешивания лечения (IPTW), чтобы обеспечить известные confounders были сбалансированы между группами. Важно отметить, что неизвестные confounders не могут быть сбалансированы, и один должен быть осведомлен о потенциале для остаточного путаницы.

При выполнении должным образом, хотя, склонность оценки являются мощным инструментом, который может предсказать и воспроизвести результаты рандомизированных контролируемых испытаний16. Из имеющихся методов оценки склонности, соответствие и IPTW, как правило, предпочитают17. В рамках IPTW, пациенты взвешиваются по их склонности или вероятности для лечения. Стабилизирующий вес, как правило, рекомендуется на сырых весах, в то время как обрезка весов также может рассматриваться18,19,20,21.

Как только исследовательские группы будут сбалансированы, за ними могут последовать до тех пор, пока не будет результат интереса. Исследования, используя административные данные, могут быть заинтересованы в таких результатах, как показатели реадмиссии и анализ времени проведения мероприятий. В исследованиях, заинтересованных в смертности, военная система здравоохранения хранилище данных включает в себя поле для жизненно важного статуса, которые могут быть дополнительно расширены с помощью национального индекса смертности (NDI)22,23. NDI представляет собой централизованную базу данных о смерти записи информации из государственных учреждений, которая находится в ведении Центра по контролю заболеваний. Следователи могут запросить основной жизненный статус и/или конкретную причину смерти на основе свидетельства о смерти.

В следующем протоколе подробно описывается процесс проведения исследования административной базы данных с использованием МЛУ, дополненной информацией о смертности от НДИ. В нем подробно описывается использование IPTW для баланса базовых различий между двумя группами обработки, включая код SAS и вывод примеров.

Subscription Required. Please recommend JoVE to your librarian.

Protocol

Следующий протокол соответствует руководящим принципам наших институциональных комитетов по этике человека.

1. Определение когорты

  1. Определить и четко определить критерии включения и исключения запланированной когорты, используя либо 1) реестр или 2) точки данных, которые могут быть извлечены из МДР, таких как административные коды для диагностики или процедур (т.е. все пациенты с более чем двумя амбулаторные диагнозы или один стационарный диагноз мерцательной аритмии).
    1. При использовании реестра, включить два или более пациентов идентификаторы для точного сопоставления с военной системы здравоохранения данных репозитория, такие как медицинский номер записи (перечисленные в различных наборах данных, как patuniq и edipn), полное имя, дата рождения, и / или номер социального страхования спонсора.
      ПРИМЕЧАНИЕ: Как и во всех исследованиях с использованием личной медицинской информации, необходимы гарантии, которые должны соблюдаться. Надлежащее шифрование и управление данными должны использоваться в процессе сбора, а информация должна быть деидентифицирована как можно скорее.
      ПРИМЕЧАНИЕ: При упоминании номера социального страхования спонсора (sponssn), все пациенты перечислены в связи с их отношением к военнослужащему (или спонсору), включая идентификатор для спонсора, супруга и детей. Имейте в виду, что код отношений и номер социального страхования спонсора могут меняться с течением времени в наборе данных, когда пациенты становятся взрослыми и вступают в брак или разведены. Таким образом, несколько идентификаторов пациентов помогают обеспечить точность.
    2. При определении когорты с помощью административного кодирования выполняйте комплексный поиск по литературе для выявления предыдущих исследований, которые потенциально подтвердили интересующие кодексы. Обзор мКБ-9-CM24 и/или руководства МКБ-10-CM25 для уточнения определений кода и соседних кодов для обеспечения соответствующего диапазона кодов используется. Кроме того, просмотрите таблицы перекрестных ссылок, включенные в руководства, для рассмотрения дополнительных кодов для включения/исключения. Предыдущие исследования валидации содержат сообщения о положительной прогностической ценности, чувствительности и специфичности для различных стратегий административного кодирования. Эти помогают в оптимизации когортного отбора, а также идентификации результатов.
  2. Определите, существуют ли ограничения (например, на основе возраста) по желаемой когорте или другим критериям исключения для включения в запрос данных.
  3. Определите период исследования, чтобы включить время до даты индекса для сбора базовых ковариатов (как правило, 12 месяцев в исследованиях административных данных), а также дату окончания исследования.

2. Определение ковариатов и результатов

  1. Определить административные кодексы для смешения условий с помощью поиска литературы и использования мКБ-9-СМ24 и/или руководств МКБ-10-СМ25, как это делается в шаге 1.1.2 выше.
  2. Определите другие необходимые ковариаты, включая демографические данные, медикаменты и лабораторные данные.
  3. Просмотрите доступные поля данных в словаре данных MDR здесь: https://health.mil/Military-Health-Topics/Technology/Support-Areas/MDR-M2-ICD-Functional-References-and-Specification-Documents.

3. Отправка запроса на МДР

  1. Получить одобрение Совета по институциональному обзору.
  2. Заполните приложение соглашения об обмене данными, которое можно найти здесь: https://health.mil/Military-Health-Topics/Privacy-and-Civil-Liberties/Submit-a-Data-Sharing-Application?type=All#RefFeed. В рамках приложения укажите поля данных и файлы, запрашиваемые на листе хранилища данных DRT Military Health System (MDR) (связанный с формой заявки). Укажите, запрашивает ли группа аналитика данных необработанные данные или же группа получит прямой доступ к MDR. Далее укажите, предназначен ли запрос на одноразовую вытягивание данных или регулярные вытягивания запрашиваются ежедневно, ежемесячно или ежегодно.
    ПРИМЕЧАНИЕ: Для получения данных MDR любым методом, должен быть спонсор, который является государственным служащим (активная обязанность военных или GS), который, как правило, является членом следственной группы.
  3. Если доступ к MDR напрямую, заполните "MDR Авторизация Запрос Форма" и "MDR CS 2875 Форма", которые можно найти здесь: https://health.mil/Military-Health-Topics/Technology/Support-Areas/MDR-M2-ICD-Functional-References-and-Specification-Documents.

4. Доступ к МДР и извлечение соответствующих данных

  1. Если доступ к MDR напрямую, следуйте инструкциям для доступа и использования MDR, включая требования к программному обеспечению и пример SAS программ, которые доступны в "MDR пользователя Руководство" и "MDR Функциональное руководство" найти здесь: https://health.mil/Military-Health-Topics/Technology/Support-Areas/MDR-M2-ICD-Functional-References-and-Specification-Documents.
    ПРИМЕЧАНИЕ: Файлы сохраняются в формате SAS и доступны через оболочку unix обычно с помощью putty.exe, а также ftp программы. Необходимы знания SAS.
  2. Для получения полезного обзора установки MDR, обзор Министерства по делам исследователей Министерства по делам о использовании данных MHS https://health.mil/Reference-Center/Publications/2012/10/10/Guide-for-DoD-Researchers-on-Using-MHS-Data.
  3. Как и в шаге 2.3, просмотрите словарь данных MDR для получения подробной информации обо всех доступных файлах данных https://health.mil/Military-Health-Topics/Technology/Support-Areas/MDR-M2-ICD-Functional-References-and-Specification-Documents.
    ПРИМЕЧАНИЕ: Не все файлы данных включают все идентификаторы пациента для сопоставления/слияния. Словарь данных помогает список идентификаторов, которые доступны для каждого файла данных. Идентификационный номер DOD, также называемый "patuniq" или "edipn", необходим для извлечения информации о аптеке, например. Поэтому наличие всех соответствующих идентификаторов пациентов на этапе интеллектуального анализа данных важно для обеспечения способности сопоставлять всю информацию о пациентах в течение нескольких лет и нескольких наборов данных. Важно повторить, что присущие исследованиям, в которых участвует PHI, необходимо строгое соблюдение процедур защиты данных после получения необходимого разрешения, и PHI должен быть уничтожен после того, как он больше не нужен.
  4. Получить необходимые идентификаторы для когорты, получив доступ к данным бенефициара vm6 (сентябрь 2002-настоящее время) или pben файл (сентябрь 2000-сентябрь 2002).
    1. Используйте макрос ниже или аналогичную программу, чтобы сопоставить данные vm6 с когортным файлом. В этом случае код может быть использован как написанный для поиска медицинских номеров пациентов (MRNs) для данного пациента социального, который уже находится в когортном файле. Используйте различные имена переменных в розыгрыше данных vm6 и когортных файлах для имен пациентов и дат рождения, чтобы помочь проверить ошибки позже. Чтобы защитить PHI, храните данные с идентификаторами пациента на узло обслуживания в пространстве, предоставленном в рамках запроса данных (см. Руководство пользователя MDR).
      ПРИМЕЧАНИЕ: MRNs называются идентификационным номером Минобороны, ПАТУНИК или EDIPN в МДР).
      Equation 1
    2. Поскольку записи баз данных никогда не бывают полностью свободными от ошибок, выполняйте проверку ошибок после каждого важного шага в дополнение к проверке журнала программы и вывода на наличие любых потенциальных проблем. Используйте шаг данных ниже, чтобы просмотреть потенциальные несоответствия с приведенным выше кодом (файлы пациента сопоставляются на основе социального обеспечения пациента/бенефициара). При сравнении имен из когортного файла (фамилия, имя) с файлом vm6 (last_name, first_name), сопоставить только первые три буквы, чтобы уменьшить ложные ошибки, возникающие с различиями в правописании/интервалах между файлами.
      Equation 2
    3. Просмотр файла данных об ошибках ("чековое имя"). Игнорировать ошибки, вызванные пунктуацией (O'Reilly против OReilly). Проверьте другие ошибки, вызывающие озабоченность при ручном обзоре медицинской записи, или рассмотрите возможность отказа от соответствующей информации о пациенте/пациенте, если существуют существенные ошибки и если проверка невозможна.
  5. Извлеките оставшиеся необходимые данные из МДР.
    1. При необходимости получите расу и пол из файлов vm6ben (pben-файлы до сентября 2002 года), сливите с когортным файлом и проверьте наличие ошибок, как это было сделано выше:
      Equation 3
    2. Получить данные о смерти из файла смерти мастер, объединиться с когортным файлом, и проверить на наличие ошибок, как сделано выше:
      Equation 4
    3. Получите дополнительные файлы данных, необходимые для анализа (см. Руководство MDR Functional User для определения местоположения данных и дополнительные полезные макросы и код SAS).
      ПРИМЕЧАНИЕ: Данные хранятся в отдельных файлах в зависимости от того, были ли они непосредственно предоставлены военной системой здравоохранения или доставлены в другое место и выставлены счета в военную систему здравоохранения. Примеры файлов приведены ниже.
      CAPER - прямое лечение, амбулаторные файлы от FY 2004-настоящее время
      SADR - прямое лечение, амбулаторные файлы с 1998 по 2005 год
      SIDR - прямое лечение, стационарная госпитализация (прямая помощь) с 1989 года по настоящее время
      TEDI - выставлен счет помощи, институциональные файлы претензии FY 2001-настоящее время
      HCSRI - выставлен счет помощи, институциональных претензий FY 1994-2005
      TEDNI - выставлен счет помощи, неинституциональные претензии FY 2001-настоящее время
      HCSRNI - выставлен счет помощи, неинституциональные претензии FY 1994-2005
      PDTS - аптечный файл с индивидуальными рецептами fy 2002-present

5. Слияние данных и построение суммарных файлов

  1. Независимо от того, получены ли данные от аналитика данных или получены непосредственно из MDR, как это делается в разделе 4 выше, файлы данных необходимо будет суммировать и объединять вместе, чтобы сформировать файл анализа. На протяжении всего процесса используйте методы, которые повышают точность данных, включая проверку ошибок и обзор журналов и выходных данных, как это также обсуждалось ранее.
    1. При слиянии данных используйте по крайней мере два идентификатора пациента, когда это возможно, чтобы обеспечить сильное соответствие (например, число медицинских записей и дату рождения), так как ошибки могут существовать в любой области. После слияния данных просмотрите данные, чтобы обеспечить ожидаемые результаты. Запустите код, чтобы убедиться, что первые три буквы имени совпадают в дополнение к другому идентификатору или двум, полезно проверить надлежащие совпадения (см. шаг 4.5.1).
      ПРИМЕЧАНИЕ: Фамилия не может совпадать, если пациент был женат в течение рассматриваемого периода времени. Незначительные изменения могут также существовать в полях имен из-за апострофов или интервалов, а также опечаток.
    2. Обратите особое внимание на совпадения на терминалах этапов в этом процессе, таких как определение пациентов, которые имели результаты.
  2. Извлекайте базовые сопутствующие условия с использованием кодов МКБ-9-СМ или МКБ-10-СМ за период до даты индекса, дата, в течение чем пациент считается входом в исследование. Как правило, использовать 12 месяцев до даты индекса для определения сопутствующих состояний.
    1. Убедитесь, что пациенты имели право на военную систему здравоохранения в течение базового периода (можно проверить ежемесячно в файле vm6ben).
    2. Поиск базовых кодов диагностики в амбулаторных и/или стационарных файлах для установления базовых сопутствующих заболеваний в течение базового 12-месячного периода до даты индекса. Используйте коды ICD-9-CM или ICD-10-CM, установленные в разделе 1. При использовании сопутствующих заболеваний Elixhauser используйте доступное программное обеспечение от HCUP, чтобы изменить названия переменных диагноза и файлы по мере необходимости. (https://www.hcup-us.ahrq.gov/toolssoftware/comorbidity/comorbidity.jsp#download)
  3. Поиск стационарных и/или стационарных файлов после даты индекса для получения результатов, определенных кодами МКБ-9-СМ или МКБ-10-СМ, таких как госпитализация для инфаркта миокарда в качестве первичной диагностики (поиск 410.x1 в SIDR).
  4. Установить дату окончания исследования для всех пациентов в качестве отсечения для наблюдения за пациентами, которые не продемонстрировали результат интереса. Определите, какие пациенты должны подвергаться цензуре до окончания исследования.
    1. Поиск vm6ben файл для обеспечения права на медицинское обслуживание через дату окончания исследования.; в противном случае, цензура пациента в момент потери права.
    2. Если важно ограничить исследование активными пользователями системы здравоохранения независимо от права, таких как активные пользователи аптеки, а затем определить последний контакт здравоохранения (например, последнее заполнение лекарства) в файлах данных и цензуре пациентов на этой даты.
      ПРИМЕЧАНИЕ: Будьте осторожны, используя телефонные встречи, так как они могут присутствовать в медицинской записи после смерти произошло или если бенефициар вышел из системы здравоохранения по-другому.

6. Соответствие национальному индексу смертности (НДИ)

  1. После того, как полная когорта будет определена, отправьте информацию в национальный индекс смертности для сопоставления, если смертность является конечным пунктом.
    1. Во-первых, включить намерение сопоставить с NDI в запросах на данные MDR и одобрение IRB. Убедитесь в утверждении и завершении всех этапов шифрования данных, выполненных перед отправкой защищенной медицинской информации (PHI) в NDI для сопоставления.
  2. "Национальный индекс смерти (NDI) Форма применения" и направления для запроса данных о смерти из Национального индекса смерти можно найти здесь: https://www.cdc.gov/nchs/ndi/index.htm.
  3. Отправить данные на защищенный паролем компакт-диск ночной почтой в NDI. Результаты будут отправлены обратно примерно через 2 недели таким же образом.
  4. После получения результатов NDI просмотрите частичные совпадения на потенциальное включение/исключение.
    1. "Глава 4 - Оценка выхода NDI" предоставляет полезный обзор результатов обзора и может быть найден на той же веб-странице: https://www.cdc.gov/nchs/ndi/index.htm. Матчи по номеру социального страхования, как правило, обеспечивают сильнейший матч.
    2. При необходимости, перекрестная проверка смертей в Индексе смерти социального обеспечения и / или ветеранов дела Бенефициарная идентификация отчеты Locator Подсистемы (BIRLS) для повышения точности. Имейте в виду, что военнослужащие, которые умирают за рубежом, скорее всего, не появляются на поискND, но часто признаются в файле жизненного статуса MDR или в VA BIRLS.
  5. Слияние файла смерти с основным когортным файлом после завершения обзора.

7. Деидентификация данных

  1. Как только вся необходимая информация будет получена, деидентифицируйте файлы данных, чтобы защитить PHI. Создайте случайный идентификатор пациента для каждого пациента с помощью "ranuni" (см. Руководство МДР Функционального пользователя). Удалить из файлов данных социальные, медицинские записи, дату рождения пациента (после возраста расчета) и т.д. При необходимости (и одобрены), храните ключ, который связывает случайный идентификатор пациента с PHI надежно на узлах SCE.

8. Вычисление оценки склонности18,19,26

  1. Используйте логистическую регрессию для моделирования вероятности лечения (прок логистика в SAS).
    1. Укажите файл данных ("dat" в примере).
    2. Используйте заявление класса для указания категориальных переменных. Используйте "ref - first", чтобы указать наименьшее значение (например, 0) в качестве эталонного значения.
    3. В модели оператора укажите переменную обработки как зависимую переменную (Rx) и установите значение для "события" как значение для получения лечения (1 в данном случае).
    4. Включите любые возможные предсказатели получения лечения в качестве ковариатов в модель, особенно если они могут быть предсказателями результата (например, смерть). Рассмотрим, если взаимодействие между терминами может повлиять на лечение. Включите их в модель, используя «я» (например, мужской) или используйте синтаксис, показанный ниже, размещая «я» между ковариатами и «No2» в конце, чтобы указать все взаимодействия 2 x 2, в соответствии с конкретной моделью.
    5. Используйте выходную выписку, чтобы указать, что прогнозируемая вероятность лечения (prob) будет определяться "ps" и выходом в файл "ps_data".
      Equation 5
      ПРИМЕЧАНИЕ: Переменные в модели: мужской: мужской пол (двоичный), ckd: хроническое заболевание почек (двоичный), печень: хроническая болезнь печени (двоичный), диабет (двоичный), Copd: хроническая обструктивная болезнь легких (двоичный), chf: сердечная недостаточность (двоичный), Cad: Ишемическая болезнь сердца (двоичный), cvd: цереброваскулярное заболевание (двоичный), колодка: периферическая артериальная болезнь (двоичная), возраст (непрерывный).
  2. Рассчитайте веса от прогнозируемой вероятности (оценка склонности). Если пациент получил лечение (Rx No 1), то вес оценки склонности составляет 1/(оценка склонности). Если пациент не получил лечения, то вес балла склонности составляет 1/(1 - оценка склонности).
    Equation 6
  3. Стабилизировать оценку склонности, разделив его на средний вес. В приведенном ниже коде Proc означает вывод среднего веса в переменную "mn_wt" в файле данных "m". Приведенный ниже набор данных, сохраняющий mn_wt из файла данных "m", затем вычисляет баллы стабилизированной склонности (st_ps_weight) для каждого наблюдения.
    Equation 7
  4. Проверить балансировку после применения обратной вероятности взвешивания лечения.
    1. Макроstdiff упрощает вычисления стандартизированных средних различий для ковариатов до и после взвешивания в SAS. Код для макроса можно найти здесь: http://www.lerner.ccf.org/qhs/software/lib/stddiff.sas.
    2. Рассчитайте стандартизированную среднее различие перед взвешиванием. Как и во всех макросах, макрокод должен быть запущен в SAS до его вызова. Приведено в примере оператора вызова ниже с covariates интереса.
      Equation 8
      Inds - набор входных данных, groupvar - переменная, которая определяет группы исследования, шарвары - категоричные переменные, нумвары - непрерывные переменные, stdfmt - формат стандартизированной разницы, outds - набор выходных данных.
    3. Позвоните в макрос stddiff еще раз, чтобы вычислить стандартизированную средную разницу после взвешивания. "Wtvar" определяет переменную, содержащую стандартизированную оценку склонности, и добавляется в заявление макровызова. Если стандартизированные различия все меньше или равны 0,1, то балансировка считается успешной.
      Equation 9
  5. ASD до и после взвешивания может быть сообщено в табликском или графном формате. Для направления для использования макроса SAS для создания участка, пожалуйста, смотрите дополнительные материалы.
  6. Скорректированные СМПВ данные теперь могут использоваться в неиварном анализе после обеспечения балансировки измеренных confounders.

9. Создание модели результатов и создание участка кумулятивной функции заболеваемости

  1. Есть несколько способов, что резвенный анализ времени до события может быть построен, в том числе с помощью proc lifetest для создания сюжета выживания. Используйте значение веса для обозначения стандартизированного веса склонности.
  2. Для создания участка cif с использованием веса склонности, используйте proc phreg.
    1. В proc phreg ссылайтесь на ковариатный файл для указания ковариатных значений, которые будут использоваться при генерации участка. В этом случае ковариатный файл содержит только одну переменную Rx, которая может быть 1 или 0.
      Equation 10
    2. Переключать ods графики на. Используйте дополнительные операторы по мере необходимости для указания выходных файлов для типа графика или файла (jpeg и т.д.; см. https://support.sas.com/documentation/cdl/en/statug/63962/HTML/default/viewer.htm#statug_odsgraph_sect014.htm).
      Equation 11
    3. В синтаксисе proc phreg используйте оператор веса для указания стандартизированной переменной оценки склонности. Укажите значения для базовых ковариатов, используя исходное заявление, чтобы иметь возможность построить функцию кумулятивной частоты. Укажите слои для использования для участка с помощью "rowid" (в данном случае RX 1 против 0). Число в скобках после переменной результата ("событие") определяет значение (ы) переменной, которая должна подвергаться цензуре, которая должна включать дату цензуры и любые конкурирующие события. В этом случае 0 подвергается цензуре, а 1 является истинным событием.
      Equation 12

Subscription Required. Please recommend JoVE to your librarian.

Representative Results

По завершении IPTW таблицы или сюжеты абсолютных стандартизированных различий могут быть сгенерированы соответственно с помощью макрокода stddiff или макрокода asdplot. На рисунке 1 показан пример правильного балансирования в большой когорте из 10 000 участников, использующих макрос asdplot. После применения оценки склонности, абсолютные стандартизированные различия были значительно сокращены. Отсечение, используемое для абсолютной стандартизированной разницы, является несколько произвольным, хотя 0,1 часто используется и обозначает незначительную разницу между двумя группами. В небольшой когорте, надлежащее балансирование труднее достичь. На рисунке 2 показаны неудачные результаты попытки сбалансировать ковариаты в когорте из 100 участников.

После того, как будет сформирована стандартизированная оценка склонности, исследовательская группа может приступить к анализу результатов. Анализ выживания часто используется из-за необходимости подвергать участников цензуре с неравномерной последующей информацией, и на рисунке 3 показан пример использования proc phreg со стандартизированными весами оценки склонности для создания кумулятивной функции частоты (CIF) участка. Сюжет CIF изображает растущее число событий с течением времени. В этом случае необработанная или контролируельная группа (No Rx) имеет большее количество событий и сравнительно хуже, чем обработанная группа (Rx).

Figure 1
Рисунок 1: Пример успешного балансировки. В большой когорте (n 10 000) IPTW добился балансировки ковариатов со всеми абсолютными стандартизированными различиями, снижающимися до менее чем 0,1. Пожалуйста, нажмите здесь, чтобы просмотреть большую версию этой цифры.

Figure 2
Рисунок 2: Пример неудачного балансировки. В небольшой когорте (n no 100) IPTW не смогла достичь балансировки ковариатов, при этом многие абсолютные стандартизированные различия, оставшиеся более 0,1. Пожалуйста, нажмите здесь, чтобы просмотреть большую версию этой цифры.

Figure 3
Рисунок 3: Пример кумулятивного участка функции частоты сравнения групп лечения. Со временем совокупная заболеваемость смертностью увеличивается в обеих группах, хотя она выше в необработанной группе (No Rx). Таким образом, в этом примере, обработанная группа улучшила выживаемость. Пожалуйста, нажмите здесь, чтобы просмотреть большую версию этой цифры.

Дополнительные материалы. Пожалуйста, нажмите здесь, чтобы просмотреть этот файл (Право нажмите, чтобы скачать).

Subscription Required. Please recommend JoVE to your librarian.

Discussion

Ретроспективный анализ с использованием крупных административных наборов данных обеспечивает эффективную и экономически эффективную альтернативу, когда рандомизированные контролируемые испытания неосуществимы. Соответствующий набор данных будет зависеть от населения и переменных интересов, но MDR является привлекательным вариантом, который не имеет возрастных ограничений видели с данными Medicare. С любым набором данных важно быть близко знакомым с его расположением и словарем данных. Следует позаботиться о том, чтобы обеспечить захват полных данных и точное сопоставление и слияние данных.

Коды для диагностики должны быть определены с использованием существующей литературы и глубокого понимания системы кодирования МКБ-9-СМ и МКБ-10-СМ для максимизации стоимости назначенных диагнозов. Существующие наборы кодов сопутствующих заболеваний, в том числе Elixhauser27 или уточненный индекс сопутствующих заболеваний Charlson28,29,могут быть использованы для определения сопутствующих условий, которые могут повлиять на исход интереса. Аналогичным образом, проверенные алгоритмы кодирования в административных данных и должны быть использованы. Проверка должна оставаться областью активных исследований, поскольку продолжается изучение оптимального использования алгоритмов кодирования МКБ-9-СМ и МКБ-10-СМ для максимальной точной классификации широкого спектра заболеваний.

Оценки склонности могут быть использованы для устранения предубеждений, присущих любому ретроспективного анализу. Эффективное взвешивание или сопоставление баллов склонности должно уменьшить абсолютную разницу стандартизации (ASD) ниже желаемого порога, обычно установленного на уровне 0,1. Надлежащее балансирование помогает обеспечить сопоставимость групп лечения в отношении известных confounders, и надлежащим образом используемые методы оценки склонности были использованы для успешного воспроизведения рандомизированных результатов испытаний. После правильного сбалансирования, группы лечения можно сравнить с univariate время до события или другого анализа.

Даже при соответствующей балансировки, есть потенциал для остаточного путаницы3, так что следственная группа должна ограничить эффект неизмеримых confounders. Кроме того, если влияние ковариатов на выбор лечения сильны, предвзятость все еще может оставаться30. В небольших когортах, оценки склонности вряд ли полностью уменьшить ASD ниже 0,1 для всех переменных и регрессии корректировки могут быть использованы, чтобы помочь удалить остаточный дисбаланс31. Регрессионная ререгусионная ререгусионная коррекция может также использоваться в анализе подгрупп, когда соответствующий баланс больше не гарантирован.

Если все сделано правильно, исследования с административными данными дают своевременные ответы на важные клинические вопросы при отсутствии рандомизированных клинических испытаний. Хотя невозможно устранить все предубеждения из обсервационных исследований, предвзятость может быть ограничена с помощью оценки склонности и остающихся тщательных анализов.

Subscription Required. Please recommend JoVE to your librarian.

Disclosures

Авторам нечего раскрывать.

Acknowledgments

Исследование, о которых сообщается в этой публикации, было поддержано Национальным центром передовых трансляционных наук Национальных институтов здравоохранения под номером премии UL1 TR002345. Содержание является исключительно ответственностью авторов и не обязательно отражает официальные взгляды Национальных институтов здравоохранения.

Отказ от ответственности: Кроме того, мнения, выраженные в этой статье, являются мнениями автора и не должны быть истолкованы как представляющие каким-либо образом мнения правительства Соединенных Штатов, министерства обороны Соединенных Штатов (МО) или министерства Соединенных Штатов Армии. Идентификация конкретных продуктов или научных приборов считается неотъемлемой частью научной деятельности и не представляет собой одобрение или подразумеваемое одобрение со стороны автора, Министерства обороны или какого-либо компонентного учреждения.

Materials

Name Company Catalog Number Comments
CD Burner (for NDI Request)
Computer
Putty.exe Putty.org
SAS 9.4 SAS Institute Cary, NC
WinSCP or other FTP software https://winscp.net/eng/index.php

DOWNLOAD MATERIALS LIST

References

  1. Concato, J., Shah, N., Horwitz, R. I. Randomized, controlled trials, observational studies, and the hierarchy of research designs. New England Journal of Medicine. 342 (25), 1887-1892 (2000).
  2. Austin, P. C., Platt, R. W. Survivor treatment bias, treatment selection bias, and propensity scores in observational research. Journal of Clinical Epidemiology. 63 (2), 136-138 (2010).
  3. Sturmer, T., Wyss, R., Glynn, R. J., Brookhart, M. A. Propensity scores for confounder adjustment when assessing the effects of medical interventions using nonexperimental study designs. Journal of Internal Medicine. 275 (6), 570-580 (2014).
  4. Schermerhorn, M. L., et al. Long-Term Outcomes of Abdominal Aortic Aneurysm in the Medicare Population. New England Journal of Medicine. 373 (4), 328-338 (2015).
  5. Williams, R. J. II, et al. A Propensity-Matched Analysis Between Standard Versus Tapered Oral Vancomycin Courses for the Management of Recurrent Clostridium difficile Infection. Open Forum Infectious Diseases. 4 (4), (2017).
  6. Mitchell, J. D., et al. Impact of Statins on Cardiovascular Outcomes Following Coronary Artery Calcium Scoring. Journal of the American College of Cardiology. 72 (25), 3233-3242 (2018).
  7. Rush, T., McGeary, M., Sicignano, N., Buryk, M. A. A plateau in new onset type 1 diabetes: Incidence of pediatric diabetes in the United States Military Health System. Pediatric Diabetes. 19 (5), 917-922 (2018).
  8. Rhon, D. I., Greenlee, T. A., Marchant, B. G., Sissel, C. D., Cook, C. E. Comorbidities in the first 2 years after arthroscopic hip surgery: substantial increases in mental health disorders, chronic pain, substance abuse and cardiometabolic conditions. British Journal of Sports Medicine. , (2018).
  9. Mitchell, J., Paisley, R., Moon, P., Novak, E., Villines, T. Coronary Artery Calcium Score and Long-term Risk of Death, Myocardial Infarction and Stroke: The Walter Reed Cohort Study. Journal of the American College of Cardiology: Cardiovascular Imaging. , (2017).
  10. McCormick, N., Lacaille, D., Bhole, V., Avina-Zubieta, J. A. Validity of myocardial infarction diagnoses in administrative databases: a systematic review. PLoS ONE. 9 (3), e92286 (2014).
  11. Huo, J., Yang, M., Tina Shih, Y. -C. Sensitivity of Claims-Based Algorithms to Ascertain Smoking Status More Than Doubled with Meaningful Use. Value in Health. , Available from: https://doi.org/10.1016/j.jval.2017.09.002 (2017).
  12. Nayan, M., et al. The value of complementing administrative data with abstracted information on smoking and obesity: A study in kidney cancer. Canadian Urological Association Journal. 11 (6), 167-171 (2017).
  13. Birman-Deych, E., et al. Accuracy of ICD-9-CM codes for identifying cardiovascular and stroke risk factors. Medical Care. 43 (5), 480-485 (2005).
  14. Preen, D. B., Holman, C. D., Spilsbury, K., Semmens, J. B., Brameld, K. J. Length of comorbidity lookback period affected regression model performance of administrative health data. Journal of Clinical Epidemiology. 59 (9), 940-946 (2006).
  15. Rector, T. S., et al. Specificity and sensitivity of claims-based algorithms for identifying members of Medicare+Choice health plans that have chronic medical conditions. Health Services Research. 39 (6 Pt 1), 1839-1857 (2004).
  16. Hernán, M. A., et al. Observational studies analyzed like randomized experiments: an application to postmenopausal hormone therapy and coronary heart disease. Epidemiology (Cambridge, Mass.). 19 (6), 766-779 (2008).
  17. Austin, P. C. The relative ability of different propensity score methods to balance measured covariates between treated and untreated subjects in observational studies. Medical Decision Making. 29 (6), 661-677 (2009).
  18. Robins, J. M., Hernan, M. A., Brumback, B. Marginal structural models and causal inference in epidemiology. Epidemiology. 11 (5), 550-560 (2000).
  19. Robins, J. Marginal structural models. 1997 Proceedings of the American Statistical Association, section on Bayesian statistical science. , 1-10 (1998).
  20. Thoemmes, F., Ong, A. D. A Primer on Inverse Probability of Treatment Weighting and Marginal Structural Models. Emerging Adulthood. 4 (1), 40-59 (2016).
  21. Xu, S., et al. Use of stabilized inverse propensity scores as weights to directly estimate relative risk and its confidence intervals. Value in Health: the Journal of the International Society for Pharmacoeconomics and Outcomes Research. 13 (2), 273-277 (2010).
  22. Cowper, D. C., Kubal, J. D., Maynard, C., Hynes, D. M. A primer and comparative review of major US mortality databases. Annals of Epidemiology. 12 (7), 462-468 (2002).
  23. Skopp, N. A., et al. Evaluation of a methodology to validate National Death Index retrieval results among a cohort of U.S. service members. Annals of epidemiology. 27 (6), 397-400 (2017).
  24. Buck, C. J. 2015 ICD-9-CM for Hospitals, Volumes 1, 2, & 3, Professional Edition. , Elsevier Saunders. (2015).
  25. Buck, C. J. 2018 ICD-10-CM for Hospitals, Professional Edition. , Elsevier Saunders. (2018).
  26. Guo, S., Fraser, W. M. Propensity Score Analysis: Statistical Methods and Applications, Second Edition. , Sage Publications. (2015).
  27. Elixhauser, A., Steiner, C., Harris, D. R., Coffey, R. M. Comorbidity measures for use with administrative data. Medical Care. 36 (1), 8-27 (1998).
  28. Charlson, M. E., Pompei, P., Ales, K. L., MacKenzie, C. R. A new method of classifying prognostic comorbidity in longitudinal studies: development and validation. Journal of Chronic Diseases. 40 (5), 373-383 (1987).
  29. Deyo, R. A., Cherkin, D. C., Ciol, M. A. Adapting a clinical comorbidity index for use with ICD-9-CM administrative databases. Journal of Clinical Epidemiology. 45 (6), 613-619 (1992).
  30. Austin, P. C., Stuart, E. A. The performance of inverse probability of treatment weighting and full matching on the propensity score in the presence of model misspecification when estimating the effect of treatment on survival outcomes. Statistical Methods in Medical Research. 26 (4), 1654-1670 (2017).
  31. Austin, P. C. Balance diagnostics for comparing the distribution of baseline covariates between treatment groups in propensity-score matched samples. Statistics in Medicine. 28 (25), 3083-3107 (2009).

Tags

Медицина Выпуск 155 обратная вероятность взвешивания лечения оценка склонности национальный индекс смертности Хранилище данных Военной системы здравоохранения предвзятость выбор лечения путаница большие данные
Обратная вероятность взвешивания лечения (Оценка потенциалности) с использованием хранилища данных военной системы здравоохранения и Национального индекса смерти
Play Video
PDF DOI DOWNLOAD MATERIALS LIST

Cite this Article

Mitchell, J. D., Gage, B. F.,More

Mitchell, J. D., Gage, B. F., Fergestrom, N., Novak, E., Villines, T. C. Inverse Probability of Treatment Weighting (Propensity Score) using the Military Health System Data Repository and National Death Index. J. Vis. Exp. (155), e59825, doi:10.3791/59825 (2020).

Less
Copy Citation Download Citation Reprints and Permissions
View Video

Get cutting-edge science videos from JoVE sent straight to your inbox every month.

Waiting X
Simple Hit Counter