A Metadata Extraction Approach for Clinical Case Reports to Enable Advanced Understanding of Biomedical Concepts

John Harry Caufield; David A. Liem; Anders O. Garlid; Yijiang Zhou; Karol Watson; Alex A. T. Bui; Wei Wang; Peipei Ping

doi:10.3791/58392

JoVE Journal > Medicine

Please note that all translations are automatically generated. Click here for the English version.

Medicine

Подход извлечения метаданных для клинических случаев для включения расширенного понимания концепций, биомедицинских

Published: September 20, 2018

doi:

10.3791/58392

John Harry Caufield², David A. Liem^2,3, Anders O. Garlid², Yijiang Zhou, Karol Watson³, Alex A. T. Bui^5,6,7, Wei Wang^7,8,9, Peipei Ping^2,3,7,8

Summary

Мы представляем протокола и связанных с ними метаданных шаблон для извлечения текста, описывающий биомедицинских концепций в клинических случаев. Структурированные текстовые значения производится через этот протокол может поддерживать глубокий анализ тысяч клинических повествования.

Abstract

Клинические случаи (КЦДЗ) являются ценным средством обмена наблюдения и исследования в области медицины. Меняется форма этих документов, и их содержание включает в себя описания многочисленных, Роман болезни презентаций и лечения. До настоящего времени текстовые данные в КЦДЗ основном неструктурированных, требующих значительных усилий человека и вычислительные вынести эти данные полезны для углубленного анализа. В этом протоколе мы описываем методы для определения метаданных, соответствующих конкретным биомедицинских понятия, часто наблюдается в КЦДЗ. Мы предоставляем шаблон метаданных как руководство для документа аннотации, признавая, что введение структуры на КЦДЗ могут осуществляться путем комбинации ручного и автоматизированного усилий. Представленный здесь подход подходит для организации связанных с концепцией текста от большой литературе корпус (например, тысячи из КЦДЗ), но может быть легко адаптирована для облегчения более целенаправленных задач или небольшие наборы отчетов. Результате структурированных текстовых данных включает в себя достаточно семантического контекста для поддержки различных рабочих процессов анализа последующего текста: мета анализ для определения как максимизировать CCR подробно, эпидемиологические исследования редких заболеваний и разработка моделей медицинские языка могут все быть сделаны более реализуемы и управляемой с помощью структурированных текстовых данных.

Introduction

Клинические случаи (КЦДЗ) являются основные средства обмена, замечания и идеи в медицине. Они служат как основной механизм коммуникации и образования для врачей и студентов-медиков. Исторически КЦДЗ также предоставили счетов возникающих заболеваний, их лечения и их генетическим стола¹^,²^,и³^,⁴. Например первый лечения человека бешенство Луи Пастер в 1885⁵^,⁶ и первое применение пенициллина в пациентов,⁷ были оба сообщили через КЦДЗ. Начиная с апреля 2018, были опубликованы более 1,87 миллионов КЦДЗ с более половины миллиона в течение последнего десятилетия; журналы продолжают предоставлять новые места для этих докладов⁸. Хотя уникальные по форме и содержанию, КЦДЗ содержат текстовые данные, которые в основном неструктурированных, содержат широкий словарный запас и касаются взаимосвязанных явлений, ограничивая их использования в качестве ресурса структурированной. Требуются значительные усилия для извлекать подробные метаданные (например, «данные о данных», или в данном случае, описания содержимого документа) от КЦДЗ и установить их как данные обнаружимым, доступной, совместимых и многоразовые (ярмарка)⁹ ресурсов.

Здесь мы описываем процесс для извлечения текста и числовых значений для стандартизации описания конкретных биомедицинских концепций в опубликованных КЦДЗ. Эта методология включает шаблон метаданных для руководства заметки; Смотрите Рисунок 1 обзор этого процесса. Применение процесса аннотации к большой коллекции отчетов (например, несколько тысяч определенного типа болезни презентации) позволяет Ассамблее управляемой и структурированного набора аннотированный клинических текстов, достижение machine-readable Документация и биомедицинских явления встроенные в каждой клинической картины. Хотя форматы данных, таких как предоставляемые HL7 (например., версии 3 стандарта обмена сообщениями¹⁰ или быстро здравоохранения ресурсов совместимости [FHIR]¹¹), LOINC¹²и пересмотр 10 международной статистической Классификация болезней и связанных с ними проблем со здоровьем (МКБ-10)¹³ обеспечивают стандартов для описания и обмена клинических наблюдений, они не поимка текст, окружающих эти данные, они не предназначены для. Результаты нашей методологии лучше всего использовать для реализации структуры на КЦДЗ и облегчения последующего анализа, нормализации через контролируемые словари и систем кодирования (например., МКБ-10), и/или преобразования в форматы клинических данных, перечисленных выше .

Добыча ресурсов КЦДЗ является активной области работы в рамках биомедицинских и клинических информатики. Хотя предыдущие предложения стандартизировать структуру дело отчеты (например., используя HL7 v2.5¹⁴ или стандартизированной терминологии фенотип¹⁵) заслуживают похвалы, вполне вероятно, что КЦДЗ будет продолжать следить за целый ряд различных естественный язык форм и документов макеты, как они имеют большую часть прошлого века. В идеальных условиях авторы новых отчетов следуйте уход Руководство¹⁶ чтобы убедиться, что они являются всеобъемлющими. Подходы, чувствительных к естественного языка и его отношение к медицинской концепции, поэтому может быть наиболее эффективным в работе с новым и архивированных отчетов. Ресурсы, такие как ремесло¹⁷ и те производства информатики для интеграции биологии и курирование¹⁸ прикроватная (i2b2) поддерживать подходы, обработки естественного языка (NLP) пока не специально сосредоточиться на КЦДЗ или клинических повествования. Аналогично медицинские инструменты НЛП такие cTAKES¹⁹ и зажим²⁰ были разработаны, но как правило определить конкретные слова или фразы (то есть, подразделений) в документы, вместо того, чтобы общие концепции, обычно описывается в КЦДЗ.

Мы разработали стандартизированных метаданных шаблон для функции, обычно включаемых в КЦДЗ. Этот шаблон определяет возможности наложить структуры на КЦДЗ — важным прекурсором для углубленного сравнения содержимого документа-еще не обеспечивает достаточную гибкость, чтобы удерживать семантического контекста. Хотя мы разработали формат, связанный с этим шаблоном, подходящими для ручной аннотации и вычислений с помощью текста, мы обеспечили, что это особенно легко использовать для ручного комментаторы. Наш подход заметно отличается от более сложных (и, следовательно, менее сразу понятно неподготовленным исследователей) рамки как FHIR²¹. Следующий протокол описывает изолировать функции документов, соответствующий типу данных каждого шаблона с одним набором значений, соответствующих этим в одной CCR.

Типы данных в шаблоне являются те самые описательные КЦДЗ и медицинских документов, ориентированных на пациента в целом. Аннотации этих функций способствует находимости, доступность, совместимости и повторное использование CCR текста, главным образом путем предоставления в ее структуре. Типы данных, в четыре общие категории: идентификации документа и аннотации, судебный отчет идентификации (например, свойства документа уровня), медицинское содержание концепции (главным образом концепции уровня свойства) и подтверждения (т.е. особенности предоставления доказательств финансирования). В этом процессе аннотации каждый документ включает в себя полный текст CCR, минуя любой материал содержимое документа, независимых дела (например, экспериментальные протоколы). КЦДЗ, как правило, меньше, чем 1000 слов каждая; один корпус идеально быть проиндексирован же библиографическая база данных и находиться в том же письменного языка.

Продуктом подход, описанный здесь, при применении к CCR корпус, является структурированный набор аннотированных клинических текста. Хотя эта методика может быть выполнена полностью вручную и была разработана чтобы быть выполнены специалистами домена без опыта информатики, он дополняет подходы обработки естественного языка, указанного выше и предоставляет данные, подходящие для Вычислительный анализ. Такой анализ может представлять интерес для аудитории исследователей, помимо тех, которые часто читают КЦДЗ, включая:

тех, кто занимается презентации болезни, их ключевых симптоматология, обычные диагностические подходы и процедуры
те, кто пожелает сравнить результаты клинических испытаний с события, описанные в рамках клинических литературы, потенциально содержащих дополнительные замечания и большей статистической мощности.
Биоинформатика, биомедицинской информатики и компьютерной науки исследователей, которые требуют медицинские язык структурированных наборов данных или высокого уровня понимания медицинских историй из
Исследователи политики правительства, упором на как клинические испытания могут лучше отражать как диагностики и лечения, как это происходит в действительности

Обеспечение соблюдения структуры на КЦДЗ может поддерживать многочисленные последующие усилия, чтобы лучше понять язык медицинских и биомедицинских явлений.

Protocol

1. документ и заметки идентификации Примечание: Значения в этой категории поддерживают процесс аннотации. Используя шаблон заметки, предоставляют набор идентификатор для метаданных, например, Case123. Идентификатор формата должен быть постоянной в течение всего проекта (например, Case001 через Case500). Укажите дату, на которую документ был читать и аннотированная. Используйте формат, напоминающие «10 Ян 2018» для согласованности и удобочитаемости. 2. Отчет идентификации Примечание: Значения этой категории обеспечивают функции уровня документа и способствовать находимости документа. В соответствии с форматом каждого поля во всех заметок, например, отдельные значения должны быть разделены точкой с запятой без следующих пробелов во всех записях. Используйте одинаковые форматы для тех, которые используются в исходном документе или используемыми в библиографической базе данных как MEDLINE. Указать название документа. Предоставить имена всех авторов документа в указанный порядок. Нормализовать формат всех имен, таким образом, что все имена принимают форму единого фамилия, после чего любое количество инициалы, например Джейн б. парк становится JB парк. Не включать заголовки. Отделить несколько авторов с запятой без дополнительных знаков препинания, таким образом, что Джон а. Смит, Джейн б. парк принимает форму JA Смит; Парк JB. Предоставить год издания этого документа. Обеспечить полное название журнала, в котором был опубликован документ. Список названий контролируемых журнал обеспечивается NLM каталог (https://www.ncbi.nlm.nih.gov/nlmcatalog). Укажите адрес домашнего учреждения авторов этого документа, как указано в документе. Это может включать департаментов, географических точках и почтовый адрес. Если несколько расположений (например, если принадлежность отличаются между авторами), укажите только детали для соответствующего автора. Если соответствующий автор не могут быть идентифицированы, использовать первого автора, или не указывать учреждение. Если соответствующий автор имеет несколько филиалов, укажите оба и разделить точкой с запятой. Обеспечить соответствующий автор этого документа, как указано в заголовке документа, используя тот же формат, что и в типе данных авторы. Предоставьте идентификатор документа (например, PMID). Предоставить цифровой идентификатор объекта, где это возможно и доступно, разрешаемое в документе URL (через https://www.doi.org/), не PubMed Центральной страница. Предоставить стабильные URL-адрес в полный текст документа, при наличии. Чтобы максимизировать доступность, это может относиться к PubMed Центральной версии. Предоставить языка документа. Для документов на нескольких языках, обеспечивают оба, разделенные точкой с запятой. 3. медицинское содержание Примечание: Значения этой категории определить возможности уровня документа, концепции и текста. Они служат для повышения доступности документа, взаимодействия и многократного использования. Эти функции предоставляют способы соблюдать концептуальную и семантического сходства между содержимого документа, с акцентом на биомедицинских тем и событий. Большинство категорий в этом разделе может включать несколько текст заявления и каждый должны быть разделены точкой с запятой. Включить контекстную детали в каждом поле (например, «мать был рак молочной железы в возрасте 50 лет») вместо только терминов из словаря (например, не «рак груди» только). Не включать обширные детализации каждого наблюдения. Опустите часто повторяющиеся слова и фразы (например, местоимения, слово «пациент» и фразы «жаловались» или «представлены»). Хотя субъективности через несколько комментаторы, вероятно, она может быть уменьшена путем иметь несколько комментаторы для каждого документа и путем автоматической нормализации после сбора данных. Вычислительная постобработки подходы будут варьироваться в зависимости от последующего анализа потребностей и здесь не обсуждаются подробно. Предоставьте следующую информацию в шаблон заметки. Предоставить конкретные термины определены в документе, обычно в его заголовке, как ключевые термины. Разделяйте точкой с запятой, как условия могут включать в себя другие знаки пунктуации. Предоставляют значения демографических, специально любой текст заявления, описания фона пациента, включая пола и/или пола, возраста, этнической принадлежности или гражданства. Предоставить географических местах, упомянутых в клинической повествование, отличных от адреса конкретного учреждения. Это не должно включать анатомического расположения частей, но может включать любой географической локали, где проживает или путешествия пациента. Предоставляют значения стиль жизни, включая любые заявления текст, описывающий частые пациента деятельности или поведения, имеющих отношение к их общее состояние здоровья. На практике это часто включает Курение или привычки потребления алкоголя, но может также включать солнце, диета или частоты конкретных видов физической активности. Предоставляют значения медицинской истории, обращаясь к истории семьи. Включите любой текст заявления, описания клинических наблюдений и события опытных братьев и сестер, родителей и других членов семьи. Это включает в себя генетические условия и негативные замечания (то есть, История семьи был отрицательным для болезнь). Предоставляют значения, ссылаясь на социальной истории, включая любые заявления текст, описывающий пациента фон, не охваченные в демографии или стиль жизни. Там могут быть дублирования контента между этими категориями. Заявления могут включать профессиональной истории и социальные привычки. Предоставляют значения, ссылаясь на медицинских и хирургических истории пациента. Включите любой текст заявления, описания любого медицинского наблюдения, лечения или других событий, происходящих до начала клинических проявлений. Это включает акушерских истории и периоды хорошего здоровья, где не указано. Укажите один или несколько из следующих категорий системы 16 болезни. Обратите внимание, что эти ценности являются категориальной вместо свободного текста. Категории не являются всеобъемлющими, но следует указать большинство систем, сказались события, описанные в клинической картины и диагноз болезни. Следовать определенный набор категорий, основанный на категориях используется в международной статистической классификации болезней и связанных с ними проблем здоровья, редакция 10 код системы (МКБ-10). Приведена Таблица 1 список болезней системы категорий наряду с соответствующие диапазоны код МКБ-10. Представить подробную информацию о всех признаков и симптомов. Включите любой текст заявления, описания любого медицинского наблюдения признаки или симптомы, начиная с первоначальной презентации, включая их начала, продолжительность, тяжести и резолюции, если. Не включать в себя симптомы, описанные в итоговом документе. Эти значения могут перекрываться с другими типами, если симптомы продолжают от истории первоначального представления. Подробную информацию о любых сопутствующих заболеваний. Включайте любые слова или фразы, описания различных заболеваний на момент первоначального клинической картины. Существует вероятность дублирования между этими значениями и тех, кто в клинической истории, хотя сопутствующие заболевания не должны включать термины аналогичны в диагностике. Подробную информацию о всех диагностических методов и процедур. Включить имена медицинских процедур для диагностических целей, включая экзамены, тесты и изображений, а также условия, при которых эти испытания были выполненных и соответствующих анатомических местах (например, «верхних конечностей венозной ультразвук»). Исключите результаты теста. Подробную информацию о диагностике. Включать любые заявления текст, описывающий диагнозы болезней, даже если окончательный диагноз является неоднозначным. Предоставлять все лабораторные значения и результаты испытаний. Включать имена диагностических тестов, их значений и условий, при которых они были выполнены. Это будет включать совпадения с терминов, используемых в диагностических методов и процедур типа данных. Как числовые, так и качественные значения (например, анализ крови был в нормальных пределах) являются приемлемым. Если не указаны имена диагностических тестов, используйте термины, описывающие результаты (например, лейкопения), хотя они также должны быть включены в признаки и симптомы. Подробную информацию о патологии. Включите любые заявления текст, описывающий результаты патологии и гистология исследований, включая грубые патологии, иммунологии и микроскопии исследования. Термины могут совпадать с тех, которые используются в диагностических методах и процедурах (шаг 3.11), например, с процедурами для получения образцов таких биопсии. Обеспечить все фармакологические методы лечения. Включать любые заявления текст, описывающий лекарственной терапии, используемых в процессе лечения, включая общие условия, такие как антибиотики или имена конкретных наркотиков. Кроме того включать описание когда и как лекарственной терапии были остановлены. Обеспечение всех интервенционных процедур. Включите любой текст заявления, описания лечебных процедур, используемых в процессе лечения, включая инвазивные процедуры, имплантация медицинских приборов и процедур делается для облегчения других терапий. Кроме того включать описание, когда и каким образом текущие терапевтические процедуры были остановлены, при необходимости. Предоставить итоги пациента. Включите любой текст заявления, описания состояния здоровья пациента по состоянию на конец клинической картины, описанных в докладе, включая любые последующие испытания. Предоставляют количества всех диагностических изображений, рисунков, видео/анимации и таблиц. Включить все количество визуальных средств массовой информации, включенные в отчет, в следующем формате: количество изображений; Количество фигур; Количество видео или анимации; Количество таблиц. Различие между изображениями и фигуры таким образом: изображения включают в себя любые продукты клинической диагностики, в том числе фотографии, микроскопии, ЭКГ ритм изображения и другие продукты диагностических изображений, хотя цифры являются все другие изображения, как правило, включая участки данных и иллюстрации. Предоставлять другим КЦДЗ доказательств связей. Это поле может включать идентификаторы (например, PMIDs) и других докладов в наборе данных, процитировано или ссылки на этот доклад. Предоставить доказательства отношений, в клинических испытаниях. Это поле может содержать идентификаторы клинических испытаний, сославшись на этот CCR. Выявить испытания их ClinicalTrials.gov идентификаторы, предшествует NCT, или другой стабильной идентификатор. Включать сшивки базы данных, соответствующий этому документу, включая идентификаторы, желательно как имена баз данных и стабильные URL-адресов. 4. Выражение признательности Примечания: Значения этой категории определить особенности уровня документа еще имеют мало последовательную структуру всей публикации. Они предоставляют подробную информацию относительно организаций, оказывающих поддержку для CCR и связанной с этим работы. Эта категория также включает в себя поле для общего количества ссылок, цитируется статья: это предназначено предоставить грубый показатель степени к которому документ имеет концептуальных связей с другими биомедицинскими документов любого типа. В течение четырех данных типов в этом разделе обеспечивают следующее. Укажите, что всех источников финансирования в поддержку работы и соответствующий пи а также соответствующие премии чисел. Первое значение, источник финансирования, должно включать в себя названия всех организаций, оказания финансовой поддержки для работы. Отдельные организации с запятой и запрещено, например, Национальные институты здравоохранения/Национальный институт рака; Доу; Смит Парк фонд . Следующее значение, премия номер, укажите любые цифры премии или конкретных обозначений, а также получатели наград, где уместно, как инициалы получателей в скобках, например, R01HL123123 (для JP) , NS12312 (для JP, JS), учебных стипендий (в JS). Авторы явно может заявить, что никакой соответствующей информации доступен (например, «не финансирование было получено»); в таких случаях используйте текст, предоставляемый авторы как значение источник финансирования. В противном случае значение должно быть NA. Укажите раскрытие информации/конфликты интереса как указано авторами, например, JP является консультантом для DrugCo. Авторы явно может заявить, что никакой соответствующей информации доступен (например, «конфликта интересов не объявлен»); в таких случаях используйте текст, предоставляемый авторы как раскрытие информации/конфликт интересов значения. В противном случае, как указано выше значение должно быть NA. Укажите численное количество все ссылки, приведенные в документе, не включая тех, которые предусмотрены в любых дополнительных материалов. Текст ссылки не должны включаться в этой области.

Representative Results

На рисунке 2приведен пример процесса аннотации. Этот корпус22 описывает презентацию инфекции, бактериальных патогенов Burkholderia thailandensis. Для справки соответствующая часть этой CCR предоставляется в формате обычного текста в дополнительный файл 1; Некоторые результаты исследований представлены в настоящем докладе и включены для сравнения. На практике преобразование сообщения в формате HTML или PDF в простой текст может улучшить эффективность и простоту извлечения метаданных. В таблице 2приводятся примеры двух наборов метаданных Аннотации завершенных CCR. В первом из этих примеров является макет данных для иллюстрации идеальный формат каждого значения, в то время как во втором примере содержит значения, извлеченные из опубликованных CCR на редкое состояние, акродерматит enteropathica23. Рисунок 1. Рабочий процесс для аннотации судебный отчет. Протокол, описанные здесь предоставляет метод для идентификации текстовых функций часто присутствует в клинических случаев. Этот процесс требует Ассамблеи документе корпус. Результатом процесса аннотации, когда объединяются в один файл, позволяет идентифицировать текст функции, связанные с медицинской концепции и их описания в случае докладов. Пожалуйста, нажмите здесь, чтобы посмотреть большую версию этой фигуры. Рисунок 2. Определение концепции конкретного текста в отчете клинический случай. Начиная с текстом доклада случай, вручную аннотатором может прогресс через документ, выявление сегментов текста, соответствующий каждому компоненту шаблон метаданных. Идентификация функций выделены синим цветом. Текст, соответствующий медицинской концепции находятся в красном цвете и помечены с их типом; весь выделенный текст в третьей колонке относится к типу патологии. Пожалуйста, нажмите здесь, чтобы посмотреть большую версию этой фигуры. Категория Описание МКБ-10 Глава Диапазон кода МКБ-10 Рак Любой тип рака или злокачественные новообразования. II C00-D49 нервной Любое заболевание головного мозга, позвоночника или нервы. VI G00-G99 сердечно-сосудистые Любое заболевание сердца или сосудистой системы. Не включать гематологических заболеваний. IX I00-I99 опорно-двигательного аппарата и ревматические Любое заболевание мышц, скелетной системы, суставов и соединительных тканей. XIII M00-M99 пищеварения Любое заболевание желудочно-кишечного тракта и органов пищеварения, печени и поджелудочной железы. XI K00-K95 акушерский и гинекологический Любое заболевание, касающиеся беременности, родов, женской репродуктивной системы или груди. XIV; XV O00-O9A; N60-N98 инфекционные Любое заболевание вызывает инфекционных микроорганизмов. Я A00-B99 органов дыхания Любое заболевание легких и дыхательных путей. X J00-J99 гематологические Любое заболевание крови, костного мозга, лимфатических узлов, или селезенки. III D50-D89 почек и урологические Любое заболевание почек или мочевого пузыря, мочеточников, а также мужских репродуктивных органов, в том числе простаты. XIV N00-N53; N99 эндокринной системы Любое заболевание желез внутренней секреции, а также метаболические расстройства. IV E00-E89 Челюстно- лицевая Любое условие, с участием рот, челюсти, головы, лица и шеи. XI; XIII K00-K14; M26 M27 глаз Любое условие, связанных с глаз, включая слепоту. VII H00-H59 ЛОР Любое состояние уха, носа или горла. VIII H60-H95; J30-J39 кожа Любое заболевание кожи. XII L00-L99 редкие Особая категория зарезервированы для сообщения о редких заболеваний, определены как те влияющих менее чем 200000 человек в Соединенных Штатах (см. https://rarediseases.info.nih.gov/diseases) NA NA Таблицы 1. Категорий болезней для аннотации документа. Категории, перечисленные здесь являются те, использоваться для заболевания системного типа данных в шаблоне документа метаданных. Поскольку каждая болезнь презентация может включать несколько систем органов или этиологии, единый клинических случая доклад может соответствовать несколько категорий. Эти категории основном следовать те, которые используются для различения секции международной статистической классификации болезней и связанных с ними проблем здоровья, редакция 10 (МКБ-10) код системы: предоставляются соответствующие МКБ-10 глав и код диапазоны. Некоторые категории, например, заболевания челюстно- лицевой , соответствуют несколько разделов системы МКБ-10. Тип данных Пример #1 Пример #2 (Кэмерон и Макклейн 1986) Документ и заметки идентификации Внутренний идентификатор CCR005 CCR2000 Дата аннотации 2 Мар 2018 1 Мар 2018 Отчет идентификации Название Случай эндокардит. Глазной гистопатология акродерматит enteropathica. Авторы Грант АБ; Чанг CD Кэмерон JD; McClain CJ Год 2017 1986 Журнал Журнал мир медицины и доклады Британский журнал по офтальмологии Учреждение Кафедра медицины, Отдела кардиологии, первой больницы, Бостон, Массачусетс, США Кафедра офтальмологии, медицинской школы университета Миннесоты, Миннеаполис, Миннесота 55455 Соавтор Грант АБ Камерон JD PMID 25555555 3756122 DOI 10.1011/wjmcr.2017.11.001 NA Ссылка HTTPS://www.NCBI.nlm.nih.gov/PMC/articles/PMC9555555/ HTTPS://www.NCBI.nlm.nih.gov/PMC/articles/PMC1040795/ Язык английский английский Медицинское содержание Ключевые слова бруцеллеза; эндокардит; Митральный клапан NA Демография 37-летний мужчина ребенок мужского пола Географическое расположение Флорида; Рио-де-Жанейро, Бразилия NA Стиль жизни курильщика; Иногда алкоголь NA История семьи третьим из пяти детей кровосмесительных родителей; младший брат имеет хроническая экзема NA Социальная история Строительный Рабочий NA Медицинское/хирургическое история История усталости 8 фунтов 9 унций (3884 г) продукта неосложненной, полный срок беременности; в хорошем здоровье до возраст 1 месяц, когда он разработал пузырей сыпь на щеках; сыпь распространилась привлечь кожи вокруг глаз, носа и рта; поражения кожи были также отмечены на область живота и конечностей; диарея и отказ процветать; Биопсия кожи в то время показал паракератоз типичной акродерматит enteropathica; лечение в течение следующих шести лет с периодические курсы антибиотиков широкого спектра, грудное молоко и diodoquin; частично ответил; разработана общая облысения, прерывистый акродерматит и кратковременный понос с неоптимальной веса; спастичность, приписываемых участия центральной нервной системы, ae разработан 8 месяцев возраста; несколько эпизодов кардиопульмональной ареста на 11 месяцев; отсутствие координации его голосовых связок; трахеостомические; по возрасту 18 месяцев ребенок разработал поиска нистагм, связанные с двусторонним атрофия зрительного нерва и незначительное ослабление сосудов сетчатки, а также признаки задержка психомоторного развития; двусторонние кератоконъюнктивит; кожная сыпь; второй биопсия кожи, выполненных в возрасте 3 лет снова показал паракератоз типичный для ae; тяжелая сыпь и диареи; двусторонние брутто передней помутнения роговицы были замечены, который был полностью решен к тому времени он был пересмотреть в возрасте пяти; частые инфекции, включая средний отит, инфекции мочевыводящих путей и инфекций кожи Болезни системы сердечно-сосудистой системы; инфекционные пищеварения; кожи; глаз; редкие Признаки и симптомы сердцебиение и одышка на предыдущей неделе; представлен с вялость, головная боль, озноб тяжелые блефароконъюнктивит и двусторонних передней роговицы кровенаполнение; тяжелая сыпь и диареи; грамотрицательные бактериальные сепсис; поражения кожи, типичные акродерматит enteropathica, отсутствие тимуса ткани, отмеченные атрофия зрительных нервов, нервов и оптических трактов и обширные мозжечковая дегенерация Сопутствующие заболевания гипертензия; гиперлипидемия NA Диагностические методы и процедуры Физическое обследование; электрокардиография; посев крови глаза экзамен; вскрытие Диагностика Бруцеллы эндокардита Акродерматит enteropathica Лабораторные значения повышение с – реактивного белка (до 9 мг/дл); щелочная фосфатаза (250 u/l) NA Патология Бруцеллы melitensis был культивированный из образцов крови правый и левый глаза были похожи; в толщиной от одного до трех слои клеток плоского Плоскоклеточный эпителиальных клеток эпителия роговицы был сокращен на всей поверхности роговицы; все полярности эпителия был потерян. боуменова мембрана могут быть выявлены только в периферии правой роговицы. не Боумена могут быть определены в левой роговицы. дегенеративных ни воспалительные pannus могут быть определены в любом глаз; обширные атрофия круговой и косые мышцы цилиарного тела; Некоторые задняя миграции капсульной эпителия объектива и начале корковых дегенеративных изменений; обширные дегенерация сетчатки пигментного эпителия на протяжении заднего полюса; сетчатки придают и показал мягкий изменения автолиза течение; Некоторые сохранение стержня и конус наружной сегментов в заднего полюса, однако, эти структуры были полностью потеряны впереди экватора; обширные потери ганглия клетки и нервные волокна слоев обоих глаз; почти полная атрофия дисков и прилегающих зрительного нерва Фармакологическая терапия Гентамицин 240 мг/iv/день NA Inverventional терапия Замена протеза клапана NA Пациентов результат оценки восстановление было гладко; разряженные дом умер в 1971 году (7 лет) Запись диагностических изображений/видеозапись 2; 1; 0; 1 7; 0; 0; 0 Связь с другими случае отчеты 5555555 23430849 Отношения с Clinial суда NCT05555123 NA Crosslink с базой данных MedlinePlus медицинской информации: https://medlineplus.gov/ency/article/000597.htm HighWire – PDF: http://bjo.bmj.com/cgi/pmidlookup?view=long&pmid=3756122; PubMed Центральной Европы: http://europepmc.org/abstract/MED/3756122; Генетический Альянс: http://www.diseaseinfosearch.org/result/143 Благодарности Источник финансирования Национальные институты здравоохранения/Национальный сердца, легких и крови института Клуб Лайонс Миннесота; Исследования, чтобы предотвратить слепоту; Администрация по делам ветеранов; Бюро алкоголя и других наркотиков злоупотребления программирования штата Миннесота Номер премии R01HL123123 (для AG) NA Раскрытие конфликтов интересов Доктор Грант является платной Пресс для DrugCo. NA Ссылки 4 27 В таблице 2. Стандартизированных метаданных шаблон для клинический случай сообщает, с пример аннотаций. Набор функций, общих для клинический случай докладов и содействия их концепция уровня аннотации показано здесь. Этот шаблон аранжирован в три основных раздела: идентификация, медицинского контента и благодарности, обозначающий цель и дополнительную ценность, обеспечиваемой каждого типа функции случае отчетов. Эта таблица содержит два набора пример аннотаций, один из беллетризированный отчет, и другой набор производных от отчета о состоянии акродерматит enteropathica23. Дополнительный файл 1. Текст доклада клинических случая (Чанг и др. 2017). пожалуйста, нажмите здесь, чтобы загрузить этот файл.

Discussion

Осуществление стандартизированных метаданных шаблона для КЦДЗ можно сделать их содержание более СПРАВЕДЛИВОЙ, расширить их аудиторию и расширять их приложения. После традиционного использования КЦДЗ как образовательные инструменты в медицинской коммуникации, здравоохранения стажеров (например, студентов-медиков, стажеры и стипендиаты) и биомедицинских исследователи могут найти что содержание резюме доклада включить более быстрое понимания. Самая большая сила стандартизация метаданных с КЦДЗ, однако, является, что индексирование преобразует эти данные в противном случае изолирован наблюдений в интерпретации моделей. Протокол, здесь может служить в качестве первого шага в рабочем процессе для работы с КЦДЗ, ли этот процесс состоит из эпидемиологического анализа, постмаркетингового наркотиков или лечения наблюдения или более широкие исследования патогенеза или терапевтической эффективности. Структурированных функций, определенных в КЦДЗ может предоставить полезным ресурсом для исследователей, упором на презентации болезни и лечения, особенно редких заболеваний. Клинические исследователи могут найти данные о прошлых схемы лечения для анализа записанных симптомы или побочные эффекты и степень улучшения при предыдущих стандартов медицинской помощи. Данные также могут управлять более широкого анализа новых методов лечения, основанной на эффективности, отсутствие отрицательных последствий или токсичности, или наркотиков, ориентация различий пола, возрастной группы или генетический фон.

Преимущества, предоставляемые структурированных метаданных также применимы к вычислительных процессов, предназначенных для разбора или модель медицинского языка. Структурированные функции CCR могут также предоставлять доказательства из районов, где авторы отчетов могут предоставлять более легко machine-readable (и в некоторых случаях, читаемую) содержание. Разница между КЦДЗ может быть результатом отсутствия явно предоставленных замечаний: например, точный возраст пациента не может быть указан. Аналогичным образом клиницисты не упомянуть тесты Если диагностики или их результаты были рассмотрены тривиальным. Путем предоставления примеров необходимых для углубленного анализа пробелов, соблюдения структуры на КЦДЗ освещаются возможные улучшения. В более широкой перспективе большей доступности структурированных текстовых данных из медицинских документов поддерживает усилия (НЛП) чтобы узнать от больших данных в области здравоохранения²⁴^,²⁵обработки естественного языка.

Disclosures

The authors have nothing to disclose.

Acknowledgements

Эта работа частично поддержали национальные сердца, легких и крови института: R35 HL135772 (для P. Ping); Национальный институт Генеральной медицинских наук: U54 GM114833 (для P. Ping, K. Уотсон и W. Wang); Национальный институт биомедицинских изображений и биоинженерии: T32 EB016640 (для A. Bui); подарок от Фонда Хоаг и д-р S. Сетти; и T.C. Laubisch облечение в Калифорнийском университете (для P. Ping).

Materials

A corpus of clinical case reports

n/a

Full texts of case reports may be accessed through PubMed (e.g., using the search query "Case Reports"[Filter]), other citation databases such as Europe PMC (https://europepmc.org/) or directly through publishers.

References

Ban, T. A. The role of serendipity in drug discovery. Dialogues in Clinical Neuroscience. 8 (3), 335-344 (2006).
Cabán-Martinez, A. J., García-Beltrán, W. F. Advancing medicine one research note at a time: the educational value in clinical case reports. BMC Research Notes. 5 (1), 293 (2012).
Vandenbroucke, J. P. In Defense of Case Reports and Case Series. Annals of Internal Medicine. 134 (4), 330 (2001).
Bayoumi, A. M. The storied case report. Canadian Medical Association Journal. 171 (6), 569-570 (2004).
Pasteur, L. Méthode pour prévenir la rage après morsure. Comptes rendus de l’Académie des Sciences. 101, 765-774 (1885).
Pearce, J. Louis Pasteur and Rabies: a brief note. Journal of Neurology, Neurosurgery & Psychiatry. 73 (1), 82-82 (2002).
Keefer, C. S., Blake, F. G., Marshall, E. K. J., Lockwood, J. S., Wood, W. B. J. PENICILLIN IN THE TREATMENT OF INFECTIONS. Journal of the American Medical Association. 122 (18), 1217 (1943).
Akers, K. G. New journals for publishing medical case reports. Journal of the Medical Library Association JMLA. 104 (2), 146-149 (2016).
Wilkinson, M. D., et al. The FAIR Guiding Principles for scientific data management and stewardship. Scientific Data. 3, 160018 (2016).
Beeler, G. W. HL7 Version 3-An object-oriented methodology for collaborative standards development. International Journal of Medical Informatics. 48 (1-3), 151-161 (1998).
McDonald, C. J. LOINC, a Universal Standard for Identifying Laboratory Observations: A 5-Year Update. Clinical Chemistry. 49 (4), 624-633 (2003).
. CDC/National Center for Health Statistics ICD-10-CM Official Guidelines for Coding and Reporting Available from: https://www.cdc.gov/nchs/data/icd/10cmguidelines_fy2018_final.pdf (2017)
Rajeev, D., et al. Development of an electronic public health case report using HL7 v2.5 to meet public health needs. Journal of the American Medical Informatics Association. 17 (1), 34-41 (2010).
Biesecker, L. Mapping phenotypes to language: a proposal to organize and standardize the clinical descriptions of malformations. Clinical Genetics. 68 (4), 320-326 (2005).
Riley, D. S., et al. CARE guidelines for case reports: explanation and elaboration document. Journal of Clinical Epidemiology. 89, 218-235 (2017).
Cohen, K. B., et al. Coreference annotation and resolution in the Colorado Richly Annotated Full Text (CRAFT) corpus of biomedical journal articles. BMC Bioinformatics. 18 (1), 372 (2017).
Sun, W., Rumshisky, A., Uzuner, O. Evaluating temporal relations in clinical text: 2012 i2b2 Challenge. Journal of the American Medical Informatics Association. 20 (5), 806-813 (2013).
Savova, G. K., et al. Mayo clinical Text Analysis and Knowledge Extraction System (cTAKES): architecture, component evaluation and applications. Journal of the American Medical Informatics Association. 17 (5), 507-513 (2010).
Soysal, E., et al. CLAMP – a toolkit for efficiently building customized clinical natural language processing pipelines. Journal of the American Medical Informatics Association. 25 (3), 331-336 (2018).
Bender, D., Sartipi, K. HL7 FHIR: An Agile and RESTful approach to healthcare information exchange. Proceedings of the 26th IEEE International Symposium on Computer-Based Medical Systems. , 326-331 (2013).
Chang, K., et al. Human Infection with Burkholderia thailandensis, China, 2013. Emerging Infectious Diseases. 23 (8), 1416-1418 (2013).
Cameron, J. D., McClain, C. J. Ocular histopathology of acrodermatitis enteropathica. British Journal of Ophthalmology. 70 (9), 662-667 (1986).
Maddox, T. M., Matheny, M. A. Natural Language Processing and the Promise of Big Data. Circulation: Cardiovascular Quality and Outcomes. 8 (5), 463-465 (2015).
Kreimeyer, K., et al. Natural language processing systems for capturing and standardizing unstructured clinical information: A systematic review. Journal of Biomedical Informatics. 73, 14-29 (2017).

Play Video

PDF

DOI

DOWNLOAD MATERIALS LIST

Cite This Article

Caufield, J. H., Liem, D. A., Garlid, A. O., Zhou, Y., Watson, K., Bui, A. A. T., Wang, W., Ping, P. A Metadata Extraction Approach for Clinical Case Reports to Enable Advanced Understanding of Biomedical Concepts. J. Vis. Exp. (139), e58392, doi:10.3791/58392 (2018).

Подход извлечения метаданных для клинических случаев для включения расширенного понимания концепций, биомедицинских

Summary

Abstract

Introduction

Protocol

Representative Results

Discussion

Disclosures

Acknowledgements

Materials

References

Tags

Play Video

Cite This Article

View Video

Подход извлечения метаданных для клинических случаев для включения расширенного понимания концепций, биомедицинских

Summary

Abstract

Introduction

Protocol

Representative Results

Discussion

Disclosures

Acknowledgements

Materials

References

Tags

Play Video

Cite This Article

View Video

✖

To prove you're not a robot, please enter the text in the image below