A Metadata Extraction Approach for Clinical Case Reports to Enable Advanced Understanding of Biomedical Concepts

John Harry Caufield; David A. Liem; Anders O. Garlid; Yijiang Zhou; Karol Watson; Alex A. T. Bui; Wei Wang; Peipei Ping

doi:10.3791/58392

JoVE Journal > Medicine

Please note that all translations are automatically generated. Click here for the English version.

Medicine

臨床症例を有効にするためのメタデータ抽出アプローチ先端医学の概念の理解

Published: September 20, 2018

doi:

10.3791/58392

John Harry Caufield², David A. Liem^2,3, Anders O. Garlid², Yijiang Zhou, Karol Watson³, Alex A. T. Bui^5,6,7, Wei Wang^7,8,9, Peipei Ping^2,3,7,8

Summary

プロトコルや臨床事例研究の医学の概念を説明するテキストの抽出のための関連するメタデータテンプレートを紹介しています。このプロトコルを介して生成された構造化されたテキスト値は、臨床の物語の何千もの深い分析をサポートできます。

Abstract

臨床症例報告 (Ccr) は、観察や医学の洞察力を共有する貴重な手段です。これらのドキュメントの形式が異なります、コンテンツには説明が含まれています多数、新規疾患のプレゼンテーションとトリートメント。これまでのところ、Ccr 内のテキストデータは綿密な分析に役立つこれらのデータをレンダリングする重要な人間と計算の努力を必要とする主な構造ではありません。このプロトコルでは Ccr 内でよくみられる特定の生物医学的概念に対応するメタデータを識別する方法をについて説明します。提供メタデータテンプレートガイドとしてドキュメントアノテーション手動および自動の努力の組み合わせにより Ccr の構造を課すことを追求可能性があることを認識します。ここで紹介した方法が (例えば、何千人も Ccr の) 大きい文献コーパスから概念関連テキストの組織にとって適切なより集中されたタスクまたはレポートの小さなセットを容易に簡単に適応させること。結果として得られる構造化されたテキストデータを含むさまざまな後続のテキスト解析ワークフローをサポートするための十分な意味的文脈: CCR を最大化する方法を決定するためのメタ分析の詳細、希少疾患の疫学的研究とモデル開発医療言語すべて作られるかもしれないより実現可能な構造化されたテキストデータを使用して管理します。

Introduction

臨床症例報告 (Ccr) は、観察や医学の洞察力を共有する基本的な手段です。これらはコミュニケーションと臨床医および医学生のための教育の基本的なメカニズムとして機能します。歴史的に、Ccr は、新興感染症のアカウント、その治療とその遺伝的背景¹^,²^,³^,⁴も提供しています。たとえば、1885⁵^,⁶のルイ・パスツールによって人間の狂犬病の最初の治療と⁷であった患者にペニシリンの最初のアプリケーション両方の Ccr を報告しました。以上 187 万 Ccr は、過去 10 年間の内半分以上 100万 2018 年 4 月に現在公開されています。雑誌は、これらのレポートの⁸の新しい会場を提供し続けています。独特のフォームとコンテンツ、Ccr が主として構造化されたテキストデータを含む、広大な語彙が含まれて、構造化されたリソースとしての使用を制限する、相互に関連する現象を懸念します。詳細なメタデータを抽出する多大な労力が必要 (すなわち、 「データに関するデータ」、または、この場合は、ドキュメントの内容の説明) Ccr からあり、検索、アクセス、相互運用性、再利用可能な (フェア)⁹データとして構築します。リソース。

ここでは、テキストと公開された Ccr 内特定生物医学的概念の記述を標準化する数値値を抽出するプロセスをについて説明します。この方法には、注釈をガイドするメタデータテンプレートが含まれていますこのプロセスの概要については、図 1を参照してください。注釈プロセスのレポートの大規模なコレクションへの応用 (例えば、数千人の疾患の特定の種類の) 機械可読を達成する管理しやすく構造化された注釈付き臨床テキスト、一連のアセンブリを許可ドキュメントで、それぞれの臨床プレゼンテーション内で埋め込まれた生体現象。HL7 によって提供されるようなデータ形式が (e.g、メッセージング標準¹⁰または高速医療相互運用性リソース [FHIR]¹¹のバージョン 3)、LOINC¹²、およびリビジョン 10 の国際統計。病気および関連の健康上の問題 (ICD-10) の分類¹³記述および臨床的観察を交換するための標準を提供する、これらのデータを囲むテキストをキャプチャしないでくださいも彼らがするものです。私たちの方法論の結果を最高使用して Ccr の構造を適用し、その後の分析、統制語彙とコーディングシステムを正常化を容易にする (e.g、ICD 10)、および/または上記臨床データフォーマットへの変換。.

Ccr をマイニングは、生物医学および臨床情報内の作業の活動領域です。以前の提案の構造を標準化するケースレポートが (e.g、HL7 v2.5¹⁴を使用してまたは標準化表現用語¹⁵) 称賛に値するが、Ccr は次の異なるさまざまないくなりそうだ。自然言語の形式とドキュメントのレイアウト、彼らとして過去世紀の多くのために持っています。理想的な条件の下で新しいケースレポートの著者する包括的なケアのガイドライン¹⁶に従ってください。医療の概念を自然言語との関係に敏感なアプローチは、新しいおよびアーカイブ済みレポートでの作業に最も効果的なしたがってかもしれません。統合生物学プロデュースクラフト¹⁷などそれらのリソースとベッドサイド (i2b2)¹⁸キュレーション自然言語処理 (NLP) の方法をサポートまだ特に焦点 Ccr または臨床物語はありません。同様に、cTAKES¹⁹などクランプ²⁰医療自然言語処理ツールは開発されているが、一般的に Ccr の一般的説明されている一般的な概念ではなく、ドキュメント内で特定の単語や句 (すなわちエンティティ) を識別します。

我々は、Ccr に一般的に含まれる機能のための標準化されたメタデータテンプレートを設計しています。このテンプレートは、Ccr の構造を課す機能を定義-ドキュメントの内容の詳細な比較のための重要な前駆体-まだ意味のコンテキストを保持するための十分な柔軟性が可能になります。手動アノテーションと計算支援テキストマイニングの両方に適したこのテンプレートに関連付けられている形式を設計するが、それは特に使いやすいマニュアル人手の確認しました。我々のアプローチは、FHIR²¹などのフレームワークにからより複雑な (そして、したがって、あまり未熟なすぐに理解できる研究者) を著しく異なります。次のプロトコルでは、各テンプレートデータ型、単一の単一の CCR のそれらに対応する値のセットに対応するドキュメント機能を分離する方法について説明します。

テンプレート内のデータ型は、Ccr と患者中心の医療文書の最もわかりやすい一般に。これらの機能の注釈は、主に構造を与えることによってファインダビリティ、アクセシビリティ、相互運用性、および CCR テキストの再利用性を促進します。データ型は、4 つの一般的なカテゴリ: 文書と注釈の識別、ケースレポート識別 (すなわち、文書レベルのプロパティ)、医療コンテンツの概念 (主に概念レベルのプロパティ) および受信確認 (すなわち、の資金の証拠を提供する機能)。この注釈プロセスでは、各ドキュメントには CCR、省略する場合 (実験プロトコルなど) に独立した任意のドキュメントの内容材料の完全なテキストが含まれています。Ccr は、一般的に未満 1,000 単語各;単一コーパスは、理想的には同じ書誌データベースでインデックスを作成するされ、同じ言語で書かれました。

CCR コーパスに適用した場合、ここで説明するアプローチの製品は、臨床の注釈テキストの構造化されたセットです。この方法は完全に手動で実行することができますおよび情報学経験がなくてもドメイン専門家によって行われるように設計されています、それ上で指定した自然言語処理のアプローチを補完するものし、に適切なデータを提供します解析。そのような分析は、Ccr などをよく読む人を超える研究者の観客に興味のある可能性があります。

これらの病気のプレゼンテーション、主要症状、通常の診断アプローチ治療との関係
可能性のある追加の観測と統計の力を提供する臨床文献で説明されているイベントと臨床試験の結果を比較したい人は。
構造化医療言語データセットまたは医療物語の大まかな理解を必要とするコンピューター科学者、生体情報工学、バイオインフォマティクス
政府政策の研究者がどのように臨床試験に焦点を当てを反映可能性があります最高の診断と治療、それが現実のしくみ

Ccr の構造体を強制医療言語と生体現象を理解し多数のそれに続く努力をサポートできます。

Protocol

1. 文書と注釈の同定注: このカテゴリの値は、注釈プロセスをサポートします。注釈テンプレートを使用すると、このメタデータに固有識別子を設定、例えば、 Case123を提供します。識別子の形式は、(例えば、 Case500を介してCase001 ) プロジェクト全体で一貫性のある必要があります。ドキュメントを読み、注釈された日付を指定します。整合性と可読性のため「2018 年 1 月 10 日」に似た形式を使用します。 2 症例報告識別注: このカテゴリの値はドキュメントレベルの機能を提供する、ドキュメントのファインダビリティの貢献。すべての注釈で各フィールドの形式と一貫している、例えば、個々の値の指定はすべてのエントリに次のスペースなしセミコロンで。元のドキュメントまたは文献データベース MEDLINE などで使用されているで使用されるものと同じ形式を使用します。ドキュメントのタイトルを提供します。記載されている順序でドキュメントのすべての著者の名前を提供します。すべての名前の形式を正規化、そのすべての名前は、イニシャルの任意の数字が続く単一姓の形をとる、例えばジェーン B 公園公園 JBになります。タイトルは含まれません。ジョン・ A ・スミス、ジェーン B 公園スミス JA; の形式をとります、複数の著者を追加句読点を含まないセミコロンで区切ります公園バトン。文書の出版物の年を提供します。文書が出版されたジャーナルの完全なタイトルを提供します。NLM カタログ (https://www.ncbi.nlm.nih.gov/nlmcatalog).によって制御された仕訳帳の名前の一覧が提供されます。ドキュメントで指定されている、文書の著者の所属機関のアドレスを提供します。これは、部門、地理的位置および住所の詳細を含めることができます。複数の場所を指定した場合 (例えば著者の所属が異なる場合)、対応する著者の詳細のみを指定します。対応する著者を識別できない場合、使用する最初の著者のまたは機関を指定しません。対応する著者に複数の所属がある場合両方を指定する、セミコロンで区切ります。著者データ型で使用されるのと同じ形式を使用してドキュメントの見出し内にある指定したドキュメントの対応する著者を提供します。ドキュメント識別子 (例えばPMID) を提供します。デジタルオブジェクト識別子を提供が可能であり、ドキュメントに解決 (https://www.doi.org/) を使用して URL、PubMed の本部ないページします。利用可能な場合、文書の本文に安定した URL を提供.アクセシビリティを最大限にこれは PubMed 中央バージョンを参照可能性があります。ドキュメントの言語を提供します。複数の言語で利用可能なドキュメントは、両方を提供するには、セミコロンで区切ります。 3. 医療内容注: このカテゴリの値は、ドキュメントレベル、概念レベル、およびテキストレベルの機能を識別します。ドキュメントのアクセシビリティ、相互運用性、再利用性を高めるのに役立ちます。これらの機能は、医学トピックおよびイベントの焦点とのドキュメントコンテンツの概念と意味の類似性を観察する方法を提供します。このセクションのほとんどの項目は、複数のテキスト文を含めることができ、それぞれは、セミコロンを使用して区切る必要があります。各フィールドのコンテキストの詳細を含める (例えば、「母親は、50 歳で乳癌を持っていた」) 統制語彙から用語のみを提供するのではなく (などない「乳がん」だけで)。各観察を超えて広範な詳細は含まれません。繰り返し実施される一般的な単語やフレーズ (代名詞など単語「患者」フレーズ「の不平を言った」や「表示」) を省略します。複数の人手間主観性が可能性がありますが、それ複数人手各ドキュメントおよびデータ収集後の自動正規化することによってなることがあります。計算処理後のアプローチは、その後の分析のニーズによって異なります、詳細でここで議論されていません。注釈テンプレートに以下の情報を提供します。重要な用語として通常のヘッダーは、文書内で識別される特定の用語を提供します。利用規約はその他の句読点を含めることができます、セミコロンで区切ります。人口統計値、具体的セックスや性別、年齢、民族性、または国籍を含め、患者さんのバックグラウンドを説明する任意のテキスト文を提供します。特定の機関のアドレス以外の臨床物語内で記載されている地理的な場所を提供します。これは解剖学的位置・部品、含めることはできませんが、任意の地理的なロケール患者が存在するか、移動を含めることができます。頻繁に患者等の一般的な健康に関連する動作を説明する任意のテキスト文を含むライフスタイルの値を提供します。実習では、これはよく、喫煙やアルコール消費習慣、太陽への露出、ダイエットや身体活動の特定の種類の周波数が表示される場合もあります。家族の歴史を参照する病歴の値を提供します。臨床的観察を記述するテキスト文、兄弟、両親、そして他の家族によって経験されるイベントが含まれます。これは遺伝的条件と (すなわち、家系は陰性疾患) 否定的な観測が含まれます. 人口や生活様式に記載されていない患者の背景を説明する任意のテキスト文を含む社会の歴史を参照する値を提供します。これらのカテゴリー間の内容の重複があります。ステートメントは、職業歴および社会的な習慣を含めることができます。患者の病歴と手術歴を参照する値を提供します。すべての医学の観察、治療、または臨床プレゼンテーションの開始前に起こるその他のイベントを記述する任意のテキスト文が含まれます。産科の歴史および健康の期間が含まれます記載されています。次の 16 疾病システムカテゴリの 1 つ以上を指定します。これらの値はフリーテキストではなくカテゴリ別に注意してください。カテゴリは、包括的ではないが臨床プレゼンテーションで説明されているほとんどのシステムでのイベントの影響を受けることを示す必要があり、病を診断しました。フォローカテゴリに基づいて、カテゴリの特定のセットは、国際統計分類の病気および関連の健康上の問題、改正で 10 (ICD-10) コードシステムを使用しました。対応する ICD 10 コードの範囲と一緒に病気システムカテゴリの一覧については表 1を参照してください。すべての兆候と症状.の詳細を提供します。徴候や症状の場合は、発症、期間、重大度、および解決を含むプレゼンテーションを最初から開始の医学の観察を記述する任意のテキスト文が含まれます。結果説明されている現象は含めないでください。現象が引き続き歴史から初期プレゼンテーションする場合、これらの値は他の型と重なる可能性があります。任意の合併症の詳細を提供します。別の病気の初期の臨床プレゼンテーションの時に存在を記述する任意語句が含まれます。併存疾患に診断と同じ言葉を含めることはできませんが、これらの値とこれらの臨床の歴史が重なる可能性が高いがあります。すべての診断技術と手順の詳細を提供します。診断、検査、テスト、およびイメージング、されるこれらのテストが実行されると関連する解剖学的な場所 (例えば、「上肢静脈条件などに行われる医療手技の名を含める超音波」)。テスト結果を除外します。診断の詳細を提供します。最終診断があいまいな場合でも、病気の診断を説明する任意のテキスト文を入れるすべての臨床検査値を提供し、テストの結果。彼らが実行する診断テスト、その値の名前が含まれます。これは診断技術およびプロシージャのデータ型で使用される用語の重複を含みます。数値と定性的な値 (例えば、完全な血球数が正常範囲内であった)、許容.診断テストの名前を指定しない場合は、彼らはまた徴候や症状に含まれますが必要があります (例えば、白血球減少症)、結果を説明する用語を使用します。病理学の詳細を提供します。総体の病理学、免疫学、顕微鏡の研究を含む病理学および組織学の研究の結果を説明する任意のテキスト文が含まれます。用語は、診断技術と手順 (ステップ 3.11)、例えば、生検などのサンプルを取得するために実行する手順で使用されるものと重なる可能性があります。すべての薬理学的治療を提供します。抗生物質や特定の薬剤名.などの一般的な用語を含む治療の過程で使用されて、薬物療法を説明する任意のテキスト文を含めるまた、薬物療法が停止したタイミングと方法の説明が含まれます。すべてのインターベンションを提供します。治療手順治療、侵襲的処置を含む医療機器や他の療法を容易にするために行われるプロシージャの注入過程で使用を記述する任意のテキスト文が含まれます。また、含まれての説明および継続的な治療手順を停止していた、方法が必要な場合。患者のアウトカムを提供します。フォローアップテストを含む、レポートに記載されている臨床症状の末の患者の健康を記述する任意のテキスト文が含まれます。すべての診断画像、図、動画/アニメーション、およびテーブルのカウントを提供します。次の形式でのレポートに含まれる視覚的なメディアのすべてのカウントを含める: イメージの数カウントの数字;ビデオまたはアニメーションの数テーブルの数。画像や図形を区別この方法で: 画像には臨床診断、写真、顕微鏡写真、心電図リズム画像診断イメージング、数字は他のすべてのイメージの他の製品などの製品が含まれます通常、データプロットとイラストを含みます。他の Ccr の関係の証拠を提供します。このフィールドが引用したデータセットまたはこのレポートを参照する識別子 (例えばPMIDs) の他のレポートがあります。臨床試験関係の証拠を提供します。このフィールドは、この CCR を引用して臨床試験の識別子を含めることができます。それらの ClinicalTrials.gov 識別子の前に高専、またはその他の安定した識別子によって試験を識別します。できればデータベース名としての識別子を含む、この文書に対応するデータベースのクロスリンクを含めるし、Url を安定します。 4. 確認ノート: このカテゴリの値はドキュメントレベルの機能を識別するまだ出版物間で少し一貫性のある構造を持っています。CCR と関連の仕事のためのサポートを提供する組織に関する詳細情報を提供します。このカテゴリには記事で引用された文献の総数のフィールドも含まれています: これはドキュメントがあらゆる種類の他の医療ドキュメントと概念の関係を持っている程度の大まかな指標を提供するものです。このセクションの 4 つのデータ型の中には、以下を提供します。受賞番号だけでなく、円周率の仕事をサポートし、対応するすべての資金源を指定します。最初の値、資金源は、仕事のため金融サポートを提供するすべての組織の名前を含める必要があります。別の組織のセミコロンとスペースを例えば、健康/国立がん研究所の国立研究所。DOE;スミス公園財団. 次の値は、受賞番号指定賞数かの受賞者と一緒に提供されている固有の名称、適切な場合、かっこ内の受信者のイニシャルとして例えば、 R01HL123123 (JP) に、 NS12312 (JP、JS) に、研究研修員 (JS) します。著者は明示的に対応する情報がないことを述べることができる (例えば、「資金が返ってこなかった」);この場合、資金の元の値として著者によって提供されるテキストを使用します。それ以外の場合、値は、na というべき例えば著者はJP は DrugCo のためのコンサルタントによって指定された開示/利害の対立を指定します。著者は明示的に対応する情報がないことを述べることができる (例えば、「利害の対立は宣言されていません」);この場合、金利の値の開示/競合として著者によって提供されたテキストを使用します。そうでなければ、上記のように、値は、na というべきない任意の補足資料で提供されているものも含めてドキュメントで引用されたすべての文献の数値の個数を指定します。このフィールドには、参照テキストが含まれません。

Representative Results

注釈プロセスの例は図 2に示します。このケース22では、細菌の病原細菌病菌 thailandensisによる感染症のプレゼンテーションについて説明します。補足ファイル 1でテキスト形式で提供されますこの CCR の関連する部分の参考のためいくつかの研究成果本報告についても、比較のために含まれています。実習ではプレーンテキスト、HTML または PDF 形式で提供されているレポートを変換するメタデータの抽出の容易さと効率が向上します。 2 セット完了した CCR メタデータアノテーションの例は表 2に提供されます。最初の例は、2 番目の例はまれな条件、肢端皮膚炎炎23を公開された CCR から抽出した値を含まれている各値の理想的なフォーマットを説明するために模擬データです。図 1。ケースレポート注釈ワークフロー。ここで説明したプロトコルでは、テキスト機能臨床症例の内で頻繁に存在を識別するためのメソッドを提供します。このプロセスには、ドキュメントのコーパスのアセンブリが必要です。一度 1 つのファイルにまとめ、注釈プロセスの製品は、医療概念と事例レポートの中でその説明に関連付けられているテキスト機能を同定できます。この図の拡大版を表示するのにはここをクリックしてください。図 2。症例の概念に固有のテキストの識別。ケースレポートのテキストに始まり、手動 annotator が進行、ドキュメントをメタデータテンプレートの各コンポーネントに対応するテキストのセグメントを識別します。識別機能は、青色で強調表示されます。医療の概念に対応するテキストは、赤とその型のラベルが付いた3 番目の列にすべての強調表示されたテキストは、病理タイプを指します。この図の拡大版を表示するのにはここをクリックしてください。カテゴリ説明 ICD 10 章 ICD 10 コードの範囲がんがんや悪性新生物のすべての種類。 II C00 D49 神経脳や背骨、神経の病気の総称です。 VI G00 G99 心血管系心臓や血管系の病気の総称です。血液疾患は含まれません。 IX I00 I99 筋骨格系およびリウマチ性筋肉、骨格、関節や結合組織の病気の総称です。 XIII M00 M99 消化器消化管と肝臓、膵臓など、消化器官の病気の総称です。 XI K00 K95 産科と婦人科妊娠、出産、女性の生殖システムや胸に関する病気。 XIV;XV O00 O9A;N60 N98 感染感染微生物による任意の病気の原因。私 A00 B99 呼吸器肺と気道の病気の総称です。 X J00 J99 血液血液、骨髄、リンパ節や脾臓の病気の総称です。 III D50 D89 腎臓と泌尿器科腎臓や膀胱、尿管、前立腺などの男性生殖器などの病気の総称です。 XIV N00 N53;N99 内分泌代謝性疾患と同様に、内分泌腺の病気の総称です。 IV E00 E89 口腔顎顔面任意の条件は、口の中、顎、頭、顔や首を含みます。 XI;XIII K00 K14;M26 M27 目失明を含む眼を含む任意の条件。 VII H00 H59 耳鼻科耳、鼻および喉の任意の条件。 VIII H60 H95。J30 J39 肌皮膚の病気の総称です。 XII L00 L99 まれな特別なカテゴリ (https://rarediseases.info.nih.gov/diseases を参照)、アメリカ合衆国でより少ない 20万人に影響を与えるものとして定義されている、まれな病気のレポートのために予約 NA NA テーブル 1。ドキュメントへのコメントの疾患のカテゴリ。は以下のカテゴリは、メタデータのドキュメントテンプレートの病気システムデータ型に使用します。各疾患のプレゼンテーションは、複数の器官系や病因を伴うことがありますと単一症例が複数のカテゴリに対応しています。これらのカテゴリは主国際統計分類の病気および関連の健康上の問題のセクションを区別するために使用されるものに従うリビジョン 10 (ICD-10) コードシステム: 対応する ICD 10 章とコードの範囲を提供します。口腔顎顔面の疾患など、いくつかのカテゴリは、ICD 10 システムの複数のセクションに対応します。データ型例 1 例 2 (キャメロン・マクレーン 1986) 文書と注釈の同定内部 ID CCR005 CCR2000 コメント日付 2018 年 3 月 2 日 2018 年 3 月 1 日症例報告識別タイトル性心内膜炎の 1 例。肢端皮膚炎炎の病理組織学的眼。著者グラント ab さん。チャン CD キャメロン JD。マクレーン CJ 年 2017 1986 ジャーナル事例報告と医学の世界ジャーナル眼科学のイギリスジャーナル機関米国、マサチューセッツ州ボストン最初総合病院循環器科・内科ミネアポリス、ミネソタ州 55455 ミネソタ大学医学部眼科学教室対応する著者グラント AB キャメロン JD PMID 25555555 3756122 土井 10.1011/wjmcr.2017.11.001 NA リンク https://www.ncbi.nlm.nih.gov/pmc/articles/PMC9555555/ https://www.ncbi.nlm.nih.gov/pmc/articles/PMC1040795/ 言語英語英語診療内容重要な単語ブルセラ病;心内膜炎;僧帽弁 NA 人口統計学 37 歳男性男性の子地理的な場所フロリダ;リオ・デ・ジャネイロ、ブラジル NA ライフスタイル喫煙者。時折アルコールを飲む NA 家族の歴史血族の両親の 5 人の子供の 3 分弟は慢性湿疹 NA 社会史建設労働者 NA 内科・外科の歴史疲労の歴史合併症のない、完全的妊娠の 8 ポンド 9 オンス (3884 g) 製品とき彼は彼の頬に水疱性の発疹を開発した 1 ヶ月歳まで健康で目、鼻、および口の周りの皮膚を巻き込む発疹が広がる腹部と四肢の皮膚病変が認められたも下痢や発育不全;その時皮膚生検示した異型錯角化症性肢端炎; 典型的です広域スペクトルの抗生物質、母乳、および diodoquin; の断続的なコースの次の 6 年間で扱われる部分的に答えた;合計脱毛症、間欠性肢端、最適体重増加; と断続的な下痢を開発ae による中枢神経系の関与に起因する痙性を時代の 8 ヶ月で開発していた11 ヶ月で心肺停止のいくつかのエピソード彼の声帯の調整の欠如気管;生後 18 カ月子は両側性視神経萎縮、網膜血管の若干の減衰だけでなく、精神障害の兆候に関連付けられている検索眼振を開発しました。両側性角結膜炎。皮膚の発疹。第 2 の皮膚生検 3 歳で再びを示した異型錯角化 ae; 典型的です重度の皮膚発疹、下痢;どのいた完全に彼を; 5 歳で検討した時点で解決した二国間総前歯角膜混濁が見られました。中耳炎、尿路感染症、皮膚感染症を含む頻繁な感染症病気システム心血管;感染消化器;皮膚;目;まれな徴候と症状動悸、前の週の呼吸困難倦怠感、頭痛、悪寒と提示重度眼瞼結膜炎と二国間の前部角膜血管侵入;重度の皮膚発疹、下痢;グラム陰性細菌敗血症;肢端皮膚炎炎、胸腺組織、視神経、視交叉、視索の退化と広範な小脳変性の不在の典型的な皮膚病変併存疾患高血圧;高脂血症 NA 診断のテクニックと手続き身体検査;心電図検査。血液培養眼の検査;剖検診断ブルセラ性心内膜炎肢端皮膚炎炎臨床検査値 c 反応性蛋白 (9 mg/dl); の増加します。アルカリホスファターゼ (250 u/l) NA 病理ブルセラ melitensis が血液サンプルから培養しました。右と左の目外観において類似していた角膜の表面全体に平坦化された扁平上皮細胞の 3 つの細胞層に 1 つの厚さで角膜上皮が減った上皮の極性をすべてが失われました。ボーマン膜は、右の角膜の周辺部にのみ識別できます。左の角膜でボーマン膜を識別できません。どちらの目で識別できる変性も炎症性パンヌス毛様体の円形と斜筋の広範な萎縮レンズ莢膜上皮および初期皮質変性変化のいくつかの後部の移行後極; を通して網膜色素上皮細胞の広範な変性網膜が添付され; 中軽度の自己分解変化を示した後極の桿体と錐体の外側セグメントのいくつかの保存しかし、これらの構造体は赤道; 前方完全に失われました。両方の目の神経節細胞と神経繊維層の広汎な損失ほぼ完全にディスクと隣接する視神経の萎縮薬理学的療法ゲンタマイシン 240 mg/iv/毎日 NA Inverventional 療法人工弁置換術 NA 患者のアウトカム評価回復は順調。退院 1971 年 (7 歳) が死亡診断イメージング/ビデオテープ録画 2; 1; 0; 1 7; 0; 0; 0 その他の症例報告との関係 5555555 23430849 治験との関係 NCT05555123 NA データベースと架橋図書館健康情報: https://medlineplus.gov/ency/article/000597.htm HighWire – PDF: http://bjo.bmj.com/cgi/pmidlookup?view=long&pmid=3756122;ヨーロッパ PubMed 中央: http://europepmc.org/abstract/MED/3756122;遺伝的アライアンス: http://www.diseaseinfosearch.org/result/143 受信確認資金源健康/国立心臓、肺、血液研究所の国立研究所ミネソタ州のライオンズクラブ;失明の予防研究復員軍人援護局;アルコールや他の薬物の乱用のミネソタ州のプログラミング受賞番号 (AG) に R01HL123123 NA 開示/利益の競合グラント博士は、DrugCo のため有料のスポークスマンです。 NA 参照 4 27 表 2。臨床ケースの標準化されたメタデータテンプレートレポートの例注釈。臨床例に共通する機能のセットを報告し、概念レベルの注釈を促進することを示します。このテンプレートは 3 つの主要なセクションに整理される: 識別、医療コンテンツおよび確認、目的と症例報告機能の種類ごとによって与えられる付加的な価値を示します。このテーブルに例注釈、小説の症例報告のいずれかの 2 つのセットが含まれていると、別の条件性肢端炎23レポートから派生。 1 の補足ファイル。臨床症例報告 (チャンらのテキスト2017).ファイルのダウンロードは、こちらをご覧ください。

Discussion

Ccr の標準化されたメタデータのテンプレートの実装は、彼らのコンテンツより公正を作る、彼らの聴衆を拡大および、応用を拡張できます。医療コミュニケーション教育のツールとして Ccr の伝統的な使用は、次の医療研修 (例えば、医学部学生、インターン、および仲間)、生物医学研究者見つけることができます要約のケースレポートの内容を有効にすることより迅速です理解します。Ccr、メタデータ標準の最大の強みは、ただし、ことは解釈のパターンには、観測を分離データ変換をそれ以外の場合インデックスです。このワークフローは、病態の解明や治療効果のより広範な調査または治療監視ポストマーケティングの薬剤疫学的解析から構成されるかどうか、ここで提供されるプロトコルは、Ccr を操作するためのワークフローの最初のステップとして使用できます。Ccr 内で識別される構造の特徴は、病気プレゼンテーションと特に珍しい条件のための治療研究者に有用なリソースを提供できます。臨床研究者は、過去の治療記録された症状や副作用やケアの前の基準の改善の程度を分析するためにデータにあります。また、データは新しい治療法の効果、副作用や毒性の欠如またはターゲティング性別、年齢グループ、または遺伝的背景の差異に基づいてのより広範な分析を運転するかもしれない。

構造化メタデータによって提供される利点は、解析または医療言語をモデルに設計されている計算ワークフローに同様に適用されます。構造化された CCR 機能は、レポート作成者がより簡単に機械可読な提供することが地域の (およびいくつかのケースでは、人間が判読できる) の証拠のコンテンツもあります。Ccr 分散できます明示的に指定された観測の欠如に起因する:例えば、患者さんの正確な年齢が指定されていない可能性があります。同様に、臨床医は診断やその結果は自明と考えられていた場合にテストを述べないことがあります。詳細な分析に必要なギャップの例を提供し、潜在的な改善をハイライト Ccr の構造を適用します。広い視野で医療ドキュメントの構造化されたテキストデータの可用性の向上は、自然言語処理 (NLP) 医療²⁴^,²⁵で大きなデータから学ぶ努力をサポートしています。

Disclosures

The authors have nothing to disclose.

Acknowledgements

この作品は、国民の中心、肺および血の協会によって部分で支えられた: R35 HL135772 (P. Ping のような) に国立総合医学研究所: U54 GM114833 (P. Ping、k. ワトソン、西王し)生体イメージング・生体工学研究所: (A. Bui); する T32 EB016640ホーグ財団と忍博士 Setty; からの贈り物(P. Ping) に UCLA で T.C. Laubisch 基金。

Materials

A corpus of clinical case reports

n/a

Full texts of case reports may be accessed through PubMed (e.g., using the search query "Case Reports"[Filter]), other citation databases such as Europe PMC (https://europepmc.org/) or directly through publishers.

References

Ban, T. A. The role of serendipity in drug discovery. Dialogues in Clinical Neuroscience. 8 (3), 335-344 (2006).
Cabán-Martinez, A. J., García-Beltrán, W. F. Advancing medicine one research note at a time: the educational value in clinical case reports. BMC Research Notes. 5 (1), 293 (2012).
Vandenbroucke, J. P. In Defense of Case Reports and Case Series. Annals of Internal Medicine. 134 (4), 330 (2001).
Bayoumi, A. M. The storied case report. Canadian Medical Association Journal. 171 (6), 569-570 (2004).
Pasteur, L. Méthode pour prévenir la rage après morsure. Comptes rendus de l’Académie des Sciences. 101, 765-774 (1885).
Pearce, J. Louis Pasteur and Rabies: a brief note. Journal of Neurology, Neurosurgery & Psychiatry. 73 (1), 82-82 (2002).
Keefer, C. S., Blake, F. G., Marshall, E. K. J., Lockwood, J. S., Wood, W. B. J. PENICILLIN IN THE TREATMENT OF INFECTIONS. Journal of the American Medical Association. 122 (18), 1217 (1943).
Akers, K. G. New journals for publishing medical case reports. Journal of the Medical Library Association JMLA. 104 (2), 146-149 (2016).
Wilkinson, M. D., et al. The FAIR Guiding Principles for scientific data management and stewardship. Scientific Data. 3, 160018 (2016).
Beeler, G. W. HL7 Version 3-An object-oriented methodology for collaborative standards development. International Journal of Medical Informatics. 48 (1-3), 151-161 (1998).
McDonald, C. J. LOINC, a Universal Standard for Identifying Laboratory Observations: A 5-Year Update. Clinical Chemistry. 49 (4), 624-633 (2003).
. CDC/National Center for Health Statistics ICD-10-CM Official Guidelines for Coding and Reporting Available from: https://www.cdc.gov/nchs/data/icd/10cmguidelines_fy2018_final.pdf (2017)
Rajeev, D., et al. Development of an electronic public health case report using HL7 v2.5 to meet public health needs. Journal of the American Medical Informatics Association. 17 (1), 34-41 (2010).
Biesecker, L. Mapping phenotypes to language: a proposal to organize and standardize the clinical descriptions of malformations. Clinical Genetics. 68 (4), 320-326 (2005).
Riley, D. S., et al. CARE guidelines for case reports: explanation and elaboration document. Journal of Clinical Epidemiology. 89, 218-235 (2017).
Cohen, K. B., et al. Coreference annotation and resolution in the Colorado Richly Annotated Full Text (CRAFT) corpus of biomedical journal articles. BMC Bioinformatics. 18 (1), 372 (2017).
Sun, W., Rumshisky, A., Uzuner, O. Evaluating temporal relations in clinical text: 2012 i2b2 Challenge. Journal of the American Medical Informatics Association. 20 (5), 806-813 (2013).
Savova, G. K., et al. Mayo clinical Text Analysis and Knowledge Extraction System (cTAKES): architecture, component evaluation and applications. Journal of the American Medical Informatics Association. 17 (5), 507-513 (2010).
Soysal, E., et al. CLAMP – a toolkit for efficiently building customized clinical natural language processing pipelines. Journal of the American Medical Informatics Association. 25 (3), 331-336 (2018).
Bender, D., Sartipi, K. HL7 FHIR: An Agile and RESTful approach to healthcare information exchange. Proceedings of the 26th IEEE International Symposium on Computer-Based Medical Systems. , 326-331 (2013).
Chang, K., et al. Human Infection with Burkholderia thailandensis, China, 2013. Emerging Infectious Diseases. 23 (8), 1416-1418 (2013).
Cameron, J. D., McClain, C. J. Ocular histopathology of acrodermatitis enteropathica. British Journal of Ophthalmology. 70 (9), 662-667 (1986).
Maddox, T. M., Matheny, M. A. Natural Language Processing and the Promise of Big Data. Circulation: Cardiovascular Quality and Outcomes. 8 (5), 463-465 (2015).
Kreimeyer, K., et al. Natural language processing systems for capturing and standardizing unstructured clinical information: A systematic review. Journal of Biomedical Informatics. 73, 14-29 (2017).

Play Video

PDF

DOI

DOWNLOAD MATERIALS LIST

Cite This Article

Caufield, J. H., Liem, D. A., Garlid, A. O., Zhou, Y., Watson, K., Bui, A. A. T., Wang, W., Ping, P. A Metadata Extraction Approach for Clinical Case Reports to Enable Advanced Understanding of Biomedical Concepts. J. Vis. Exp. (139), e58392, doi:10.3791/58392 (2018).

臨床症例を有効にするためのメタデータ抽出アプローチ先端医学の概念の理解

Summary

Abstract

Introduction

Protocol

Representative Results

Discussion

Disclosures

Acknowledgements

Materials

References

Tags

Play Video

Cite This Article

View Video

臨床症例を有効にするためのメタデータ抽出アプローチ先端医学の概念の理解

Summary

Abstract

Introduction

Protocol

Representative Results

Discussion

Disclosures

Acknowledgements

Materials

References

Tags

Play Video

Cite This Article

View Video

✖

To prove you're not a robot, please enter the text in the image below