Waiting
Login processing...

Trial ends in Request Full Access Tell Your Colleague About Jove
Click here for the English version

Medicine

Etkinleştirmek klinik olgu sunumları için bir meta veri ayıklama yaklaşım Biyomedikal kavramları anlayış gelişmiş

Published: September 20, 2018 doi: 10.3791/58392

Summary

Biz bir iletişim kuralı ve ilişkili meta veriler şablonu klinik olgu sunumları Biyomedikal kavramları açıklayan bir metin çıkarım için mevcut. Bu protokolü ile üretilen yapılandırılmış metin değerleri derinlemesine analiz klinik anlatıları binlerce destekleyebilir.

Abstract

Klinik olgu sunumları (CCRs) gözlemler ve tıpta anlayışlar paylaşımı değerli bir anlamı vardır. Bu belgeler şeklinde değişir ve içeriklerini açıklamaları içeren çok sayıda, roman hastalık sunumlar ve tedavileri. Şimdiye kadar metin veri CCRs içinde büyük ölçüde yapılandırılmamış, bu veriler derinlemesine analiz için yararlı işlemek için önemli insan ve hesaplamalı çaba gerektiren. Bu protokol için sık sık gözlenen CCRs içinde belirli Biyomedikal kavramlarına karşılık gelen meta veriler tanımlayan yöntemleri açıklanmaktadır. Biz bir meta veri şablonu bir kılavuz olarak belge ek bilgi için CCRs yapısına heybetli el ile ve otomatik çaba kombinasyonları tarafından takip edilebilir bu tanıma sağlar. Burada sunulan yaklaşım uygun metin kavramı ile ilgili organizasyonu için bir büyük edebiyat corpus (Örneğin, binlerce CCRs olan) ancak daha odaklı görevleri veya küçük rapor kümesi kolaylaştırmak için kolayca adapte olabilir. Sonuç yapılandırılmış metin verileri sonraki metni analiz iş akışları çeşitli desteklemek için yeterli anlamsal bağlamda içerir: meta-analizler CCR maksimize etmek nasıl belirlemek için ayrıntılı, epidemiyolojik çalışmalar nadir hastalıklar ve modellerinin geliştirilmesi Tıbbi dil tüm daha gerçekleşebilir ve yönetilebilir yapılandırılmış metin veri kullanımı ile yapılabilir.

Introduction

Klinik olgu sunumları (CCRs) gözlemler ve tıpta anlayışlar paylaşımı için temel bir yol vardır. Bunlar, iletişim ve eğitim klinisyenler ve tıp öğrencileri için temel bir mekanizma olarak hizmet vermektedir. Tarihsel olarak, CCRs aynı zamanda ortaya çıkan hastalıkların hesapları, kendi tedavileri ve onların genetik arka planlar1,2,3,4hazırladık. Örneğin, insan kuduz Louis Pasteur 18855,6 tarafından ilk tedavisinde ve penisilin7 vardı hastalarda ilk uygulama her ikisi de CCRs bildirdi. 1.87 milyondan fazla CCRs aynı derecede-in Nisan 2018, son on yıl içinde yarım milyon ile yayınlanmış; günlükleri yeni mekanları için bu raporları8sağlamak devam etmektedir. Benzersiz olmasına rağmen biçim ve içerik, CCRs büyük ölçüde yapılandırılmamış metin verilerini içeren, geniş bir kelime içeren ve birbiriyle ilişkili olaylar, bunların kullanımı yapılandırılmış bir kaynak olarak sınırlama endişe. Önemli çaba ayrıntılı meta veriler ayıklamak için gereklidir (Yani, "veriler hakkında veri", ya da bu durumda, belge içeriğini açıklamalarını) CCRs gelen ve onları bulunabilmesini, erişilebilir, birlikte çalışabilir ve yeniden kullanılabilir (adil)9 veri olarak kurmak kaynak.

Burada, metin ve sayısal yayımlanmış CCRs içinde belirli Biyomedikal kavramları açıklaması standartlaştırmak için değerleri ayıklamak için bir işlemi açıklar. Bu metodoloji ek açıklama rehberlik için bir meta veri şablonu içerir; Bu işlemine genel bakış için bkz. Şekil 1 . Ek açıklama işlemi uygulama raporları geniş bir koleksiyon için (Örneğin, birkaç bin hastalık sununun belirli bir türdeki) makine sistemi tarafından okunabilen elde derleme açıklamalı klinik metinler, yönetilebilir ve yapılandırılmış bir dizi verir belgeleri ve Biyomedikal olayları her klinik sunu içinde gömülü. HL7 tarafından verilen gibi veri biçimleri rağmen (e.g., sürüm 3 ileti standart10 veya11hızlı sağlık birlikte çalışabilirlik kaynakları [FHIR]), LOINC12ve revizyon 10 Uluslararası istatistik Hastalıkları ve ilgili sağlık sorunları (ICD-10) sınıflandırılması13 sağlayın standartlar tanımlamak ve klinik gözlemler alışverişi için bu veri çevreleyen metin yakalama değil, ne de onlar için içindir. Metodolojimiz sonuçlarını en iyi CCRs yapısına uygulamak ve daha sonraki analiz, normalleştirme kontrollü terimlerini ve kodlama sistemleri aracılığıyla kolaylaştırmak için kullanılır (Örn., ICD-10), ve/veya yukarıda listelenen klinik veri biçimlerini dönüştürme .

CCRs madencilik içinde biyomedikal ve klinik bilişim çalışmalarının etkin bir alandır. Önceki teklif yapısını standartlaştırmak için raporları durumda olsa (Örn., HL7 v2.514 kullanarak veya standart fenotip terminoloji15) övgüye değer, CCRs farklı çeşitli takip etmeye devam büyük olasılıkla vardır doğal dil formlar ve belge düzenleri son yüzyıl için var onlar. İdeal koşullar altında Yeni olgu sunumları yazarlarının kapsamlı olduklarından emin olmak için bakım kuralları16 izleyin. Tıbbi kavramlarına hem doğal dil ve ilişkisi duyarlı yaklaşımlar bu nedenle yeni ve arşivlenmiş raporları ile çalışma en etkili olabilir. CRAFT17 ve bu gibi kaynakları entegre biyoloji için Bilişim tarafından üretilen ve başucu (i2b2)18 küratörlüğü doğal dil işleme (NLP) yaklaşımlar destek henüz CCRs veya klinik anlatıları özellikle odak yok. Benzer şekilde, cTAKES19 ve kelepçe20 gibi tıbbi NLP araçları geliştirilmiştir ancak genellikle belirli sözcükleri veya deyimleri (Örneğin, varlıklar) yaygın olarak CCRs içinde açıklanan genel kavramlar yerine belgeler içinde tanımlamak.

Standart meta veri şablonu yaygın olarak CCRs içinde bulunan özellikleri için tasarladık. Bu şablonu CCRs yapısına dayatmaya özellikleri tanımlar — belge içeriğini ayrıntılı karşılaştırmalar için bir temel öncül-henüz anlamsal bağlamda korumak yeterli esneklik sağlar. Biz el ile ek açıklama ve hesaplama açısından yardımlı metin madenciliği için uygun olacak şekilde bu şablonla ilişkilendirilmiş biçimi tasarladık rağmen özellikle için el ile annotators kolay sağlamıştır. Bizim yaklaşım belirgin çerçeveler FHIR21gibi daha karmaşık gelen (ve bu nedenle, eğitimsiz için hemen anlaşılabilir araştırmacılar daha az) farklıdır. Aşağıdaki iletişim kuralı tek bir CCR, olanlar için karşılık gelen değerleri tek bir set ile her şablon veri türüne karşılık gelen belge özelliklerini yalıtmak nasıl açıklar.

Şablon içinde veri türleri CCRs ve tıbbi belgeleri hasta odaklı için en açıklayıcı genel olarak bunlar. Ek açıklama bu özelliklerin findability, erişilebilirlik, birlikte çalışabilirlik ve CCR metin, yeniden kullanılırlığı öncelikle yapısı vererek teşvik etmektedir. Dört genel kategoride veri türleridir: belge ve ek açıklama tanımlama, olgu sunumu kimlik (Örneğin, belge düzeyi özellikleri), tıbbi içerik kavramları (Öncelikle kavram düzeyinde Özellikler) ve bildirimleri (yani kanıt finansman sağlayan özellikler). Bu ek açıklama işlemde, her belgenin herhangi bir belge içeriği malzeme durum (Örneğin, deneysel protokoller) bağımsız atlama bir CCR tam metnini içerir. CCRs genellikle az 1.000 kelime vardır; tek bir corpus ideal aynı bibliyografik veritabanı tarafından dizine olmamalıdır ve yazılı dilde olması.

Yaklaşım CCR corpus için uygulandığında burada, açıklanan ürün ek açıklama eklenen klinik metin yapılandırılmış bir kümesidir. Bu yöntem tamamen el ile yapılabilir ve etki alanı uzmanları Bilişim deneyimin olmadan gerçekleştirmesi için tasarlanmış olsa da, yukarıda belirtilen doğal dil işleme yaklaşımlar tamamlar ve veri için uygun sağlar sayısal analiz. Bu tür analizleri kitlelere olanlar da dahil olmak üzere CCRs, sık sık okumak ötesinde araştırmacıların ilgi olabilir:

  • Bu hastalık sunumlar, anahtar symptomology, her zamanki tanı yaklaşımları ve tedavileri ile ilgili
  • isteyenler klinik edebiyat içinde açıklanan olaylarla klinik sonuçlarını karşılaştırmak için potansiyel olarak ek gözlemler ve büyük istatistiksel güç sağlayan.
  • Biyoinformatik, biyomedikal Bilişim ve yapılandırılmış Tıp dili veri kümeleri veya tıbbi anlatıların üst düzey anlayış isteyen bilgisayar bilim araştırma
  • Hükümet politikası araştırmacılar ne kadar klinik denemeler üzerinde odaklanarak en iyi yansıtabilir nasıl tanı ve tedavi olarak gerçekte oluşur

CCRs yapısına uygulayan tıbbi dil ve Biyomedikal olayları daha iyi anlamak için çok sayıda sonraki çabalarını destekleyebilir.

Protocol

1. belge ve ek açıklama tanımlama

Not: Bu kategorideki değerleri ek açıklama işlemi destekler.

  1. Ek açıklama şablonu kullanarak, bu meta verileri için belirli bir tanımlayıcı kümesi, Örneğin, Case123sağlar. Tanımlayıcı biçiminde (Örneğin, Case001 Case500yoluyla) proje boyunca tutarlı olmalıdır.
  2. Üzerinde bir belge okumak ve açıklamalı tarihi belirtin. "Jan 10 2018" benzeyen bir biçim tutarlılığı ve okunabilirlik için kullanın.

2. olgu sunumu tanımlama

Not: Bu kategorideki değerleri belge düzeyi özellikleri sağlar ve bir belgenin findability katkıda.

  1. Karşıdan karşıya tüm ek açıklamalar her alanın biçimi ile tutarlı olması, Örneğin, tek tek değerleri noktalı tüm girişleri aşağıdaki boşluksuz tarafından ayrılmalıdır. Bu bir bibliyografik veritabanı MEDLINE gibi kullanılan özgün belge veya kullanılan aynı biçimleri kullanın.
  2. Belgenin başlığı sağlar.
  3. Sağlanan sırayla belgenin tüm yazarların isimleri sağlar. Tüm adları biçimi normalleştirmek, öyle ki tüm adları baş harfleri herhangi bir sayı ile tek bir son adı biçiminde, Örneğin Jane B. Park Park JBolur. Başlıklar dahil etmeyin. John A. Smith, Jane B. Park alır Smith JA şeklinde olduğunu birden çok yazar olmadan ek noktalama, noktalı virgül ile ayırın; Park JB
  4. Belgenin yayınlanması yıl sağlar.
  5. Belgenin yayımlandığı günlüğün tam başlık sağlayın. Kontrollü günlük adlarının bir listesini NLM Katalog (https://www.ncbi.nlm.nih.gov/nlmcatalog). tarafından sağlanan
  6. Belgede belirtilen belge yazarlarının ev kurumun adresi sağlayın. Bu bölümler, coğrafi konumları ve posta adresi ayrıntıları içerebilir.
    1. Birden fazla yerde verdiyse (Üyelikler yazarlar arasında farklı olursamesela ), yalnızca ayrıntıları ilgili yazar için belirtin. Bir yazarın tanımlanamıyorsa, bu ilk yazarın kullanın veya bir kurum belirtmeyin. Bir yazarın birden fazla üyelikler varsa, her ikisi de belirtin ve noktalı virgülle ayırın.
  7. Yazarın yazarlar veri türü kullanılan olarak aynı biçimi kullanan belge başlık içinde belirtildiği gibi belgenin sağlar.
  8. Bir belge tanımlayıcısı (Örneğin, bir PMID) sağlar.
  9. Dijital bir nesne tanıtıcısı nerede mümkün ve kullanılabilir, belgeye çözülebilir URL (https://www.doi.org/) aracılığıyla, PubMed orta sayfa.
  10. Varsa belgenin tam metni için istikrarlı bir URL sağlamak. Erişilebilirlik en üst düzeye çıkarmak için bu PubMed orta sürüme bakınız.
  11. Belgenin dil sağlar. Her ikisi de birden çok dilde belgeler sağlamak için noktalı virgülle ayrılmış.

3. tıbbi içerik

Not: Bu kategorideki değerleri belge düzeyi, kavram düzeyi ve metin düzey özelliklerini tanımlayın. Onlar bir belgenin erişilebilirlik, birlikte çalışabilirlik ve yeniden kullanılabilirliği arttırmak için hizmet vermektedir. Bu özellikler belge içeriği, biyomedikal konular ve olaylar odaklanarak arasındaki kavramsal ve anlamsal benzerlikler gözlemlemek için yollar sağlar. Bu bölümdeki en Kategoriler birden çok metin ifadeleri içerebilir ve her bir noktalı virgül kullanarak ayrılmış.

  1. Bağlamsal ayrıntı her alanına dahil (Örneğin, "annem vardı meme kanseri 50 yaşında") sadece kontrollü bir kelime şartlarından sağlayarak yerine (Örneğin, değil "meme kanseri" yalnız). Her gözlemin ötesinde ayrıntılı bilgi içerir.
  2. Sık tekrarlanan kelime ve deyimler (Örneğin, zamirler, kelime "hasta" ve "şikayet" ifadeler veya "ile sunulan") atlayın. Öznellik birden çok annotators arasında olası olsa da, birden çok annotators her belge için ve veri toplama sonra otomatik normalleştirme aracılığıyla alarak azaltılabilir. Hesaplamalı post-processing yaklaşımlar daha sonraki analiz ihtiyaçlarına göre değişiklik gösterir ve burada ayrıntılı olarak ele değil.
  3. Ek açıklama şablonunda aşağıdaki bilgileri sağlayın.
    1. Bir belgede, genellikle kendi başlık içinde anahtar terimler tanımlanan belirli koşulları sağlamak. Şartlar noktalama içerebilir gibi noktalı virgülle ayırın.
    2. Demografik değerleri, özel olarak açıklayan bir hastanın arka plan, seks ve/veya cinsiyet, yaş, etnik köken veya Milliyet de dahil olmak üzere herhangi bir metin ifadeleri ekleyin.
    3. Belirli kurum adresleri dışında klinik anlatı içinde belirtilen coğrafi konumları sağlar. Bu anatomik mekanlar/parçalar içermemesi gerekir, ancak nerede hasta bulunmasına veya seyahat herhangi bir coğrafi yerel ayar içerebilir.
    4. Sık sık hasta faaliyetleri veya davranışları onların genel sağlık için ilgili açıklayan bir metin deyimleri dahil olmak üzere yaşam tarzı değerleri sağlar. Uygulamada, bu sık sık sigara veya alkol tüketim alışkanlıkları ile ilgili ama aynı zamanda güneşe maruz kalma, diyet ve fiziksel aktivite olan belirli frekans içerebilir.
    5. Aile öyküsü için başvuran tıp tarihi değerleri sağlar. Herhangi bir klinik gözlemleri açıklayan metin ifadeleri ve kardeşleri, anne ve diğer aile üyeleri tarafından deneyimli olayları içerir. Bu genetik koşullar ve negatif gözlemler (Yani, Aile öyküsü için negatif bir hastalık) içerir.
    6. Sosyal Tarih demografi veya yaşam tarzı yer almayan hasta arka plan tanımlayan herhangi bir metin dahil atıfta değerleri sağlar. Bu kategoriler arasında içerik çakışıyor olabilir. İfadeleri iş geçmiş ve sosyal alışkanlıkları içerebilir.
    7. Hastanın tıbbi ve cerrahi tarihine atıfta değerleri sağlar. Herhangi bir tıbbi gözlem, tedaviler veya diğer olaylar meydana önce klinik sununun başına tanımlayan herhangi bir metin ifadeleri içerir. Bu obstetrik geçmiş ve iyi bir sağlık, süreler içerir belirtilen yerler.
    8. Aşağıdakilerden birini veya birkaçını aşağıdaki 16 hastalığı sistem kategorileri belirtin. Bu değerler serbest metin yerine kategorik olduğunu unutmayın. Kategoriler kapsamlı değildir ama Olaylar tarafından etkilenen sistemlerin çoğu klinik sunuda açıklanan belirtmelidir ve hastalığı teşhis.
      1. Takip kategorilere göre kategoriler, belirli bir grup uluslararası istatistik sınıflandırma hastalıkları ve ilgili sağlık sorunları, gözden geçirme 10 (ICD-10) kod sistemi kullanılır. Karşılık gelen ICD-10 kodu aralıkları ile birlikte hastalık sistem kategori listesi için bkz. Tablo 1 .
    9. Tüm işaretler ve belirtiler. ayrıntılarını sağlamak Herhangi bir tıbbi gözlem işaretleri veya onların başlangıçlı, süresi, şiddeti ve çözünürlük, eğer sağlamak da dahil olmak üzere başlangıç sunumunu başlayan belirtiler açıklayan herhangi bir metin ifadeleri içerir. Sonuç açıklanan belirtiler eklemeyin. Belirtiler tarihinin ilk tanıtımı için devam ederseniz bu değerler diğer türleri ile çakışabilir.
    10. Herhangi bir comorbidities ayrıntılarını sağlamak. Tüm terimleri veya tümcecikleri farklı hastalıkların başlangıç klinik sunumunu anda mevcut açıklayan içerir. Orada 's bu değerleri ve bu klinik tarihinin arasında büyük olasılıkla örtüşme ektanı şartları aynı bu tanı içermemesi gerekir.
    11. Ayrıntılar tüm tanılama teknikleri ve yordamlar sağlanmaktadır. Sınavlar, testler ve görüntüleme yanı sıra koşullar altında gerçekleştirilen ve ilgili anatomik konumları (Örneğin, "üst ekstremite venöz bu testler vardı da dahil olmak üzere tanılama amacıyla yapılan tıbbi prosedürler adlarını içerir Ultrason"). Test sonuçları hariç.
    12. Tanı ayrıntılarını sağlamak. Son tanı belirsiz olsa bile tanı hastalığın, tanımlayan herhangi bir metin ifadeleri içerir.
    13. Tüm laboratuar değerlerini sağlamak ve test sonuçları. Tanı sınamaları, değerler ve koşullar altında gerçekleştirilen adlarını içerir. Bu tanılama teknikleri ve yordamları veri türü kullanılan terimler ile örtüşme içerecektir. Sayısal ve niteliksel değerleri (Örneğin, tam kan sayımı normal sınırlar içinde olduğunu) vardır kabul edilebilir. Tanı sınamaları adları sağlanmazsa, belirti ve bulgular Ayrıca eklenmelidir rağmen sonuçları (Örneğin, lökopeni), açıklayan terimleri kullanın.
    14. Patoloji ayrıntılarını sağlamak. Brüt patoloji, immünoloji ve mikroskopisi çalışmaları da dahil olmak üzere patoloji ve histoloji çalışmaların sonuçları açıklayan herhangi bir metin ifadeleri içerir. Şartlar tanılama teknikleri ve prosedürleri (adım 3.11), Örneğin, biyopsi gibi örneklerini almak için gerçekleştirilen yordamlar ile kullanılan ile çakışabilir.
    15. Tüm farmakolojik tedaviler sağlar. Antibiyotik veya özel uyuşturucu adları. gibi genel terimler dahil tedavi sırasında kullanılan ilaç tedavileri tanımlayan herhangi bir metin ifadeleri içerir Ayrıca, ne zaman ve nasıl ilaç durdurmuş açıklamalar içerir.
    16. Tüm girişimsel yordamlar sağlar. İnvaziv yordamlar, dahil tedavi, tıbbi cihazlar ve diğer tedaviler kolaylaştırmak için neler yordamlar implantasyonu sırasında kullanılan tedavi prosedürlerinin tanımlayan herhangi bir metin ifadeleri içerir. Ayrıca, açıklamaları gerektiğinde ne zaman ve nasıl devam eden tedavi prosedürlerinin durdurmuş, dahil.
    17. Hasta sonuç sağlar. Hastanın herhangi bir izleme testleri de dahil olmak üzere raporda açıklanan klinik sunu sonu itibariyle sağlık açıklayan herhangi bir metin ifadeleri içerir.
    18. Tüm tanı resim, resimler, videolar/animasyonlar ve tablo kez sağlar. Görsel medya aşağıdaki biçimi rapora dahil tüm sayıları dahil: sayısını görüntüler; Rakamlar sayısı; Video veya animasyon sayısı; Tablolar sayısı.
      1. Görüntüleri ve resimler arasındaki farkı bu şekilde: görüntüleri dahil Klinik teşhis, fotoğraflar, Filmler, elektrokardiyogram ritim görüntüleri ve rakamlar başka görüntüleri ise tanı, görüntüleme ve diğer ürünleri de dahil olmak üzere herhangi bir ürün genellikle veri araziler ve resimler de dahil olmak üzere.
    19. Kanıt ilişkilerin diğer CCRs sağlamak. Bu alan tanımlayıcıları (Örneğin, PMIDs) diğer Özet Tablo raporları veri kümesi tarafından atıf ya da bu raporu başvuru içerebilir.
    20. Klinik deneyler için ilişkilerin kanıt. Bu alan klinik çalışmalarda bu CCR gerekçe göstererek tanımlayıcısını içerebilir. Denemeler NCT tarafından öncesinde kendi ClinicalTrials.gov tanımlayıcıları veya başka istikrarlı bir tanımlayıcı tarafından tanımlayın.
    21. Tanımlayıcılar, tercihen olarak veritabanı adları da dahil olmak üzere bu belgeye karşılık gelen veritabanı Glossar içerir ve URL'leri istikrarlı.

4. ilgili kaynaklar

Notlar: Bu kategorideki değerleri belge düzeyi özelliklerini tanımlama henüz yayınları arasında küçük tutarlı yapıya sahip. Onlar bir CCR ve ilgili çalışma için destek sağlayan kuruluşlar ile ilgili ayrıntılı bilgi sağlar. Bu kategoride de başvurular tarafından bir makale Year toplam sayısı için bir alan vardır: Bu herhangi bir tür Biyomedikal diğer belgelerle kavramsal ilişkileri olan bir belge derecesi, kaba ölçülü sağlamak amacıyla hazırlanmıştır. Bu bölümde dört veri türleri içinde aşağıdakileri sağlar.

  1. İş destekleyen ve karşılık gelen tüm finansman kaynakları yanı sıra ilgili Ödülü sayılar PI belirtin. İlk değer, finansman kaynağı, tüm kuruluşlar için iş finansal destek sağlayan adlarını içermelidir.
    1. Noktalı virgül ve boşluk, Örneğin, Ulusal kurumları Sağlık/Ulusal Kanser Enstitüsüile ayrı kuruluşlar; DOE; Smith-Park Vakfı .
    2. Ödülü numarası, aşağıdaki değeri belirtmek için herhangi bir ödül numaraları veya belirli Tasarım Ödülleri alıcıları ile birlikte sağlanan, nerede, baş harfleri alıcıların parantez içinde Örneğin, R01HL123123 (JP için) uygun , NS12312 (JP, JS), Araştırma Eğitim Bursu (JS için). Yazarlar açıkça ilgili hiçbir bilgi kullanılabilir durum (Örneğin, "hiçbir fon aldı"); Bu gibi durumlarda, yazarlar tarafından finansman kaynağı değeri olarak sağlanan metin kullanın. Aksi takdirde, değer na olmalıdır
  2. Yazarlar, Örneğin, JP DrugCo için bir danışmandırtarafından belirtilen açıklamalar/ilgi çatışmaları belirtin. Yazarlar açıkça ilgili hiçbir bilgi kullanılabilir durum (Örneğin, "hiçbir çıkar çatışması ilan"); Bu gibi durumlarda, faiz değer açıklamaları/çatışma yazarlar tarafından sağlanan metin kullanın. Aksi takdirde, yukarıdaki gibi değer na olmalıdır
  3. Tarafından sağlanan ek materyalleri dahil değil belgenin atıf yapılan tüm başvurular sayısal sayısını belirtin. Hiçbir başvuru metni bu alana dahil edilmelidir.

Representative Results

Ek açıklama işleminin bir örneği Şekil 2' de gösterilmiştir. Bu durumda22 sunuyu enfeksiyon Bakteriyel pathogen Burkholderia thailandensistarafından açıklanır. Başvuru için bu CCR ilgili bölümünü ek dosya 1düz metin biçiminde sağlanır; Bazı araştırma bulguları da bu raporda sunulmaktadır ve karşılaştırma için yer almaktadır. Uygulamada, verimlilik ve meta veriler çıkarma kolaylığı için düz metin HTML veya PDF biçiminde sağlanan raporları dönüştürme artırabilir.

Tamamlanan CCR meta veriler ek açıklamalar, iki kümesinden örnek Tablo 2' de verilmiştir. Bu örnekleri içerirken ikinci örnek, nadir bir koşulu, acrodermatitis enteropathica23yayımlanmış bir CCR çıkarılan değerler her bir değerin, ideal format göstermek için sahte veri ilkidir.

Figure 1
Şekil 1. İş akışı için olgu sunumu ek açıklama. Burada açıklanan protokol metin özellikleri içinde klinik olgu sunumları sık mevcut tanımlaması için bir yöntem sağlar. Bu işlem bir belge corpus Meclisi gerektirir. Ek açıklama sürecinin bir kez tek bir dosyaya toplanan ürün tanımlaması tıbbi kavramları ve olgu sunumları içinde açıklamaları ile ilgili metin özellikleri izin verir. Bu rakam daha büyük bir versiyonunu görüntülemek için buraya tıklayınız.

Figure 2
Şekil 2. Klinik olgu sunumu kavramı özgü metin tanımlaması. Olgu sunumu metinle başlayan, bir el ile tanımlık-ilerleme belge içinde meta veriler şablonu her bileşen için karşılık gelen metin parçalarını tanımlayan. Kimlik özellikleri mavi renkle vurgulanır. Tıbbi kavramlara karşılık gelen metin kırmızı ve onların türüyle etiketli vardır; Üçüncü sütunda tüm Vurgulanan metni patoloji türünü gösteriyor. Bu rakam daha büyük bir versiyonunu görüntülemek için buraya tıklayınız.

Kategori Açıklama ICD-10, Bölüm ICD-10 kodu aralığı
kanser Her tür kanser veya malign neoplazmı. II C00-D49
gergin Herhangi bir hastalık beyin, omurga veya sinirler. VI G00-G99
kardiyovasküler Herhangi bir hastalık kalp veya damar sistemi. Hematolojik hastalıklar içermez. IX I00 I99
Kas-iskelet ve romatizmal Kas, iskelet sistemi, eklem ve bağ dokusu herhangi bir hastalik. XIII M00 M99
sindirim Gastrointestinal sistem ve sindirim organları, pankreas ve karaciğer de dahil olmak üzere herhangi bir hastalık. XI K00-K95
Obstetrik ve jinekolojik Hamilelik, Doğum, kadın üreme sistemi veya göğüsler ilgili herhangi bir hastalık. XIV; XV O00-O9A; N60-N98
bulaşıcı Herhangi bir hastalığı bulaşıcı mikroorganizmalar tarafından neden olur. Ben A00-B99
Solunum Herhangi bir hastalık akciğer ve solunum yolları. X J00-J99
hematolojik Herhangi bir hastalığı kan, kemik iliği, lenf düğümleri veya dalak. III D50-D89
böbrek ve dahi Böbrekler veya mesane, üreter, aynı zamanda prostat dahil olmak üzere erkek üreme organları da dahil olmak üzere herhangi bir hastalık. XIV N00-N53; N99
Endokrin Herhangi bir hastalık metabolik bozukluklar yanı sıra endokrin bezlerin. IV E00-E89
Oral ve Maksillofasiyal Cerrahi Ağız, jaws, baş, yüz veya boyun içeren herhangi bir durum. XI; XIII K00-K14; M26-M27
göz Körlük de dahil olmak üzere gözleri içeren herhangi bir durum. VII H00-H59
otorhinolaryngologic Kulak, burun ve/veya boğaz herhangi bir durum. VIII H60-H95; J30-J39
Cilt Herhangi bir hastalık deri. XII L00-L99
nadir Raporlar bu az 200.000 (bkz. https://rarediseases.info.nih.gov/diseases) Amerika Birleşik Devletleri bireylerde etkileyen olarak tanımlanan nadir hastalıklar için ayrılmış özel bir kategoride NA NA

Tablo 1. Hastalık kategorileri belge ek açıklama için. Burada listelenen kategorilerden bu hastalık sistem veri türü belge meta veri şablonu için kullanılmak üzere vardır. Her hastalık sunum ücretli olabilecek birden fazla organ sistemleri veya etiologies gibi tek bir klinik vaka rapor birden çok kategoriye karşılık. Bu kategoriler büyük ölçüde bu bölümleri Uluslararası istatistik sınıflandırma hastalıkları ve ilgili sağlık sorunları, ayırt etmek için kullanılan izleyin gözden geçirme 10 (ICD-10) kod sistemi: karşılık gelen ICD-10 bölüm ve kodu aralıkları sağlanmaktadır. Bu hastalık, oral ve Maksillofasiyal Cerrahi için gibi bazı kategoriler ICD-10 sistemi birden çok bölüm için karşılık gelir.

Veri türü Örnek #1 Örnek #2 (Cameron ve McClain 1986)
Belge ve ek açıklama tanımlama
Dahili kod CCR005 CCR2000
Ek açıklama tarihi Mar 2 2018 Mar 1 2018
Olgu sunumu tanımlama
Başlık Endokardit Olgusu. Acrodermatitis enteropathica oküler histopatoloji.
Yazarlar Grant AB; Chang CD Cameron JD; McClain CJ
Yıl 2017 1986
Günlük Dünya Dergisi tıp ve olgu sunumları Oftalmoloji İngiliz dergisi
Kurum Bölümü Tıp Fakültesi, Kardiyoloji, ilk General Hospital, Boston, Massachusetts, ABD bölümü Bölümü Oftalmoloji, Minnesota Üniversitesi Tıp Fakültesi, Minneapolis, Minnesota 55455
Sorumlu yazar Grant AB Cameron JD
PMID 25555555 3756122
DOI 10.1011/wjmcr.2017.11.001 NA
Bağlantı https://www.ncbi.NLM.nih.gov/pmc/articles/PMC9555555/ https://www.ncbi.NLM.nih.gov/pmc/articles/PMC1040795/
Dil İngilizce İngilizce
Tıbbi içerik
Anahtar kelimeler brusella; Endokardit; Mitral kapak NA
Demografi 37 yaşında erkek erkek çocuk
Coğrafi konumları Florida; Rio de Janeiro, Brezilya NA
Yaşam tarzı Sigara içen; içecekler alkol bazen NA
Aile öyküsü üçüncü düşündürmekteyse anne beş çocuk; küçük kardeşi kronik egzama var NA
Sosyal Tarih İnşaat işçisi NA
Tıp/Cerrahi tarihi yorgunluk tarihçesi bir komplikasyonsuz, tam dönem gebeliğin 8 Lirası 9 ons (3884 g) ürün; yaş 1 ay ne zaman o kavurucu cilt onun yanaklarda kurdeşen kadar iyi günlerde; döküntü gözler, burun ve ağız çevresindeki deri dahil etmek yaymak; deri lezyonlari da karın ve kol ve bacaklar üzerinde kaydedilmiştir; ishal ve başarısızlık gelişmek için; o zaman cilt biyopsisi parakeratosis acrodermatitis enteropathica tipik gösterdi; geniş spektrumlu antibiyotikler, anne sütü ve diodoquin aralıklı kursları ile önümüzdeki altı yıl içinde tedavi; kısmen yanıt verdi; Toplam saç dökülmesi, aralıklı acrodermatitis ve aralıklı ishal suboptimal kilo alımı ile geliştirilen; santral sinir sistemi tutulumu ae tarafından atfedilen spastisite tarafından 8 ay-in yaş geliştirmişti; 11 ay, kardiyopulmoner arrest çeşitli bölümlerini; Ses tellerini koordinasyon eksikliği; Trakeostomi; Yaş 18 ay tarafından arama nistagmus bilateral optik atrofi ve retina damarları hafif zayıflama yanı sıra psikomotor retardasyon belirtileri ile ilgili çocuk geliştirilen; ikili keratokonjonktivit; deri döküntüsü; 3 yaşında ikinci cilt biyopsisi yine parakeratosis ae için tipik gösterdi; şiddetli deri döküntüsü ve ishal; ikili brüt ön korneal opaklıklar hangi tamamen yaş beşte reexamined zaman tarafından çözüldü görüldü; otitis media, idrar yolu enfeksiyonları ve deri enfeksiyonları gibi sık enfeksiyonlar
Hastalık sistemi kardiyovasküler; bulaşıcı sindirim; Cilt; göz; nadir
Belirti ve bulgular çarpıntı ve önceki hafta içinde dispne; uyuşukluk, baş ağrısı ve titreme ile sunulan şiddetli blepharoconjunctivitis ve ikili ön korneal vascularisation; şiddetli deri döküntüsü ve ishal; Ayagin Gram-negatif bakteri sepsis; deri lezyonlari tipik acrodermatitis enteropathica, devamsızlık timik doku, görme sinirini, hemisferlerine ve optik yolları belirgin dejenerasyon ve geniş serebellar dejenerasyon
Ektanı hipertansiyon; hiperlipidemi NA
Tanılama teknikleri ve prosedürleri Fizik muayene; elektrokardiyografi; kan kültürü oküler muayene; Nekropsi
Tanı Brusella endokarditine Acrodermatitis enteropathica
Laboratuvar değerleri c - reaktif protein (9 mg/dl); artırmak alkalen fosfataz (250 u/l) NA
Patoloji Brusella melitensis kan örnekleri kültürlü sağ ve sol gözü görünüşte benzer vardı; kornea epitel kornea tüm yüzey üzerinde kalınlıkta bir üç hücre katmanları düzleştirilmiş skuamöz epitel hücrelerinin düşürüldü; epitel tüm polarite kayboldu. Bowman'ın membran sadece doğru kornea çevre belirlenmiştir. hiçbir bowman'ın membran sol kornea belirlenmiştir. ne de enflamatuar dejeneratif pannus her iki gözünün içine belirlenmiştir; geniş atrofi silier vücut dairesel ve oblik kas; Bazı posterior göç objektif kapsüler epitel ve erken kortikal dejeneratif değişiklikler; geniş dejenerasyonu retina pigment epiteli arka kutup boyunca; Retina bağlı ve boyunca hafif autolytic değişiklikleri gösterdi; arka direğe çubuk ve koni dış kesimlerinde bazı korunması ancak, bu yapıların anterior Ekvator tamamen kayboldu; kapsamlı kaybı her iki gözde ganglion hücre ve sinir fiber kat; disk ve bitişik optik sinir neredeyse tamamlandı atrofi
Farmakolojik tedavi viomisin 240 mg/IV/günlük NA
Inverventional tedavisi protez kapak replasmanı NA
Hasta sonuç değerlendirmesi Kurtarma olaysız; Ordudan terhis edilen ana sayfa (7 yaş) 1971 yılında öldü
Tanı görüntüleme/video kaset kayıt 2; 1; 0; 1 7 0 0; 0
İlişki diğer olgu sunumları için 5555555 23430849
Clinial deneme ile ilişkisi NCT05555123 NA
Crosslink veritabanı ile MedlinePlus sağlık bilgi: https://medlineplus.gov/ency/article/000597.htm HighWire - PDF: http://bjo.bmj.com/cgi/pmidlookup?view=long&pmid=3756122; Europe PubMed Merkez: http://europepmc.org/abstract/MED/3756122; Genetik İttifak: http://www.diseaseinfosearch.org/result/143
İlgili kaynaklar
Finansman kaynağı Sağlık/Ulusal Kalp, akciğer ve kan Enstitüsü Ulusal Enstitüleri Minnesota Lions Kulüp; Araştırma körlüğü önlemek için; Gaziler İdaresi; Alkol ve diğer uyuşturucu ofisi kötüye Minnesota eyaletinde programlama
Ödül sayısı R01HL123123 (AG için) NA
Açıklamalar/çatışma ilgi Doktor Grant DrugCo ücretli sözcüsü olduğunu. NA
Referanslar 4 27

Tablo 2. Klinik vaka için standart meta veri şablonu raporlar, örnek ek açıklamalarla. Klinik vaka için ortak özellikler kümesini raporlar ve onların kavram düzeyinde ek açıklamaları kolaylaştırmak burada gösterilir. Bu şablonu üç birincil bölümler halinde düzenlenmiştir: kimlik, tıbbi içerik ve ilgili kaynaklar, amaç ve olgu sunumu özelliği her tür tarafından tanınan ek değer ifade eden. Bu tablo örnek ek açıklamaları, kurgusal bir olgu sunumu, biri iki kümesi içerir ve başka bir koşul acrodermatitis enteropathica23bir rapordan türetilmiş ayarla.

Ek dosya 1. Metin klinik olgu sunumu (Chang vd. 2017). bu dosyayı indirmek için buraya tıklayınız.

Discussion

Standart meta veri şablonu uygulanması için CCRs onların içerik daha adil yapmak, onların kitle genişletin ve uygulamalarını genişletmek. CCRs tıbbi iletişim eğitim araçları olarak geleneksel kullanımı, Sağlık Eğitim (Örneğin, tıp öğrencileri, stajyerler ve arkadaşlarının) ve Biyomedikal araştırmacıları özetlenen olgu sunumu içeriği etkinleştirmek daha hızlı bulabilirsiniz anlama. En büyük gücü ile CCRs, meta veriler belirli ancak, bu veri dönüşümler Aksi takdirde dizin oluşturma gözlemler yorumlanabilir kalıpları içine izole olduğunu. Bu iş akışı epidemiyolojik analizi, pazarlama sonrası ilaç veya tedavi gözetim veya daha geniş araştırmalar Patogenez veya tedavi edici etkinliği oluşur olup olmadığını burada sağlanan iletişim kuralı CCRs ile çalışmak için bir iş akışı için ilk adım olarak hizmet verebilir. Yapısal özellikler CCRs içinde tanımlanan hastalık sunumlar ve tedavisi, nadir koşulları özellikle odaklanarak araştırmacılar için yararlı bir kaynak sağlayabilir. Klinik araştırmacılar veri kaydedilmiş belirtiler ya da yan etkileri ve bakım altında önceki standartları geliştirme derecesini çözümlemek için son tedavi rejimleri bulabilirsiniz. Verileri da daha geniş analizler yeni tedavilerin etkinliğini, yan etkileri ya da toksisite, eksikliği veya cinsiyet, Yaş grubu ya da genetik arka plan farklılıkları hedefleme uyuşturucu temel kullanıyor.

Yapılandırılmış meta verileri tarafından sağlanan yararları benzer şekilde ayrıştırma veya tıbbi dil modelleme için tasarlanmış Hesaplamalı iş akışları için geçerlidir. Yapılandırılmış CCR özellikleri de kanıt nerede rapor yazarları daha kolay makine sistemi tarafından okunabilen sağlayabilir alanların (ve bazı durumlarda, okunabilir) içeriği sağlayabilir. CCRs arasında farkı açıkça sağlanan gözlemler eksikliğinden neden olur: bir hastanın kesin yaş belirtilen mesela . Tanılama veya bunların sonuçları önemsiz kabul edildi Eğer benzer şekilde, klinisyenler testleri kızlar. Boşluklar derinlemesine analiz için gerekli örnekleri sağlayarak, CCRs yapısına uygulayan potansiyel iyileştirmeler vurgulamaktadır. Daha geniş bir perspektif içinde doğal dil işleme (NLP) çabaları sağlık24,25büyük veri öğrenmek için yapılandırılmış metin veri tıbbi belgelerden daha fazla kullanılabilirlik destekler.

Disclosures

Yazarlar ifşa gerek yok.

Acknowledgments

Bu eser kısmen Ulusal Kalp, akciğer ve kan Enstitüsü tarafından desteklenmiştir: R35 HL135772 (için s. Ping); Genel tıbbi Bilimler Ulusal Enstitüsü: U54 GM114833 (için s. Ping, K. Watson ve W. Wang); Ulusal Enstitüsü Biyomedikal görüntüleme ve Biyomühendislik: T32 EB016640 (için A. Bui); Hoag Vakfı ve Dr. S. Setty hediyesi; ve UCLA (için s. Ping) T.C. Laubisch bağış.

Materials

Name Company Catalog Number Comments
A corpus of clinical case reports n/a n/a Full texts of case reports may be accessed through PubMed (e.g., using the search query "Case Reports"[Filter]), other citation databases such as Europe PMC (https://europepmc.org/) or directly through publishers.

DOWNLOAD MATERIALS LIST

References

  1. Ban, T. A. The role of serendipity in drug discovery. Dialogues in Clinical Neuroscience. 8 (3), 335-344 (2006).
  2. Cabán-Martinez, A. J., García-Beltrán, W. F. Advancing medicine one research note at a time: the educational value in clinical case reports. BMC Research Notes. 5 (1), 293 (2012).
  3. Vandenbroucke, J. P. In Defense of Case Reports and Case Series. Annals of Internal Medicine. 134 (4), 330 (2001).
  4. Bayoumi, A. M. The storied case report. Canadian Medical Association Journal. 171 (6), 569-570 (2004).
  5. Pasteur, L. Méthode pour prévenir la rage après morsure. Comptes rendus de l'Académie des Sciences. 101, 765-774 (1885).
  6. Pearce, J. Louis Pasteur and Rabies: a brief note. Journal of Neurology, Neurosurgery & Psychiatry. 73 (1), 82-82 (2002).
  7. Keefer, C. S., Blake, F. G., Marshall, E. K. J., Lockwood, J. S., Wood, W. B. J. PENICILLIN IN THE TREATMENT OF INFECTIONS. Journal of the American Medical Association. 122 (18), 1217 (1943).
  8. Akers, K. G. New journals for publishing medical case reports. Journal of the Medical Library Association JMLA. 104 (2), 146-149 (2016).
  9. Wilkinson, M. D., et al. The FAIR Guiding Principles for scientific data management and stewardship. Scientific Data. 3, 160018 (2016).
  10. Beeler, G. W. HL7 Version 3-An object-oriented methodology for collaborative standards development. International Journal of Medical Informatics. 48 (1-3), 151-161 (1998).
  11. HL7 FHIR Release 3 (STU; v3.0.1-11917). , Available from: http://hl7.org/implement/standards/fhir/ (2018).
  12. McDonald, C. J. LOINC, a Universal Standard for Identifying Laboratory Observations: A 5-Year Update. Clinical Chemistry. 49 (4), 624-633 (2003).
  13. CDC/National Center for Health Statistics ICD-10-CM Official Guidelines for Coding and Reporting. , Available from: https://www.cdc.gov/nchs/data/icd/10cmguidelines_fy2018_final.pdf (2017).
  14. Rajeev, D., et al. Development of an electronic public health case report using HL7 v2.5 to meet public health needs. Journal of the American Medical Informatics Association. 17 (1), 34-41 (2010).
  15. Biesecker, L. Mapping phenotypes to language: a proposal to organize and standardize the clinical descriptions of malformations. Clinical Genetics. 68 (4), 320-326 (2005).
  16. Riley, D. S., et al. CARE guidelines for case reports: explanation and elaboration document. Journal of Clinical Epidemiology. 89, 218-235 (2017).
  17. Cohen, K. B., et al. Coreference annotation and resolution in the Colorado Richly Annotated Full Text (CRAFT) corpus of biomedical journal articles. BMC Bioinformatics. 18 (1), 372 (2017).
  18. Sun, W., Rumshisky, A., Uzuner, O. Evaluating temporal relations in clinical text: 2012 i2b2 Challenge. Journal of the American Medical Informatics Association. 20 (5), 806-813 (2013).
  19. Savova, G. K., et al. Mayo clinical Text Analysis and Knowledge Extraction System (cTAKES): architecture, component evaluation and applications. Journal of the American Medical Informatics Association. 17 (5), 507-513 (2010).
  20. Soysal, E., et al. CLAMP - a toolkit for efficiently building customized clinical natural language processing pipelines. Journal of the American Medical Informatics Association. 25 (3), 331-336 (2018).
  21. Bender, D., Sartipi, K. HL7 FHIR: An Agile and RESTful approach to healthcare information exchange. Proceedings of the 26th IEEE International Symposium on Computer-Based Medical Systems. , 326-331 (2013).
  22. Chang, K., et al. Human Infection with Burkholderia thailandensis, China, 2013. Emerging Infectious Diseases. 23 (8), 1416-1418 (2013).
  23. Cameron, J. D., McClain, C. J. Ocular histopathology of acrodermatitis enteropathica. British Journal of Ophthalmology. 70 (9), 662-667 (1986).
  24. Maddox, T. M., Matheny, M. A. Natural Language Processing and the Promise of Big Data. Circulation: Cardiovascular Quality and Outcomes. 8 (5), 463-465 (2015).
  25. Kreimeyer, K., et al. Natural language processing systems for capturing and standardizing unstructured clinical information: A systematic review. Journal of Biomedical Informatics. 73, 14-29 (2017).

Tags

Tıp sayı: 139 veri bilim Tıp Bilişimi metin madenciliği ek açıklama küratörlüğü klinik olgu sunumları
Etkinleştirmek klinik olgu sunumları için bir meta veri ayıklama yaklaşım Biyomedikal kavramları anlayış gelişmiş
Play Video
PDF DOI DOWNLOAD MATERIALS LIST

Cite this Article

Caufield, J. H., Liem, D. A.,More

Caufield, J. H., Liem, D. A., Garlid, A. O., Zhou, Y., Watson, K., Bui, A. A. T., Wang, W., Ping, P. A Metadata Extraction Approach for Clinical Case Reports to Enable Advanced Understanding of Biomedical Concepts. J. Vis. Exp. (139), e58392, doi:10.3791/58392 (2018).

Less
Copy Citation Download Citation Reprints and Permissions
View Video

Get cutting-edge science videos from JoVE sent straight to your inbox every month.

Waiting X
Simple Hit Counter