Waiting
Login processing...

Trial ends in Request Full Access Tell Your Colleague About Jove
Click here for the English version

Medicine

Geleneksel Tıpta Dil Tanısının Nesnelleştirilmesi, Veri Analizi ve Çalışma Uygulaması

Published: April 14, 2023 doi: 10.3791/65140
* These authors contributed equally

Summary

Bu çalışma, bir dil görüntüsünü segmentlere ayırmak için U-Net ve diğer derin öğrenme algoritmalarını kullandı ve dil tanısının nesnelleştirilmesini araştırmak için segmentasyon sonuçlarını karşılaştırdı.

Abstract

Dil teşhisi, geleneksel Çin tıbbı (TCM) teşhisinin temel bir tekniğidir ve görüntü işleme teknolojisi ile dil görüntülerini nesneleştirme ihtiyacı artmaktadır. Bu çalışma, son on yılda dil nesnelleştirmesinde kaydedilen ilerlemeye genel bir bakış sunmakta ve segmentasyon modellerini karşılaştırmaktadır. Gerçek dil görüntü kümelerini kullanarak algoritmaları doğrulamak ve karşılaştırmak için çeşitli derin öğrenme modelleri oluşturulmuştur. Her modelin güçlü ve zayıf yönleri analiz edilir. Bulgular, U-Net algoritmasının hassasiyet doğruluğu (PA), geri çağırma ve birleşme (MIoU) metrikleri üzerinden ortalama kesişim ile ilgili diğer modellerden daha iyi performans gösterdiğini göstermektedir. Bununla birlikte, dil görüntüsü elde etme ve işlemedeki önemli ilerlemelere rağmen, dil tanısını nesnelleştirmek için tek tip bir standart henüz belirlenmemiştir. Mobil cihazlar kullanılarak yakalanan dil görüntülerinin dil tanı nesneleştirmesinde yaygın olarak uygulanmasını kolaylaştırmak için, daha fazla araştırma karmaşık ortamlarda yakalanan dil görüntülerinin yarattığı zorlukları ele alabilir.

Introduction

Dil gözlemi, geleneksel Çin etnik tıbbında (TCM) yaygın olarak kullanılan bir tekniktir. Dilin rengi ve şekli fiziksel durumu ve çeşitli hastalık özelliklerini, şiddetlerini ve prognozlarını yansıtabilir. Örneğin, geleneksel Hmong tıbbında, dilin rengi vücut ısısını tanımlamak için kullanılır, örneğin kırmızı veya mor bir dil, ısı ile ilgili patolojik faktörleri gösterir. Tibet tıbbında, bir durum hastanın dilini gözlemleyerek, mukusun rengine, şekline ve nemine dikkat ederek değerlendirilir. Örneğin, Heyi hastalığı olan hastaların dilleri kırmızı ve kaba veya siyah ve kuruolur 1; Xieri hastalığı2 olan hastaların sarı ve kuru dilleri vardır; Bu arada, Badakan hastalığı3 olan hastaların beyaz, nemli ve yumuşak bir dilivardır 4. Bu gözlemler dil özellikleri ile fizyoloji ve patoloji arasındaki yakın ilişkiyi ortaya koymaktadır. Genel olarak, dilin durumu tanı, hastalık tanımlama ve tedavi etkisinin değerlendirilmesinde hayati bir rol oynar.

Aynı zamanda, farklı etnik gruplar arasındaki farklı yaşam koşulları ve diyet uygulamaları nedeniyle, dil görüntülerindeki farklılıklar belirgindir. Rengin belirlenmesi için uluslararası bir standart temelinde kurulan Laboratuvar modeli, 1931 yılında Uluslararası Ekler Komisyonu (CIE) tarafından formüle edilmiştir. 1976'da bir renk deseni değiştirildi ve adlandırıldı. Lab renk modeli üç öğeden oluşur: L parlaklığa karşılık gelirken, a ve b iki renk kanalıdır. a, koyu yeşilden (düşük parlaklık değeri) griye (orta parlaklık değeri) parlak pembeye (yüksek parlaklık değeri) kadar renkleri içerir; b, parlak maviden (düşük parlaklık değeri) griye (orta parlaklık değeri) sarıya (yüksek parlaklık değeri) geçer. Beş etnik grubun dil renginin L x a x b değerlerini karşılaştırarak, Yang ve ark.5 , Hmong, Hui, Zhuang, Han ve Moğol gruplarının dil görüntülerinin özelliklerinin birbirinden önemli ölçüde farklı olduğunu bulmuşlardır. Örneğin, Moğollar sarı dil kaplamalı koyu dillere sahipken, Hmong'un beyaz dil kaplamalı açık dilleri vardır, bu da dil özelliklerinin bir popülasyonun sağlık durumunu değerlendirmek için tanısal bir gösterge olarak kullanılabileceğini düşündürmektedir. Ayrıca, dil görüntüleri, etnik tıbbın klinik araştırmalarında kanıta dayalı tıp için bir değerlendirme indeksi olarak işlev görebilir. O ve ark.6 , TCM tanısı için bir temel olarak dil görüntülerini kullandılar ve Çin ve Batı tıbbı ile birlikte Chou-Ling-Dan peletlerinin (TCM'de mevsimsel grip de dahil olmak üzere enflamatuar ve ateşli hastalıkları tedavi etmek için kullanılan CLD granülleri) güvenliğini ve etkinliğini sistematik olarak değerlendirdiler. Sonuçlar, dil görüntülerinin klinik çalışmalar için bir değerlendirme indeksi olarak bilimsel geçerliliğini ortaya koymuştur. Bununla birlikte, geleneksel tıp pratisyenleri genellikle dil özelliklerini gözlemlemek ve hastaların fizyolojik ve patolojik durumlarını değerlendirmek için öznelliğe güvenir ve daha kesin göstergeler gerektirir.

İnternetin ve yapay zeka teknolojisinin ortaya çıkışı, dil teşhisinin dijitalleştirilmesinin ve nesneleştirilmesinin önünü açmıştır. Bu süreç, dil görüntüsünün içeriğini yansıtan dil görüntülerinin nitel ve nesnel bir tanımını sağlamak için matematiksel modellerin kullanılmasını içerir7. İşlem birkaç adım içerir: görüntü yakalama, optik telafisi, renk düzeltme ve geometrik dönüşüm. Önceden işlenmiş görüntüler daha sonra görüntü konumlandırma ve segmentasyon, özellik çıkarma, desen tanıma vb. İçin algoritmik bir modele beslenir. Bu işlemin çıktısı, dil görüntü verilerinin son derece verimli ve kesin bir teşhisidir, böylece dil teşhisinin nesnelleştirilmesi, nicelleştirilmesi ve bilgilendirilmesi hedefine ulaşılır8. Böylece dil tanı verilerinin yüksek verimlilik ve yüksek hassasiyetle işlenmesi amacına ulaşılmaktadır. Dil tanılama bilgisine ve derin öğrenme teknolojisine dayanan bu çalışma, doktorlar için dillerin nicel özelliklerini çıkarmak, tanının güvenilirliğini ve tutarlılığını artırmak ve sonraki dil tanısı nesneleştirme araştırmaları için yöntemler sağlamak amacıyla bir bilgisayar algoritması kullanarak dil gövdesini ve dil kaplamasını dil görüntülerinden otomatik olarak ayırmıştır9.

Subscription Required. Please recommend JoVE to your librarian.

Protocol

Bu çalışma, Çin Ulusal Doğa Bilimleri Vakfı projesi olan TCM Yüz Görüntüsünün İlişkilendirme Analizine Dayalı Dinamik Değişim Kurallarının Oluşturulması projesi tarafından onaylanmıştır. Etik onay numarası 2021KL-027 olup, klinik araştırma protokolü (2021.04.12, V2.0), bilgilendirilmiş onam (2021.04.12, V2.0), denek işe alım materyalleri (2021.04.12, V2.0), çalışma vakaları ve/veya vaka sunumları, konu günlük kartları ve diğer anketler (2021.04.12, V2.0), klinik araştırmaya katılanların listesi, araştırma projesi onayı, vb. Çalışmaya katılan hastalardan bilgilendirilmiş onam alındı. Bu çalışmanın temel deneysel yaklaşımı, model segmentasyon etkilerini doğrulamak ve karşılaştırmak için gerçek dil görüntülerini kullanmaktır. Şekil 1 , dil tanı nesnelleştirmesinin bileşenlerini sunmaktadır.

1. Görüntü alma

  1. Hastaların lingual yüz görüntülerini toplamak için kendi geliştirdiği el tipi lingual yüz teşhis cihazını kullanın.
  2. Bilgisayar sayfasında hastanın adını, cinsiyetini, yaşını ve hastalığını girin. Burada yer alan görüntüler, kliniğe gelen ve çalışmanın amacı ve içeriği hakkında bilgilendirildikten sonra fotoğraflanmayı kabul eden hastalara aittir. Hastanın dik oturduğunu onaylayın, tüm yüzü görüntü alma cihazına yerleştirin ve hastaya dilini ağzından maksimum ölçüde uzatmasını söyleyin.
  3. Görüntü alma cihazını bir bilgisayara bağlı tutun ve bilgisayar ekranındaki görüntüler aracılığıyla hastanın doğru konumda olduğunu ve dilin ve yüzün tamamen açıkta olduğunu doğrulayın.
  4. Üç fotoğraf çekmek için bilgisayar ekranındaki Shoot (Çek ) düğmesine üç kez basın.
    NOT: Görüntü toplama aracı şu anda sadece patent başvuru aşamasındadır ve ticari kullanım için değildir, bu nedenle satılık değildir.
  5. Toplanan dil ve yüz görüntülerini manuel olarak seçin ve filtreleyin. Dil ve yüze pozlaması tamamlanmamış görüntülerin yanı sıra yetersiz ışık nedeniyle çok karanlık olan görüntüleri filtreleyin ve hariç tutun. Şekil 2 , yazılımın görüntü alma sayfasını göstermektedir.
  6. Deneysel tasarımda, alternatif olarak her hastadan bir seferde üç görüntü toplayın ve sonraki algoritma eğitimi ve testi için örnek olarak nispeten standart, tamamen pozlanmış, iyi aydınlatılmış ve net bir görüntü seçin.
  7. Çekimden sonra veri toplayın, manuel tarama için verileri dışa aktarın ve çıplak gözle görülebilen standart dışı görüntüleri silin. Aşağıdaki filtreleme ve hariç tutma ölçütlerini kullanın: eksik dil ve yüze maruz kalma ve yetersiz ışığın bir sonucu olarak çok karanlık görüntüler. Az aydınlatılmış, tamamlanmamış ve standart bir görüntü örneği Şekil 3'te gösterilmiştir.
    NOT: Yetersiz ışık genellikle hastanın yüzünü tamamen aletin içine yerleştirememesinden kaynaklanır. Tam pozlama genellikle sadece hastanın doğru şekilde fotoğraflanmasıyla elde edilir.

2. Dil segmentasyonu

  1. Aşağıda açıklandığı gibi çevrimiçi bir ek açıklama aracı kullanarak dil görüntüsü segmentasyonu gerçekleştirin.
    1. Labelme'yi yükleyin, etiket arayüzünün sol üst köşesindeki düğmesine tıklayın, görüntünün bulunduğu klasörü seçin ve fotoğrafları açın.
    2. İzleme noktalarını başlatmak, dil ve dil şekillerini izlemek, seçilen alanlara (örneğin, dil ve dil yüzeyi) göre adlandırmak ve kaydetmek için çokgen oluştur'a tıklayın.
    3. Tüm işaretler tamamlandığında, görüntüyü veri klasörüne kaydetmek için Kaydet'i tıklatın. Ayrıntılı bir akış şeması için Şekil 4'e bakın.
      NOT: Görüntülerde piksel farklılıkları olabileceğinden, görüntüler algoritma eğitimi ve testi için doğrudan kullanılamaz.
  2. Hedef dolgu uzunluğu olarak görüntünün uzun kenarı olacak şekilde görüntüleri kenar doldurarak ve görüntüleri bir kareye doldurmak için beyaz kenar dolgusu gerçekleştirerek, görüntünün uzun tarafı kenar uzunluğu olarak kullanarak görüntüleri aynı boyutta birleştirin. Cihaz tarafından yakalanan görüntü boyutu 1080 x 1920 pikseldir ve doldurulan görüntünün boyutu 1920 x 1920 pikseldir. Bkz. Şekil 5.
  3. Gerekirse görüntü geliştirme uygulayın. Kullanılan görüntüler sabit bir sahnede çekildiği ve çevre, aydınlatma ve diğer faktörlerden daha az etkilendiği için bu çalışmada herhangi bir iyileştirme uygulanmamıştır.
  4. Çekim işlemi sırasında nesnenin yanıp sönmesi ve lens bloke etme gibi kontrol edilemeyen faktörleri hesaba katmak için her hasta için üç görüntü toplandığından, hasta başına bir görüntüyü korumak için her hastadan gelen görüntüleri manuel olarak tarayın.
  5. Modeli eğitmek amacıyla, 200 kişiden veya 600 görüntüden veri toplayın. Gösterimden sonra, yaklaşık 200 kullanılabilir görüntüyü saklayın.
  6. Görüntü numarasına göre, tüm dil görüntülerini rastgele bölün, bunların% 70'ini eğitim setine ve% 30'unu bir elektronik tablodaki test setine yerleştirin.

3. Dil sınıflandırması

  1. Resmi web sitelerine gidin ve Anaconda, Python ve Labelme'yi indirip yükleyin. Ortamı etkinleştirin ve genel ortamın kurulumunu ve ayarlanmasını tamamlayın. Yazılımın kurulumunu ve kurulumunu açıklayan bir akış şeması için Şekil 6'ya bakın.
  2. Yüklü ortamda derin öğrenme algoritması modelini oluşturun, parametreleri ayarlayın ve eğitim kümesini kullanarak model eğitimini tamamlayın. Model seçimini ve ayarlamasını aşağıdaki adımlarda açıklandığı gibi gerçekleştirin.
    1. Model seçimi: Araştırmanın amacına göre uygun modeli seçin. Son 5 yılda dil görüntü işleme üzerine yapılan araştırmalar gözden geçirildikten sonra, bu çalışmada doğrulama için U-Net, Seg-Net, DeeplabV3 ve PSPNet olmak üzere dört algoritma seçilmiştir (model kodları için Ek Kodlama Dosyası 1, Ek Kodlama Dosyası 2, Ek Kodlama Dosyası 3 ve Ek Kodlama Dosyası 4'e bakınız).
    2. Veri kümesi oluşturma: Model seçimini tamamladıktan sonra, yukarıda açıklandığı gibi, esas olarak Labelme ek açıklamasını ve tekdüze görüntü boyutu yöntemlerini kullanarak araştırma içeriğiyle birlikte gerekli veri kümesini oluşturun.
  3. Aşağıda açıklandığı gibi model eğitimi gerçekleştirin. Şekil 7 , algoritma eğitim işleminin ayrıntılarını göstermektedir.
    1. İleriye doğru yayılım için verileri sinir ağına girin, her nöron önce ağırlıklı bir değer birikimi girer ve daha sonra sonucu elde etmek için bu nöronun çıkış değeri olarak bir aktivasyon fonksiyonu girer.
    2. Sonucu hata işlevine girin ve hatayı almak ve yanlışlıkla tanıma derecesini değerlendirmek için beklenen değerle karşılaştırın. Kayıp fonksiyonu ne kadar küçük olursa, model o kadar iyi olur.
    3. Geri yayılımı ile hatayı azaltın ve gradyan vektörünü belirleyin. Ağırlıkları gradyan vektörüne göre sonuçlara doğru eğilime göre ayarlayın, böylece hata sıfıra düşme veya küçülme eğilimindedir.
    4. Set tamamlanana veya hata değeri artık azalmayana kadar bu eğitim işlemini tekrarlayın, bu noktada model eğitimi tamamlanır. Eğitim ve testteki algoritma modelinin akış şeması için Şekil 8'e bakın.
  4. Segmentasyon için aynı test verilerini kullanarak dört modeli test edin ve segmentasyon etkisine göre model performansını değerlendirin. Dört hassasiyet, hatırlama, ortalama piksel doğruluğu (MPA) ve MIoU metriği daha kapsamlı bir model performansı değerlendirmesi sağlar.
  5. Dört modelin sonuçları oluşturulduktan sonra, değerlerini yatay olarak karşılaştırın; Değer ne kadar yüksek olursa, segmentasyon doğruluğu o kadar yüksek olur ve modelin performansı o kadar iyi olur. Bkz. Şekil 9, Şekil 10 ve Şekil 11.

Subscription Required. Please recommend JoVE to your librarian.

Representative Results

Karşılaştırma sonuçları için, bu çalışma tarafından oluşturulan ortamın algoritma modelini eğitmek ve test etmek için aynı örnekleri kullandığı Şekil 12, Şekil 13 ve Tablo 1'e bakın. MIoU göstergesi: U-Net > Seg-Net > PSPNet > DeeplabV3; MPA göstergesi: U-Net > Seg-Net > PSPNet > DeeplabV3; hassasiyet göstergesi: U-Net > Seg-Net > DeeplabV3 > PSPNet; hatırlama: U-Net > Seg-Net > PSPNet > DeeplabV3. Dizin değeri ne kadar büyük olursa, segmentasyon doğruluğu o kadar yüksek olur ve model performansı o kadar iyi olur. İndeks sonuçlarına göre U-Net algoritmasının MIoU, MPA, hassasiyet ve hatırlamada diğer algoritmalardan üstün olduğu, segmentasyon doğruluğunun da diğer algoritmalara göre daha yüksek olduğu analiz edilebilir. Bu nedenle, U-Net algoritması dört farklı algoritma arasında en iyi performansa sahiptir. PSPNet, MIoU, MPA ve geri çağırmada DeeplabV3'ten daha iyidir, DeeplabV3 modeli ise tüm dizinlerde Seg-Net modelinden daha düşüktür. Bu nedenle, DeeplabV3 algoritmasının bu araştırma ortamındaki dört algoritma arasında en az arzu edilen kapsamlı performansa sahip olduğu sonucuna varılabilir.

Değerlendirme göstergeleri
Bu çalışmada, algoritma modelinin performansı esas olarak hassasiyet, geri çağırma, MPA ve MIoU ile doğrulanmıştır. Modelin performans ölçümleri, model sınıflandırma sonuçlarından oluşan karışıklık matrisiyle doğrudan ilişkilidir ve modelin doğru ve yanlış sınıflandırdığı örneklerin sayısını yansıtır. Matris, test kümesi sonuçlarına eşdeğer tahmini değeri temsil eder ve gerçek, temel gerçeği temsil eder. Her iki kategori de sırasıyla T ve F ile temsil edilen doğru ve yanlış olarak ayrılır ve dört kombinasyonla sonuçlanır: TP, FP, FN ve TN.MPA her kategorideki doğru sınıflandırılmış piksellerin oranının ortalama değeridir ve MIoU ortalama kesişim-birleştirme oranıdır. Bu, semantik segmentasyon için en yaygın metriktir; kesişimin oranını hesaplar ve gerçek ve tahmin edilen değerleribirleştirir 10. Bunların formülü şunlardır:

Hassasiyet = , hatırlama = , MPA = (CPA = , burada N toplam kategori sayısıdır) ve MIoU = (IoU = Equation 1Equation 4 Equation 2Equation 1Equation 3 Equation 5).

Bu dört metrik, dil görüntülerinin segmentasyon etkisinin daha kapsamlı bir değerlendirmesini sağlar.

Bu çalışma, algoritma modellerini gerçek dilsel görüntü verilerini kullanarak eğitmek ve test etmek için U-Net, Seg-Net, DeeplabV3 ve PSPNet olmak üzere dört derin öğrenme algoritma modelini seçti. U-Net11 , solda bir kodlayıcı ve sağda bir kod çözücüden oluşan U şeklinde bir mimariye sahiptir ve daha az veri ile daha doğru sınıflandırma sonuçlarını eğitme ve görüntü özelliklerini kapsamlı bir şekilde çıkarma avantajına sahiptir. Çok ölçekli hedef segmentasyon problemini çözmek için Res-Net ağına dayanan DeepLabV3, içi boş evrişim yapısını benimser, modülü çok ölçekli bağlamı yakalamak için tasarlar, koşullu rasgele alanı (CRF) kaldırır ve atrous uzamsal piramit havuzu (ASPP) modülünü yükselterek model performansını önemli ölçüde artırır. Semantik segmentasyon, segmentlere ayrılmış nesnenin her pikseli için kategori etiketini almayı amaçlar. Seg-Net, bir kodlayıcı ve bir kod çözücü de dahil olmak üzere semantik segmentasyon için simetrik bir yapıya sahip evrişimli bir sinir ağı (CNN) mimarisidir. Bunun avantajı, kod çözücünün düşük çözünürlüklü özellik diyagramları için yukarı örnekleme yönteminin, yukarı örnekleme öğrenme süresini ortadan kaldırmasıdır. PSPNet modeli esas olarak sahne ayrıştırmaya uygulanır, semantik segmentasyona bağlam bilgileri eklenir, bu da kısmi hatayı önleyebilir, genel sahne sınıflandırma bilgilerini kullanmak için uygun stratejilerin eksikliği sorununu çözebilir ve nihai tahmin edilen sonuçların güvenilirliğini artırabilir.

Figure 1
Şekil 1: Dil tanı nesnelleştirmesinin bileşenleri. Görüntü çekim elemanları, dil segmentasyonu ve dil sınıflandırması dahil olmak üzere dil teşhis bileşenleri. Bu şeklin daha büyük bir versiyonunu görmek için lütfen buraya tıklayın.

Figure 2
Şekil 2: Görüntü yakalama sayfası. Dil görüntü alma arayüzü ve anket içeriği. Bu şeklin daha büyük bir versiyonunu görmek için lütfen buraya tıklayın.

Figure 3
Şekil 3: Görüntü filtreleme ve reddetme kriterleri. Yeşil onay işareti dahil etme ölçütlerini, kırmızı çarpı işareti ise dışlama ölçütlerini temsil eder. Bu şeklin daha büyük bir versiyonunu görmek için lütfen buraya tıklayın.

Figure 4
Şekil 4: Labelme işaretleme işleminin şematik diyagramı. Labelme yazılımı, klasörün açılmasından dosyanın kaydedilmesine kadar görüntünün tüm sürecine açıklama eklemek için kullanılır. Bu şeklin daha büyük bir versiyonunu görmek için lütfen buraya tıklayın.

Figure 5
Şekil 5: Resim ön işleme diyagramı. Çekilen görüntünün boyutu 1080 x 1920 pikseldir ve dolgu görüntüsünün boyutu 1920 x 1920 pikseldir. Bu şeklin daha büyük bir versiyonunu görmek için lütfen buraya tıklayın.

Figure 6
Şekil 6: Ortam yapılandırmasının akış şeması. Algoritma yalnızca ortam yapılandırıldıktan sonra çalışabilir. Bu şeklin daha büyük bir versiyonunu görmek için lütfen buraya tıklayın.

Figure 7
Şekil 7: Algoritma eğitimi çalıştırma detay diyagramı. Algoritma işleminde ayrıntılı adımlar ve yürütme yöntemleri. Bu şeklin daha büyük bir versiyonunu görmek için lütfen buraya tıklayın.

Figure 8
Şekil 8: Eğitim ve testte algoritma modelinin akış şeması. Veri işleme, algoritma eğitimi ve algoritma testi dahil olmak üzere algoritmanın önemli adımları. Bu şeklin daha büyük bir versiyonunu görmek için lütfen buraya tıklayın.

Figure 9
Şekil 9: Seg-Net algoritma yapısı. Seg-Net algoritmasının mantıksal yapısı ve kod çalıştırma işlemidir. Bu şeklin daha büyük bir versiyonunu görmek için lütfen buraya tıklayın.

Figure 10
Şekil 10: U-Net algoritma yapısı. U-Net algoritması mantıksal yapı ve kod çalıştırma işlemidir. Bu şeklin daha büyük bir versiyonunu görmek için lütfen buraya tıklayın.

Figure 11
Şekil 11: Dil görüntü segmentasyon çalışmalarının akışı. Görüntüdeki kırmızı alan dil segmentasyonunun sonucudur ve yeşil alan dil kaplama segmentasyonunun sonucudur. Bu şeklin daha büyük bir versiyonunu görmek için lütfen buraya tıklayın.

Figure 12
Şekil 12: Dört algoritma metriğinin karşılaştırma tablosu. MIoU, MPA, hassasiyet ve geri çağırma, algoritma performansının değerlendirme endeksleridir. Değer ne kadar büyük olursa, algoritma performansı o kadar iyi olur ve segmentasyon doğruluğu o kadar yüksek olur. Bu şeklin daha büyük bir versiyonunu görmek için lütfen buraya tıklayın.

Figure 13
Şekil 13: Dil segmentasyonu için dört algoritmanın sonuçlarının karşılaştırılması. Görüntüdeki kırmızı alan dil segmentasyonunun sonucudur ve yeşil alan dil kaplama segmentasyonunun sonucudur. Bu şeklin daha büyük bir versiyonunu görmek için lütfen buraya tıklayın.

Figure 14
Şekil 14: U-Net algoritması yapı diyagramı. Mavi/beyaz kutular özellik haritasını gösterirken, özellik haritasının üzerindeki sayı kanal sayısını temsil eder. Bu şeklin daha büyük bir versiyonunu görmek için lütfen buraya tıklayın.

MIoU .MPA Kesinlik Anımsamak
U-Net 84.00% 89.38% 91.90% 89.38%
DeeplabV3 59.68% 61.33% 84.21% 61.33%
PSPNet 67.80% 72.56% 82.71% 72.56%
SegNet 80.09% 87.14% 88.53% 87.14%

Tablo 1: Dört algoritma segmentasyon sonuç metriğinin karşılaştırılması. Ölçümler MIoU, MPA, hassasiyet ve geri çağırma idi.

Ek Kodlama Dosyası 1: U-Net_training. U-Net modeli eğitim kodu. Bu Dosyayı indirmek için lütfen buraya tıklayın.

Ek Kodlama Dosyası 2: Seg-Net_training. Seg-Net modeli eğitim kodu. Bu Dosyayı indirmek için lütfen buraya tıklayın.

Ek Kodlama Dosyası 3: DeeplabV3_training. DeeplabV3 modeli eğitim kodu. Bu Dosyayı indirmek için lütfen buraya tıklayın.

Ek Kodlama Dosyası 4: PSPNet_training. PSPNet modeli eğitim kodu. Bu Dosyayı indirmek için lütfen buraya tıklayın.

Subscription Required. Please recommend JoVE to your librarian.

Discussion

Yukarıda sunulan karşılaştırma sonuçlarına dayanarak, incelenen dört algoritmanın özelliklerinin çeşitli olduğu ve bunların belirgin avantaj ve dezavantajlarının aşağıda açıklandığı açıktır. Tam bir evrişim ağının modifikasyonuna ve genişlemesine dayanan U-Net yapısı, bir büzülme yolu ve simetrik bir genişleyen yol aracılığıyla bağlamsal bilgi ve kesin konumlandırma elde edebilir. Her piksel noktasını sınıflandırarak, bu algoritma daha yüksek bir segmentasyon doğruluğu elde eder ve görüntüyü eğitilmiş modelle daha hızlı bir şekilde bölümlere ayırır. Öte yandan, bir kodlayıcı ve bir kod çözücünün simetrik bir yapısını içeren Seg-Net algoritması, yeni problemlere hızla adapte olma ve konuşma, semantik, görme ve oyun gibi görevlerde iyi performans gösterme avantajına sahiptir. Bununla birlikte, algoritma büyük miktarda veri gerektirir, bu da donanım yapılandırması açısından talepkar hale getirir ve bu nedenle yalnızca bazı görevler için geçerlidir. Daha genel bir çerçeve olarak, DeeplabV3 algoritması, çoğu ağ için ASSP modüllerini geliştirme ve genel performansı artırmak için bunları basamaklı veya paralel olarak yerleştirme avantajına sahiptir. Bununla birlikte, nihai özellik haritasının, nispeten kaba olan ve daha sonra geliştirilebilecek olan 8 ve 16 oranlarında yukarı örnekleme ile elde edilmesi gerekir. Ayrıca, PSPNet modeli, PSP modülü aracılığıyla farklı bölgelerden bağlamsal bilgileri toplama, böylece küresel bilgilere erişimi iyileştirme ve birden fazla veri kümesinde iyi sonuçlar sunma gibi en önemli özelliğe sahiptir. Sonuçlar, U-Net modelinin bu araştırma ortamında en yüksek segmentasyon doğruluğuna ve en iyi segmentasyon etkisine sahip olduğunu göstermektedir.

U-Net mimarisi, tıbbi görüntü segmentasyonundaki üstünlüğünü göstermektedir12. Başlangıçta 2D hücre görüntü segmentasyonu için tasarlanan U-Net algoritması, 2D modülünü bir 3D modülle değiştirerek daha da geliştirilmiştir. Bu modifikasyon, manyetik rezonans görüntüleme (MRI), bilgisayarlı tomografi (BT) ve üç boyutlu (3D) ultrason görüntüleri gibi 3D görüntüleri işleme yeteneğini güçlendirmiştir. Tıbbi görüntüleri organlara, dokulara ve lezyonlara ayırarak değerli klinik veriler elde edilebilir. Geliştirilmiş U-Net algoritması, sonraki muayene ve tedaviler için etkili bir araçtır. Tıbbi teşhiste, görüntülerin sınıflandırılması birçok teşhis sürecinin çok önemli bir parçasıdır. Geleneksel tıp, dil, cilt ve ifade de dahil olmak üzere tüm görünür işaretleri gözlemlemeye dayanır. Tıbbi görüntü segmentasyon teknolojisinin ortaya çıkışı ve ilerlemesi tıbbi tanıda büyük önem taşımaktadır. TCM'de, yüz ve dil görüntülerini analiz etmek, özellik çıkarma sınıflandırması için çeşitli derin öğrenme algoritmalarının kullanılmasını gerektirir. Öte yandan, görüntü segmentasyon algoritmaları Batı tıbbında yaygın olarak kullanılmaktadır ve klinik tanı ve patoloji için bir temel oluşturmaktadır13.

Bu çalışmanın araştırma süreci, veri ön işleme, algoritma eğitimi ve testi ve algoritma performans karşılaştırması dahil olmak üzere kritik adımları içermektedir. Başlangıçta, ham veriler işleme, etiketleme ve sonraki algoritma yapımını kolaylaştırmak için eğitim ve test setlerine bölünür. İşlenen veriler daha sonra sinir ağına beslenir ve kayıp fonksiyonu, geri yayılma yoluyla gradyan vektörünü belirlemek için ayarlanır. Daha sonra, parametreler eğitim sürecinin tamamlanmasına kadar ayarlanır. Algoritma performansı, performansını kapsamlı bir şekilde değerlendirmek için MIoU, MPA, hassasiyet ve geri çağırma gibi birden çok dizin kullanılarak görüntü segmentasyon efekti test edilerek değerlendirilir. Gerçek algoritma eğitim sürecinde, modelin gürültü verilerinin özellikleri de dahil olmak üzere verileri çok ayrıntılı bir şekilde öğrendiği aşırı montaj meydana gelebilir. Bu, daha sonraki testler sırasında verilerin tanımlanmasına, verilerin yanlış sınıflandırılmasına ve zayıf bir genelleme yeteneğine neden olur. Aşırı uyum meydana gelirse, eğitim verileri artırılabilir veya veriler yeniden temizlenebilir. Bu çalışmada gradyan iniş yinelemeli yöntemi benimsenmiştir. Aşırı uydurma, yinelemeyi önceden keserek de önlenebilir.

Bu çalışmanın kısıtlılığı açıktır; Görüntüler sabit aletler kullanılarak toplanmıştır ve deneysel aletler şu anda ticari amaçlar için kullanılamaz. Sonuç olarak, bu çalışmadaki dil görüntüleri tek bir sahneden alınmıştır ve klinik arka planı ve karmaşık ve değişken ışık koşullarını tamamen yansıtmamaktadır. Bu nedenle, karmaşık ortamlar ve zayıf aydınlatma koşulları altında görüntü işleme tekniklerini incelemek için daha fazla araştırmaya ihtiyaç vardır. Dil tanısının nesnelleştirme çalışmaları zengin içerik içerir, bu nedenle doğru dil vücut segmentasyonu esastır. Sonuç olarak, algoritmaların en uygun segmentasyon etkisiyle karşılaştırılması ve doğrulanması, sonraki çalışmalar için önemlidir. Dil segmentasyonunu sınıflandırma ile birleştirmek teorik olarak otomatik dil görüntüsü yargısına ulaşabilir ve tanıya yardımcı olabilir; akademisyenler bu konuyu araştırmış ve incelemişlerdir. Sağlık hizmetlerinde, biyomedikal görüntüleri işlemek için nesnelerin internetini ve kablosuz iletişim teknolojilerini ve ayrıca tanı yardımını kullanmak, bir sistemin verimliliğini artırabilir. Mansour ve ark.14 , işbirlikçi derin öğrenmeye ve nesnelerin internetine dayanan otomatik bir dil rengi görüntüsü (ASDL-TCI) tasarladı. Veri toplama, ön işleme, özellik çıkarma, sınıflandırma ve parametre optimizasyonunu içerir. Bu modelin hassasiyeti, geri çağırma oranı ve doğruluğu, diğer yöntemlerden daha üstün olan sırasıyla 0.984, 0.973 ve 0.983'tür.

Görüntü yakalama ve ön işleme
Görüntü alma işlemi sırasında, ışık kaynaklarının yoğunluğu ve çeşitliliği görüntü kalitesini doğrudan etkileyebilir ve bu da görüntü segmentasyonunu ve sınıflandırma sonuçlarını etkiler. Bu nedenle, ışık kaynağını doğal ışık kaynaklarının etkisini mümkün olduğunca yakından taklit edecek şekilde ayarlamak önemlidir. Ek olarak, standart ışık kaynaklarını kullanmak veya birden fazla ışık kaynağı kullanmak ve sabit bir sahnede çekim yapmak gibi yöntemler, ışığın, arka planın ve diğer faktörlerin olumsuz etkilerini önleyebilir ve böylece algoritmik segmentasyonun doğruluğunu artırabilir. Dil görüntülerini toplamak için kullanılan enstrüman aydınlatma parametreleri, dil görüntülerinin renk oluşturma efektini etkileyen standart aydınlatma ile aynı değildir. Bu nedenle, kullanılan en yaygın ön işleme yöntemi renk düzeltmedir. Cai ve ark.15 , bir dil görüntüsünün renk verileri ile karşılık gelen dilin renk rengi arasındaki tutarsızlığı ele almak için, dil görüntüsünün renk uzayı dönüşümünü ve renk düzeltmesini normalleştirmenin gerekli olduğunu bulmuşlardır. Ekran cihazının renk performansı da gerçek dil gövdesinden saparak test ve ayarlama yapılmasını gerektirir. Ayrıca, resim boyutu, görüntü toplama işlemi sırasında kullanılan farklı edinme araçlarına bağlı olarak değişir16. Eğitim verimliliğini artırmak ve depolama alanından tasarruf etmek için, derin öğrenme ağının giriş resmi boyutunda sınırlamaları vardır. Bu nedenle, resim ön işleme aşamasında resim boyutu standartlaştırılmalıdır. Genellikle bu, model eğitimi için giriş resmi boyutunun eşit şekilde yeniden şekillendirilmesiyle gerçekleştirilir; yaygın olarak kullanılan yeniden şekillendirme yöntemleri enterpolasyon, kırpma, dahil etme, döşeme ve yansıtmadır.

Dil görüntü segmentasyonu
Dil görüntüsü segmentasyonu iki türe ayrılabilir: geleneksel ve derin öğrenme segmentasyon yöntemleri17. Geleneksel dil görüntü segmentasyon yöntemleri, Yılan algoritması ve Otsu algoritması gibi algoritmalardan oluşur. Aktif bir kontur modeli olarak, Snake algoritması18 önce bir profil eğrisi belirler ve ardından ilk profili gerçek bir profil eğrisine dönüşecek şekilde ayarlar. İlk konturların elde edilmesi ve konturların evrimi, Yılan algoritması için araştırmanın ana odak noktasıdır. Öte yandan, Otsu algoritması, orijinal görüntüdeki gri değeri hesaplamak ve her pikselin gri tonlama değerini eşik değeriyle karşılaştırmak için bir veya daha fazla eşik kullanan klasik bir eşik segmentasyon algoritmasıdır. Karşılaştırma sonuçlarına dayanarak, dil ve arka plan, derin öğrenme yöntemlerinin ortaya çıkmasından önce tasvir edilmiştir. Bu iki algoritma, dil görüntü işleme ve dil teşhisi nesnelleştirmesinde yaygın olarak kullanılmaktadır.

Derin öğrenme teorisinin ortaya çıkışından bu yana, çok sayıda bilim adamı dil teşhisi nesnelleştirme ve derin öğrenmenin entegrasyonunu araştırmıştır. Zheng ve ark.19 , çeşitli algoritmaları birleştirerek ve dil algılama yöntemini açık bir ortamda keşfederek görüntü segmentasyonuna dayalı bir dil algılama yöntemi geliştirdiler ve sonuçta olumlu dil segmentasyon sonuçları elde ettiler. Yuan ve ark.20 , bölge ilişkisinin tek piksel kaybı fonksiyonuna dayanan bir dil segmentasyon yöntemi önermiştir, burada geliştirilmiş kayıp fonksiyonu bölge pikselleri arasındaki korelasyonu açıklamıştır. Piksel etiketli semantik denetimli öğrenmeyi kullanarak, MIoU endeksinin% 96.32'ye ulaşmasıyla örneklenen model eğitim verimliliği artırıldı. Dil görüntüsü, hastalığın başlangıcı ile yakından bağlantılı olan diş izleri, çatlaklar ve delinmeler gibi spesifik morfolojik özellikler sergiledi. Bu nedenle, dil gözlemi hastalığın ilerlemesini teşhis etmede yardımcı olabilir. Wang ve ark. 21 , gelişmiş doğruluk ve stabilite sağlayan küçük örnek veri setleri için derin öğrenme dil kırığı segmentasyon yaklaşımı önermiştir. Bu yöntem, önce dil gövdesini, ardından dil çatlaklarını bölmeyi içeriyordu ve odak kaybını fonksiyon kaybı olarak dahil ederek U-Net algoritmasını geliştirdi.

Dil görüntüsü sınıflandırması
Dil görüntülerini sınıflandırmak temel olarak dil rengi, dikenler, çatlaklar ve kaplama rengi gibi özellikleri tanımlamayı içerir. Wang ve ark.22 , dil gövdesini bölümlere ayırmak için Yılan algoritmasını kullandılar ve delinmeleri tanımlamak için karşılıklı bilgi görüntü kaydı, günlük kenarı tespiti, paralel çizgi ve diğer yöntemler gibi teknikleri kullandılar. Bu yaklaşım, erken tespit ve önlemeyi kolaylaştırırken otomatik delinme tanımlama ve sayma sorununu etkili bir şekilde çözdü. Büyük bir veri hacmi, uzun eğitim süresi ve yüksek ekipman gereksinimleri gibi dil görüntü algoritmasının eğitimi ile ilgili sınırlamaları ele almak için, Yang ve ark.23, transfer öğrenimine dayanan tamamen bağlı bir sinir ağı önerdi. Bu yöntem, özellikleri ayıklamak ve bunları tamamen bağlı sinir ağı (FCN) ile birleştirmek için iyi eğitilmiş Inception_v3 kullanır ve% 90'ın üzerinde bir doğruluk oranı elde eder. Bu yaklaşım, küçük örneklerde ve çoklu sınıflandırmalarda derin öğrenme sorununu çözdü. Song ve ark.24 , GoogLe-Net ve Res-Net'teki görüntüleri bulmak için bir basamaklı sınıflandırıcı kullandılar ve üç dil görüntüsü özelliğini otomatik olarak sınıflandırmak için derin öğrenmeyi transfer etmek, eğitmek ve uygulamak için kullandılar: diş izleri, çatlaklar ve dil kaplama kalınlığı. Sınıflandırma sonuçlarının ortalama doğruluğu% 94'ü aştı. Bununla birlikte, dil görüntüsü sınıflandırma algoritması, yüzün diğer ilgisiz kısımlarından gelen parazitlere karşı oldukça hassastır ve sınıflandırma doğruluğunu doğrudan etkiler25.

Zhai ve ark.26 , dikkat mekanizmalarını kullanarak dil görüntülerini sınıflandırmak için çok aşamalı bir algoritma geliştirdi. Bu yöntem, dil lokalizasyonu aşamasında kaynaşmış olan çeşitli algısal görüş alanlarından özellikler çıkararak dil bölgelerini tanımlama doğruluğunu arttırır. Ayrıca, dikkat mekanizması modülü, dil safsızlıklarından kaynaklanan paraziti bastıran dil görüntüsü sınıflandırma doğruluğunu geliştirir. Farklı hastalıkların dil özelliklerini sınıflandırma sorunuyla karşı karşıya kalan27, derin öğrenme algoritmaları da yeni yaklaşımlar sağlayabilir. Ek olarak, Shi ve ark.28 , C5.0 karar ağacı algoritmasına dayanan küçük hücreli olmayan akciğer kanseri için tipik bir sınıflandırma yöntemini araştırmışlardır. Qi eksikliği sertifikası ve Yin eksikliği sertifikası sınıflandırması ile ilgili yedi nitelik sınıflandırma kuralı belirlediler. Modelin doğruluğu %80.37 olarak bulundu. Ek olarak, Li ve ark.29 , stokastik orman algoritmasını kullanarak diyabet için bir tanı modeli geliştirmiştir. Ayrıca, modelin performansını artırmak için dil görüntülerinden doku ve renk özelliklerini analiz ettiler.

Son
Batı tıbbının çağdaş tanı yaklaşımlarının aksine, TCM'nin tanı yöntemleri minimal invazivdir ve minimum zarar gerektirir. Ek olarak, gözlem, dinleme veya koku alma, sorgulama ve palpasyonun dört tanı yöntemi, TCM'nin çeşitli yönlerinde temellerine sahiptir. Bununla birlikte, TCM tanı ve tedavisinin uygulayıcının uzmanlığına ve kişisel tedavi kavramlarına büyük ölçüde dayanması nedeniyle, nesnellik ve standardizasyon eksikliği olabilir. Sonuç olarak, TCM tanısını nesnelleştirme eğilimi, TCM'nin ilerlemesini teşvik edebilecek daha fazla araştırma için bir yön olarak ortaya çıkmıştır.

Dil teşhisinin nesnelleştirilmesi, görüntüleri ve büyük miktarda veriyi yüksek verimlilikle işleme potansiyeline sahiptir ve bu da doktorlara önemli ölçüde yardımcı olabilir. Bununla birlikte, dil teşhisinin sadece geleneksel bir yöntem olmadığını, aynı zamanda doğrulandığını da belirtmek önemlidir. Chen ve ark.30, 382 COVID-19 hastasının dil görüntüleri hakkında klinik veriler topladıkları bir çalışma yürütmüştür. Tüm görüntüleme grupları için dil görüntü özelliklerini ve laboratuvarın renk deseni parametrelerini istatistiksel olarak analiz ettiler. Çalışmanın bulguları, dil görüntülerinin özellikleri ile kullanılan Batı tıbbı türü arasında bir korelasyon olduğunu ortaya koydu. Ek olarak, dil görüntülerindeki değişiklikler hastalığın genel patogenezi ile uyumludur. Dil görüntülerinin bazı parametreleri, TCM31'de COVID-19'un patojenik değişikliklerini tahmin etmede potansiyel olarak yardımcı olabilir.

Geleneksel tıp dili tanısını nesnelleştirirken, çok sayıda araştırmacı segmentasyon ve sınıflandırma yöntemini kullanmıştır. Derin öğrenme ve evrişim sinir ağları, dil görüntü özelliklerini sınıflandırmak için gereklidir. Dil görüntü segmentasyon algoritmasının doğruluğu, dilin yüzden tam olarak ayrılıp ayrılamayacağını belirlediği için çok önemlidir, böylece sonraki özelliklerin sınıflandırılmasının doğruluğunu etkiler. Sonuç olarak, mevcut algoritma modelinin doğruluğunu arttırmak, bu alanda çok önemli bir araştırma odağıdır. Şu anda, algoritma modelini ve doğruluğunu geliştirmek bir araştırma noktasıdır.

Bu çalışmada U-Net, Seg-Net, DeeplabV3 ve PSPNet4 algoritmalarının performansını karşılaştırmak için aynı test seti verileri kullanılmıştır. Bu önlem, kullanılan verilerin kalitesinde tutarlılık sağlamak için alınmıştır. Bu çalışmada kullanılan deneysel ortam altında, U-Net algoritması, segmentasyon doğruluğu açısından diğer üç algoritmadan önemli ölçüde daha iyi performans göstermiştir. MIoU, algoritma performansını değerlendirmek için kullanılan en önemli dizin olan semantik segmentasyon algoritması32'nin ek açıklama ölçüsüdür. U-Net algoritmasının MIoU değeri, Seg-Net algoritmasından% 3.91, DeeplabV3'ünkinden % 23.32 ve PSPNet'inkinden % 16.2 daha yüksekti. Bu, U-Net algoritmasının diğer algoritmalardan daha iyi performans gösterdiğine dair kanıt sağlar.

Bununla birlikte, derin öğrenme algoritmaları kullanılarak dil görüntülerinin segmentasyonunda ve sınıflandırılmasında bazı sorunlar vardır. Örneğin, hasta gizliliği nedeniyle, tıbbi görüntü veri kümeleri, diğer semantik bölümlere ayrılmış veri kümelerine kıyasla boyut olarak çok küçüktür ve bu da büyük verilerde derin öğrenmenin avantajlarını kısıtlar. Büyük parametre modeli segmentasyonu, montaj problemine eğilimlidir. Bu nedenle, ağ yapısının uygun iyileştirme modları seçilerek ayarlanması gerekir. Şu anda, dil teşhisinin nesnelleştirme araştırması henüz tek tip bir toplama standardı oluşturmamıştır; satın alma ortamı ve ışık kaynağı türü uygun standardizasyondan yoksundur. Araştırmacılar genellikle toplama ortamını kurar ve kendi halka açık olmayan veritabanlarını oluştururlar. Aynı zamanda, mevcut algoritmik modeller iyi bir doğruluk elde edebilse de, kullanılan veriler dikkatli bir şekilde taranır ve önceden işlenir, bu da gerçek tanı ve tedavi ortamında elde edilmesi zordur, böylece klinik uygulamasını sınırlar. Ek olarak, dil teşhisinin daha fazla nesnelleştirilmesi, farklı cihazlar tarafından yakalanan karmaşık ortamlar veya dil görüntüleri ile ilgilenecektir33. Diğer bir eğilim ise dinamik bilgi işleme, özellikle dil hakkında daha ayrıntılı bilgi sağlayan ve dil teşhisinin avantajlarını daha kapsamlı bir şekilde yansıtan video görüntü işlemedir. Bu nedenle, dinamik detayları işlemek için derin öğrenme algoritmaları geliştirmek gerekir. Genel olarak, tıbbi dil teşhisinin nesnelleştirilmesi, derin öğrenme algoritmaları ile birleştiğinde, TCM tanısında öznelliği azaltma sözü vermektedir.

Subscription Required. Please recommend JoVE to your librarian.

Disclosures

Yazarların beyan edecekleri bir çıkar çatışması yoktur.

Acknowledgments

Bu çalışma, Çin Ulusal Doğa Vakfı (hibe no.82004504), Çin Bilim ve Teknoloji Bakanlığı Ulusal Anahtar Araştırma ve Geliştirme Programı (hibe no.2018YFC1707606), Sichuan Eyaleti Çin Tıbbı İdaresi (hibe no.2021MS199) ve Çin Ulusal Doğa Vakfı (hibe no.82174236) tarafından desteklenmiştir.

Materials

Name Company Catalog Number Comments
CPU Intel(R) Core(TM) i7-9700K
GPU  NVIDIA GeForce RTX 3070 Ti (8192MB)
Operating systems Microsoft Windows 10 Professional Edition (64-bit)
Programming language Python
RAM 16G

DOWNLOAD MATERIALS LIST

References

  1. Jiu, G., et al. Effects of herbal therapy on intestinal microbiota and serum metabolomics in different rat models of Mongolian medicine. Evidence-Based Complementary and Alternative. 2022, 7255780 (2022).
  2. Xi, J., Xin, Y., Teregle, Study on the correlation between the animal model of Mongolian medicine 34;Xieri disease" and serum ALT and AST. Electronic Journal of Cardiovascular Diseases in Combination of Traditional Chinese. 4 (33), 134-135 (2016).
  3. Yin, L., et al. Study on the mechanism of serum differential protein changes in bronchial asthma based on proteomics. Chinese Journal of Traditional Chinese Medicine. 47 (22), 6227-6234 (2022).
  4. Wang, X. H., Bao, L. Band Seed. The origin and development of tongue diagnosis in Mongolian medicine. Chinese Ethnic Folk Medicine. (1), 64-65 (2008).
  5. Yang, S., et al. A comparative study on the feature parameters of tongue diagnosis images in five nationalities. Chinese Journal of Traditional Chinese Medicine. 36 (11), 6428-6430 (2021).
  6. He, J. Y., et al. Efficacy and safety of Chou-Ling-Dan granules in the treatment of seasonal influenza via combining Western and traditional Chinese medicine, protocol for a multicentre, randomised controlled clinical trial. BMJ Open. 9 (4), e024800 (2019).
  7. Wang, D. J., et al. Scientific knowledge mapping and visualization analysis in the field of Chinese medicine tongue feature objectification research. World Science and Technology - Modernization of Chinese Medicine. 23 (9), 3032-3040 (2021).
  8. Yuan, S. M., Qian, P., Li, F. F. Research progress of color correction methods for tongue and face diagnosis in traditional Chinese Medicine. Chinese Journal of Traditional Chinese Medicine. 34 (9), 4183-4185 (2019).
  9. Kanawong, R., et al. Tongue image analysis and its mobile app development for health diagnosis. Advances in Experimental Medicine and Biology. 1005, 99-121 (2017).
  10. Yu, Y., et al. Semantic segmentation evaluation index and evaluation method. Computer Engineering and Application. , (2023).
  11. Sehyung, L., Negishi, M., Urakubo, H., Kasai, H., Ishii, S. Mu-net: Multi-scale U-net for two-photon microscopy image denoising and restoration. Neural Networks. 125, 92-103 (2020).
  12. Huang, X. M., et al. A review on the application of U-Net and its variants in medical image segmentation. Chinese Journal of Biomedical Engineering. 41 (5), 567-576 (2022).
  13. Lu, J. H., Xu, Y. F., Wang, Y. Q., Hao, Y. M. Research overview of tongue objectification in traditional Chinese medicine based on computer image technology. World Science and Technology - Modernization of Traditional Chinese Medicine. 24 (11), 4568-4573 (2022).
  14. Mansour, R. F., Althobaiti, M. M., Ashour, A. A. Internet of things and synergic deep learning based biomedical tongue color image analysis for disease diagnosis and classification. IEEE Access. 9, 94769-94779 (2021).
  15. Cai, Y. H., Hu, S. B., Guan, J., Zhang, X. F. Analysis of the development and application of tongue diagnosis objectification techniques in Chinese medicine. World Science and Technology - Modernization of Chinese Medicine. 23 (7), 2447-2453 (2021).
  16. Ghosh, S., Das, N., Nasipuri, M. Reshaping inputs for convolutional neural network: some common and uncommon methods. Pattern Recognition. 93, 79-94 (2019).
  17. Shang, Z. M., et al. Research progress of digital acquisition and characterization of tongue diagnosis information. Chinese Journal of Traditional Chinese Medicine. 36 (10), 6010-6013 (2021).
  18. Ning, J., Zhang, D., Wu, C., Yue, F. Automatic tongue image segmentation based on gradient vector flow and region merging. Neural Computing and Applications. 21, 1819-1826 (2012).
  19. Zheng, F., Huang, X. Y., Wang, B. L., Wang, Y. H. A method for tongue detection based on image segmentation. Journal of Xiamen University. 55 (6), 895-900 (2016).
  20. Li, Y. T., Luo, Y. S., Zhu, Z. M. Deep learning-based tongue feature analysis. Computer Science. 47 (11), 148-158 (2020).
  21. Wang, Y. D., Sun, C. H., Cui, J. L., Wu, X. R., Qin, Y. X. Research on deep learning-based tongue fissure segmentation algorithm. World Science and Technology - Modernization of Chinese Medicine. 23 (9), 3065-3073 (2021).
  22. Wang, X. M., Wang, R. Y., Guo, D., Lu, S. Z., Zhou, P. Research on the identification method of tongue punctures based on auxiliary light source. Journal of Sensing Technology. 29 (10), 1553-1559 (2016).
  23. Yang, J. D., Zhang, P. A fully connected neural network based on migration learning for tongue image classification. Journal of the Second Military Medical University. 39 (8), 897-902 (2018).
  24. Song, C., Wang, B., Xu, J. T. Research on tongue feature classification method based on deep migration learning. Computer Engineering and Science. 43 (8), 1488-1496 (2021).
  25. Ding, H. J., He, J. C. Study on modern techniques and methods of tongue diagnosis. Shi Zhen Chinese Medicine. 21 (5), 1230-1232 (2010).
  26. Zhai, P. B., et al. A multi-stage tongue image classification algorithm incorporating attention mechanism. Computer Engineering and Design. 42 (6), 1606-1613 (2021).
  27. Hou, Y. S. A new clustering analysis algorithm based on deep learning. Journal of Xinxiang University. 35 (12), 4 (2018).
  28. Shi, Y. L., et al. A decision tree algorithm for classification of non-small cell lung cancer evidence based on tongue and pulse data. World Science and Technology - Modernization of Chinese Medicine. 24 (7), 2766-2775 (2022).
  29. Li, J., Hu, X. J., Zhou, C. L., Xu, J. T. Study on the feature analysis and diagnosis model of diabetic tongue based on random forest algorithm. Chinese Journal of Traditional Chinese Medicine. 37 (3), 1639-1643 (2022).
  30. Chen, C. H., et al. The characteristics of the combination of the four diagnostic methods of traditional Chinese medicine from the perspective of the differences between Chinese and Western medical diagnosis methods. Journal of Guangzhou University of Traditional Chinese Medicine. 28 (3), 332-334 (2011).
  31. Chen, R., et al. Correlation analysis of tongue image and western medicine typing in 382 patients with novel coronavirus pneumonia based on Lab colour model and imaging histology. Chinese Journal of Traditional Chinese Medicine. 36 (12), 7010-7014 (2021).
  32. Ju, J. W., Jung, H., Lee, Y. J., Mun, S. W., Lee, J. H. Semantic segmentation dataset for AI-based quantification of clean mucosa in capsule endoscopy. Medicina. 58 (3), 397 (2022).
  33. Wu, X., et al. A review of research on deep learning in tongue image classification. Computer Science and Exploration. , 1-23 (2022).

Tags

Tıp Sayı 194 etnik tıp geleneksel Çin tıbbı dil teşhisi algoritma derin öğrenme
Geleneksel Tıpta Dil Tanısının Nesnelleştirilmesi, Veri Analizi ve Çalışma Uygulaması
Play Video
PDF DOI DOWNLOAD MATERIALS LIST

Cite this Article

Feng, L., Xiao, W., Wen, C., Deng,More

Feng, L., Xiao, W., Wen, C., Deng, Q., Guo, J., Song, H. Objectification of Tongue Diagnosis in Traditional Medicine, Data Analysis, and Study Application. J. Vis. Exp. (194), e65140, doi:10.3791/65140 (2023).

Less
Copy Citation Download Citation Reprints and Permissions
View Video

Get cutting-edge science videos from JoVE sent straight to your inbox every month.

Waiting X
Simple Hit Counter