Il presente studio ha utilizzato U-Net e altri algoritmi di deep learning per segmentare un’immagine della lingua e ha confrontato i risultati della segmentazione per studiare l’oggettivazione della diagnosi della lingua.
La diagnosi della lingua è una tecnica essenziale della diagnosi della medicina tradizionale cinese (MTC) e la necessità di oggettivare le immagini della lingua attraverso la tecnologia di elaborazione delle immagini è in crescita. Il presente studio fornisce una panoramica dei progressi compiuti nell’oggettivazione della lingua negli ultimi dieci anni e confronta i modelli di segmentazione. Vari modelli di deep learning sono costruiti per verificare e confrontare gli algoritmi utilizzando set di immagini in lingua reale. Vengono analizzati i punti di forza e di debolezza di ciascun modello. I risultati indicano che l’algoritmo U-Net supera altri modelli per quanto riguarda l’accuratezza di precisione (PA), il richiamo e le metriche di intersezione media su unione (MIoU). Tuttavia, nonostante i significativi progressi nell’acquisizione e nell’elaborazione delle immagini della lingua, non è ancora stato stabilito uno standard uniforme per oggettivare la diagnosi della lingua. Per facilitare l’applicazione diffusa delle immagini della lingua catturate utilizzando dispositivi mobili nell’oggettivazione della diagnosi della lingua, ulteriori ricerche potrebbero affrontare le sfide poste dalle immagini della lingua catturate in ambienti complessi.
L’osservazione della lingua è una tecnica ampiamente utilizzata nella medicina etnica tradizionale cinese (MTC). Il colore e la forma della lingua possono riflettere la condizione fisica e varie proprietà, gravità e prognosi della malattia. Ad esempio, nella medicina tradizionale Hmong, il colore della lingua viene utilizzato per identificare la temperatura corporea, ad esempio, una lingua rossa o viola indica fattori patologici legati al calore. Nella medicina tibetana, una condizione viene giudicata osservando la lingua di un paziente, prestando attenzione al colore, alla forma e all’umidità del muco. Ad esempio, le lingue dei pazienti con malattia di Heyi diventano rosse e ruvide o nere e secche1; i pazienti con malattia di Xieri2 hanno la lingua gialla e secca; nel frattempo, i pazienti con malattia di Badakan3 hanno una lingua bianca, umida e morbida4. Queste osservazioni rivelano la stretta relazione tra le caratteristiche della lingua e la fisiologia e la patologia. Nel complesso, lo stato della lingua svolge un ruolo vitale nella diagnosi, nell’identificazione della malattia e nella valutazione dell’effetto del trattamento.
Allo stesso tempo, a causa delle diverse condizioni di vita e pratiche alimentari tra i diversi gruppi etnici, sono evidenti variazioni nelle immagini della lingua. Il modello Lab, stabilito sulla base di uno standard internazionale per la determinazione del colore, è stato formulato dalla Commission International Eclairage (CIE) nel 1931. Nel 1976, un modello di colore è stato modificato e nominato. Il modello di colore Lab è composto da tre elementi: L corrisponde alla luminosità, mentre a e b sono due canali di colore. A include colori dal verde scuro (valore di luminosità basso) al grigio (valore di luminosità medio) al rosa brillante (valore di luminosità elevato); B va dal blu brillante (valore di luminosità basso) al grigio (valore di luminosità medio) al giallo (valore di luminosità alto). Confrontando i valori L x a x b del colore della lingua di cinque gruppi etnici, Yang et al.5 hanno scoperto che le caratteristiche delle immagini della lingua dei gruppi Hmong, Hui, Zhuang, Han e mongoli erano significativamente distinte l’una dall’altra. Ad esempio, i mongoli hanno lingue scure con un rivestimento di lingua gialla, mentre gli Hmong hanno lingue chiare con un rivestimento di lingua bianca, suggerendo che le caratteristiche della lingua possono essere utilizzate come indicatore diagnostico per valutare lo stato di salute di una popolazione. Inoltre, le immagini della lingua possono funzionare come indice di valutazione per la medicina basata sull’evidenza nella ricerca clinica della medicina etnica. He et al.6 hanno utilizzato le immagini della lingua come base per la diagnosi di MTC e hanno valutato sistematicamente la sicurezza e l’efficacia dei pellet Chou-Ling-Dan (granuli CLD usati per trattare malattie infiammatorie e febbrili, compresa l’influenza stagionale in MTC) combinati con la medicina cinese e occidentale. I risultati hanno stabilito la validità scientifica delle immagini della lingua come indice di valutazione per gli studi clinici. Tuttavia, i medici tradizionali generalmente si affidano alla soggettività per osservare le caratteristiche della lingua e valutare le condizioni fisiologiche e patologiche dei pazienti, richiedendo indicatori più precisi.
L’emergere di Internet e della tecnologia dell’intelligenza artificiale ha spianato la strada alla digitalizzazione e all’oggettivazione della diagnosi della lingua. Questo processo comporta l’utilizzo di modelli matematici per fornire una descrizione qualitativa e oggettiva delle immagini della lingua7, che rifletta il contenuto dell’immagine della lingua. Il processo include diverse fasi: acquisizione dell’immagine, compensazione ottica, correzione del colore e trasformazione geometrica. Le immagini pre-elaborate vengono quindi inserite in un modello algoritmico per il posizionamento e la segmentazione delle immagini, l’estrazione delle caratteristiche, il riconoscimento dei modelli, ecc. Il risultato di questo processo è una diagnosi altamente efficiente e precisa dei dati dell’immagine della lingua, raggiungendo così l’obiettivo di oggettivazione, quantificazione e informatizzazione della diagnosi della lingua8. Pertanto, viene raggiunto lo scopo di un’elaborazione ad alta efficienza e alta precisione dei dati di diagnosi della lingua. Basato sulla conoscenza della diagnosi della lingua e sulla tecnologia di apprendimento profondo, questo studio ha separato automaticamente il corpo della lingua e il rivestimento della lingua dalle immagini della lingua utilizzando un algoritmo informatico, al fine di estrarre le caratteristiche quantitative delle lingue per i medici, migliorare l’affidabilità e la coerenza della diagnosi e fornire metodi per la successiva ricerca sull’oggettivazione della diagnosi della lingua9.
Sulla base dei risultati del confronto presentati sopra, è evidente che le caratteristiche dei quattro algoritmi in esame sono varie e i loro distinti vantaggi e svantaggi sono descritti di seguito. La struttura U-Net, basata sulla modifica e l’espansione di una rete di convoluzione completa, può ottenere informazioni contestuali e posizionamento preciso attraverso un percorso di contrazione e un percorso di espansione simmetrico. Classificando ogni punto pixel, questo algoritmo raggiunge una maggiore precisione di seg…
The authors have nothing to disclose.
Questo lavoro è stato sostenuto dalla National Nature Foundation of China (sovvenzione n. 82004504), dal National Key Research and Development Program del Ministero della Scienza e della Tecnologia della Cina (sovvenzione n. 2018YFC1707606), dalla Chinese Medicine Administration della provincia del Sichuan (sovvenzione n. 2021MS199) e dalla National Nature Foundation of China (sovvenzione n. 82174236).
CPU | Intel(R) Core(TM) i7-9700K | ||
GPU | NVIDIA GeForce RTX 3070 Ti (8192MB) | ||
Operating systems | Microsoft Windows 10 Professional Edition (64-bit) | ||
Programming language | Python | ||
RAM | 16G |