Cilt Lezyonu Sınıflandırması İçin Açıklanabilir Bir Gizlilik Koruyucu Multimodal Topluluk Çerçevesi

Amrita Koul; N. P. Singh

doi:10.3791/71472

Research Article

Cilt Lezyonu Sınıflandırması İçin Açıklanabilir Bir Gizlilik Koruyucu Multimodal Topluluk Çerçevesi

DOI:

10.3791/71472

⸱

June 12th, 2026

Amrita Koul¹ , N. P. Singh¹

¹Department of Computer Science and Engineering, School of Engineering and Technology, MVN University, Palwal

Summary

$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

Önerilen çalışma, erken cilt kanseri tespiti için derin öğrenme özellikleri, klinik meta veriler ve açıklanabilir yapay zeka tekniklerini entegre ederek teşhis doğruluğunu, şeffaflığı ve güvenilir klinik karar desteğini artırarak doğru cilt lezyonu sınıflandırması için açıklanabilir, gizlilik koruyan çok modlu bir toplu kumaş düzenlemesi geliştirmeyi ve değerlendirmeyi amaçlamaktadır.

Abstract

$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

Dermatolojik hastalıklar arasında cilt kanseri en hayati tehlike oluşturanlardan biridir. Erken ve doğru teşhis, hastanın prognozunu iyileştirmek için önemlidir. Buna rağmen, geleneksel yapay zeka tabanlı tanı yöntemleri, gizlilik endişeleri, sınırlı yorumlanabilirlik ve çok sınıflı cilt lezyonu veri setlerinde ciddi sınıf dengesizliği gibi çeşitli zorluklarla karşı karşıyadır. Bu zorlukların üstesinden gelmek için, önerilen makale, karmaşık derin öğrenme modelleri ve toplu modelleme yaklaşımını açıklanabilir yapay zeka yöntemleriyle birleştiren, gizliliğe duyarlı, açıklanabilir çok modlu bir cilt lezyonu sınıflandırma modeli önermektedir. Deneysel değerlendirme, Kaggle Hub aracılığıyla erişilebilen çok sınıflı cilt lezyonu sınıflandırması üzerine kamuya açık HAM10000 kıyaslama verileri kullanılarak yapılır; bu veriler yedi klinik açıdan önemli lezyon sınıfına (akiec, bcc, bkl, df, mel, nv, vasc) dağıtılmıştır. Verileri dengelemek için, azınlık sınıflarını güçlendirmek için sınıf dengeleme tekniği kullanılır. EfficientNet B4, DenseNet201 ve MobileNetv2, derin özellik temsillerini çıkarmak için kullanılır ve ardından belirgin klinik meta verilerle birleştirilerek sağlam bir multimodal özellik alanı oluşturulur. Bu multimodal özellikler, XGBoost, LightGBM, Derin Sinir Sınıflandırıcısı (DNC) eğitimlerinde kullanılır ve sırasıyla %92, %90 ve %94 sınıflandırma doğruluğu elde edilmiştir. XGBoost, LightGBM ve Derin Sinir Sınıflandırıcı (DNC) çıktılarını birleştirmek için üst üste bir topluluk stratejisi uygulanır ve bu da doğruluğun %96'ya artmasına yol açar. Model yorumlanabilirlik teknikleri, şeffaflığı artıran özellik düzeyinde açıklamalar sağlar. Deneysel bulgular, önerilen çerçevenin klinik olarak ilgili gerçek yaşam sınıflandırmasıyla verimlilik açısından uygulanabilirliğini kanıtladı.

Introduction

$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

Cilt kanseri, dünya çapında artan insidans oranlarıyla önemli bir küresel sağlık yükü^{oluşturur 1}. Yapay radyasyon, cilt kanserine katkıda bulunan önemli bir faktör olarak kabul edilir ve kontrol edilmemiş hücre çoğalmasına ve tümör gelişimine yol açan genetik mutasyonlara yol açar ^1,2_.Cilt kanserleri, melanom, skuamöz hücreli karsinom ve bazal hücreli karsinom (BCC) gibi bir hastalık grubunu oluşturur. Bu hastalıkların nedenleri, klinik sunumu ve prognostik faktörleri^{farklılık gösterir 3}. Cilt hastalıkları, piksel düzeyindeki benzerlikler nedeniyle tıbbi tanıda bir engel^{haline geldi 4}. 2022 yılında, dünya genelinde 331.722 tahmini melanoma vakası (58.667 ölüm) ve 1,2 milyon NMSC vakası (69.416 ölüm) vardı. Melanoma için yaşa göre standartlaştırılmış ölüm oranlarının (ASR) zirvesi Okyanusya (29,78/100.000), Kuzey Amerika (16,3) ve Avrupa (10,43) idi. Ancak, ölüm oranı Afrika (0,35) ve Asya'da (0,30) Kuzey Amerika ve Okyanusya'da (her ikisinde 0,02) en yüksekti; bu da daha kötü bir^{prognozu yansıtabilir.} Dermatolojide, cilt lezyonlarının tanısı ve izlenmesi öncelikle görsel muayene ve diğer invaziv olmayan değerlendirmelere dayanmıştır. İnvaziv yöntemler uygulanmaz, çünkü lezyonlara zarar verebilir ve lezyon büyümesinin klinik takibinin yapılmasını^{engelleyebilir.} Cilt lezyonları farklı türlerde olabilir: melanoma (MEL), dermatofibroma (DF), aktinik keratoz ve intraepitelyal karsinom (AKIEC), bazal hücre karsinomi (BCC), iyi huylu keratoz (BKL), melanositik nevus (NV) ve vasküler lezyonlar (VASC), HAM10000 veri^{seti 5'te} tanımlandığı gibi. Dermatoskopik görüntülerin sınıflandırılmasında başlıca zorluklar tüyler, mürekkepler, cetvel izleri, renkli lekeler, parıltılar, damlalar, yağ kabarcıkları, kan damarları, hiperpigmentli alanlar ve/veya iltihap lezyonların^{varlığıdır.} Daha önce tıbbi görüntüleme ve cilt lezyonu sınıflandırması için özellik seçimi ve derin öğrenme^{üzerine çalışmalar yapılmıştır} ^7,8.

Cilt kanseri teşhisi için bilgisayar görme tabanlı yaklaşımlar ve el yapımı ile derin özelliklerin entegrasyonu da^{incelenmiştir 9}, ayrıca sınıflandırma performansını artırmak için özellik birleştirme^{stratejileri de incelenmiştir 10}. Son gelişmeler, makine öğreniminin sağlık sistemlerinde entegrasyonunu ve güvenli tıbbi veri işleme çerçevelerini daha da^{vurgulamaktadır 11,12}_.Gelişmiş hesaplamalı algoritmalarla desteklenen yapay zeka sağlık hizmeti kullanımı, özellikle uzaktan ve evde bakım ortamlarındaki hastalar için faydalı olan kişiselleştirilmiş ve verimli entegre bakım programları sunma^{potansiyeline sahiptir 13}. Dermatoskopik görüntülerin geniş veri setleri kullanılarak, derin öğrenme modelleri—özellikle Konvolüsyon sinir ağları (CNN)—çeşitli cilt lezyonlarını doğru şekilde tanımlamak ve sınıflandırmak için eğitilebilir. Cilt lezyonu segmentasyonunda güçlü sonuçlar gösteren birkaç teknik, bunlar arasında Tam Konvolüsyon Ağlar (FCN'ler), CNN'ler, Derin CNN'ler (DCNN'ler), Tam Konvolüsyon Kıntı Ağlar (FCRN'ler) ve U-Net mimarileri bulunur. Derin sinir ağları (DNN'ler), oldukça karmaşık mimarileri nedeniyle kolayca yorumlanamıyor, bu yüzden karar alma süreçlerini anlamak^{zordur 14,15}. Tıbbi görüntü analizindeki son gelişmeler, derin konvolüsyon sinir ağlarının (CNN) cilt lezyonu sınıflandırma görevlerinde verimliliği önemli ölçüde artırdığını göstermiştir. HAM10000 gibi dermoskopik veri setleri üzerinde yapılan birkaç çalışma, ResNet, DenseNet ve EfficientNet gibi CNN tabanlı mimarilerin, lezyon görüntülerinden hiyerarşik özellik temsillerini öğrenerek güçlü çok sınıflı sınıflandırma performansı elde ettiğini göstermiştir. Birden fazla CNN omurgası birleştirildiği hibrit özellik füzyon yaklaşımları, tamamlayıcı derin temsilleri entegre ederek tanı doğruluğunu daha da^{artırmıştır 16}. Ayrıca, mevcut çalışmalar hibrit CNN Transformatör modellerini tıbbi görüntü analizinde incelemiştir. Görme transformatörü ve CNN özellik çıkarıcılarına sahip modellerin, cilt lezyonu sınıflandırma görevlerinde daha iyi sonuçlar verdiği kanıtlanmıştır; çünkü yerel doku içeriğini ve küresel bağlamsal ilişkileri daha iyi çıkarabilirler¹⁷. Bu hibrit tasarımlar, dengeli temsil öğrenme yeteneğine sahip oldukları için tıbbi görüntülemede de en son teknoloji olarak görülmektedir.

Tıbbın diğer alanlarında, özellik füzyon stratejileri dermatoloji dışında yaygın olarak kullanılmıştır. CNN tabanlı hibrit sistemler, akciğer ve kolon kanserinin daha iyi sınıflandırılması için histopatolojik görüntülerin analizinde de uygulanmıştır; gelişmiş özellik temsilleri ve mekansal öğrenme dinamikleri^{ile 16}. Aynı şekilde, oftalmolojide birleşmiş özellik temsilleri üzerine eğitilmiş derin öğrenme modellerinin kullanımı, diyabetik retinopati ile fundus görüntülerinin aşamalanmasında başarılı bir uygulama göstermiştir; çok sınıflı bir derecelendirme görevinde daha sağlam ve sınıflandırma doğruluğu^{sağlamıştır 18}. Bu alanlardaki multimodal füzyon yöntemleri, heterojen özellik temsillerinin özellikle dengesiz tıbbi verilerde daha iyi genelleme ve sınıflandırma sağladığını^{göstermektedir 19}.

Bu iyileştirmeler yapılmış olsa da, mevcut uygulamalar genellikle çoklu modal olmakla sınırlıdır, entegre değildir, sınıf dengesizliği sorununu ele almak için yetersiz ve klinik karar alma süreçlerinde faydalı değildir. Bu sorunları aşmak için, bu makale gizlilik farkında olan ve her iki model yorumlanabilirlik yöntemini entegre eden açıklanabilir bir cilt lezyonu sınıflandırma modeli sunmaktadır. Bu tür açıklanabilirlik yöntemleri, modelin tahminlerini açıklamak, hangi özelliklerin en önemli olduğunu göstermek ve dermoskopik görüntülerin önemli alanlarını vurgulamak için kullanılabilir; böylece klinik prosedürlerde netlik ve güveni artırır, böylece klinik şeffaflığı artırır, güven oluşturur ve yapay zeka sistemlerinin klinik uygulamada güvenli uygulanmasını destekler. HAM10000 veri setinde önemli bir dengesizlik vardır; bazı sınıflarda diğerlerinden çok daha az örneklem bulunur. Bu sorunu aşmak için, sentetik azınlık aşırı örnekleme tekniği (sınıf dengeleme olarak da bilinir) az temsil edilen sınıflar için sentetik örnekler üretmek amacıyla kullanılır. Sınıf dengeleme teknikleri, veri setini dengeler; modelin azınlık lezyon tiplerinden daha iyi öğrenmesini sağlar, duyarlılığı artırır ve klinik olarak anlamlı ancak daha az sık kullanılan cilt kanseri sınıflarının daha güvenilir tahmin edilmesini sağlar. EfficientNet-B4, DenseNet201 ve MobileNetV2'nin derin özellikleri, klinik meta verilerle birleştirilerek her cilt lezyonunun daha bilgilendirici bir temsili oluşturulur. Bu çift özellik, dermoskopik görüntülerin ve diğer hasta bilgilerinin görsel desenlerini çıkarıp daha derinlemesine bir analiz yapmamıza yardımcı olur. Özellikler daha sonra XGBoost, LightGBM ve Derin Sinir Ağı gibi farklı sınıflandırıcılarda eğitilerek cilt lezyonu sınıflandırma modelinin yetenek ve gücünü artırıyor. Modeller topluluğu, modeli geliştirmek için üst üste yığma tekniği ile kullanılır. Bu, çoklu modellerin güçlü yönlerinden yararlanarak topluluktaki tüm modellerin tahminlerinden öğrenen ve faydalanan bir bileşik modeldir; aynı zamanda onların sınırlamalarını hafifletmektedir.

Access restricted. Please log in or start a trial to view this content.

Protocol

$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

Bu çalışma, kamuya açık ve tamamen anonimleştirilmiş dermoskopik veri setlerini kullandı ve doğrudan insan katılımı içermedi; bu nedenle, etik komite onayı gerekmiyordu. Materyaller Tablosu , bu çalışmada kullanılan tüm malzeme veya araçların detaylarını içerir. Tablo 1 , işlemci türü, bellek, işletim sistemi ve yazılım çerçeveleri gibi donanım ve yazılım ortamının ayrıntılarını içerir. Tablo 2 , her cilt lezyonu kategorisi için sınıf bazında hassasiyet, geri çağırma, F1 puanı ve destek detaylarını içerir.

Önerilen çok modlu cilt lezyonu sınıflandırma çerçevesinin genel iş akışı

Bu araştırmanın genel planı, cilt lezyonlarının çoklu sınıflandırılmasının kesin ve anlaşılır bir şeması oluşturmaktır. İş akışı, HAM10000 veri setinin veri toplama ve ön işleme ile başlar, ardından derin öğrenme mimarileri ve klinik meta verilerin dahil edilmesiyle özellik çıkarımına geçer. Daha sonra, birkaç makine öğrenimi sınıflandırıcısı eğitilip optimize edilir ve sonuçları bir toplu stratejide toplanır. Son olarak, modelin tahminleri açıklanabilirlik teknikleri kullanılarak yorumlanır ve modelin etkinliği gerçek dünyada klinik karar desteğinde kullanılmak üzere değerlendirilir.

Önerilen sistemin öngörü doğruluğunu artırmak için, hem görüntü tabanlı özellikleri hem de klinik meta verileri birleştiren çok modlu bir makine öğrenimi boru hattı kullanılır ( Şekil 1'de gösterildiği gibi). Model, dermoskopik görüntülerin görsel çıktılarını hastayla ilgili bilgilerle birleştirerek çeşitli cilt lezyonlarıyla ilgili daha ayrıntılı desenleri tespit edebilir. Böyle bir kombinasyonla, sistem daha iyi tahminler yapabilir ve bu nihayetinde gerçekleşecek. Cilt lezyonu sınıflandırmasının kalitesini ve faydalılığını artırın. Sinir ağlarının yardımıyla üç önceden eğitilmiş konvolüsyon Derin özellik çıkarılır (EfficientNet-B4, DenseNet201 ve MobileNetV2): dermoskopik görüntülerin çeşitli tamamlayıcı desenlerini yakalayabilirler. Bu mimariler, cilt lezyonlarının nasıl göründüğünü, renk ve doku değişikliklerini ve inşa şeklini yüksek seviyede öğrenir. Daha sonra, bir özellik füzyon modülü derin özellikleri klinik özellikler ve demografik verilerle birleştirerek zengin çok modlu bir özellik oluşturur. Birleştirilen veriler, uygun model testini sağlamak için eğitim, doğrulama ve test verilerine ayrılır. Sonrasında, derin özellikleri klinik özellikler ve demografiklerle birleştirmek için bir özellik birleşimi modülü kullanılır ve zengin çok modlu bir özellik oluşturulur. Bu veriler daha sonra modeli test etmek için eğitim, test ve doğrulama verilerine ayrılır. Tahmin doğruluğunu daha da artırmak için topluluk stratejisi kullanılır. Bu, birkaç modelin sonuçlarının ortalaması alınarak ve bu ortalamalı olasılıkları kullanarak nihai tahmini yaparak genelleştirmeyi artırarak ve bireysel modellerin neden olacağı varyansı en aza indirerek yapılır. Bunun yanı sıra, model yorumlanabilirlik teknikleri gibi açıklanabilirlik yöntemleri de modelin kararlarını nasıl verdiğini daha iyi açıklamak için entegre edilmiştir. Model yorumlanabilirlik yöntemi, giriş değişkenlerinin katkısını nicelikle ölçerek özellik düzeyinde yorumlar sağlarken, model yorumlanabilirlik yöntemi ise dermoskopik görüntülerde tahmini etkileyen piksel düzeyindeki önemli alanları belirler. Model yorumlanabilirlik teknikleri, her giriş değişkeninin katkısını nicelikten ölçerek özellik düzeyinde açıklamalar sunarken, model yorumlanabilirlik teknikleri dermoskopik görüntülerde tahmini etkileyen piksel düzeyindeki önemli bölgeleri vurgular. Bu teknikler birleştiğinde, modelleri daha yorumlanabilir hale getirir ve klinisyenlerin sistemin kararları nasıl aldığını öğrenmelerine yardımcı olur. Sonuç olarak, önerilen ürün hattı, anlaşılır ve gizlilik farkında bir sistem sunarak şeffaflığı ve güveni artırıyor ve gerçek dünyada sağlık ortamında daha güvenilir cilt kanseri teşhisi konmasını sağlıyor.

Hazırlıklı veri seti açıklaması

Bu makalede, HAM10000 (10.000 eğitim görseliyle İnsan Makineye Karşı) veri seti çok sınıflı cilt lezyonu sınıflandırması için birincil veri seti olarak kullanılmıştır. Veri seti, çeşitli tıbbi kaynaklardan toplanan 10.000'den fazla dermoskopik figürü içermektedir. Klinik kaynaklar ve popülasyonlar, dermatolojik görüntü analizinde en yaygın kullanılan kıyaslama veri setlerinden biri haline gelir. Veri setindeki her görüntü, görüntü tanımlayıcıları, tanı etiketleri, hasta yaşı, cinsiyet ve lezyonun anatomik konumu gibi önemli klinik meta verilerle birlikte gelir. Veri seti yedi tanısal kategoriyi kapsar: aktinik keratozlar (akiec), bazal hücre karsinomu (bcc), iyi huylu keratoz (bkl), dermatofibroma (df), melanositik nevuslar (nv), vasküler lezyonlar (vasc) ve melanoma (mel).

Klinik meta veri ön işlemesi

Sınıflandırma hattına eklenen yardımcı özellikler arasında yaş, cinsiyet ve hastadaki lezyonun konumu gibi klinik meta veriler yer alıyordu. Eksik veya bilinmeyen değerler vardı ve bunlar deterministik bir ön işleme yaklaşımıyla ele alındı. Yaş değişkeni (sayısal) durumunda, eğitim setinde hesaplanan medyan yaş eksik değerleri hesaplamak için kullanılmıştır. Medyan atama seçilmesinin nedeni, klinik verilerde yaygın olan istisnalara ve çarpık verilere dirençli olmasıdır. Cinsiyet ve lezyon konumu (kategorik değişkenler) için eksik veya belirtilmemiş değerler hariç tutulmadı; 'bilinmeyen' etiketli özel bir kategoriye atandılar. Yöntem, mevcut tüm örnekleri korur ve model, eksikliğin kendisinin öngörücü olup olmadığını belirlemekte özgürdür. Daha sonra kategorik değişkenlere tek sıcak kodlama uygulanarak onları makine öğrenimi modelleriyle uyumlu hale getirdi. Tüm ön işleme, örneğin emputasyon, kodlama vb. sadece eğitim setinde yapılır ve veri kaybını önlemek için doğrulama ve deney setlerine de aynı dönüşümler yapılırdı. Klinik meta verilerin eksikliği nedeniyle örneklemler dışlanmamıştı ve bu da verilerin maksimum düzeyde kullanılmasını ve metodolojik tutarlılığın sağlanmasını sağladı.

Şekil 1: Cilt lezyonu sınıflandırması için multimodal sistem. Çalışma yaklaşımı, dermoskopik görüntü özelliklerini hasta meta verileriyle birleştirerek deri lezyonlarını topluluk derin öğrenme modelleri kullanarak sınıflandırıyor. Çerçeve, ön işleme, özellik çıkarma, çoklu modlu birleşme ve sınıflandırmayı içerir; böylece gelişmiş tanı performansı ve yorumlanabilirlik sağlanır. Bu figürün daha büyük bir versiyonunu görmek için lütfen buraya tıklayın.

İş akışı, HAM10000 cilt lezyonu veri setinin dermoskopik görüntüleri ve klinik meta verilerine dayanarak önerilen sınıflandırma hattını gösterir. EfficientNet-B4, DenseNet201 ve MobileNetV2, görüntülerdeki derin özellikleri ön işlemek ve çıkarmak için kullanılır. Klinik meta veriler kodlanır ve görüntü özellikleri klinik meta verilerle birleştirmek için özellik birleştirme yöntemi kullanılır. Sınıf dengesizliği sorununu ele almak için, sınıf dengeleme tekniği, ham görüntüler veya bireysel özellik akışları yerine birleşmiş çoklu modal özellik alanında kullanılır; burada sentetik örnekler hem görsel hem de klinik özelliklerin birleşimini korur ve gerçekçi olmayan örnekler üretmez. Birleşik özellikler daha sonra XGBoost, LightGBM ve derin sinirsel sınıflandırıcı gibi sınıflandırıcılar üzerinde eğitiliyor.

Şekil 2: HAM10000 veri setinden yedi farklı tanı grubundan dermoskopik örnekler. Görüntüler, otomatik sınıflandırma için kullanılan tipik görsel özellikleri gösterir. (A) Aktinik keratozlar (akiec), düzensiz pigmentasyona sahip pürüzlü yüzeyler gösterir. (B) Düzensiz şekiller ve kan damarları olan bazal hücreli karsinom (BCC). (C) Açık kahverengi yüzeyli keratoz benzeri lezyonlar (bkl), keratotik özellikler gösterir. (D) Dermatofibrom (df), merkezi yara benzeri görünümü ve pigmentasyonu vardır. (E) Melanositik nevüsler (nv), iyi huylu ve nispeten simetrik mollar. (F) Kan damarları nedeniyle kırmızımsı-mor bir görünüm gösteren damar lezyonları (vasc). (G) Melanoma (mel), düzensiz şekilli, asimetrik ve çok pigmentli bir lezyon olarak ortaya çıkar. Bu figürün daha büyük bir versiyonunu görmek için lütfen buraya tıklayın.

Bu dermoskopik görüntüler, cilt lezyonlarının görsel heterojenliğini ortaya koymaktadır; bu lezyonlarda pigmentasyon, doku ve yapının morfolojisinde farklılıklar vardır. Bu varyasyonlar, otomatik sınıflandırma sistemlerine büyük bir zorluk oluşturur ve derin öğrenme tabanlı sistemlerin önemini vurgular. Ince tanı kalıplarını ortaya çıkarmaya duyarlı olan özellik çıkarma teknikleri. Veri seti açıklamasının ardından, Şekil 2 , dermatolojik tanı görüntüleme araştırmalarında yaygın olarak incelenen HAM10000 veri setine dahil edilen yedi cilt lezyonu kategorisini göstermektedir. Bu sınıflar arasında Aktinik Keratoz (akiec), Bazal Hücre Karsinomi (bcc), Benign Keratoz (bkl), Dermatofibroma (df), Melanositik Nevus (nv), Vasküler Lezyonlar (vasc) ve Melanoma (mel)²¹ bulunur. Tüm bu lezyon türlerinin benzersiz görsel özellikleri vardır; Şekil 3'te gösterildiği gibi, pigmentasyon desenleri, yüzey dokusu, renk dağılımı ve lezyon sınırları boyunca anormallikler var. Tüm bu lezyonların görsel özellikleri farklıdır ve pigmentasyon, yüzey dokusu, renk dağılımı ve lezyonların sınırlarındaki anormalliklerde farklılıklarla karakterize edilirler. Bunlar, dermatologların klinik muayene yaparken aklında bulunduracağı önemli özelliklerdir ve doğru sınıflandırmaya ulaşmak için makine öğrenimi modelleri tarafından iyi modellenmelidir. Bunlar ayırt edici özellikler olsa da, bu lezyonların çoğu neredeyse aynı görünür, bu da sadece dermoskopik görüntülere bakıldığında aralarını ayırt etmeyi zorlaştırır. Bazı lezyon türleri arasındaki ayrım genellikle son derece ince olsa da klinik olarak önemlidir, bu da otomatik olarak sınıflandırmayı zorlaştırır. Bu yüzden, lezyon sınıfları arasında ince taneli görsel görüntüleri ve ince farklılıkları öğrenmek için eğitim alabilen güçlü yapay zeka modelleri oluşturmak acildir. Bu özellikler, uygun açıklama ile sadece güçlendirilmekle kalmaz; bu da modelin farklı lezyon türlerinde ayırt edici becerilerinin gelişmesini sağlar, ayrıca melanom gibi bazı tehlikeli durumların daha erken teşhis edilmesine de yardımcı olur. Son olarak, tanı doğruluğunu artırabilir, klinisyenleri hasta sonuçlarını iyileştiren kararlar almada bilgilendirebilir ve daha iyi kararlar almasına yardımcı olabilir.

Şekil 3: HAM10000 veri setinde cilt lezyonlarının sınıf bazında dağılımı Şekil, bu çalışmada ele alınan yedi lezyon kategorisinin dağılımını göstermektedir: Aktinik Keratozlar (akiec), Bazal Hücre Karsinoması (bcc), İyi Havalı Keratoz benzeri lezyonlar (bkl), Dermatofibroma (df), Melanositik nevus (nv), Vasküler lezyonlar (vasc) ve Melanoma (mel). Bu grafik, lezyon sınıflarının sınıf dengesizliğini göstermektedir. Bu figürün daha büyük bir versiyonunu görmek için lütfen buraya tıklayın.

Veri setinin analizi, farklı lezyon türlerinin sınıflarında bir dengesizlik olduğunu göstermektedir. En yaygın Melanositik Nevü (nv) türü, yaklaşık 6.705 örnekle en yaygın tiptir; ardından Melanoma (1.113) ve Benign Keratoz (1.099) gelir. Buna karşılık, klinik öneme sahip bazı lezyon türleri de önemli ölçüde daha az temsil edilmektedir; örneğin Dermatofibroma (115) ve Vasküler Lezyonlar (142). Bu orantısızlık, makine öğrenimi modelleri için tehdit oluşturur çünkü modeller çoğunluk sınıflarına eğilimli olabilirler ve olağandışı ama klinik olarak anlamlı lezyonları tespit edemeyebilirler. Bu sorunu ele almak ve modelin tüm sınıflara göre model performansları üzerinde eğitimini geliştirmek için gelişmiş ön işleme gereklidir. Stratejilere ihtiyaç var. Bunlar arasında hedefli veri artırımı ve sınıf dengeleme gibi teknikler bulunur. Veriler, modelin az temsil edilen sınıflarda önemli eğilimleri keşfetmesini teşvik eden (Sınıf dengeleme tekniği ve sınıf ağırlık ayarlaması) yöntemiyle dengelenebilir. XGBoost ve LightGBM için kullanılan hiperparametreler öncelikle varsayılan konfigürasyonlarına ayarlanmış, ön deneylere dayalı küçük ayarlamalar yapılmıştı. Derin sinirsel sınıflandırıcı için, katman sayısı, nöron sayısı, öğrenme hızı, parti büyüklüğü ve epoch sayısı gibi mimari ve eğitim parametreleri doğrulama verileri kullanılarak ampirik olarak seçilmiştir. Hiperparametrelerin tam kümesi Tablo 3'te sunulmaktadır. Genel olarak, bu çalışmada kullanılan dermoskopik görüntü sayısı toplamda 10.015'tir. Bu, eğitilip test edilecek geniş bir veri koleksiyonu sağlama avantajına sahip ve aynı zamanda sıkıcı ama ödüllendirici bir ölçüttür. Önerilen cilt lezyonu sınıflandırma sisteminin etkinliğini değerlendirin.

Veri ön işleme

Ön işleme boru hattı, HAM10000 veri setini çok modlu öğrenmeye hazırlar; görüntüleri standartlaştırır, derin özellikleri çıkarır, klinik meta verileri entegre eder ve sınıf dengesizliğini giderir.

Görüntü Standartlaştırması: Tüm dermoskopik görüntüler 224 × 224 piksel boyutlarına yeniden boyutlandırıldı ve z-skor normalizasyonu kullanılarak normalleştirildi.

Denklem 1 (1)

Ben ham görüntüyü temsil ettiğimde, μ piksel bazında ortalamayı gösterir ve σ standart sapmadır.

Derin Özelliklerin Çıkarılması: Tamamlayıcı derin özellikler, üç önceden eğitilmiş konvolüsyon sinir ağı kullanılarak çıkarıldı: Efficient-Net B4, DenseNet201 ve MobileNetV2. Her ağ, normalleştirilmiş görüntüyü bir özellik vektörüne eşler.

Denklem 2 (2)

Çıkarılan özellikler, birleşik bir temsil oluşturmak üzere birleştirildi:

F_Fusion=F_EffB4 ||F_Yoğun ||F_MobV2 (3)

(burada || birleştirme anlamına gelir)

Klinik Meta Veri Entegrasyonu: Yaş, cinsiyet ve lezyon lokalizasyonu gibi klinik özellikler min-max ölçeklendirme kullanılarak temizlendi, etiketlendi ve normalleştirildi:

Denklem 4 (4)

İşlenen metaveri vektörü M_klinik, görüntü özellikleriyle birleştirilerek nihai çok modlu girdi oluşturuldu:

F_kombine=F_füzyonM_klinik (5)

Veri Seti Bölünmesi: Sınıf dağılımını korumak için katmanlı bir bölünme uygulandı

D_treni,D _testi=Bölünme (F_comibed,0.8) (6)

Sınıf dengesizliği yönetimi: HAM10000 veri setinde, "nevus" (NV) örnekleri diğer azınlık gruplarında, örneğin VASC'li DF'de az temsil edildiği için sınıflar arasında ciddi bir dengesizlik vardır. Bu sorunu azaltmak için "Sentetik Azınlık Aşırı Örnekleme Tekniği" (sınıf dengeleme tekniği) kullanıldı. Kullanımı: Yeni sentetik örnekler şu şekilde üretildi:

x_new=x_i+ λ(x_zi- x_i) (7)

Denklem 8

x_i azınlık sınıfı örneği olduğunda, x_zi en yakın komşularından biridir ve λ 0 ile 1 arasındaki tekdüz dağılımdan alınan rastgele bir değerdir. Sentetik örnek, Şekil 4'te gösterildiği gibi, x alt i'yi birleştiren çizgi segmenti boyunca üretilir.ve xent, x_i ve x_zi'yi birleştirir.

Şekil 4: Sınıf dengeleme tekniği uygulamadan önce/sonra HAM10000 veri setinde sınıf dağılımı. (A) Sınıf dengelemeden önce, lezyon sınıfları arasında dengesizlikle. (B) Tüm sınıfların temsili eşit olduğu birleşik özellik alanında sınıf dengesinden sonra, sınıflandırıcı eğitim sürecinde önyargıyı önlemek için. Bu figürün daha büyük bir versiyonunu görmek için lütfen buraya tıklayın.

HAM10000 veri setindeki sınıf dengesizliği sorununu çözmek için Sentetik Azınlık Aşırı Örnekleme Tekniği (sınıf dengeleme tekniği) uygulanır. Sınıf dengeleme tekniği, mevcut veri noktaları arasında etkileşim yoluyla azınlık sınıfları için sentetik örnekler üretir ve bu da az temsil edilen lezyon kategorilerinin temsilinin artmasına yardımcı olur. Bu azınlık sınıflarının daha fazla örneğinin üretilmesinin nihai sonucu, tüm yedi lezyon türüne göre genel olarak daha dengeli bir veri setidir. Bu dengeli temsil, sınıflandırma modellerinin her sınıfta daha iyi öğrenmesini ve çoğunluk sınıflarındaki önyargıyı en aza indirmesini sağlayacaktır. Sonuç olarak, model sınıflandırma açısından daha adil ve özellikle nadir ama klinik olarak önemli cilt lezyonlarına karşı hassastır.

Gizlilik koruyucu öğrenme çerçevesi

Önerilen sistem, ciltte gizlilik farkında ve yorumlanabilir çok modlu otomatik lezyon sınıflandırma sistemi önermektedir. Sistemin nihai amacı, tanı performansını artırmak ve aynı zamanda eğitim süreci boyunca hassas hasta bilgilerini korumaktır. Hasta gizliliği, sağlık uygulamalarında hayati bir ihtiyaç olduğundan, sağlık verilerinin gizliliği yasaları ve etik hususlar sağlık ortamlarında son derece önemlidir. Bu nedenle, önerilen model, federasyon öğrenim fikirlerine dayanan merkeziyetsiz bir öğrenme modeli içerecektir. Bu merkeziyetsiz ortamda, model eğitimi tüm hasta verilerini merkezi bir konumda toplamak yerine dağıtık bir grup istemci üzerinde gerçekleştirilir. Tüm katılımcı müşteriler modeli kendi verileriyle yerel olarak eğitiyor ve ham hasta verileri yerel ortamdan çıkmaz. Hassas tıbbi kayıtların taşınmasına alternatif olarak, model güncellemeleri veya parametreler merkezi bir sunucuya gönderilerek toplanır. Bu iş birliğine dayalı öğrenme yaklaşımı, çeşitli kurumların veya veri kaynaklarının veri gizliliğinden ödün vermeden model eğitimine katkıda bulunmasını sağlar.

w_t^(k) t. yinelemedeki kth istemcinin model parametreleri olsun ve n_k o istemcide örnek boyutu olsun. Küresel modelin güncellenmesi şu şekilde hesaplanır:

Denklem 8 (8)

Bu toplama stratejisi, daha büyük veri setlerine sahip müşterilerin küresel modele orantılı olarak daha fazla katkıda bulunmasını sağlarken, küçük müşterilerin öğrenme sürecine katılmasına izin vermektedir. Ham hasta veri alışverişi yapmadan işbirlikçi eğitimi mümkün kılarak, önerilen çerçeve gizliliği korur ve veri setleri arasında dağıtılmış bilgiden fayda sağlar.

Federe deneysel kurulum

HAM10000 veri setiyle simüle edilmiş bir federe öğrenme sistemi, sunulan gizlilik farkında çerçevenin verimliliğini doğrulamak için tasarlandı. Veriler, özdeş olmayan dağıtılmış (IIID olmayan) verilerle gerçek hayattaki çok kurumsal bir ortamı simüle etmek için üç istemciye bölündü. Her danışanın farklı bir lezyon sınıfı karışımı vardır ve bu, klinik merkezler arasında dünyada bir farklılık gösterir. Aynı multimodal özellik çıkarma boru hattı (EfficientNet-B4, DenseNet201, MobileNet V2 ve klinik meta veriler) her istemcide yerel olarak çalıştırılıyordu. Eğitimlerinde, müşteriler yerel modellerini kendi başlarına güncelliyor ve öğrenilen parametreler yalnızca merkezi sunucu ile FedAvg algoritması tarafından birleştirilmek üzere değiştiriliyordu. Tahmin doğruluğu ile gizlilik arasındaki denge, her birinin performansını ölçmek için federasyon modeli ile merkezi eğitim yaklaşımı arasında karşılaştırıldı. Şekil 5'te belirtilen test sonuçları, federasyon modelinin rekabetçi performans gösterebileceğini, merkezi öğrenmeye kıyasla sadece hafif bir doğruluk azaldığını ve veri gizliliğinin çok daha iyi olduğunu göstermektedir.

Şekil 5: HAM10000 veri setinin istemci bazında dağılımı Bu, cilt lezyonu verilerinin danışanlar arasında dağılımını gösterir ve veri dağılımındaki çeşitliliği gösterir. Bu, danışanlar arasındaki veri heterojenliğini gösterir; bu, federasyon öğreniminin kritik bir yönüdür. Bu figürün daha büyük bir versiyonunu görmek için lütfen buraya tıklayın.

HAM10000'de oluşturulan heterojen (IID olmayan) danışan dağılımları, gerçek hayat klinik durumlarını modellemek için üç gruba ayrıldı. Her danışan içindeki farklı lezyon kategorilerinin dağılımı farklıdır, özellikle nevüs sınıfı (nv), ki bu sınıf hastalar arasında eşit dağılmaz. Bu düzenleme, kurumlardaki verilerin eşit şekilde dağıtılmadığı federasyon öğreniminin gerçek dünya zorluklarının göstergesidir.

Performans karşılaştırması: merkezi ve federasyon öğrenimi

Önerilen federasyon öğrenme çerçevesinin etkinliğini değerlendirmek için, Şekil 6'da gösterildiği gibi HAM10000 veri seti kullanılarak merkezi ve federasyon eğitim stratejileri arasında karşılaştırmalı bir analiz yapılmıştır. Merkezi ortamda, tüm veri örnekleri tek bir eğitim havuzunda toplanmıştır. En iyi performans gösteren merkezi model olan üst üste yığılmış topluluk, genel doğruluğu %96'ya ulaştı. Buna karşılık, federasyon ayarı veri setini üç istemci arasında dağıtmış, aynı olmayan dağıtılmış (IID olmayan) verilerle dağıtmıştır; her istemci modeli yerel olarak eğitmiş ve FedAff kullanarak yalnızca model parametrelerini paylaşmıştır. Federe model, merkezi yaklaşıma kıyasla %2 performans farkına karşılık gelen yaklaşık %94 genel doğruluk sağlamıştır; bu da Tablo 4'te gösterilmiştir. Bu marjinal azalma, merkeziyetsiz optimizasyon ve müşteriler arasında heterojen veri dağılımı nedeniyle beklenmektedir.

Bu küçük değişiklik gerçekleşmiş olsa da, federasyon modeli yine de tahmin konusunda iyi performans gösterdi. Merkezi eğitimde, sınıf bazında davranış, nevus (nv) (F1-puanı = 1.00) gibi sınıfların çoğunun sabit kaldığını, dermatofibroma (df) gibi azınlık sınıflarının ise (F1 puanı ≈ 0.65–0.66) dağılım dengesizliğine daha duyarlı olduğunu ve bunun federasyon performansını daha fazla etkileyebileceğini gösterir. Özellikle, federe yapı, hassas hasta bilgilerinin açığa çıkma olasılığını en aza indiriyor çünkü hastalar arasında ham tıbbi verilerin paylaşılmasını gerektirmiyor.

Şekil 6: Federe öğrenme ile merkezi öğrenme karşılaştırması. Bu rakam, öğrenme paradigmalarını doğruluk, hassasiyet, hatırlama ve F1-puanı gibi performans ölçütleri kullanılarak karşılaştırmaktadır. Bu, federasyon öğrenimin, geleneksel öğrenme yaklaşımına benzer performansa ulaşma yeteneğini gösterirken, mahremiyeti koruyor. Bu figürün daha büyük bir versiyonunu görmek için lütfen buraya tıklayın.

Tablo 4 sonuçları, federasyon öğrenme modelinin rekabetçi olabileceğini ve doğruluk modelinin merkezi modele kıyasla yaklaşık %2 kadar hafifçe düştüğünü göstermektedir. Bu küçük azalma, merkeziyetsiz optimizasyon ve IID dışı veri dağılımıyla açıklanabilir. Ancak, federasyon modelinin gizlilik koruması açısından büyük bir avantajı vardır; hassas hasta bilgileri müşteriler arasında paylaşılmaz. Federe model ile merkezi yığılmış topluluk modelinin adil bir karşılaştırması sağlamak için, federasyon modeli aynı mimari ve hiperparametrelerle test edilmiştir. Bu çalışmada ele alınan gizlilik koruma yönü kavramsaldır ve federasyon öğrenimi gibi tekniklerin gelecekteki çalışmalara entegrasyonunu vurgulamayı amaçlamaktadır. Mevcut uygulamada gizlilik koruma mekanizmalarının deneysel doğrulaması yapılmamaktadır.

Çok modlu özellik birleşimi

Cilt lezyonlarının teşhisi genellikle cilt gözlemi ve klinik öykü içerir. Dermatologlar çoğu durumda, dermoskopik görüntüleri sadece hasta bilgileriyle (yaş, cinsiyet ve lezyonun konumu) ilişkili konuma getirerek tanı değerlendirmelerini yapmazlar. Önerilen sistem, bu klinik iş akışından ilham almaktadır ve görüntü tabanlı ile klinik verileri birleştirmek için çok modlu bir öğrenme yaklaşımı içermektedir. CNN'ler, önceden var olan dermoskopik görüntü derinlikli özellikler üzerine eğitilmiştir. Bu tür ağlar, renk değişiklikleri, lezyon formları, yapısal anomaliler ve doku özellikleri gibi karmaşık görsel tasarımları tanır. Bununla birlikte, görüntülerin özellikleri bir lezyonun klinik durumunu yakalamak için yeterli olmayabilir. Her görüntüyle ilgili klinik meta veriler de öğrenmeye dahil edilir. Derin görüntü özelliklerini işlenmiş klinik özellikler ve demografik bilgilerle entegre edecek bir özellik füzyon modülü oluşturulacak. Bu bileşik temsil, her bir lezyonun hem görsel hem de bağlamsal bilgilerinden oluşan entegre bir multimodal özellik temsilidir. Model, genel sınıflandırma yeteneğini artıran tamamlayıcı desenler elde etmek için birkaç veri kaynağını entegre edebilir. Multimodal temsil, sistemin görsel olarak benzer lezyonları daha etkili ayırt etmesine ve klinik göstergeleri dikkate almasına olanak tanır. Model, klinik olarak daha anlamlı ve etkilidir çünkü dermatologların klinik uygulamada lezyonları nasıl incelediğine daha yakın bir yaklaşımdır.

Yığılmış topluluk öğrenimi
Önerilen çerçeve, sistemin öngörme yeteneğini daha da geliştirmek için üst üste yığılmış bir topluluk öğrenme stratejisi kullanır. Topluluk öğrenimi, genellemeyi artırmak ve tek modellerde ortaya çıkabilecek tahmin hatalarını en aza indirmek için iki veya daha fazla öngörücü model kullanan bileşik bir tahmin yöntemidir. Birden fazla temel öğrenen, tek bir sınıflandırıcı kullanmak yerine çoklu modal özellik temsili üzerinde bağımsız olarak eğitilir. Tüm temel öğreniciler, belirli bir örneğin belirli bir lezyon sınıfına ait olma olasılığına dair bir tahmin sunar. Bu olasılık tahminleri daha sonra meta düzeyde toplanır. Her temel öğrenenlere, nihai tahmine göreceli önemini göstermek için bir ağırlık verilir. Normalize sınıf olasılıkları üretmek için toplanan çıktıyı hesaplamak için softmax aktivasyon fonksiyonu kullanılır. Üst üste yığılmış topluluk yönteminin birçok avantajı vardır. Birincisi, çeşitli modellerin birleşimi nedeniyle tahmin varyansını en aza indirir ve böylece genelleştirmenin performansını artırır. İkincisi, çeşitli modeller verilerdeki farklı eğilimleri tanımladığı için gücü artırır. Üçüncü olarak, topluluk öğrenimi, özellikle tıbbi verilerde, bazı klinik ilgi çekici durumların o kadar yaygın olmadığı yerlerde, azınlık lezyon sınıflarının sınıflandırılmasını artırır.

Açıklanabilir yapay zeka entegrasyonu

Tıbbi yapay zeka sistemleri ayrıca, yüksek tahmin doğruluğu kritik olsa da, seçimlerine net açıklamalar sunmalıdır. Yapay zeka sistemlerine güvenmek ve uygulamalarında etkili olmak için klinisyenler, bir modelin ortaya koyduğu tanıya nasıl uyduğunu kavrayabilmelidir. Bu ihtiyacı karşılamak için, önerilen çerçeve, Şekil 7'de gösterildiği gibi açıklanabilir yapay zeka (XAI) yöntemlerini içermektedir.

Şekil 7: Çok sınıflı cilt lezyonu sınıflandırması için farklı sınıflandırma modellerinin karışıklık matrisleri. (A) XGBoost, (B) LightGBM, (C) Derin Sinir Sınıflandırıcı ve (D) Yığılmış Toplu Model. Her bir karışıklık matrisi, tüm yedi cilt lezyonu türü için gerçek sınıf (satırlar) ile tahmin edilen sınıf (sütunlar) arasındaki ilişkiyi gösterir: akiec, bcc, bkl, df, mel, nv ve vasc. XGBoost ve LightGBM modelleri nv ve bkl sınıfları için iyi performans sergiliyor, ancak mel ve nv arasında bazı karışıklıklar var. Derin Sinir Sınıflandırıcısı, bkl ve df sınıflandırmasını iyileştirir ve diyagonal dışı karışıklığı azaltır. Stacked Ensemble modeli, diyagonal giderek daha baskın hale gelerek en büyük sınıflandırma tutarlılığını gösterir. Bu figürün daha büyük bir versiyonunu görmek için lütfen buraya tıklayın.

Sistem, modelin ne öngördüğüne dair bir fikir vermek için iki popüler açıklanabilirlik yaklaşımını (model yorumlanabilirlik tekniği (SHapley Ekleyici Açıklamaları) ve model yorumlanabilirlik tekniği (Yerel Yorumlanabilir Model-Bağımsız Açıklamalar)) içerir. Model yorumlanabilirlik yöntemi, özelliklerin her bir girdi özelliğinin genel tahmine ne kadar katkıda bulunduğunu ölçerek özellikleri açıklar. Sınıflandırma sonucunda hangi klinik değişkenlerin/görsel özelliklerin en çok etkili olduğunu belirlemeye yardımcı olur. Bu, araştırmacıların ve klinisyenlerin modelin veri setindeki genel davranışını görmelerini sağlar. Model yorumlanabilirlik tekniği ise, bireysel tahminlerin yerel açıklamalarıyla ilgilenir. Dermoskopik görüntünün modelin kararını en çok etkileyen bölgeleri vurgular. Bu piksel düzeyindeki görsel açıklamalar, klinisyenlerin sınıflandırmayı etkileyen lezyon bölgelerini görsel olarak incelemelerini sağlar. Önerilen çerçeve, küresel ve yerel yorumlanabilirlik sunar; Bu, model yorumlanabilirlik tekniğinin entegre edilmesiyle sağlanır. Çift açıklama mekanizması şeffaflığı artırır ve klinisyenlerin modelin tıbbi açıdan önemli kalıpları hedefleyip hedeflemediğini değerlendirmelerini sağlar.

Klinik karar destek potansiyeli

Gizliliği koruyan öğrenme, çoklu modlu özellik birleşimi, topluluk modelleme ve açıklanabilir yapay zeka, otomatik cilt lezyonu sınıflandırması için entegre ve sağlam bir sistemin temel bileşenleridir. İdeal olarak, sistem sadece yüksek prognostik güce sahip olmakla kalmayıp, aynı zamanda şeffaf ve güvenli olmalıdır; bunlar tıbbi sistemlerde iki temel faktördür; Şekil 8'de gösterildiği gibi.

Şekil 8: Yığılmış topluluk modeli için alıcı çalışma karakteristikası (ROC) eğrileri. (A–C) Bu, yedi cilt lezyonu tipi için gerçek pozitif oran (hassasiyet) ve yanlış pozitif oranı (1-özellik) ile ROC eğrilerini gösterir. Eğrinin altındaki alan (AUC), üst üste yığılmış topluluk modelinin sınıflar arasındaki ayrım performansını temsil eder. Bu figürün daha büyük bir versiyonunu görmek için lütfen buraya tıklayın.

Bu sistem, açıklanabilir tahminler ve gizlilik koruması sağlar. Sonuç olarak, diğer dermatolojik tanı sistemleri için faydalı bir sistemdir. Bu sistem, sağlık uygulayıcıları/dermatologların lezyon şüpheliliğini değerlendirmesini ve tanı doğruluğunu artırmalarını sağlar ve bu nedenle uygulayıcılar/dermatologlar, hastaların daha ciddi bir hastalığı (örneğin melanom) olabileceği erken aşamada teşhis koymalarına yardımcı olur. Özetle, Şekil 9'da gösterildiği gibi, bu sistem yüksek teknolojili yapay zeka (YD) sistemlerini kullanma ve gerçek dünya uygulamalarını uygulamaya taşımayı amaçlamaktadır; böylece dermatologların hastaları daha doğru ve daha güvenle teşhis etmesine yardımcı olurken, hastaların mahremiyet ve güvenliğini ve konforlarını güvence altına almaya yardımcı olur.

Şekil 9: Çok sınıflı cilt lezyonu sınıflandırması için model yorumlanabilirlik teknikleri kullanılarak açıklanabilirlik sonuçları. (A) İyi ve kötü huylu lezyon tahminlerini etkileyen özellik katkılarını gösteren SHAP grafiki. (B) BCC tahmini için LIME açıklaması, sınıflandırma sonucuna olumlu ve olumsuz katkı sağlayan özellikleri gösterir. (C) Akiec tahmini için LIME açıklaması, model karar alma sürecinde yer alan en etkili özellikleri vurgular. Bu yorumlanabilirlik görselleştirmeleri, modelin tahminlerini önemli ölçüde etkileyen bölgeleri ve çıkarılan özellikleri göstererek, cilt lezyonu değerlendirmesinde sınıflandırma sürecinin şeffaflığını ve anlaşılmasını artırmaktadır. Bu figürün daha büyük bir versiyonunu görmek için lütfen buraya tıklayın.

Değerlendirme stratejisi

Örnekleme yanlılığını önlemek ve tüm cilt lezyonu kategorilerinde orijinal sınıf dağılımını korumak için veri seti 80:20 tren-test bölünmesine ayrıldı. Eğitim alt kümesi daha sonra 90:10 train: valide, hiperparametreleri ayarlamak ve modeli optimize etmek için bölündü. Test seti eğitim sürecinde hiçbir aşamada kullanılmamış ve yalnızca eğitim sürecinin sonunda, veri sızıntısını önlemek ve tarafsız bir performans değerlendirmesi sağlamak için son test olarak uygulanmıştır. Tüm modeller önceden işlenmiş ve eşit ortamlarda eğitilmiş, veriler aynı şekilde bölünmüş ve genişletilmiş, değerlendirme protokolleri aynı şekilde uygulanıp takip edilmiş, bu da adil ve tekrarlanabilir karşılaştırmalar yapılmasına olanak sağlamıştır. Modeller, doğruluk, hassasiyet, hatırlama, F1 puanı ve AUC temelinde kapsamlı şekilde değerlendirildi; sınıf bazında sonuçlar ayrıntılı analiz edilerek hem büyük hem de azınlık lezyon sınıfları için sağlamlıkları belirlendi. Bu standartlaştırılmış doğrulama aracı, önerilen yaklaşımın güvenilirliğini, şeffaflığını ve genellenebilirliğini artırmaya ve performans raporlamasındaki olası tutarsızlıkları aşmaya yardımcı olacaktır.

Access restricted. Please log in or start a trial to view this content.

Results

$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

Çok sınıflı cilt lezyonu sınıflandırması için dört sınıflandırma yöntemi (XGBoost, LightGBM, Derin Sinir Sınıflandırıcı ve üst üste yığılmış topluluk modeli) değerlendirildi. Modeller sırasıyla %92, %90, %94 ve %96 genel doğruluk elde etmiş ve c'nin

Sınıf bazında performans

Her lezyon kategorisi için hassasiyet, hatırlama ve F1 puanı dahil olmak üzere sınıf bazında ayrıntılı bir değerlendirme sağlanır. Akiec sınıfı ...

Access restricted. Please log in or start a trial to view this content.

Discussion

$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

Mevcut protokol, cilt lezyonlarını otomatik olarak sınıflandırmak için yorumlanabilir, gizlilik hassasiyetli, çok modlu bir çerçeve oluşturmak için tekrarlanabilir bir boru hattı oluşturuyor. Protokol, dermoskopik görüntü analizini klinik meta veriler ve yorumlanabilir makine öğrenimi yöntemleriyle birleştirerek model şeffaflığı yoluyla tanı performansını artıran sistematik bir model izler. HAM10000 cilt lezyonu veri seti kamuya açık olup, standartlaştırılmış değerlendirmeye olanak tanır...

Access restricted. Please log in or start a trial to view this content.

Disclosures

$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

Yazarların açıklayacak hiçbir şeyi yok. Çıkar çatışmamız yok. Yazarlar, yapay zeka araçlarının yalnızca dil düzenleme ve biçimlendirme için kullanıldığını belirtmektedir. Tüm bilimsel içerik, analiz ve yorumlar yazarlar tarafından geliştirilip doğrulanmıştır.

Acknowledgements

$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

Yazarlar, akademik rehberlik ve araştırma desteği sağlayan MVN Üniversitesi, Palwal'a teşekkür etmektedir. Yazarlar ayrıca, bu çalışmanın deneysel değerlendirmesinde kullanılan kamuya açık HAM10000 cilt lezyonu veri setini de kabul etmektedir.

Access restricted. Please log in or start a trial to view this content.

Materials

```html

List of materials used in this article
Name	Company	Catalog Number	Comments
DenseNet201 CNN Architecture	IBM	https://arxiv.org/abs/1608.06993	Görüntü sınıflandırma için derin öğrenme modeli
EfficientNet-B4 CNN Architecture	Google	https://arxiv.org/abs/1905.11946	Görüntü sınıflandırma için derin öğrenme modeli
Google Colaboratory Platform	Google	https://colab.research.google.com	Bulut tabanlı hesaplama ortamı
HAM10000 Skin Lesion Dataset	Harvard Dataverse	https://doi.org/10.7910/DVN/DBW86T	Dermoskopik görüntü veri seti
Keras Derin Öğrenme API	Google	Sürüm 2.x	Sinir ağı API'si
LIME Açıklanabilirlik Kütüphanesi	LIME Projesi	Sürüm 0.x	Model açıklanabilirlik tekniği
MobileNetV2 CNN Architecture	Google	https://arxiv.org/abs/1801.04381	Görüntü sınıflandırma için derin öğrenme modeli
Matplotlib Görselleştirme Kütüphanesi	Matplotlib Geliştirme Ekibi	Sürüm 3.x	Grafikler ve performans görselleştirme oluşturmak için kullanılır
NVIDIA GPU	NVIDIA	RTX Serisi	Model eğitimi için hesaplama donanımı
NumPy Sayısal Hesaplama Kütüphanesi	NumPy Geliştiricileri	Sürüm 1.x	Veri analizi yazılımı
OpenCV Görüntü İşleme Kütüphanesi	OpenCV Vakfı	Sürüm 4.x	Görüntü işleme kütüphanesi
Pandas Veri Analizi Kütüphanesi	Pandas Geliştirme Ekibi	Sürüm 1.x	Veri analizi yazılımı
Python Programlama Ortamı	Python Yazılım Vakfı	Sürüm 3.9+	Veri analizi yazılımı
SHAP Açıklanabilirlik Kütüphanesi	SHAP Projesi	Sürüm 0.x	Model açıklanabilirlik tekniği
SMOTE Aşırı Örnekleme Tekniği	imbalanced-learn Projesi	Sürüm 0.x	Dengesiz veri setlerini işlemek için sınıf dengeleme tekniği
Scikit-learn Makine Öğrenimi Kütüphanesi	scikit-learn Projesi	Sürüm 1.x	Makine öğrenimi kütüphanesi
TensorFlow Derin Öğrenme Çerçevesi	Google	Sürüm 2.x	Derin öğrenme çerçevesi

```

Reprints and Permissions

Request permission to reuse the text or figures of this JoVE article

Request Permission

Cilt Lezyonu Sınıflandırması İçin Açıklanabilir Bir Gizlilik Koruyucu Multimodal Topluluk Çerçevesi

In This Article

Summary

Abstract

Introduction

Protocol

Results

Discussion

Disclosures

Acknowledgements

Materials

Reprints and Permissions

Tags

Related Articles