Research Article

Cilt Lezyonu Sınıflandırması İçin Açıklanabilir Bir Gizlilik Koruyucu Multimodal Topluluk Çerçevesi

June 12th, 2026

In This Article

Summary

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

Önerilen çalışma, erken cilt kanseri tespiti için derin öğrenme özellikleri, klinik meta veriler ve açıklanabilir yapay zeka tekniklerini entegre ederek teşhis doğruluğunu, şeffaflığı ve güvenilir klinik karar desteğini artırarak doğru cilt lezyonu sınıflandırması için açıklanabilir, gizlilik koruyan çok modlu bir toplu kumaş düzenlemesi geliştirmeyi ve değerlendirmeyi amaçlamaktadır.

Abstract

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

Dermatolojik hastalıklar arasında cilt kanseri en hayati tehlike oluşturanlardan biridir. Erken ve doğru teşhis, hastanın prognozunu iyileştirmek için önemlidir. Buna rağmen, geleneksel yapay zeka tabanlı tanı yöntemleri, gizlilik endişeleri, sınırlı yorumlanabilirlik ve çok sınıflı cilt lezyonu veri setlerinde ciddi sınıf dengesizliği gibi çeşitli zorluklarla karşı karşıyadır. Bu zorlukların üstesinden gelmek için, önerilen makale, karmaşık derin öğrenme modelleri ve toplu modelleme yaklaşımını açıklanabilir yapay zeka yöntemleriyle birleştiren, gizliliğe duyarlı, açıklanabilir çok modlu bir cilt lezyonu sınıflandırma modeli önermektedir. Deneysel değerlendirme, Kaggle Hub aracılığıyla erişilebilen çok sınıflı cilt lezyonu sınıflandırması üzerine kamuya açık HAM10000 kıyaslama verileri kullanılarak yapılır; bu veriler yedi klinik açıdan önemli lezyon sınıfına (akiec, bcc, bkl, df, mel, nv, vasc) dağıtılmıştır. Verileri dengelemek için, azınlık sınıflarını güçlendirmek için sınıf dengeleme tekniği kullanılır. EfficientNet B4, DenseNet201 ve MobileNetv2, derin özellik temsillerini çıkarmak için kullanılır ve ardından belirgin klinik meta verilerle birleştirilerek sağlam bir multimodal özellik alanı oluşturulur. Bu multimodal özellikler, XGBoost, LightGBM, Derin Sinir Sınıflandırıcısı (DNC) eğitimlerinde kullanılır ve sırasıyla %92, %90 ve %94 sınıflandırma doğruluğu elde edilmiştir. XGBoost, LightGBM ve Derin Sinir Sınıflandırıcı (DNC) çıktılarını birleştirmek için üst üste bir topluluk stratejisi uygulanır ve bu da doğruluğun %96'ya artmasına yol açar. Model yorumlanabilirlik teknikleri, şeffaflığı artıran özellik düzeyinde açıklamalar sağlar. Deneysel bulgular, önerilen çerçevenin klinik olarak ilgili gerçek yaşam sınıflandırmasıyla verimlilik açısından uygulanabilirliğini kanıtladı.

Introduction

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

Cilt kanseri, dünya çapında artan insidans oranlarıyla önemli bir küresel sağlık yüküoluşturur 1. Yapay radyasyon, cilt kanserine katkıda bulunan önemli bir faktör olarak kabul edilir ve kontrol edilmemiş hücre çoğalmasına ve tümör gelişimine yol açan genetik mutasyonlara yol açar 1,2. Cilt kanserleri, melanom, skuamöz hücreli karsinom ve bazal hücreli karsinom (BCC) gibi bir hastalık grubunu oluşturur. Bu hastalıkların nedenleri, klinik sunumu ve prognostik faktörlerifarklılık gösterir 3. Cilt hastalıkları, piksel düzeyindeki benzerlikler nedeniyle tıbbi tanıda bir engelhaline geldi 4. 2022 yılında, dünya genelinde 331.722 tahmini melanoma vakası (58.667 ölüm) ve 1,2 milyon NMSC vakası (69.416 ölüm) vardı. Melanoma için yaşa göre standartlaştırılmış ölüm oranlarının (ASR) zirvesi Okyanusya (29,78/100.000), Kuzey Amerika (16,3) ve Avrupa (10,43) idi. Ancak, ölüm oranı Afrika (0,35) ve Asya'da (0,30) Kuzey Amerika ve Okyanusya'da (her ikisinde 0,02) en yüksekti; bu da daha kötü birprognozu yansıtabilir. Dermatolojide, cilt lezyonlarının tanısı ve izlenmesi öncelikle görsel muayene ve diğer invaziv olmayan değerlendirmelere dayanmıştır. İnvaziv yöntemler uygulanmaz, çünkü lezyonlara zarar verebilir ve lezyon büyümesinin klinik takibinin yapılmasınıengelleyebilir. Cilt lezyonları farklı türlerde olabilir: melanoma (MEL), dermatofibroma (DF), aktinik keratoz ve intraepitelyal karsinom (AKIEC), bazal hücre karsinomi (BCC), iyi huylu keratoz (BKL), melanositik nevus (NV) ve vasküler lezyonlar (VASC), HAM10000 veriseti 5'te tanımlandığı gibi. Dermatoskopik görüntülerin sınıflandırılmasında başlıca zorluklar tüyler, mürekkepler, cetvel izleri, renkli lekeler, parıltılar, damlalar, yağ kabarcıkları, kan damarları, hiperpigmentli alanlar ve/veya iltihap lezyonlarınvarlığıdır. Daha önce tıbbi görüntüleme ve cilt lezyonu sınıflandırması için özellik seçimi ve derin öğrenmeüzerine çalışmalar yapılmıştır 7,8.

Cilt kanseri teşhisi için bilgisayar görme tabanlı yaklaşımlar ve el yapımı ile derin özelliklerin entegrasyonu daincelenmiştir 9, ayrıca sınıflandırma performansını artırmak için özellik birleştirmestratejileri de incelenmiştir 10. Son gelişmeler, makine öğreniminin sağlık sistemlerinde entegrasyonunu ve güvenli tıbbi veri işleme çerçevelerini daha davurgulamaktadır 11,12. Gelişmiş hesaplamalı algoritmalarla desteklenen yapay zeka sağlık hizmeti kullanımı, özellikle uzaktan ve evde bakım ortamlarındaki hastalar için faydalı olan kişiselleştirilmiş ve verimli entegre bakım programları sunmapotansiyeline sahiptir 13. Dermatoskopik görüntülerin geniş veri setleri kullanılarak, derin öğrenme modelleri—özellikle Konvolüsyon sinir ağları (CNN)—çeşitli cilt lezyonlarını doğru şekilde tanımlamak ve sınıflandırmak için eğitilebilir. Cilt lezyonu segmentasyonunda güçlü sonuçlar gösteren birkaç teknik, bunlar arasında Tam Konvolüsyon Ağlar (FCN'ler), CNN'ler, Derin CNN'ler (DCNN'ler), Tam Konvolüsyon Kıntı Ağlar (FCRN'ler) ve U-Net mimarileri bulunur. Derin sinir ağları (DNN'ler), oldukça karmaşık mimarileri nedeniyle kolayca yorumlanamıyor, bu yüzden karar alma süreçlerini anlamakzordur 14,15. Tıbbi görüntü analizindeki son gelişmeler, derin konvolüsyon sinir ağlarının (CNN) cilt lezyonu sınıflandırma görevlerinde verimliliği önemli ölçüde artırdığını göstermiştir. HAM10000 gibi dermoskopik veri setleri üzerinde yapılan birkaç çalışma, ResNet, DenseNet ve EfficientNet gibi CNN tabanlı mimarilerin, lezyon görüntülerinden hiyerarşik özellik temsillerini öğrenerek güçlü çok sınıflı sınıflandırma performansı elde ettiğini göstermiştir. Birden fazla CNN omurgası birleştirildiği hibrit özellik füzyon yaklaşımları, tamamlayıcı derin temsilleri entegre ederek tanı doğruluğunu daha daartırmıştır 16. Ayrıca, mevcut çalışmalar hibrit CNN Transformatör modellerini tıbbi görüntü analizinde incelemiştir. Görme transformatörü ve CNN özellik çıkarıcılarına sahip modellerin, cilt lezyonu sınıflandırma görevlerinde daha iyi sonuçlar verdiği kanıtlanmıştır; çünkü yerel doku içeriğini ve küresel bağlamsal ilişkileri daha iyi çıkarabilirler17. Bu hibrit tasarımlar, dengeli temsil öğrenme yeteneğine sahip oldukları için tıbbi görüntülemede de en son teknoloji olarak görülmektedir.

Tıbbın diğer alanlarında, özellik füzyon stratejileri dermatoloji dışında yaygın olarak kullanılmıştır. CNN tabanlı hibrit sistemler, akciğer ve kolon kanserinin daha iyi sınıflandırılması için histopatolojik görüntülerin analizinde de uygulanmıştır; gelişmiş özellik temsilleri ve mekansal öğrenme dinamikleriile 16. Aynı şekilde, oftalmolojide birleşmiş özellik temsilleri üzerine eğitilmiş derin öğrenme modellerinin kullanımı, diyabetik retinopati ile fundus görüntülerinin aşamalanmasında başarılı bir uygulama göstermiştir; çok sınıflı bir derecelendirme görevinde daha sağlam ve sınıflandırma doğruluğusağlamıştır 18. Bu alanlardaki multimodal füzyon yöntemleri, heterojen özellik temsillerinin özellikle dengesiz tıbbi verilerde daha iyi genelleme ve sınıflandırma sağladığınıgöstermektedir 19.

Bu iyileştirmeler yapılmış olsa da, mevcut uygulamalar genellikle çoklu modal olmakla sınırlıdır, entegre değildir, sınıf dengesizliği sorununu ele almak için yetersiz ve klinik karar alma süreçlerinde faydalı değildir. Bu sorunları aşmak için, bu makale gizlilik farkında olan ve her iki model yorumlanabilirlik yöntemini entegre eden açıklanabilir bir cilt lezyonu sınıflandırma modeli sunmaktadır. Bu tür açıklanabilirlik yöntemleri, modelin tahminlerini açıklamak, hangi özelliklerin en önemli olduğunu göstermek ve dermoskopik görüntülerin önemli alanlarını vurgulamak için kullanılabilir; böylece klinik prosedürlerde netlik ve güveni artırır, böylece klinik şeffaflığı artırır, güven oluşturur ve yapay zeka sistemlerinin klinik uygulamada güvenli uygulanmasını destekler. HAM10000 veri setinde önemli bir dengesizlik vardır; bazı sınıflarda diğerlerinden çok daha az örneklem bulunur. Bu sorunu aşmak için, sentetik azınlık aşırı örnekleme tekniği (sınıf dengeleme olarak da bilinir) az temsil edilen sınıflar için sentetik örnekler üretmek amacıyla kullanılır. Sınıf dengeleme teknikleri, veri setini dengeler; modelin azınlık lezyon tiplerinden daha iyi öğrenmesini sağlar, duyarlılığı artırır ve klinik olarak anlamlı ancak daha az sık kullanılan cilt kanseri sınıflarının daha güvenilir tahmin edilmesini sağlar.  EfficientNet-B4, DenseNet201 ve MobileNetV2'nin derin özellikleri, klinik meta verilerle birleştirilerek her cilt lezyonunun daha bilgilendirici bir temsili oluşturulur. Bu çift özellik, dermoskopik görüntülerin ve diğer hasta bilgilerinin görsel desenlerini çıkarıp daha derinlemesine bir analiz yapmamıza yardımcı olur. Özellikler daha sonra XGBoost, LightGBM ve Derin Sinir Ağı gibi farklı sınıflandırıcılarda eğitilerek cilt lezyonu sınıflandırma modelinin yetenek ve gücünü artırıyor. Modeller topluluğu, modeli geliştirmek için üst üste yığma tekniği ile kullanılır. Bu, çoklu modellerin güçlü yönlerinden yararlanarak topluluktaki tüm modellerin tahminlerinden öğrenen ve faydalanan bir bileşik modeldir; aynı zamanda onların sınırlamalarını hafifletmektedir.

Protocol

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

Bu çalışma, kamuya açık ve tamamen anonimleştirilmiş dermoskopik veri setlerini kullandı ve doğrudan insan katılımı içermedi; bu nedenle, etik komite onayı gerekmiyordu. Materyaller Tablosu , bu çalışmada kullanılan tüm malzeme veya araçların detaylarını içerir. Tablo 1 , işlemci türü, bellek, işletim sistemi ve yazılım çerçeveleri gibi donanım ve yazılım ortamının ayrıntılarını içerir. Tablo 2 , her cilt lezyonu kategorisi için sınıf bazında hassasiyet, geri çağırma, F1 puanı ve destek detaylarını içerir.

Önerilen çok modlu cilt lezyonu sınıflandırma çerçevesinin genel iş akışı

Bu araştırmanın genel planı, cilt lezyonlarının çoklu sınıflandırılmasının kesin ve anlaşılır bir şeması oluşturmaktır. İş akışı, HAM10000 veri setinin veri toplama ve ön işleme ile başlar, ardından derin öğrenme mimarileri ve klinik meta verilerin dahil edilmesiyle özellik çıkarımına geçer. Daha sonra, birkaç makine öğrenimi sınıflandırıcısı eğitilip optimize edilir ve sonuçları bir toplu stratejide toplanır. Son olarak, modelin tahminleri açıklanabilirlik teknikleri kullanılarak yorumlanır ve modelin etkinliği gerçek dünyada klinik karar desteğinde kullanılmak üzere değerlendirilir.

Önerilen sistemin öngörü doğruluğunu artırmak için, hem görüntü tabanlı özellikleri hem de klinik meta verileri birleştiren çok modlu bir makine öğrenimi boru hattı kullanılır ( Şekil 1'de gösterildiği gibi). Model, dermoskopik görüntülerin görsel çıktılarını hastayla ilgili bilgilerle birleştirerek çeşitli cilt lezyonlarıyla ilgili daha ayrıntılı desenleri tespit edebilir. Böyle bir kombinasyonla, sistem daha iyi tahminler yapabilir ve bu nihayetinde gerçekleşecek. Cilt lezyonu sınıflandırmasının kalitesini ve faydalılığını artırın. Sinir ağlarının yardımıyla üç önceden eğitilmiş konvolüsyon Derin özellik çıkarılır (EfficientNet-B4, DenseNet201 ve MobileNetV2): dermoskopik görüntülerin çeşitli tamamlayıcı desenlerini yakalayabilirler. Bu mimariler, cilt lezyonlarının nasıl göründüğünü, renk ve doku değişikliklerini ve inşa şeklini yüksek seviyede öğrenir. Daha sonra, bir özellik füzyon modülü derin özellikleri klinik özellikler ve demografik verilerle birleştirerek zengin çok modlu bir özellik oluşturur. Birleştirilen veriler, uygun model testini sağlamak için eğitim, doğrulama ve test verilerine ayrılır. Sonrasında, derin özellikleri klinik özellikler ve demografiklerle birleştirmek için bir özellik birleşimi modülü kullanılır ve zengin çok modlu bir özellik oluşturulur. Bu veriler daha sonra modeli test etmek için eğitim, test ve doğrulama verilerine ayrılır. Tahmin doğruluğunu daha da artırmak için topluluk stratejisi kullanılır. Bu, birkaç modelin sonuçlarının ortalaması alınarak ve bu ortalamalı olasılıkları kullanarak nihai tahmini yaparak genelleştirmeyi artırarak ve bireysel modellerin neden olacağı varyansı en aza indirerek yapılır. Bunun yanı sıra, model yorumlanabilirlik teknikleri gibi açıklanabilirlik yöntemleri de modelin kararlarını nasıl verdiğini daha iyi açıklamak için entegre edilmiştir. Model yorumlanabilirlik yöntemi, giriş değişkenlerinin katkısını nicelikle ölçerek özellik düzeyinde yorumlar sağlarken, model yorumlanabilirlik yöntemi ise dermoskopik görüntülerde tahmini etkileyen piksel düzeyindeki önemli alanları belirler. Model yorumlanabilirlik teknikleri, her giriş değişkeninin katkısını nicelikten ölçerek özellik düzeyinde açıklamalar sunarken, model yorumlanabilirlik teknikleri dermoskopik görüntülerde tahmini etkileyen piksel düzeyindeki önemli bölgeleri vurgular. Bu teknikler birleştiğinde, modelleri daha yorumlanabilir hale getirir ve klinisyenlerin sistemin kararları nasıl aldığını öğrenmelerine yardımcı olur. Sonuç olarak, önerilen ürün hattı, anlaşılır ve gizlilik farkında bir sistem sunarak şeffaflığı ve güveni artırıyor ve gerçek dünyada sağlık ortamında daha güvenilir cilt kanseri teşhisi konmasını sağlıyor.

Hazırlıklı veri seti açıklaması

Bu makalede, HAM10000 (10.000 eğitim görseliyle İnsan Makineye Karşı) veri seti çok sınıflı cilt lezyonu sınıflandırması için birincil veri seti olarak kullanılmıştır. Veri seti, çeşitli tıbbi kaynaklardan toplanan 10.000'den fazla dermoskopik figürü içermektedir. Klinik kaynaklar ve popülasyonlar, dermatolojik görüntü analizinde en yaygın kullanılan kıyaslama veri setlerinden biri haline gelir. Veri setindeki her görüntü, görüntü tanımlayıcıları, tanı etiketleri, hasta yaşı, cinsiyet ve lezyonun anatomik konumu gibi önemli klinik meta verilerle birlikte gelir. Veri seti yedi tanısal kategoriyi kapsar: aktinik keratozlar (akiec), bazal hücre karsinomu (bcc), iyi huylu keratoz (bkl), dermatofibroma (df), melanositik nevuslar (nv), vasküler lezyonlar (vasc) ve melanoma (mel).

Klinik meta veri ön işlemesi

Sınıflandırma hattına eklenen yardımcı özellikler arasında yaş, cinsiyet ve hastadaki lezyonun konumu gibi klinik meta veriler yer alıyordu. Eksik veya bilinmeyen değerler vardı ve bunlar deterministik bir ön işleme yaklaşımıyla ele alındı. Yaş değişkeni (sayısal) durumunda, eğitim setinde hesaplanan medyan yaş eksik değerleri hesaplamak için kullanılmıştır. Medyan atama seçilmesinin nedeni, klinik verilerde yaygın olan istisnalara ve çarpık verilere dirençli olmasıdır. Cinsiyet ve lezyon konumu (kategorik değişkenler) için eksik veya belirtilmemiş değerler hariç tutulmadı; 'bilinmeyen' etiketli özel bir kategoriye atandılar. Yöntem, mevcut tüm örnekleri korur ve model, eksikliğin kendisinin öngörücü olup olmadığını belirlemekte özgürdür. Daha sonra kategorik değişkenlere tek sıcak kodlama uygulanarak onları makine öğrenimi modelleriyle uyumlu hale getirdi. Tüm ön işleme, örneğin emputasyon, kodlama vb. sadece eğitim setinde yapılır ve veri kaybını önlemek için doğrulama ve deney setlerine de aynı dönüşümler yapılırdı. Klinik meta verilerin eksikliği nedeniyle örneklemler dışlanmamıştı ve bu da verilerin maksimum düzeyde kullanılmasını ve metodolojik tutarlılığın sağlanmasını sağladı.

figure-protocol-1
Şekil 1: Cilt lezyonu sınıflandırması için multimodal sistem. Çalışma yaklaşımı, dermoskopik görüntü özelliklerini hasta meta verileriyle birleştirerek deri lezyonlarını topluluk derin öğrenme modelleri kullanarak sınıflandırıyor. Çerçeve, ön işleme, özellik çıkarma, çoklu modlu birleşme ve sınıflandırmayı içerir; böylece gelişmiş tanı performansı ve yorumlanabilirlik sağlanır. Bu figürün daha büyük bir versiyonunu görmek için lütfen buraya tıklayın.

İş akışı, HAM10000 cilt lezyonu veri setinin dermoskopik görüntüleri ve klinik meta verilerine dayanarak önerilen sınıflandırma hattını gösterir. EfficientNet-B4, DenseNet201 ve MobileNetV2, görüntülerdeki derin özellikleri ön işlemek ve çıkarmak için kullanılır. Klinik meta veriler kodlanır ve görüntü özellikleri klinik meta verilerle birleştirmek için özellik birleştirme yöntemi kullanılır. Sınıf dengesizliği sorununu ele almak için, sınıf dengeleme tekniği, ham görüntüler veya bireysel özellik akışları yerine birleşmiş çoklu modal özellik alanında kullanılır; burada sentetik örnekler hem görsel hem de klinik özelliklerin birleşimini korur ve gerçekçi olmayan örnekler üretmez. Birleşik özellikler daha sonra XGBoost, LightGBM ve derin sinirsel sınıflandırıcı gibi sınıflandırıcılar üzerinde eğitiliyor.

figure-protocol-2
Şekil 2: HAM10000 veri setinden yedi farklı tanı grubundan dermoskopik örnekler. Görüntüler, otomatik sınıflandırma için kullanılan tipik görsel özellikleri gösterir. (A) Aktinik keratozlar (akiec), düzensiz pigmentasyona sahip pürüzlü yüzeyler gösterir. (B) Düzensiz şekiller ve kan damarları olan bazal hücreli karsinom (BCC). (C) Açık kahverengi yüzeyli keratoz benzeri lezyonlar (bkl), keratotik özellikler gösterir. (D) Dermatofibrom (df), merkezi yara benzeri görünümü ve pigmentasyonu vardır. (E) Melanositik nevüsler (nv), iyi huylu ve nispeten simetrik mollar. (F) Kan damarları nedeniyle kırmızımsı-mor bir görünüm gösteren damar lezyonları (vasc). (G) Melanoma (mel), düzensiz şekilli, asimetrik ve çok pigmentli bir lezyon olarak ortaya çıkar. Bu figürün daha büyük bir versiyonunu görmek için lütfen buraya tıklayın.

Bu dermoskopik görüntüler, cilt lezyonlarının görsel heterojenliğini ortaya koymaktadır; bu lezyonlarda pigmentasyon, doku ve yapının morfolojisinde farklılıklar vardır. Bu varyasyonlar, otomatik sınıflandırma sistemlerine büyük bir zorluk oluşturur ve derin öğrenme tabanlı sistemlerin önemini vurgular. Ince tanı kalıplarını ortaya çıkarmaya duyarlı olan özellik çıkarma teknikleri. Veri seti açıklamasının ardından, Şekil 2 , dermatolojik tanı görüntüleme araştırmalarında yaygın olarak incelenen HAM10000 veri setine dahil edilen yedi cilt lezyonu kategorisini göstermektedir. Bu sınıflar arasında Aktinik Keratoz (akiec), Bazal Hücre Karsinomi (bcc), Benign Keratoz (bkl), Dermatofibroma (df), Melanositik Nevus (nv), Vasküler Lezyonlar (vasc) ve Melanoma (mel)21 bulunur. Tüm bu lezyon türlerinin benzersiz görsel özellikleri vardır; Şekil 3'te gösterildiği gibi, pigmentasyon desenleri, yüzey dokusu, renk dağılımı ve lezyon sınırları boyunca anormallikler var. Tüm bu lezyonların görsel özellikleri farklıdır ve pigmentasyon, yüzey dokusu, renk dağılımı ve lezyonların sınırlarındaki anormalliklerde farklılıklarla karakterize edilirler. Bunlar, dermatologların klinik muayene yaparken aklında bulunduracağı önemli özelliklerdir ve doğru sınıflandırmaya ulaşmak için makine öğrenimi modelleri tarafından iyi modellenmelidir. Bunlar ayırt edici özellikler olsa da, bu lezyonların çoğu neredeyse aynı görünür, bu da sadece dermoskopik görüntülere bakıldığında aralarını ayırt etmeyi zorlaştırır. Bazı lezyon türleri arasındaki ayrım genellikle son derece ince olsa da klinik olarak önemlidir, bu da otomatik olarak sınıflandırmayı zorlaştırır. Bu yüzden, lezyon sınıfları arasında ince taneli görsel görüntüleri ve ince farklılıkları öğrenmek için eğitim alabilen güçlü yapay zeka modelleri oluşturmak acildir. Bu özellikler, uygun açıklama ile sadece güçlendirilmekle kalmaz; bu da modelin farklı lezyon türlerinde ayırt edici becerilerinin gelişmesini sağlar, ayrıca melanom gibi bazı tehlikeli durumların daha erken teşhis edilmesine de yardımcı olur. Son olarak, tanı doğruluğunu artırabilir, klinisyenleri hasta sonuçlarını iyileştiren kararlar almada bilgilendirebilir ve daha iyi kararlar almasına yardımcı olabilir.

figure-protocol-3
Şekil 3: HAM10000 veri setinde cilt lezyonlarının sınıf bazında dağılımı Şekil, bu çalışmada ele alınan yedi lezyon kategorisinin dağılımını göstermektedir: Aktinik Keratozlar (akiec), Bazal Hücre Karsinoması (bcc), İyi Havalı Keratoz benzeri lezyonlar (bkl), Dermatofibroma (df), Melanositik nevus (nv), Vasküler lezyonlar (vasc) ve Melanoma (mel). Bu grafik, lezyon sınıflarının sınıf dengesizliğini göstermektedir. Bu figürün daha büyük bir versiyonunu görmek için lütfen buraya tıklayın.

Veri setinin analizi, farklı lezyon türlerinin sınıflarında bir dengesizlik olduğunu göstermektedir. En yaygın Melanositik Nevü (nv) türü, yaklaşık 6.705 örnekle en yaygın tiptir; ardından Melanoma (1.113) ve Benign Keratoz (1.099) gelir. Buna karşılık, klinik öneme sahip bazı lezyon türleri de önemli ölçüde daha az temsil edilmektedir; örneğin Dermatofibroma (115) ve Vasküler Lezyonlar (142). Bu orantısızlık, makine öğrenimi modelleri için tehdit oluşturur çünkü modeller çoğunluk sınıflarına eğilimli olabilirler ve olağandışı ama klinik olarak anlamlı lezyonları tespit edemeyebilirler. Bu sorunu ele almak ve modelin tüm sınıflara göre model performansları üzerinde eğitimini geliştirmek için gelişmiş ön işleme gereklidir. Stratejilere ihtiyaç var. Bunlar arasında hedefli veri artırımı ve sınıf dengeleme gibi teknikler bulunur. Veriler, modelin az temsil edilen sınıflarda önemli eğilimleri keşfetmesini teşvik eden (Sınıf dengeleme tekniği ve sınıf ağırlık ayarlaması) yöntemiyle dengelenebilir. XGBoost ve LightGBM için kullanılan hiperparametreler öncelikle varsayılan konfigürasyonlarına ayarlanmış, ön deneylere dayalı küçük ayarlamalar yapılmıştı. Derin sinirsel sınıflandırıcı için, katman sayısı, nöron sayısı, öğrenme hızı, parti büyüklüğü ve epoch sayısı gibi mimari ve eğitim parametreleri doğrulama verileri kullanılarak ampirik olarak seçilmiştir. Hiperparametrelerin tam kümesi Tablo 3'te sunulmaktadır. Genel olarak, bu çalışmada kullanılan dermoskopik görüntü sayısı toplamda 10.015'tir. Bu, eğitilip test edilecek geniş bir veri koleksiyonu sağlama avantajına sahip ve aynı zamanda sıkıcı ama ödüllendirici bir ölçüttür. Önerilen cilt lezyonu sınıflandırma sisteminin etkinliğini değerlendirin.

Veri ön işleme

Ön işleme boru hattı, HAM10000 veri setini çok modlu öğrenmeye hazırlar; görüntüleri standartlaştırır, derin özellikleri çıkarır, klinik meta verileri entegre eder ve sınıf dengesizliğini giderir.

Görüntü Standartlaştırması: Tüm dermoskopik görüntüler 224 × 224 piksel boyutlarına yeniden boyutlandırıldı ve z-skor normalizasyonu kullanılarak normalleştirildi.

figure-protocol-4 (1)

Ben ham görüntüyü temsil ettiğimde, μ piksel bazında ortalamayı gösterir ve σ standart sapmadır.

Derin Özelliklerin Çıkarılması: Tamamlayıcı derin özellikler, üç önceden eğitilmiş konvolüsyon sinir ağı kullanılarak çıkarıldı: Efficient-Net B4, DenseNet201 ve MobileNetV2. Her ağ, normalleştirilmiş görüntüyü bir özellik vektörüne eşler.

figure-protocol-5(2)

Çıkarılan özellikler, birleşik bir temsil oluşturmak üzere birleştirildi:

FFusion=FEffB4 ||FYoğun ||FMobV2 (3)

(burada || birleştirme anlamına gelir)

Klinik Meta Veri Entegrasyonu: Yaş, cinsiyet ve lezyon lokalizasyonu gibi klinik özellikler min-max ölçeklendirme kullanılarak temizlendi, etiketlendi ve normalleştirildi:

figure-protocol-6 (4)

İşlenen metaveri vektörü Mklinik , görüntü özellikleriyle birleştirilerek nihai çok modlu girdi oluşturuldu:

Fkombine=FfüzyonMklinik (5)

Veri Seti Bölünmesi: Sınıf dağılımını korumak için katmanlı bir bölünme uygulandı

Dtreni,D testi=Bölünme (Fcomibed,0.8) (6)

Sınıf dengesizliği yönetimi: HAM10000 veri setinde, "nevus" (NV) örnekleri diğer azınlık gruplarında, örneğin VASC'li DF'de az temsil edildiği için sınıflar arasında ciddi bir dengesizlik vardır. Bu sorunu azaltmak için "Sentetik Azınlık Aşırı Örnekleme Tekniği" (sınıf dengeleme tekniği) kullanıldı. Kullanımı: Yeni sentetik örnekler şu şekilde üretildi:

xnew=xi + λ(xzi - xi) (7)

figure-protocol-7

xi azınlık sınıfı örneği olduğunda, xzi en yakın komşularından biridir ve λ 0 ile 1 arasındaki tekdüz dağılımdan alınan rastgele bir değerdir. Sentetik örnek, Şekil 4'te gösterildiği gibi, x alt i'yi birleştiren çizgi segmenti boyunca üretilir.ve xent, xi ve xzi'yi birleştirir.

figure-protocol-8
Şekil 4: Sınıf dengeleme tekniği uygulamadan önce/sonra HAM10000 veri setinde sınıf dağılımı. (A) Sınıf dengelemeden önce, lezyon sınıfları arasında dengesizlikle. (B) Tüm sınıfların temsili eşit olduğu birleşik özellik alanında sınıf dengesinden sonra, sınıflandırıcı eğitim sürecinde önyargıyı önlemek için. Bu figürün daha büyük bir versiyonunu görmek için lütfen buraya tıklayın.

HAM10000 veri setindeki sınıf dengesizliği sorununu çözmek için Sentetik Azınlık Aşırı Örnekleme Tekniği (sınıf dengeleme tekniği) uygulanır. Sınıf dengeleme tekniği, mevcut veri noktaları arasında etkileşim yoluyla azınlık sınıfları için sentetik örnekler üretir ve bu da az temsil edilen lezyon kategorilerinin temsilinin artmasına yardımcı olur. Bu azınlık sınıflarının daha fazla örneğinin üretilmesinin nihai sonucu, tüm yedi lezyon türüne göre genel olarak daha dengeli bir veri setidir. Bu dengeli temsil, sınıflandırma modellerinin her sınıfta daha iyi öğrenmesini ve çoğunluk sınıflarındaki önyargıyı en aza indirmesini sağlayacaktır. Sonuç olarak, model sınıflandırma açısından daha adil ve özellikle nadir ama klinik olarak önemli cilt lezyonlarına karşı hassastır.

Gizlilik koruyucu öğrenme çerçevesi

Önerilen sistem, ciltte gizlilik farkında ve yorumlanabilir çok modlu otomatik lezyon sınıflandırma sistemi önermektedir. Sistemin nihai amacı, tanı performansını artırmak ve aynı zamanda eğitim süreci boyunca hassas hasta bilgilerini korumaktır. Hasta gizliliği, sağlık uygulamalarında hayati bir ihtiyaç olduğundan, sağlık verilerinin gizliliği yasaları ve etik hususlar sağlık ortamlarında son derece önemlidir. Bu nedenle, önerilen model, federasyon öğrenim fikirlerine dayanan merkeziyetsiz bir öğrenme modeli içerecektir. Bu merkeziyetsiz ortamda, model eğitimi tüm hasta verilerini merkezi bir konumda toplamak yerine dağıtık bir grup istemci üzerinde gerçekleştirilir. Tüm katılımcı müşteriler modeli kendi verileriyle yerel olarak eğitiyor ve ham hasta verileri yerel ortamdan çıkmaz. Hassas tıbbi kayıtların taşınmasına alternatif olarak, model güncellemeleri veya parametreler merkezi bir sunucuya gönderilerek toplanır. Bu iş birliğine dayalı öğrenme yaklaşımı, çeşitli kurumların veya veri kaynaklarının veri gizliliğinden ödün vermeden model eğitimine katkıda bulunmasını sağlar.

wt(k) t. yinelemedeki kth istemcinin model parametreleri olsun ve nk o istemcide örnek boyutu olsun. Küresel modelin güncellenmesi şu şekilde hesaplanır:

figure-protocol-9 (8)

Bu toplama stratejisi, daha büyük veri setlerine sahip müşterilerin küresel modele orantılı olarak daha fazla katkıda bulunmasını sağlarken, küçük müşterilerin öğrenme sürecine katılmasına izin vermektedir. Ham hasta veri alışverişi yapmadan işbirlikçi eğitimi mümkün kılarak, önerilen çerçeve gizliliği korur ve veri setleri arasında dağıtılmış bilgiden fayda sağlar.

Federe deneysel kurulum

HAM10000 veri setiyle simüle edilmiş bir federe öğrenme sistemi, sunulan gizlilik farkında çerçevenin verimliliğini doğrulamak için tasarlandı. Veriler, özdeş olmayan dağıtılmış (IIID olmayan) verilerle gerçek hayattaki çok kurumsal bir ortamı simüle etmek için üç istemciye bölündü. Her danışanın farklı bir lezyon sınıfı karışımı vardır ve bu, klinik merkezler arasında dünyada bir farklılık gösterir. Aynı multimodal özellik çıkarma boru hattı (EfficientNet-B4, DenseNet201, MobileNet V2 ve klinik meta veriler) her istemcide yerel olarak çalıştırılıyordu. Eğitimlerinde, müşteriler yerel modellerini kendi başlarına güncelliyor ve öğrenilen parametreler yalnızca merkezi sunucu ile FedAvg algoritması tarafından birleştirilmek üzere değiştiriliyordu. Tahmin doğruluğu ile gizlilik arasındaki denge, her birinin performansını ölçmek için federasyon modeli ile merkezi eğitim yaklaşımı arasında karşılaştırıldı. Şekil 5'te belirtilen test sonuçları, federasyon modelinin rekabetçi performans gösterebileceğini, merkezi öğrenmeye kıyasla sadece hafif bir doğruluk azaldığını ve veri gizliliğinin çok daha iyi olduğunu göstermektedir.

figure-protocol-10
Şekil 5: HAM10000 veri setinin istemci bazında dağılımı Bu, cilt lezyonu verilerinin danışanlar arasında dağılımını gösterir ve veri dağılımındaki çeşitliliği gösterir. Bu, danışanlar arasındaki veri heterojenliğini gösterir; bu, federasyon öğreniminin kritik bir yönüdür. Bu figürün daha büyük bir versiyonunu görmek için lütfen buraya tıklayın.

HAM10000'de oluşturulan heterojen (IID olmayan) danışan dağılımları, gerçek hayat klinik durumlarını modellemek için üç gruba ayrıldı. Her danışan içindeki farklı lezyon kategorilerinin dağılımı farklıdır, özellikle nevüs sınıfı (nv), ki bu sınıf hastalar arasında eşit dağılmaz. Bu düzenleme, kurumlardaki verilerin eşit şekilde dağıtılmadığı federasyon öğreniminin gerçek dünya zorluklarının göstergesidir.

Performans karşılaştırması: merkezi ve federasyon öğrenimi

Önerilen federasyon öğrenme çerçevesinin etkinliğini değerlendirmek için, Şekil 6'da gösterildiği gibi HAM10000 veri seti kullanılarak merkezi ve federasyon eğitim stratejileri arasında karşılaştırmalı bir analiz yapılmıştır. Merkezi ortamda, tüm veri örnekleri tek bir eğitim havuzunda toplanmıştır. En iyi performans gösteren merkezi model olan üst üste yığılmış topluluk, genel doğruluğu %96'ya ulaştı. Buna karşılık, federasyon ayarı veri setini üç istemci arasında dağıtmış, aynı olmayan dağıtılmış (IID olmayan) verilerle dağıtmıştır; her istemci modeli yerel olarak eğitmiş ve FedAff kullanarak yalnızca model parametrelerini paylaşmıştır. Federe model, merkezi yaklaşıma kıyasla %2 performans farkına karşılık gelen yaklaşık %94 genel doğruluk sağlamıştır; bu da Tablo 4'te gösterilmiştir. Bu marjinal azalma, merkeziyetsiz optimizasyon ve müşteriler arasında heterojen veri dağılımı nedeniyle beklenmektedir.

Bu küçük değişiklik gerçekleşmiş olsa da, federasyon modeli yine de tahmin konusunda iyi performans gösterdi. Merkezi eğitimde, sınıf bazında davranış, nevus (nv) (F1-puanı = 1.00) gibi sınıfların çoğunun sabit kaldığını, dermatofibroma (df) gibi azınlık sınıflarının ise (F1 puanı ≈ 0.65–0.66) dağılım dengesizliğine daha duyarlı olduğunu ve bunun federasyon performansını daha fazla etkileyebileceğini gösterir. Özellikle, federe yapı, hassas hasta bilgilerinin açığa çıkma olasılığını en aza indiriyor çünkü hastalar arasında ham tıbbi verilerin paylaşılmasını gerektirmiyor.

figure-protocol-11
Şekil 6: Federe öğrenme ile merkezi öğrenme karşılaştırması. Bu rakam, öğrenme paradigmalarını doğruluk, hassasiyet, hatırlama ve F1-puanı gibi performans ölçütleri kullanılarak karşılaştırmaktadır. Bu, federasyon öğrenimin, geleneksel öğrenme yaklaşımına benzer performansa ulaşma yeteneğini gösterirken, mahremiyeti koruyor. Bu figürün daha büyük bir versiyonunu görmek için lütfen buraya tıklayın.

Tablo 4 sonuçları, federasyon öğrenme modelinin rekabetçi olabileceğini ve doğruluk modelinin merkezi modele kıyasla yaklaşık %2 kadar hafifçe düştüğünü göstermektedir. Bu küçük azalma, merkeziyetsiz optimizasyon ve IID dışı veri dağılımıyla açıklanabilir. Ancak, federasyon modelinin gizlilik koruması açısından büyük bir avantajı vardır; hassas hasta bilgileri müşteriler arasında paylaşılmaz. Federe model ile merkezi yığılmış topluluk modelinin adil bir karşılaştırması sağlamak için, federasyon modeli aynı mimari ve hiperparametrelerle test edilmiştir. Bu çalışmada ele alınan gizlilik koruma yönü kavramsaldır ve federasyon öğrenimi gibi tekniklerin gelecekteki çalışmalara entegrasyonunu vurgulamayı amaçlamaktadır. Mevcut uygulamada gizlilik koruma mekanizmalarının deneysel doğrulaması yapılmamaktadır.

Çok modlu özellik birleşimi

Cilt lezyonlarının teşhisi genellikle cilt gözlemi ve klinik öykü içerir. Dermatologlar çoğu durumda, dermoskopik görüntüleri sadece hasta bilgileriyle (yaş, cinsiyet ve lezyonun konumu) ilişkili konuma getirerek tanı değerlendirmelerini yapmazlar. Önerilen sistem, bu klinik iş akışından ilham almaktadır ve görüntü tabanlı ile klinik verileri birleştirmek için çok modlu bir öğrenme yaklaşımı içermektedir. CNN'ler, önceden var olan dermoskopik görüntü derinlikli özellikler üzerine eğitilmiştir. Bu tür ağlar, renk değişiklikleri, lezyon formları, yapısal anomaliler ve doku özellikleri gibi karmaşık görsel tasarımları tanır. Bununla birlikte, görüntülerin özellikleri bir lezyonun klinik durumunu yakalamak için yeterli olmayabilir. Her görüntüyle ilgili klinik meta veriler de öğrenmeye dahil edilir. Derin görüntü özelliklerini işlenmiş klinik özellikler ve demografik bilgilerle entegre edecek bir özellik füzyon modülü oluşturulacak. Bu bileşik temsil, her bir lezyonun hem görsel hem de bağlamsal bilgilerinden oluşan entegre bir multimodal özellik temsilidir. Model, genel sınıflandırma yeteneğini artıran tamamlayıcı desenler elde etmek için birkaç veri kaynağını entegre edebilir. Multimodal temsil, sistemin görsel olarak benzer lezyonları daha etkili ayırt etmesine ve klinik göstergeleri dikkate almasına olanak tanır. Model, klinik olarak daha anlamlı ve etkilidir çünkü dermatologların klinik uygulamada lezyonları nasıl incelediğine daha yakın bir yaklaşımdır.

Yığılmış topluluk öğrenimi
Önerilen çerçeve, sistemin öngörme yeteneğini daha da geliştirmek için üst üste yığılmış bir topluluk öğrenme stratejisi kullanır. Topluluk öğrenimi, genellemeyi artırmak ve tek modellerde ortaya çıkabilecek tahmin hatalarını en aza indirmek için iki veya daha fazla öngörücü model kullanan bileşik bir tahmin yöntemidir. Birden fazla temel öğrenen, tek bir sınıflandırıcı kullanmak yerine çoklu modal özellik temsili üzerinde bağımsız olarak eğitilir. Tüm temel öğreniciler, belirli bir örneğin belirli bir lezyon sınıfına ait olma olasılığına dair bir tahmin sunar. Bu olasılık tahminleri daha sonra meta düzeyde toplanır. Her temel öğrenenlere, nihai tahmine göreceli önemini göstermek için bir ağırlık verilir. Normalize sınıf olasılıkları üretmek için toplanan çıktıyı hesaplamak için softmax aktivasyon fonksiyonu kullanılır. Üst üste yığılmış topluluk yönteminin birçok avantajı vardır. Birincisi, çeşitli modellerin birleşimi nedeniyle tahmin varyansını en aza indirir ve böylece genelleştirmenin performansını artırır. İkincisi, çeşitli modeller verilerdeki farklı eğilimleri tanımladığı için gücü artırır. Üçüncü olarak, topluluk öğrenimi, özellikle tıbbi verilerde, bazı klinik ilgi çekici durumların o kadar yaygın olmadığı yerlerde, azınlık lezyon sınıflarının sınıflandırılmasını artırır.

Açıklanabilir yapay zeka entegrasyonu

Tıbbi yapay zeka sistemleri ayrıca, yüksek tahmin doğruluğu kritik olsa da, seçimlerine net açıklamalar sunmalıdır. Yapay zeka sistemlerine güvenmek ve uygulamalarında etkili olmak için klinisyenler, bir modelin ortaya koyduğu tanıya nasıl uyduğunu kavrayabilmelidir. Bu ihtiyacı karşılamak için, önerilen çerçeve, Şekil 7'de gösterildiği gibi açıklanabilir yapay zeka (XAI) yöntemlerini içermektedir.

figure-protocol-12
Şekil 7: Çok sınıflı cilt lezyonu sınıflandırması için farklı sınıflandırma modellerinin karışıklık matrisleri. (A) XGBoost, (B) LightGBM, (C) Derin Sinir Sınıflandırıcı ve (D) Yığılmış Toplu Model. Her bir karışıklık matrisi, tüm yedi cilt lezyonu türü için gerçek sınıf (satırlar) ile tahmin edilen sınıf (sütunlar) arasındaki ilişkiyi gösterir: akiec, bcc, bkl, df, mel, nv ve vasc. XGBoost ve LightGBM modelleri nv ve bkl sınıfları için iyi performans sergiliyor, ancak mel ve nv arasında bazı karışıklıklar var. Derin Sinir Sınıflandırıcısı, bkl ve df sınıflandırmasını iyileştirir ve diyagonal dışı karışıklığı azaltır. Stacked Ensemble modeli, diyagonal giderek daha baskın hale gelerek en büyük sınıflandırma tutarlılığını gösterir. Bu figürün daha büyük bir versiyonunu görmek için lütfen buraya tıklayın.

Sistem, modelin ne öngördüğüne dair bir fikir vermek için iki popüler açıklanabilirlik yaklaşımını (model yorumlanabilirlik tekniği (SHapley Ekleyici Açıklamaları) ve model yorumlanabilirlik tekniği (Yerel Yorumlanabilir Model-Bağımsız Açıklamalar)) içerir. Model yorumlanabilirlik yöntemi, özelliklerin her bir girdi özelliğinin genel tahmine ne kadar katkıda bulunduğunu ölçerek özellikleri açıklar. Sınıflandırma sonucunda hangi klinik değişkenlerin/görsel özelliklerin en çok etkili olduğunu belirlemeye yardımcı olur. Bu, araştırmacıların ve klinisyenlerin modelin veri setindeki genel davranışını görmelerini sağlar. Model yorumlanabilirlik tekniği ise, bireysel tahminlerin yerel açıklamalarıyla ilgilenir. Dermoskopik görüntünün modelin kararını en çok etkileyen bölgeleri vurgular. Bu piksel düzeyindeki görsel açıklamalar, klinisyenlerin sınıflandırmayı etkileyen lezyon bölgelerini görsel olarak incelemelerini sağlar. Önerilen çerçeve, küresel ve yerel yorumlanabilirlik sunar; Bu, model yorumlanabilirlik tekniğinin entegre edilmesiyle sağlanır. Çift açıklama mekanizması şeffaflığı artırır ve klinisyenlerin modelin tıbbi açıdan önemli kalıpları hedefleyip hedeflemediğini değerlendirmelerini sağlar.

Klinik karar destek potansiyeli

Gizliliği koruyan öğrenme, çoklu modlu özellik birleşimi, topluluk modelleme ve açıklanabilir yapay zeka, otomatik cilt lezyonu sınıflandırması için entegre ve sağlam bir sistemin temel bileşenleridir. İdeal olarak, sistem sadece yüksek prognostik güce sahip olmakla kalmayıp, aynı zamanda şeffaf ve güvenli olmalıdır; bunlar tıbbi sistemlerde iki temel faktördür; Şekil 8'de gösterildiği gibi.

figure-protocol-13
Şekil 8: Yığılmış topluluk modeli için alıcı çalışma karakteristikası (ROC) eğrileri. (A–C) Bu, yedi cilt lezyonu tipi için gerçek pozitif oran (hassasiyet) ve yanlış pozitif oranı (1-özellik) ile ROC eğrilerini gösterir. Eğrinin altındaki alan (AUC), üst üste yığılmış topluluk modelinin sınıflar arasındaki ayrım performansını temsil eder. Bu figürün daha büyük bir versiyonunu görmek için lütfen buraya tıklayın.

Bu sistem, açıklanabilir tahminler ve gizlilik koruması sağlar. Sonuç olarak, diğer dermatolojik tanı sistemleri için faydalı bir sistemdir. Bu sistem, sağlık uygulayıcıları/dermatologların lezyon şüpheliliğini değerlendirmesini ve tanı doğruluğunu artırmalarını sağlar ve bu nedenle uygulayıcılar/dermatologlar, hastaların daha ciddi bir hastalığı (örneğin melanom) olabileceği erken aşamada teşhis koymalarına yardımcı olur. Özetle, Şekil 9'da gösterildiği gibi, bu sistem yüksek teknolojili yapay zeka (YD) sistemlerini kullanma ve gerçek dünya uygulamalarını uygulamaya taşımayı amaçlamaktadır; böylece dermatologların hastaları daha doğru ve daha güvenle teşhis etmesine yardımcı olurken, hastaların mahremiyet ve güvenliğini ve konforlarını güvence altına almaya yardımcı olur.

figure-protocol-14
Şekil 9: Çok sınıflı cilt lezyonu sınıflandırması için model yorumlanabilirlik teknikleri kullanılarak açıklanabilirlik sonuçları. (A) İyi ve kötü huylu lezyon tahminlerini etkileyen özellik katkılarını gösteren SHAP grafiki. (B) BCC tahmini için LIME açıklaması, sınıflandırma sonucuna olumlu ve olumsuz katkı sağlayan özellikleri gösterir. (C) Akiec tahmini için LIME açıklaması, model karar alma sürecinde yer alan en etkili özellikleri vurgular. Bu yorumlanabilirlik görselleştirmeleri, modelin tahminlerini önemli ölçüde etkileyen bölgeleri ve çıkarılan özellikleri göstererek, cilt lezyonu değerlendirmesinde sınıflandırma sürecinin şeffaflığını ve anlaşılmasını artırmaktadır. Bu figürün daha büyük bir versiyonunu görmek için lütfen buraya tıklayın.

Değerlendirme stratejisi

Örnekleme yanlılığını önlemek ve tüm cilt lezyonu kategorilerinde orijinal sınıf dağılımını korumak için veri seti 80:20 tren-test bölünmesine ayrıldı. Eğitim alt kümesi daha sonra 90:10 train: valide, hiperparametreleri ayarlamak ve modeli optimize etmek için bölündü. Test seti eğitim sürecinde hiçbir aşamada kullanılmamış ve yalnızca eğitim sürecinin sonunda, veri sızıntısını önlemek ve tarafsız bir performans değerlendirmesi sağlamak için son test olarak uygulanmıştır. Tüm modeller önceden işlenmiş ve eşit ortamlarda eğitilmiş, veriler aynı şekilde bölünmüş ve genişletilmiş, değerlendirme protokolleri aynı şekilde uygulanıp takip edilmiş, bu da adil ve tekrarlanabilir karşılaştırmalar yapılmasına olanak sağlamıştır. Modeller, doğruluk, hassasiyet, hatırlama, F1 puanı ve AUC temelinde kapsamlı şekilde değerlendirildi; sınıf bazında sonuçlar ayrıntılı analiz edilerek hem büyük hem de azınlık lezyon sınıfları için sağlamlıkları belirlendi. Bu standartlaştırılmış doğrulama aracı, önerilen yaklaşımın güvenilirliğini, şeffaflığını ve genellenebilirliğini artırmaya ve performans raporlamasındaki olası tutarsızlıkları aşmaya yardımcı olacaktır.

Results

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

Çok sınıflı cilt lezyonu sınıflandırması için dört sınıflandırma yöntemi (XGBoost, LightGBM, Derin Sinir Sınıflandırıcı ve üst üste yığılmış topluluk modeli) değerlendirildi. Modeller sırasıyla %92, %90, %94 ve %96 genel doğruluk elde etmiş ve c'nin

Sınıf bazında performans

Her lezyon kategorisi için hassasiyet, hatırlama ve F1 puanı dahil olmak üzere sınıf bazında ayrıntılı bir değerlendirme sağlanır. Akiec sınıfı için (destek = 65), üst üste yığılmış topluluk 0.72 hassasiyet, 0.73 geri çağırma ve 0.72 F1 puanı elde etti; XGBoost (F1 = 0.70), LightGBM (F1 = 0.68) ve derin sinir sınıflandırıcıya (F1 = 0.71) göre biraz daha iyiydi. BCC için (destek = 103), üst üste yığılmış topluluk hassasiyet = 0.87, geri çağırma = 0.84 ve F1-skor = 0.85 elde etti; bu, XGBoost (F1 = 0.83) ve LightGBM (F1 = 0.81) ile karşılaştırılabilir ve derin sinir sınıflandırıcısından (F1 = 0.84) biraz daha yüksekti. bkl (destek = 220 ) için, üst üste yığılmış topluluk hassasiyet = 0.93, geri çağırma = 0.85 ve F1 puanı = 0.89 elde ederek XGBoost (F1 = 0.87), LightGBM (F1 = 0.86) ve derin sinir sınıflandırıcıyı (F1 = 0.88) geride bıraktı. Df için (destek = 23), performans tüm modellerde nispeten düşük kaldı. Üst üste yığılmış topluluk hassasiyet = 0.67, geri çağırma = 0.66 ve F1-skor = 0.66 olarak rapor etti; bu, XGBoost (F1 = 0.65), LightGBM (F1 = 0.63) ve derin sinir sınıflandırıcısı (F1 = 0.65) gibi özelliklere benziyordu.

mel (destek = 223) için üst üste yığılmış topluluk hassasiyet = 0.66, geri çağırma = 0.97 ve F1 puanı = 0.78 elde etti. Derin Sinir Sınıflandırıcı da melanom için yüksek hatırlama (0.96) gösterir ancak nispeten daha düşük hassasiyet (~0.66) gösterir; bu da daha fazla yanlış pozitif olduğunu gösterir. Bu, melanom tespiti için hassasiyetin modeller arasında yüksek olmasına rağmen, hassasiyetin nispeten daha düşük kaldığını vurguluyor. NV sınıfı için (destek = 1341), tüm modeller %100 sınıflandırma performansı gösterdi; hassasiyet, geri çağırma ve F1 puanları 1.00 eşit olup, çoğunluk sınıfındaki tutarlı yüksek performansı vurguladı. Vasc (destek = 28) için, üst üste yığılmış topluluk hassasiyet = 1.00, geri çağırma = 0.93 ve F1-skor = 0.96 elde etti; bu da derin sinir sınıflandırıcısına (F1 = 0.96) benzer ve XGBoost (F1 = 0.95) ile LightGBM'den (F1 = 0.94) biraz daha yüksekti.

Model karşılaştırması

Üst üste yığılmış topluluk modeli, bireysel modellere kıyasla tüm metriklerde benzer veya daha iyi performans gösterdi. Önemli olarak, melanom tespitindeki artış daha yüksek bir geri çağırma (0,97) ile yansımaktadır; bu da modelin önemli vakalara duyarlılığında iyileşme olduğunu gösterir. Azınlık sınıflarının (df, 23 örnek; akiec, 65 örnek) performansının azalması, sınıf dağılımının model performansı üzerindeki etkisini göstermektedir. En önemlisi, genel doğruluk tüm örnekler üzerinde hesaplanır ve sınıf dengesizliğinden etkilenir; nv sınıfı (destek = 1341) baskındır. Bu nedenle, azınlık sınıfları için hassasiyet veya geri çağırma dalgalanmaları, bildirilen doğruluk değerlerini açıklamaz.

Mevcut yöntemlerle karşılaştırma

Önerilen sistemin performansını karşılaştırmak için, Tablo 5 ve Tablo 6'daki önceki yöntemlerle karşılaştırma sunuyoruz. Önerilen üst üste yığılmış topluluk çerçevesi, daha önce bildirilen yaklaşımlarla aynı seviyede performans gösterir ve %96 doğruluk oranındadır. Ayrıca, önerilen model diğer yaklaşımlarda her zaman dikkate alınmayan çok modlu özellik entegrasyonu ve açıklanabilirlik de sunmaktadır. Bildirilen performans değerleri, orijinal makalelerde bildirilen sonuçlara dayanır ve farklı veri seti bölünmeleri ve değerlendirme yöntemleri nedeniyle farklılık gösterebilir.

Ana gözlem

%94, tüm sınıfların genel performansıdır ve çoğunluk sınıfından (nv, destek = 1341) etkilenir. Bu nedenle, azınlık sınıflarının performansı (örneğin, df, mel hassasiyeti) bunun bildirilen genel doğrulukla tutarsız olduğu anlamına gelmez. Üst üste oturan topluluk, sınıfların iyi performansıyla en yüksek doğruluğu (%96) elde etti. Farklı sınıfların doğruluğundaki artış (örneğin, melanom geri çağırılması), çoklu modelleme yaklaşımlarının çok sınıflı cilt lezyonlarının sınıflandırılmasının öngörücü performansını artırdığını daha da göstermektedir.

Bu, önerilen yaklaşımın ISIC 2019 veri setindeki son teknoloji modellerle karşılaştırılmasıyla daha da test edilmektedir. ResNet50, EfficientNet-B0, DenseNet121 gibi yaygın kullanılan derin öğrenme mimarileri ve önerilen stacked ensemble yönteminin performansının analizi, temel modellerle gerçekleştirildi. Her model aynı deneysel koşullarla test edildi ve birbirleriyle karşılaştırılabilir hale geldi. Tablo 6'da gösterilen sonuçlar, önerilen modelin tüm değerlendirme metriklerinde mevcut modelleri geride bıraktığını göstermektedir. Önerilen üst üste yığılmış topluluk modeli, diğer geleneksel makine öğrenimi modelleri ve derin öğrenme modellerine kıyasla %96 daha yüksek doğruluk ve 0,970 AUC değeri elde eder; bu değer Tablo 6'da görülmektedir. Çeşitli özellik temsillerini yakalamak konusunda, EfficientNet-B0 ve DenseNet121 gibi modeller bir görüntü verildiğinde güçlü temel performans gösterir, ancak bu tür görevleri tek başına yönetmekte yetersizdir. Öte yandan, topluluk yöntemi birkaç modeli başarıyla birleştirmek için uygulanır ve daha iyi genelleme ve sağlamlık garanti eder. Ayrıca, önerilen yöntem hassasiyet, hatırlama ve F1 puanı açısından tutarlı bir şekilde daha iyidir; bu da çeşitli sınıflarda sağlam olduğunu ve gerçek klinik uygulamada kullanılma umut verici bir yeteneği olduğunu gösterir. Tüm modellerin tekrarlanabilirliğini, şeffaflığını ve güvenilir karşılaştırmasını kolaylaştırmak için, deneyler standart bir protokole uygun olarak, çeşitli performans kriterleri ve aynı doğrulama koşullarıyla gerçekleştirildi.

VERİ ERIŞILEBILIRLIĞI:

Bu çalışmada kullanılan HAM10000 cilt lezyonu veri seti https://www.kaggle.com/datasets/kmader/skin-cancer-mnist-ham10000 tarihli Kaggle aracılığıyla halka açık olarak erişilebilir. Veri ön işleme, model eğitimi, değerlendirme ve analiz için kullanılan kaynak kodu ve uygulama dosyaları, makale gönderimiyle birlikte ek materyal olarak sunulmuştur.

MODEL GELIŞTIRME IÇIN ORTAM KURULUMU
BileşenTeknik özellikler
Hesaplama OrtamıGoogle Colab (Ücretsiz Katman)
CPU2 çekirdekli CPU @ 2.20 GHz
GPUNVIDIA T4 / P100
RAM12 GB
İşletim SistemiUbuntu 22.04
Python VersiyonuPython 3.10
Derin Öğrenme ModelleriEfficientNet B4, DenseNet201, MobileNetV2
SınıflandırıcılarXGBoost, LightGBM, DNC, Stacked Ensemble
Çekirdek KütüphanelerTensorFlow 2.12, Keras 2.12, NumPy, Pandas
Açıklanabilirlik AraçlarıŞAPP, LIME
Veri DengelemeSMOTE

Tablo 1: Sistem yapılandırması. Model geliştirme ve değerlendirme için kullanılır. İşlemci tipi, bellek, işletim sistemi ve yazılım çerçeveleri gibi donanım ve yazılım ortamının detaylarını içerir.

ÇOK SINIFLI CILT LEZYONU TAHMINI IÇIN DETAYLI SINIFLANDIRMA RAPORLARI
SınıfHassasiyetGeri ÇağırmaF1 PuanıDestek
XGBoost (Doğruluk: %92)
akiec0.700.710.7065
BCC0.850.820.83103
BKL0.910.830.87220
DF0.650.650.6523
mel0.630.950.76223
NV1.001.001.001341
vasc1.000.910.9528
LightGBM (Doğruluk : %90)
akiec0.680.690.6865
BCC0.830.800.81103
BKL0.900.820.86220
DF0.630.630.6323
mel0.620.940.75223
NV1.001.001.001341
vasc0.990.900.9428
Derin Sinir Sınıflandırıcı (Doğruluk : %94)
akiec0.950.90.9265
BCC0.90.940.92103
BKL0.970.920.94220
DF0.990.960.9723
mel0.990.90.94223
NV0.140.860.241341
vasc0.100.860.1828
Üst üste Toplu Grup (Doğruluk: %96)
akiec0.720.730.7265
BCC0.870.840.85103
BKL0.930.850.89220
DF0.670.660.6623
mel0.660.970.78223
NV1.001.001.001341
vasc1.000.930.9628

Tablo 2: Tüm modellerde çoklu sınıflı cilt lezyonu tahmini için ayrıntılı sınıflandırma performans metrikleri. Bu tablo, her cilt lezyonu kategorisi için sınıf bazında hassasiyet, hatırlama, F1 puanı ve destek sunar.

ModelHiperparametreDeğer
XGBoostÖğrenme HızıVarsayılan (0.3)
Ağaç Sayısı (n_estimators)100
Maksimum Derinlik6
Alt örneklem1
Colsample_bytree1
Amaçmulti:softmax
Değerlendirme Metriğimlogloss
LightGBMÖğrenme HızıVarsayılan (0.1)
Ağaç Sayısı (n_estimators)100
Maksimum Derinlik-1
Yaprak Sayısı31
Özellik Kesimi1
Poşetleme Fraksiyonu1
AmaçÇok sınıflı
Metrikmulti_logloss
Derin Sinir SınıflandırıcıKatman sayısı3 Yoğun Katman
Katman Başına Nöronlar256, 128, 64
Aktivasyon FonksiyonuReLU
Çıkış AktivasyonuSoftmax
OptimizerAdam
Öğrenme Hızı0.001
Parti Büyüklüğü32
Dönem sayısı30
Okuldan Ayrılma0.5
Kayıp FonksiyonuKategorik Çaprazentropi

Tablo 3: Hiperparametre ayarları. Modelleri eğitmek için kullanılan hiperparametre ayarları; öğrenme hızı, parti büyüklüğü, epoch sayısı ve optimizator yapılandırmaları dahil.

Merkezi vs Federe Model
Eğitim StratejisiMerkeziyet (Yığılmış Topluluk)Federated ModelFark (Δ)
Doğruluk (%)96942

Tablo 4: Merkezi ve Federe Öğrenim Karşılaştırması. Performans, gizlilik ve hesaplama özellikleri açısından merkezi ve federasyon öğrenme yaklaşımları arasında karşılaştırma.

Ref. MakaleYöntemModel TipiYılBildirilen PerformansÖnemli Katkı
[2]CNN Cilt Kanseri Tespiti ÇerçevesiCNN2020Yüksek hassasiyet (~%90+)Erken CNN tabanlı sınıflandırma
[4]Derin Öğrenme Kullanarak Melanom TeşhisiCNN2021Geliştirilmiş sınıflandırma performansıDermoskopik görüntü analizi
[8]Kontrol Noktalarıyla Optimize Edilmiş CNNCNN2023Gelişmiş doğruluk (~%92–94)Model optimizasyon stratejisi
[9]Derin Öğrenme + XAI ÇerçevesiCNN + Açıklanabilirlik2023Geliştirilmiş yorumlanabilirlikXAI entegrasyonu
[10]CNN'in Birleşik ÖzellikleriCNN2023Rekabetçi performans (~%90+)Özellik kombinasyonu
[18]SkinSage XAICNN + XAI2023Güven ve yorumlanabilirliğin artmasıAçıklanabilir yapay zeka sistemi
Bu ÇalışmaYığılmış Topluluk + Multimodal + XAITopluluk96%Topluluk + yorumlanabilirlik + gizlilik farkında

Tablo 5: Mevcut yöntemlerle karşılaştırma. Önerilen yöntemin mevcut son teknoloji yöntemlerle standart değerlendirme metrikleri kullanılarak performans karşılaştırması.

Son Teknoloji Modeller
ModelVeri setiDoğrulukHassasiyetGeri ÇağırmaF1-skorAUC
ResNet50ISIC 20190.8420.8350.8280.8310.912
EfficientNet-B0ISIC 20190.8740.8680.8610.8640.935
DenseNet121ISIC 20190.8610.8540.8480.8510.926
XGBoostISIC 20190.920.9050.8920.8980.948
LightGBMISIC 20190.90.8890.880.8840.94
Derin Sinir SınıflandırıcıISIC 20190.940.9050.890.8920.95
Önerilen Yığılmış ToplulukISIC 20190.960.940.930.9350.97

Tablo 6: Son teknoloji modellerle karşılaştırma. ISIC 2019 veri setinde üst üste yığılmış topluluk modelinin diğer son teknoloji mimarilerle karşılaştırmalı değerlendirilmesi. Performansı ölçmek için doğruluk, hassasiyet, geri çağırma, F1-Score ve AUC kullanılır. Önerilen model diğer modelleri geride bırakarak çok sınıflı cilt lezyonu sınıflandırmasında etkinliğini göstermektedir.

Discussion

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

Mevcut protokol, cilt lezyonlarını otomatik olarak sınıflandırmak için yorumlanabilir, gizlilik hassasiyetli, çok modlu bir çerçeve oluşturmak için tekrarlanabilir bir boru hattı oluşturuyor. Protokol, dermoskopik görüntü analizini klinik meta veriler ve yorumlanabilir makine öğrenimi yöntemleriyle birleştirerek model şeffaflığı yoluyla tanı performansını artıran sistematik bir model izler. HAM10000 cilt lezyonu veri seti kamuya açık olup, standartlaştırılmış değerlendirmeye olanak tanır ve dermatolojik görüntü araştırmaları alanında daha fazla araştırmanın tekrarlanabilirliğini kolaylaştırır16. Görüntü ön işleme ve normalleştirme adımı, protokoldeki en önemli adımlardan biridir; çünkü dermoskopik görüntülerin özelliklerin çıkarılmadan ve modelin eğitiminden önce standartlaştırılmasını garanti eder. Dermoskopik görüntülerde bulunan eser değişiklikler arasında eşit olmayan aydınlatma, saç bloklaması veya arka plandaki gürültü bulunur; bu da modellerin performansını etkileyebilir. Görüntülerin sabit bir çözünürlük ve normalizasyona boyutlandırılması bu farkları azaltabilir ve model klinik açıdan ilgi çeken lezyonlara odaklanabilir; örneğin pigmentasyon desenleri, düzensiz sınırlar ve asimetri. Derin öğrenme tabanlı dermatoloji sistemleri, daha önce otomatik cilt kanseri sınıflandırması 2'de gösterildiği gibi, güvenilir performans sağlamak için uygun ön işleme gerektirir.

Birden fazla konvolüsyon sinir ağı (CNN) mimarisine dayalı derin özellik çıkarma iş akışı da bu sürecin önemli bir parçasıdır. Bu süreçte, dermoskopik görüntülerdeki tamamlayıcı özellikleri öğrenmek için EfficientNet-B4, DenseNet201 ve MobileNetV2 kullanılır. Bu mimarilerin özellikler ve hesaplama maliyetleri açısından farklı avantajları vardır. Önerilen protokol, birden fazla model kullanarak özellikleri çıkarabilir ve ardından bunları birleştirerek küresel lezyon desenleri ile iyi huylu ve kötü huylu lezyonların tanımlanmasında yardımcı olabilecek lezyon morfolojilerinin spesifik özelliklerini elde edebilir. Ayrıca çoklu modal özellikli bir füzyon aşaması da vardır. Dermatolojide klinik tanı genellikle görsel ve bağlamsal klinik bilgileri (hastanın yaşı ve cinsiyeti ile lezyonun yeri) içerir. Mimari, dermoskopik görüntü özelliklerini bağlamsal bilgilerle birleştirerek tamamen görüntü tabanlı modellere tanı bağlamı katıyor. Daha pratik bir multimodal yaklaşım ve sınıflandırma sistemini güçlendiriyor.

Protokol ayrıca, sınıflandırma modellerinin tahminlerini açıklamak için özellikle model yorumlanabilirlik tekniği olmak üzere açıklanabilir yapay zeka (XAI) tekniklerini de içermektedir. Tıbbi yapay zeka sistemleri için açıklanabilirlik çok önemlidir çünkü klinisyenler, otomatik tahminlerin arkasındaki gerekçelerin farkında olup bunları tanı süreçlerine dahil etmeleri gerekir. Model yorumlanabilirlik teknikleri, her özelliğin modelin tahminleri üzerindeki etkisini ölçerek küresel özellik önemi sağlarken, model yorumlanabilirlik teknikleri, modelin tahminlerine katkıda bulunan görüntü bölgelerini göstererek yerel açıklamalar sağlar. Bu yorumlanabilirlik araçları, modelin sahte korelasyonlar yerine klinik olarak ilgili yapılara odaklandığını doğrulamaya yardımcı olur ve böylece yapay zeka destekli tanı sistemlerinde güven ve şeffaflığı artırır20.

Kullanılan veri setine veya hesaplama ortamına bağlı olarak protokolde uygulanabilecek çeşitli varyasyonlar vardır. Dermatolojik verilerde tipik bir sorun, sınıf dengesizliğidir; burada lezyon kategorisi başına örnek sayısı önemli ölçüde değişir. HAM10000 veri seti, diğer lezyon kategorilerine göre çok daha yüksek iyi huylu nevüs oranına sahiptir. Bu dengesizlik, nadir lezyon kategorileri için sentetik azınlık verileri üretebilen Sentetik Azınlık Aşırı Örnekleme Tekniği (SMOTE) gibi aşırı örnekleme teknikleriyle azaltılabilir. Veri artırma, sınıf ağırlıklandırma veya odak kaybı gibi diğer stratejiler de daha az yaygın lezyon tiplerinde model doğruluğunu artırmaya yardımcı olabilir.

Önerilen çerçeve çeşitli faydalar sunsa da, bazı sınırlamaları vardır. Model, dermatolojide karşılaşılan tüm görüntüleme senaryolarını, cilt fenotiplerini veya etnik grupları kapsaymayabilecek HAM10000 veri seti üzerinde eğitilmiştir. Bu nedenle, çerçevenin genelleme performansını değerlendirmek için harici veri setleri kullanılarak doğrulanması önemlidir. Ayrıca, birden fazla derin öğrenme modeli ve toplu öğrenmenin dahil edilmesi, modelin hesaplama alanını artırır ve kaynak kısıtlı klinik ortamlarda zorlayıcı olabilir.

Sunulduğu şekliyle, çerçeve, yalnızca görüntüler kullanan geleneksel derin öğrenme yöntemlerine kıyasla birçok ilerleme sunar. Çok modlu veri entegrasyonu daha zengin bilgi sağlar ve toplu öğrenme, çeşitli sınıflandırıcılardan gelen tahminleri toplayarak modelin dayanıklılığını artırır. Ayrıca, açıklanabilir yapay zeka tekniklerinin uygulanması, tıp alanındaki derin öğrenme modelleri için bir endişe kaynağı olan karar alma süreçlerinin yorumlanabilirliğini sağlar. Deneysel dermatoloji tekniklerinden elde edilen içgörüler, biyolojik araştırmalar için temel olan tekrarlanabilir görüntüleme ve analiz iş akışlarını vurgulayarak bu protokolü şekillendirir. Üç boyutlu cilt modelleri ve dermoskopik görüntüleme prosedürleri dahil olmak üzere gelişmiş görüntüleme yaklaşımları, cilt yapısı ve hastalık mekanizmaları hakkında daha derin bir anlayış sağlar ve böylece hesaplamalı tanı araçlarının tasarımı ve geliştirilmesinidestekler 21,22.

Bu protokolde belirtilen yaklaşım, dermatoloji araştırmalarında ve klinik ortamlarda çeşitli şekillerde uygulanabilir. Bu yaklaşım, erken melanoma tespiti ve diğer cilt rahatsızlıkları için bilgisayar destekli tanı sistemlerinin geliştirilmesine yardımcı olabilir, doktorların büyük cilt görüntü veritabanlarında gezinmesine yardımcı olabilir ve tele dermatoloji sistemlerinin bir parçası olarak kullanılabilir; böylece doktorlar dermatologlara uzaktan danışabilirler. Ayrıca, sistemin açıklanabilirliği ve gizlilik koruma özellikleri, birden fazla kurumun veri paylaştığı ve gizliliği sağladığı çok kurumlu tıbbi yapay zeka araştırma ortamında kullanılmasını sağlar. Gelecekteki araştırmalar, daha büyük, çok kurumsal veri setlerinin entegre edilmesini, ek klinik özelliklerin eklenmesini ve burada kavramsal bir uzantı olarak bahsedilen federasyon öğrenme gibi diğer gizlilik koruyucu teknikleri keşfetmeyi içerebilir. Ayrıca, çoklu modal modelleri sadece görüntü ve metaveri tabanlı modellerle karşılaştıran bir ablasyon çalışmasının olmaması bir sınırlamadır ve her veri kaynağının rolünü değerlendirmek için gelecekteki çalışmalarda ele alınacaktır.

Disclosures

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

Yazarların açıklayacak hiçbir şeyi yok. Çıkar çatışmamız yok. Yazarlar, yapay zeka araçlarının yalnızca dil düzenleme ve biçimlendirme için kullanıldığını belirtmektedir. Tüm bilimsel içerik, analiz ve yorumlar yazarlar tarafından geliştirilip doğrulanmıştır.

Acknowledgements

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

Yazarlar, akademik rehberlik ve araştırma desteği sağlayan MVN Üniversitesi, Palwal'a teşekkür etmektedir. Yazarlar ayrıca, bu çalışmanın deneysel değerlendirmesinde kullanılan kamuya açık HAM10000 cilt lezyonu veri setini de kabul etmektedir.

Materials

List of materials used in this article
NameCompanyCatalog NumberComments
DenseNet201 CNN MimarisiIBMhttps://arxiv.org/abs/1608.06993Görüntü sınıflandırması için derin öğrenme modeli
EfficientNet-B4 CNN MimarisiGooglehttps://arxiv.org/abs/1905.11946Görüntü sınıflandırması için derin öğrenme modeli
Google Colaboratory PlatformGooglehttps://colab.research.google.comBulut tabanlı hesaplama ortamı
HAM10000 Cilt Lezyonu Veri SetiHarvard Veri Evrenihttps://doi.org/10.7910/DVN/DBW86TDermoskopik görüntü veri seti
Keras Derin Öğrenme API'siGoogleSürüm 2.xSinir ağı API'si
LIME Açıklanabilirlik KütüphanesiLIME ProjesiSürüm 0.xModel yorumlanabilirlik tekniği
MobileNetV2 CNN MimarisiGooglehttps://arxiv.org/abs/1801.04381Görüntü sınıflandırması için derin öğrenme modeli
Matplotlib Görselleştirme KütüphanesiMatplotlib Geliştirme EkibiSürüm 3.xGrafikler oluşturmak ve performans görselleştirme için kullanılır
NVIDIA GPUNVIDIARTX SerisiModel eğitimi için hesaplamalı donanım
NumPy Sayısal Hesaplama KütüphanesiNumPy GeliştiricileriSürüm 1.xVeri analiz yazılımı
OpenCV Görüntü İşleme KütüphanesiOpenCV VakfıSürüm 4.xGörüntü işleme kütüphanesi
Pandas Veri Analiz KütüphanesiPandas Gelişim EkibiSürüm 1.xVeri analiz yazılımı
Python Programlama OrtamıPython Yazılım VakfıSürüm 3.9+Veri analiz yazılımı
SHAP Açıklanabilirlik KütüphanesiSHAP ProjesiSürüm 0.xModel yorumlanabilirlik tekniği
SMOTE Aşırı Numuneleme Tekniğidengesiz-öğren ProjesiSürüm 0.xDengesiz veri setlerini işlemek için sınıf dengeleme tekniği
Scikit-learn Makine Öğrenme Kütüphanesiscikit-learn ProjesiSürüm 1.xMakine öğrenimi kütüphanesi
TensorFlow Derin Öğrenme ÇerçevesiGoogleSürüm 2.xDerin öğrenme çerçevesi

Reprints and Permissions

Request permission to reuse the text or figures of this JoVE article

Request Permission

Tags

Skin Lesion ClassificationMultimodal EnsembleExplainable AIPrivacy PreservingDeep Learning ModelsClass BalancingEfficientNet B4Clinical MetadataXGBoost ClassifierModel Interpretability

Related Articles