$$\rightleftharpoonup{xx}$$
$$\longleftharp{xx}$$,
$$\longrightharp{xx}$$,
Bu çalışma, kamuya açık ve tamamen anonimleştirilmiş dermoskopik veri setlerini kullandı ve doğrudan insan katılımı içermedi; bu nedenle, etik komite onayı gerekmiyordu. Materyaller Tablosu , bu çalışmada kullanılan tüm malzeme veya araçların detaylarını içerir. Tablo 1 , işlemci türü, bellek, işletim sistemi ve yazılım çerçeveleri gibi donanım ve yazılım ortamının ayrıntılarını içerir. Tablo 2 , her cilt lezyonu kategorisi için sınıf bazında hassasiyet, geri çağırma, F1 puanı ve destek detaylarını içerir.
Önerilen çok modlu cilt lezyonu sınıflandırma çerçevesinin genel iş akışı
Bu araştırmanın genel planı, cilt lezyonlarının çoklu sınıflandırılmasının kesin ve anlaşılır bir şeması oluşturmaktır. İş akışı, HAM10000 veri setinin veri toplama ve ön işleme ile başlar, ardından derin öğrenme mimarileri ve klinik meta verilerin dahil edilmesiyle özellik çıkarımına geçer. Daha sonra, birkaç makine öğrenimi sınıflandırıcısı eğitilip optimize edilir ve sonuçları bir toplu stratejide toplanır. Son olarak, modelin tahminleri açıklanabilirlik teknikleri kullanılarak yorumlanır ve modelin etkinliği gerçek dünyada klinik karar desteğinde kullanılmak üzere değerlendirilir.
Önerilen sistemin öngörü doğruluğunu artırmak için, hem görüntü tabanlı özellikleri hem de klinik meta verileri birleştiren çok modlu bir makine öğrenimi boru hattı kullanılır ( Şekil 1'de gösterildiği gibi). Model, dermoskopik görüntülerin görsel çıktılarını hastayla ilgili bilgilerle birleştirerek çeşitli cilt lezyonlarıyla ilgili daha ayrıntılı desenleri tespit edebilir. Böyle bir kombinasyonla, sistem daha iyi tahminler yapabilir ve bu nihayetinde gerçekleşecek. Cilt lezyonu sınıflandırmasının kalitesini ve faydalılığını artırın. Sinir ağlarının yardımıyla üç önceden eğitilmiş konvolüsyon Derin özellik çıkarılır (EfficientNet-B4, DenseNet201 ve MobileNetV2): dermoskopik görüntülerin çeşitli tamamlayıcı desenlerini yakalayabilirler. Bu mimariler, cilt lezyonlarının nasıl göründüğünü, renk ve doku değişikliklerini ve inşa şeklini yüksek seviyede öğrenir. Daha sonra, bir özellik füzyon modülü derin özellikleri klinik özellikler ve demografik verilerle birleştirerek zengin çok modlu bir özellik oluşturur. Birleştirilen veriler, uygun model testini sağlamak için eğitim, doğrulama ve test verilerine ayrılır. Sonrasında, derin özellikleri klinik özellikler ve demografiklerle birleştirmek için bir özellik birleşimi modülü kullanılır ve zengin çok modlu bir özellik oluşturulur. Bu veriler daha sonra modeli test etmek için eğitim, test ve doğrulama verilerine ayrılır. Tahmin doğruluğunu daha da artırmak için topluluk stratejisi kullanılır. Bu, birkaç modelin sonuçlarının ortalaması alınarak ve bu ortalamalı olasılıkları kullanarak nihai tahmini yaparak genelleştirmeyi artırarak ve bireysel modellerin neden olacağı varyansı en aza indirerek yapılır. Bunun yanı sıra, model yorumlanabilirlik teknikleri gibi açıklanabilirlik yöntemleri de modelin kararlarını nasıl verdiğini daha iyi açıklamak için entegre edilmiştir. Model yorumlanabilirlik yöntemi, giriş değişkenlerinin katkısını nicelikle ölçerek özellik düzeyinde yorumlar sağlarken, model yorumlanabilirlik yöntemi ise dermoskopik görüntülerde tahmini etkileyen piksel düzeyindeki önemli alanları belirler. Model yorumlanabilirlik teknikleri, her giriş değişkeninin katkısını nicelikten ölçerek özellik düzeyinde açıklamalar sunarken, model yorumlanabilirlik teknikleri dermoskopik görüntülerde tahmini etkileyen piksel düzeyindeki önemli bölgeleri vurgular. Bu teknikler birleştiğinde, modelleri daha yorumlanabilir hale getirir ve klinisyenlerin sistemin kararları nasıl aldığını öğrenmelerine yardımcı olur. Sonuç olarak, önerilen ürün hattı, anlaşılır ve gizlilik farkında bir sistem sunarak şeffaflığı ve güveni artırıyor ve gerçek dünyada sağlık ortamında daha güvenilir cilt kanseri teşhisi konmasını sağlıyor.
Hazırlıklı veri seti açıklaması
Bu makalede, HAM10000 (10.000 eğitim görseliyle İnsan Makineye Karşı) veri seti çok sınıflı cilt lezyonu sınıflandırması için birincil veri seti olarak kullanılmıştır. Veri seti, çeşitli tıbbi kaynaklardan toplanan 10.000'den fazla dermoskopik figürü içermektedir. Klinik kaynaklar ve popülasyonlar, dermatolojik görüntü analizinde en yaygın kullanılan kıyaslama veri setlerinden biri haline gelir. Veri setindeki her görüntü, görüntü tanımlayıcıları, tanı etiketleri, hasta yaşı, cinsiyet ve lezyonun anatomik konumu gibi önemli klinik meta verilerle birlikte gelir. Veri seti yedi tanısal kategoriyi kapsar: aktinik keratozlar (akiec), bazal hücre karsinomu (bcc), iyi huylu keratoz (bkl), dermatofibroma (df), melanositik nevuslar (nv), vasküler lezyonlar (vasc) ve melanoma (mel).
Klinik meta veri ön işlemesi
Sınıflandırma hattına eklenen yardımcı özellikler arasında yaş, cinsiyet ve hastadaki lezyonun konumu gibi klinik meta veriler yer alıyordu. Eksik veya bilinmeyen değerler vardı ve bunlar deterministik bir ön işleme yaklaşımıyla ele alındı. Yaş değişkeni (sayısal) durumunda, eğitim setinde hesaplanan medyan yaş eksik değerleri hesaplamak için kullanılmıştır. Medyan atama seçilmesinin nedeni, klinik verilerde yaygın olan istisnalara ve çarpık verilere dirençli olmasıdır. Cinsiyet ve lezyon konumu (kategorik değişkenler) için eksik veya belirtilmemiş değerler hariç tutulmadı; 'bilinmeyen' etiketli özel bir kategoriye atandılar. Yöntem, mevcut tüm örnekleri korur ve model, eksikliğin kendisinin öngörücü olup olmadığını belirlemekte özgürdür. Daha sonra kategorik değişkenlere tek sıcak kodlama uygulanarak onları makine öğrenimi modelleriyle uyumlu hale getirdi. Tüm ön işleme, örneğin emputasyon, kodlama vb. sadece eğitim setinde yapılır ve veri kaybını önlemek için doğrulama ve deney setlerine de aynı dönüşümler yapılırdı. Klinik meta verilerin eksikliği nedeniyle örneklemler dışlanmamıştı ve bu da verilerin maksimum düzeyde kullanılmasını ve metodolojik tutarlılığın sağlanmasını sağladı.

Şekil 1: Cilt lezyonu sınıflandırması için multimodal sistem. Çalışma yaklaşımı, dermoskopik görüntü özelliklerini hasta meta verileriyle birleştirerek deri lezyonlarını topluluk derin öğrenme modelleri kullanarak sınıflandırıyor. Çerçeve, ön işleme, özellik çıkarma, çoklu modlu birleşme ve sınıflandırmayı içerir; böylece gelişmiş tanı performansı ve yorumlanabilirlik sağlanır. Bu figürün daha büyük bir versiyonunu görmek için lütfen buraya tıklayın.
İş akışı, HAM10000 cilt lezyonu veri setinin dermoskopik görüntüleri ve klinik meta verilerine dayanarak önerilen sınıflandırma hattını gösterir. EfficientNet-B4, DenseNet201 ve MobileNetV2, görüntülerdeki derin özellikleri ön işlemek ve çıkarmak için kullanılır. Klinik meta veriler kodlanır ve görüntü özellikleri klinik meta verilerle birleştirmek için özellik birleştirme yöntemi kullanılır. Sınıf dengesizliği sorununu ele almak için, sınıf dengeleme tekniği, ham görüntüler veya bireysel özellik akışları yerine birleşmiş çoklu modal özellik alanında kullanılır; burada sentetik örnekler hem görsel hem de klinik özelliklerin birleşimini korur ve gerçekçi olmayan örnekler üretmez. Birleşik özellikler daha sonra XGBoost, LightGBM ve derin sinirsel sınıflandırıcı gibi sınıflandırıcılar üzerinde eğitiliyor.

Şekil 2: HAM10000 veri setinden yedi farklı tanı grubundan dermoskopik örnekler. Görüntüler, otomatik sınıflandırma için kullanılan tipik görsel özellikleri gösterir. (A) Aktinik keratozlar (akiec), düzensiz pigmentasyona sahip pürüzlü yüzeyler gösterir. (B) Düzensiz şekiller ve kan damarları olan bazal hücreli karsinom (BCC). (C) Açık kahverengi yüzeyli keratoz benzeri lezyonlar (bkl), keratotik özellikler gösterir. (D) Dermatofibrom (df), merkezi yara benzeri görünümü ve pigmentasyonu vardır. (E) Melanositik nevüsler (nv), iyi huylu ve nispeten simetrik mollar. (F) Kan damarları nedeniyle kırmızımsı-mor bir görünüm gösteren damar lezyonları (vasc). (G) Melanoma (mel), düzensiz şekilli, asimetrik ve çok pigmentli bir lezyon olarak ortaya çıkar. Bu figürün daha büyük bir versiyonunu görmek için lütfen buraya tıklayın.
Bu dermoskopik görüntüler, cilt lezyonlarının görsel heterojenliğini ortaya koymaktadır; bu lezyonlarda pigmentasyon, doku ve yapının morfolojisinde farklılıklar vardır. Bu varyasyonlar, otomatik sınıflandırma sistemlerine büyük bir zorluk oluşturur ve derin öğrenme tabanlı sistemlerin önemini vurgular. Ince tanı kalıplarını ortaya çıkarmaya duyarlı olan özellik çıkarma teknikleri. Veri seti açıklamasının ardından, Şekil 2 , dermatolojik tanı görüntüleme araştırmalarında yaygın olarak incelenen HAM10000 veri setine dahil edilen yedi cilt lezyonu kategorisini göstermektedir. Bu sınıflar arasında Aktinik Keratoz (akiec), Bazal Hücre Karsinomi (bcc), Benign Keratoz (bkl), Dermatofibroma (df), Melanositik Nevus (nv), Vasküler Lezyonlar (vasc) ve Melanoma (mel)21 bulunur. Tüm bu lezyon türlerinin benzersiz görsel özellikleri vardır; Şekil 3'te gösterildiği gibi, pigmentasyon desenleri, yüzey dokusu, renk dağılımı ve lezyon sınırları boyunca anormallikler var. Tüm bu lezyonların görsel özellikleri farklıdır ve pigmentasyon, yüzey dokusu, renk dağılımı ve lezyonların sınırlarındaki anormalliklerde farklılıklarla karakterize edilirler. Bunlar, dermatologların klinik muayene yaparken aklında bulunduracağı önemli özelliklerdir ve doğru sınıflandırmaya ulaşmak için makine öğrenimi modelleri tarafından iyi modellenmelidir. Bunlar ayırt edici özellikler olsa da, bu lezyonların çoğu neredeyse aynı görünür, bu da sadece dermoskopik görüntülere bakıldığında aralarını ayırt etmeyi zorlaştırır. Bazı lezyon türleri arasındaki ayrım genellikle son derece ince olsa da klinik olarak önemlidir, bu da otomatik olarak sınıflandırmayı zorlaştırır. Bu yüzden, lezyon sınıfları arasında ince taneli görsel görüntüleri ve ince farklılıkları öğrenmek için eğitim alabilen güçlü yapay zeka modelleri oluşturmak acildir. Bu özellikler, uygun açıklama ile sadece güçlendirilmekle kalmaz; bu da modelin farklı lezyon türlerinde ayırt edici becerilerinin gelişmesini sağlar, ayrıca melanom gibi bazı tehlikeli durumların daha erken teşhis edilmesine de yardımcı olur. Son olarak, tanı doğruluğunu artırabilir, klinisyenleri hasta sonuçlarını iyileştiren kararlar almada bilgilendirebilir ve daha iyi kararlar almasına yardımcı olabilir.

Şekil 3: HAM10000 veri setinde cilt lezyonlarının sınıf bazında dağılımı Şekil, bu çalışmada ele alınan yedi lezyon kategorisinin dağılımını göstermektedir: Aktinik Keratozlar (akiec), Bazal Hücre Karsinoması (bcc), İyi Havalı Keratoz benzeri lezyonlar (bkl), Dermatofibroma (df), Melanositik nevus (nv), Vasküler lezyonlar (vasc) ve Melanoma (mel). Bu grafik, lezyon sınıflarının sınıf dengesizliğini göstermektedir. Bu figürün daha büyük bir versiyonunu görmek için lütfen buraya tıklayın.
Veri setinin analizi, farklı lezyon türlerinin sınıflarında bir dengesizlik olduğunu göstermektedir. En yaygın Melanositik Nevü (nv) türü, yaklaşık 6.705 örnekle en yaygın tiptir; ardından Melanoma (1.113) ve Benign Keratoz (1.099) gelir. Buna karşılık, klinik öneme sahip bazı lezyon türleri de önemli ölçüde daha az temsil edilmektedir; örneğin Dermatofibroma (115) ve Vasküler Lezyonlar (142). Bu orantısızlık, makine öğrenimi modelleri için tehdit oluşturur çünkü modeller çoğunluk sınıflarına eğilimli olabilirler ve olağandışı ama klinik olarak anlamlı lezyonları tespit edemeyebilirler. Bu sorunu ele almak ve modelin tüm sınıflara göre model performansları üzerinde eğitimini geliştirmek için gelişmiş ön işleme gereklidir. Stratejilere ihtiyaç var. Bunlar arasında hedefli veri artırımı ve sınıf dengeleme gibi teknikler bulunur. Veriler, modelin az temsil edilen sınıflarda önemli eğilimleri keşfetmesini teşvik eden (Sınıf dengeleme tekniği ve sınıf ağırlık ayarlaması) yöntemiyle dengelenebilir. XGBoost ve LightGBM için kullanılan hiperparametreler öncelikle varsayılan konfigürasyonlarına ayarlanmış, ön deneylere dayalı küçük ayarlamalar yapılmıştı. Derin sinirsel sınıflandırıcı için, katman sayısı, nöron sayısı, öğrenme hızı, parti büyüklüğü ve epoch sayısı gibi mimari ve eğitim parametreleri doğrulama verileri kullanılarak ampirik olarak seçilmiştir. Hiperparametrelerin tam kümesi Tablo 3'te sunulmaktadır. Genel olarak, bu çalışmada kullanılan dermoskopik görüntü sayısı toplamda 10.015'tir. Bu, eğitilip test edilecek geniş bir veri koleksiyonu sağlama avantajına sahip ve aynı zamanda sıkıcı ama ödüllendirici bir ölçüttür. Önerilen cilt lezyonu sınıflandırma sisteminin etkinliğini değerlendirin.
Veri ön işleme
Ön işleme boru hattı, HAM10000 veri setini çok modlu öğrenmeye hazırlar; görüntüleri standartlaştırır, derin özellikleri çıkarır, klinik meta verileri entegre eder ve sınıf dengesizliğini giderir.
Görüntü Standartlaştırması: Tüm dermoskopik görüntüler 224 × 224 piksel boyutlarına yeniden boyutlandırıldı ve z-skor normalizasyonu kullanılarak normalleştirildi.
(1)
Ben ham görüntüyü temsil ettiğimde, μ piksel bazında ortalamayı gösterir ve σ standart sapmadır.
Derin Özelliklerin Çıkarılması: Tamamlayıcı derin özellikler, üç önceden eğitilmiş konvolüsyon sinir ağı kullanılarak çıkarıldı: Efficient-Net B4, DenseNet201 ve MobileNetV2. Her ağ, normalleştirilmiş görüntüyü bir özellik vektörüne eşler.
(2)
Çıkarılan özellikler, birleşik bir temsil oluşturmak üzere birleştirildi:
FFusion=FEffB4 ||FYoğun ||FMobV2 (3)
(burada || birleştirme anlamına gelir)
Klinik Meta Veri Entegrasyonu: Yaş, cinsiyet ve lezyon lokalizasyonu gibi klinik özellikler min-max ölçeklendirme kullanılarak temizlendi, etiketlendi ve normalleştirildi:
(4)
İşlenen metaveri vektörü Mklinik , görüntü özellikleriyle birleştirilerek nihai çok modlu girdi oluşturuldu:
Fkombine=FfüzyonMklinik (5)
Veri Seti Bölünmesi: Sınıf dağılımını korumak için katmanlı bir bölünme uygulandı
Dtreni,D testi=Bölünme (Fcomibed,0.8) (6)
Sınıf dengesizliği yönetimi: HAM10000 veri setinde, "nevus" (NV) örnekleri diğer azınlık gruplarında, örneğin VASC'li DF'de az temsil edildiği için sınıflar arasında ciddi bir dengesizlik vardır. Bu sorunu azaltmak için "Sentetik Azınlık Aşırı Örnekleme Tekniği" (sınıf dengeleme tekniği) kullanıldı. Kullanımı: Yeni sentetik örnekler şu şekilde üretildi:
xnew=xi + λ(xzi - xi) (7)

xi azınlık sınıfı örneği olduğunda, xzi en yakın komşularından biridir ve λ 0 ile 1 arasındaki tekdüz dağılımdan alınan rastgele bir değerdir. Sentetik örnek, Şekil 4'te gösterildiği gibi, x alt i'yi birleştiren çizgi segmenti boyunca üretilir.ve xent, xi ve xzi'yi birleştirir.

Şekil 4: Sınıf dengeleme tekniği uygulamadan önce/sonra HAM10000 veri setinde sınıf dağılımı. (A) Sınıf dengelemeden önce, lezyon sınıfları arasında dengesizlikle. (B) Tüm sınıfların temsili eşit olduğu birleşik özellik alanında sınıf dengesinden sonra, sınıflandırıcı eğitim sürecinde önyargıyı önlemek için. Bu figürün daha büyük bir versiyonunu görmek için lütfen buraya tıklayın.
HAM10000 veri setindeki sınıf dengesizliği sorununu çözmek için Sentetik Azınlık Aşırı Örnekleme Tekniği (sınıf dengeleme tekniği) uygulanır. Sınıf dengeleme tekniği, mevcut veri noktaları arasında etkileşim yoluyla azınlık sınıfları için sentetik örnekler üretir ve bu da az temsil edilen lezyon kategorilerinin temsilinin artmasına yardımcı olur. Bu azınlık sınıflarının daha fazla örneğinin üretilmesinin nihai sonucu, tüm yedi lezyon türüne göre genel olarak daha dengeli bir veri setidir. Bu dengeli temsil, sınıflandırma modellerinin her sınıfta daha iyi öğrenmesini ve çoğunluk sınıflarındaki önyargıyı en aza indirmesini sağlayacaktır. Sonuç olarak, model sınıflandırma açısından daha adil ve özellikle nadir ama klinik olarak önemli cilt lezyonlarına karşı hassastır.
Gizlilik koruyucu öğrenme çerçevesi
Önerilen sistem, ciltte gizlilik farkında ve yorumlanabilir çok modlu otomatik lezyon sınıflandırma sistemi önermektedir. Sistemin nihai amacı, tanı performansını artırmak ve aynı zamanda eğitim süreci boyunca hassas hasta bilgilerini korumaktır. Hasta gizliliği, sağlık uygulamalarında hayati bir ihtiyaç olduğundan, sağlık verilerinin gizliliği yasaları ve etik hususlar sağlık ortamlarında son derece önemlidir. Bu nedenle, önerilen model, federasyon öğrenim fikirlerine dayanan merkeziyetsiz bir öğrenme modeli içerecektir. Bu merkeziyetsiz ortamda, model eğitimi tüm hasta verilerini merkezi bir konumda toplamak yerine dağıtık bir grup istemci üzerinde gerçekleştirilir. Tüm katılımcı müşteriler modeli kendi verileriyle yerel olarak eğitiyor ve ham hasta verileri yerel ortamdan çıkmaz. Hassas tıbbi kayıtların taşınmasına alternatif olarak, model güncellemeleri veya parametreler merkezi bir sunucuya gönderilerek toplanır. Bu iş birliğine dayalı öğrenme yaklaşımı, çeşitli kurumların veya veri kaynaklarının veri gizliliğinden ödün vermeden model eğitimine katkıda bulunmasını sağlar.
wt(k) t. yinelemedeki kth istemcinin model parametreleri olsun ve nk o istemcide örnek boyutu olsun. Küresel modelin güncellenmesi şu şekilde hesaplanır:
(8)
Bu toplama stratejisi, daha büyük veri setlerine sahip müşterilerin küresel modele orantılı olarak daha fazla katkıda bulunmasını sağlarken, küçük müşterilerin öğrenme sürecine katılmasına izin vermektedir. Ham hasta veri alışverişi yapmadan işbirlikçi eğitimi mümkün kılarak, önerilen çerçeve gizliliği korur ve veri setleri arasında dağıtılmış bilgiden fayda sağlar.
Federe deneysel kurulum
HAM10000 veri setiyle simüle edilmiş bir federe öğrenme sistemi, sunulan gizlilik farkında çerçevenin verimliliğini doğrulamak için tasarlandı. Veriler, özdeş olmayan dağıtılmış (IIID olmayan) verilerle gerçek hayattaki çok kurumsal bir ortamı simüle etmek için üç istemciye bölündü. Her danışanın farklı bir lezyon sınıfı karışımı vardır ve bu, klinik merkezler arasında dünyada bir farklılık gösterir. Aynı multimodal özellik çıkarma boru hattı (EfficientNet-B4, DenseNet201, MobileNet V2 ve klinik meta veriler) her istemcide yerel olarak çalıştırılıyordu. Eğitimlerinde, müşteriler yerel modellerini kendi başlarına güncelliyor ve öğrenilen parametreler yalnızca merkezi sunucu ile FedAvg algoritması tarafından birleştirilmek üzere değiştiriliyordu. Tahmin doğruluğu ile gizlilik arasındaki denge, her birinin performansını ölçmek için federasyon modeli ile merkezi eğitim yaklaşımı arasında karşılaştırıldı. Şekil 5'te belirtilen test sonuçları, federasyon modelinin rekabetçi performans gösterebileceğini, merkezi öğrenmeye kıyasla sadece hafif bir doğruluk azaldığını ve veri gizliliğinin çok daha iyi olduğunu göstermektedir.

Şekil 5: HAM10000 veri setinin istemci bazında dağılımı Bu, cilt lezyonu verilerinin danışanlar arasında dağılımını gösterir ve veri dağılımındaki çeşitliliği gösterir. Bu, danışanlar arasındaki veri heterojenliğini gösterir; bu, federasyon öğreniminin kritik bir yönüdür. Bu figürün daha büyük bir versiyonunu görmek için lütfen buraya tıklayın.
HAM10000'de oluşturulan heterojen (IID olmayan) danışan dağılımları, gerçek hayat klinik durumlarını modellemek için üç gruba ayrıldı. Her danışan içindeki farklı lezyon kategorilerinin dağılımı farklıdır, özellikle nevüs sınıfı (nv), ki bu sınıf hastalar arasında eşit dağılmaz. Bu düzenleme, kurumlardaki verilerin eşit şekilde dağıtılmadığı federasyon öğreniminin gerçek dünya zorluklarının göstergesidir.
Performans karşılaştırması: merkezi ve federasyon öğrenimi
Önerilen federasyon öğrenme çerçevesinin etkinliğini değerlendirmek için, Şekil 6'da gösterildiği gibi HAM10000 veri seti kullanılarak merkezi ve federasyon eğitim stratejileri arasında karşılaştırmalı bir analiz yapılmıştır. Merkezi ortamda, tüm veri örnekleri tek bir eğitim havuzunda toplanmıştır. En iyi performans gösteren merkezi model olan üst üste yığılmış topluluk, genel doğruluğu %96'ya ulaştı. Buna karşılık, federasyon ayarı veri setini üç istemci arasında dağıtmış, aynı olmayan dağıtılmış (IID olmayan) verilerle dağıtmıştır; her istemci modeli yerel olarak eğitmiş ve FedAff kullanarak yalnızca model parametrelerini paylaşmıştır. Federe model, merkezi yaklaşıma kıyasla %2 performans farkına karşılık gelen yaklaşık %94 genel doğruluk sağlamıştır; bu da Tablo 4'te gösterilmiştir. Bu marjinal azalma, merkeziyetsiz optimizasyon ve müşteriler arasında heterojen veri dağılımı nedeniyle beklenmektedir.
Bu küçük değişiklik gerçekleşmiş olsa da, federasyon modeli yine de tahmin konusunda iyi performans gösterdi. Merkezi eğitimde, sınıf bazında davranış, nevus (nv) (F1-puanı = 1.00) gibi sınıfların çoğunun sabit kaldığını, dermatofibroma (df) gibi azınlık sınıflarının ise (F1 puanı ≈ 0.65–0.66) dağılım dengesizliğine daha duyarlı olduğunu ve bunun federasyon performansını daha fazla etkileyebileceğini gösterir. Özellikle, federe yapı, hassas hasta bilgilerinin açığa çıkma olasılığını en aza indiriyor çünkü hastalar arasında ham tıbbi verilerin paylaşılmasını gerektirmiyor.

Şekil 6: Federe öğrenme ile merkezi öğrenme karşılaştırması. Bu rakam, öğrenme paradigmalarını doğruluk, hassasiyet, hatırlama ve F1-puanı gibi performans ölçütleri kullanılarak karşılaştırmaktadır. Bu, federasyon öğrenimin, geleneksel öğrenme yaklaşımına benzer performansa ulaşma yeteneğini gösterirken, mahremiyeti koruyor. Bu figürün daha büyük bir versiyonunu görmek için lütfen buraya tıklayın.
Tablo 4 sonuçları, federasyon öğrenme modelinin rekabetçi olabileceğini ve doğruluk modelinin merkezi modele kıyasla yaklaşık %2 kadar hafifçe düştüğünü göstermektedir. Bu küçük azalma, merkeziyetsiz optimizasyon ve IID dışı veri dağılımıyla açıklanabilir. Ancak, federasyon modelinin gizlilik koruması açısından büyük bir avantajı vardır; hassas hasta bilgileri müşteriler arasında paylaşılmaz. Federe model ile merkezi yığılmış topluluk modelinin adil bir karşılaştırması sağlamak için, federasyon modeli aynı mimari ve hiperparametrelerle test edilmiştir. Bu çalışmada ele alınan gizlilik koruma yönü kavramsaldır ve federasyon öğrenimi gibi tekniklerin gelecekteki çalışmalara entegrasyonunu vurgulamayı amaçlamaktadır. Mevcut uygulamada gizlilik koruma mekanizmalarının deneysel doğrulaması yapılmamaktadır.
Çok modlu özellik birleşimi
Cilt lezyonlarının teşhisi genellikle cilt gözlemi ve klinik öykü içerir. Dermatologlar çoğu durumda, dermoskopik görüntüleri sadece hasta bilgileriyle (yaş, cinsiyet ve lezyonun konumu) ilişkili konuma getirerek tanı değerlendirmelerini yapmazlar. Önerilen sistem, bu klinik iş akışından ilham almaktadır ve görüntü tabanlı ile klinik verileri birleştirmek için çok modlu bir öğrenme yaklaşımı içermektedir. CNN'ler, önceden var olan dermoskopik görüntü derinlikli özellikler üzerine eğitilmiştir. Bu tür ağlar, renk değişiklikleri, lezyon formları, yapısal anomaliler ve doku özellikleri gibi karmaşık görsel tasarımları tanır. Bununla birlikte, görüntülerin özellikleri bir lezyonun klinik durumunu yakalamak için yeterli olmayabilir. Her görüntüyle ilgili klinik meta veriler de öğrenmeye dahil edilir. Derin görüntü özelliklerini işlenmiş klinik özellikler ve demografik bilgilerle entegre edecek bir özellik füzyon modülü oluşturulacak. Bu bileşik temsil, her bir lezyonun hem görsel hem de bağlamsal bilgilerinden oluşan entegre bir multimodal özellik temsilidir. Model, genel sınıflandırma yeteneğini artıran tamamlayıcı desenler elde etmek için birkaç veri kaynağını entegre edebilir. Multimodal temsil, sistemin görsel olarak benzer lezyonları daha etkili ayırt etmesine ve klinik göstergeleri dikkate almasına olanak tanır. Model, klinik olarak daha anlamlı ve etkilidir çünkü dermatologların klinik uygulamada lezyonları nasıl incelediğine daha yakın bir yaklaşımdır.
Yığılmış topluluk öğrenimi
Önerilen çerçeve, sistemin öngörme yeteneğini daha da geliştirmek için üst üste yığılmış bir topluluk öğrenme stratejisi kullanır. Topluluk öğrenimi, genellemeyi artırmak ve tek modellerde ortaya çıkabilecek tahmin hatalarını en aza indirmek için iki veya daha fazla öngörücü model kullanan bileşik bir tahmin yöntemidir. Birden fazla temel öğrenen, tek bir sınıflandırıcı kullanmak yerine çoklu modal özellik temsili üzerinde bağımsız olarak eğitilir. Tüm temel öğreniciler, belirli bir örneğin belirli bir lezyon sınıfına ait olma olasılığına dair bir tahmin sunar. Bu olasılık tahminleri daha sonra meta düzeyde toplanır. Her temel öğrenenlere, nihai tahmine göreceli önemini göstermek için bir ağırlık verilir. Normalize sınıf olasılıkları üretmek için toplanan çıktıyı hesaplamak için softmax aktivasyon fonksiyonu kullanılır. Üst üste yığılmış topluluk yönteminin birçok avantajı vardır. Birincisi, çeşitli modellerin birleşimi nedeniyle tahmin varyansını en aza indirir ve böylece genelleştirmenin performansını artırır. İkincisi, çeşitli modeller verilerdeki farklı eğilimleri tanımladığı için gücü artırır. Üçüncü olarak, topluluk öğrenimi, özellikle tıbbi verilerde, bazı klinik ilgi çekici durumların o kadar yaygın olmadığı yerlerde, azınlık lezyon sınıflarının sınıflandırılmasını artırır.
Açıklanabilir yapay zeka entegrasyonu
Tıbbi yapay zeka sistemleri ayrıca, yüksek tahmin doğruluğu kritik olsa da, seçimlerine net açıklamalar sunmalıdır. Yapay zeka sistemlerine güvenmek ve uygulamalarında etkili olmak için klinisyenler, bir modelin ortaya koyduğu tanıya nasıl uyduğunu kavrayabilmelidir. Bu ihtiyacı karşılamak için, önerilen çerçeve, Şekil 7'de gösterildiği gibi açıklanabilir yapay zeka (XAI) yöntemlerini içermektedir.

Şekil 7: Çok sınıflı cilt lezyonu sınıflandırması için farklı sınıflandırma modellerinin karışıklık matrisleri. (A) XGBoost, (B) LightGBM, (C) Derin Sinir Sınıflandırıcı ve (D) Yığılmış Toplu Model. Her bir karışıklık matrisi, tüm yedi cilt lezyonu türü için gerçek sınıf (satırlar) ile tahmin edilen sınıf (sütunlar) arasındaki ilişkiyi gösterir: akiec, bcc, bkl, df, mel, nv ve vasc. XGBoost ve LightGBM modelleri nv ve bkl sınıfları için iyi performans sergiliyor, ancak mel ve nv arasında bazı karışıklıklar var. Derin Sinir Sınıflandırıcısı, bkl ve df sınıflandırmasını iyileştirir ve diyagonal dışı karışıklığı azaltır. Stacked Ensemble modeli, diyagonal giderek daha baskın hale gelerek en büyük sınıflandırma tutarlılığını gösterir. Bu figürün daha büyük bir versiyonunu görmek için lütfen buraya tıklayın.
Sistem, modelin ne öngördüğüne dair bir fikir vermek için iki popüler açıklanabilirlik yaklaşımını (model yorumlanabilirlik tekniği (SHapley Ekleyici Açıklamaları) ve model yorumlanabilirlik tekniği (Yerel Yorumlanabilir Model-Bağımsız Açıklamalar)) içerir. Model yorumlanabilirlik yöntemi, özelliklerin her bir girdi özelliğinin genel tahmine ne kadar katkıda bulunduğunu ölçerek özellikleri açıklar. Sınıflandırma sonucunda hangi klinik değişkenlerin/görsel özelliklerin en çok etkili olduğunu belirlemeye yardımcı olur. Bu, araştırmacıların ve klinisyenlerin modelin veri setindeki genel davranışını görmelerini sağlar. Model yorumlanabilirlik tekniği ise, bireysel tahminlerin yerel açıklamalarıyla ilgilenir. Dermoskopik görüntünün modelin kararını en çok etkileyen bölgeleri vurgular. Bu piksel düzeyindeki görsel açıklamalar, klinisyenlerin sınıflandırmayı etkileyen lezyon bölgelerini görsel olarak incelemelerini sağlar. Önerilen çerçeve, küresel ve yerel yorumlanabilirlik sunar; Bu, model yorumlanabilirlik tekniğinin entegre edilmesiyle sağlanır. Çift açıklama mekanizması şeffaflığı artırır ve klinisyenlerin modelin tıbbi açıdan önemli kalıpları hedefleyip hedeflemediğini değerlendirmelerini sağlar.
Klinik karar destek potansiyeli
Gizliliği koruyan öğrenme, çoklu modlu özellik birleşimi, topluluk modelleme ve açıklanabilir yapay zeka, otomatik cilt lezyonu sınıflandırması için entegre ve sağlam bir sistemin temel bileşenleridir. İdeal olarak, sistem sadece yüksek prognostik güce sahip olmakla kalmayıp, aynı zamanda şeffaf ve güvenli olmalıdır; bunlar tıbbi sistemlerde iki temel faktördür; Şekil 8'de gösterildiği gibi.

Şekil 8: Yığılmış topluluk modeli için alıcı çalışma karakteristikası (ROC) eğrileri. (A–C) Bu, yedi cilt lezyonu tipi için gerçek pozitif oran (hassasiyet) ve yanlış pozitif oranı (1-özellik) ile ROC eğrilerini gösterir. Eğrinin altındaki alan (AUC), üst üste yığılmış topluluk modelinin sınıflar arasındaki ayrım performansını temsil eder. Bu figürün daha büyük bir versiyonunu görmek için lütfen buraya tıklayın.
Bu sistem, açıklanabilir tahminler ve gizlilik koruması sağlar. Sonuç olarak, diğer dermatolojik tanı sistemleri için faydalı bir sistemdir. Bu sistem, sağlık uygulayıcıları/dermatologların lezyon şüpheliliğini değerlendirmesini ve tanı doğruluğunu artırmalarını sağlar ve bu nedenle uygulayıcılar/dermatologlar, hastaların daha ciddi bir hastalığı (örneğin melanom) olabileceği erken aşamada teşhis koymalarına yardımcı olur. Özetle, Şekil 9'da gösterildiği gibi, bu sistem yüksek teknolojili yapay zeka (YD) sistemlerini kullanma ve gerçek dünya uygulamalarını uygulamaya taşımayı amaçlamaktadır; böylece dermatologların hastaları daha doğru ve daha güvenle teşhis etmesine yardımcı olurken, hastaların mahremiyet ve güvenliğini ve konforlarını güvence altına almaya yardımcı olur.

Şekil 9: Çok sınıflı cilt lezyonu sınıflandırması için model yorumlanabilirlik teknikleri kullanılarak açıklanabilirlik sonuçları. (A) İyi ve kötü huylu lezyon tahminlerini etkileyen özellik katkılarını gösteren SHAP grafiki. (B) BCC tahmini için LIME açıklaması, sınıflandırma sonucuna olumlu ve olumsuz katkı sağlayan özellikleri gösterir. (C) Akiec tahmini için LIME açıklaması, model karar alma sürecinde yer alan en etkili özellikleri vurgular. Bu yorumlanabilirlik görselleştirmeleri, modelin tahminlerini önemli ölçüde etkileyen bölgeleri ve çıkarılan özellikleri göstererek, cilt lezyonu değerlendirmesinde sınıflandırma sürecinin şeffaflığını ve anlaşılmasını artırmaktadır. Bu figürün daha büyük bir versiyonunu görmek için lütfen buraya tıklayın.
Değerlendirme stratejisi
Örnekleme yanlılığını önlemek ve tüm cilt lezyonu kategorilerinde orijinal sınıf dağılımını korumak için veri seti 80:20 tren-test bölünmesine ayrıldı. Eğitim alt kümesi daha sonra 90:10 train: valide, hiperparametreleri ayarlamak ve modeli optimize etmek için bölündü. Test seti eğitim sürecinde hiçbir aşamada kullanılmamış ve yalnızca eğitim sürecinin sonunda, veri sızıntısını önlemek ve tarafsız bir performans değerlendirmesi sağlamak için son test olarak uygulanmıştır. Tüm modeller önceden işlenmiş ve eşit ortamlarda eğitilmiş, veriler aynı şekilde bölünmüş ve genişletilmiş, değerlendirme protokolleri aynı şekilde uygulanıp takip edilmiş, bu da adil ve tekrarlanabilir karşılaştırmalar yapılmasına olanak sağlamıştır. Modeller, doğruluk, hassasiyet, hatırlama, F1 puanı ve AUC temelinde kapsamlı şekilde değerlendirildi; sınıf bazında sonuçlar ayrıntılı analiz edilerek hem büyük hem de azınlık lezyon sınıfları için sağlamlıkları belirlendi. Bu standartlaştırılmış doğrulama aracı, önerilen yaklaşımın güvenilirliğini, şeffaflığını ve genellenebilirliğini artırmaya ve performans raporlamasındaki olası tutarsızlıkları aşmaya yardımcı olacaktır.