SVM, NB, KNN, AdaBoost ve Random Forest sınıflandırma algoritmaları kullanılarak meme kanserinin tahmini


Tezin Türü: Yüksek Lisans

Tezin Yürütüldüğü Kurum: İnönü Üniversitesi, Türkiye

Tezin Onay Tarihi: 2022

Tezin Dili: Türkçe

Öğrenci: AYÇA ACET

Danışman: Abdullah Erhan Akkaya

Özet:

Günümüzde kanser en yaygın hastalıklardan biridir. Yaygın olan kanser türünden biri de meme kanseridir. Meme kanseri erkek bireylere oranla kadın bireylerde daha fazla gözükmektedir. Meme kanserine yakalanma nedenleri; genetik yatkınlık, stres, bireylerin kullandığı kötü alışkanlıklar (tütün ürünleri, alkol vb.) gibi etkenler bireyin kansere yakalanma riskini arttırmaktadır. Meme hücrelerinin kontrol dışı olarak çoğalması, büyümesi ve diğer dokulara yayılması meme kanseri oluşmasının nedenidir. Kanser hücreleri normal hücre bölünmesi, çoğalması ve büyümesinden farklı bir davranış sergileyerek kontrol dışı çoğalma ve büyümesiyle başka dokulara yayılmasıdır. Kanser hücreleri sağlıklı hücre davranışının aksine genellikle çok hızlı ve sürekli olarak çoğalırlar. Kanser hücreleri iyi huylu tümör ve kötü huylu tümör olarak ikiye ayrılmaktadır. İyi huylu tümör (benign) diğer dokulara yayılmadan sadece kendi bulunduğu alanda büyüyen bir yapıya sahip. Kötü huylu tümör (malignant) ise hem bulunduğu alanda büyümüş hem de diğer dokulara yayılmıştır. Meme kanserini yenmenin en önemli etkenlerinden biri de erken teşhistir. Hatta her kanser türünde erken teşhisin hayat kurtardığı belirtilmektedir. Erken teşhis ile hasta bireye verilecek olan zarar azalır ve bununla birlikte iyileşme sürecinde başarı oranı artmaktadır. Meme kanserinin sınıflandırabilmesi için makine öğrenmesi yöntemleri kullanılmaktadır. Bu yöntemlerde meme kanseri hastası bireyin meme hücresi bilgileri alınır ve bu bilgiler girdi olarak makine öğrenmesi algoritmalarına verilmektedir. Girdi verileri ve makine öğrenmesi metodlarını kullanarak bir çıktı olarak bir veri oluşturur. Yani makine öğrenimi algoritmaları, girdi olarak meme kanseri hücre modelini ve çıktı olarak da kanser türünün iyi huylu ya da kötü huylu olarak etiketlenerek kullanılır. Modelin iyi olarak adlandırılabilmesi için meme kanserinin doğru olarak sınıflandırılması gerekmektedir. Makine öğrenimi için kullanılan algoritmalar; AdaBoost (AB), k-Nearest Neighbors (kNN), Naïve Bayes (NB), Random Forest (RF), Support Vector Machine (SVM) algoritmaları. Sınıflandırma yapabilmek için bu algoritmaların uygulanması ve sonuçlara göre doğruluk oranlarının karşılaştırılması sağlanmıştır.