Denetimli Makine Öğrenmesi ile Su Örneklerinin Sınıflandırılması


Avcu F. M.

Uluslararası Dumlupınar Fen ve Matematik Kongresi - IDUSMAC 2022, Kütahya, Türkiye, 5 - 07 Eylül 2022, ss.217-218

  • Yayın Türü: Bildiri / Özet Bildiri
  • Basıldığı Şehir: Kütahya
  • Basıldığı Ülke: Türkiye
  • Sayfa Sayıları: ss.217-218
  • İnönü Üniversitesi Adresli: Evet

Özet

Su, insan varlığı için vazgeçilmez bir kaynaktır. Aslında, insan vücudunun %60'ından fazlası sudan oluşur. Dünya yüzeyinin yaklaşık üçte ikisi su ile kaplıdır. Ancak bu su miktarının ise yine yaklaşık %3lük bir kısmı içilebilir sulardan oluşmaktadır. Hayat için en gerekli bileşik sudur. Kentleşmenin hızla artması, sanayinin ilerlemesi ve dünya nüfusunun hızlı artışı suyu daha zaruri hale getirmiştir. Özellikle sanayinin az olan tatlı su kaynaklarını kirletmesi suyu daha önemli hale getirmiştir. Bu çalışmamızda Kaliforniya Üniversitesin Makine Öğrenme Deposu web sitesinden[1] elde ettiğimiz 3276 su örneğini kullandık. Çalışma, makine öğrenimi tekniklerini kullanarak su kalitesi tahmini uygulayacağız. Sınıflandırma işlemi kimyada sıklıkla kullanılmaktadır. Ama sınıflandırma işlemleri eğer sisteme yeni bir parametre eklenmiş yada çıkarılmış ise tekrarlanmalıdır. Eklenen her özellik (ph, sertlik, iletkenlik gibi) sınıflandırmayı değiştirecektir. Bu teknikte modelimiz suyun içilmesinin güvenli olup olmadığını Ph değeri, iletkenlik, sertlik, suda çözünmüş katı miktarı, kloraminler, sülfat, bulanıklık gibi bazı parametreleri kullanarak tahmin etmektedir. Çalışmamızda Lojik Regresyon, K-En yakın Komşu, Rastgele Orman, Naive Bayes ve Destek Vektör Makinaları algoritmaları kullanılmıştır. Yapılan
çalışmada Rastgele orman algoritmasının daha iyi sonuç vermiştir.

Water is an essential resource for human beings. More than 60% of the human body consists of water. About two-thirds of the Earth's surface is covered with water. However, about 3% of this amount of
water consists of potable water. The most essential compound for life is water. The rapid increase in urbanization, the progress of industry and the rapid increase in the world population have made water
more essential. In particular, the industry's polluting the limited fresh water resources has made water more important. In this study, we used 3276 water samples obtained from the University of California
Machine Learning Repository website[1]. The classification process is frequently used in the field of chemistry. But the classification processes should be repeated if a new parameter is added or removed
from the system. Because each added or deleted feature (such as pH, hardness, conductivity) will change the classification. The model developed with the data we have estimates whether the water is safe to drink by using some parameters such as pH value, conductivity, hardness, amount of dissolved solids in water, chloramines, sulfate, turbidity. In our study, Logic Regression, K-Nearest Neighbor, Random
Forest, Naive Bayes and Support Vector Machines algorithms were used. In the study, it was seen that the Random forest algorithm gave better results.