Isırgan Otu Örneklerinin Denetimsiz Öğrenme Yöntemleri ile kümelenmesi & Derin Öğrenme ile Yöntemin Testi


Avcu F. M., Karakaplan M., Mutlu B.

Uluslararası Dumlupınar Fen ve Matematik Kongresi - IDUSMAC 2022, Kütahya, Türkiye, 5 - 07 Eylül 2022, ss.133-134

  • Yayın Türü: Bildiri / Özet Bildiri
  • Basıldığı Şehir: Kütahya
  • Basıldığı Ülke: Türkiye
  • Sayfa Sayıları: ss.133-134
  • İnönü Üniversitesi Adresli: Evet

Özet

Isırgan otu örneklerinin kümelenmesi için örneklerin GC/MS verileri kullanıldı. GC/MS spektroskopisi, temel bilimler ve sağlık bilimlerinde sıklıkla kullanılan, çok bileşenli karışımlarda elementlerin belirlenmesinde, ileri seviye molekül yapı tayininde, kalitatif ve kantitatif çalışmalar için performanslı ve hızlı bir spektroskopik yöntemdir. Bu yöntemin temeli, gaz kromatografisinde karışımdaki maddeler birbirinden ayrıldıktan sonra iyonlaştırarak kütle spektrometresinde karşımdaki maddelerin kütlelerine bağlı olarak elementler tayin edilmesine dayanır. Ayrıca verilerden ön işleme yapmadan, spektrumdan en fazla sayıda analitik bilgiyi çıkarmak için kullanılan bir yöntemdir. Öncelikle örneklerden elde edilen spektrum verilerine Elbow yöntemi uygulanarak küme sayısı belirlendi. Bu işlem sonucunda veriler 3 kümeye ayrıldı. Veriler temel bileşenler analizi (PCA) ile 2 boyuta indirildikten sonra, Hiyerarşik Kümeleme (HCA) uygulanarak örneklerin kümeleri belirlendi. Kümeleri belirlenen verinin %20’si test verisi olarak kullanılmak üzere rastgele seçildi. Kalan eğitim verisi Deep Learning ile eğitildi. Eğitim sonrası test verisi kontrol edildi ve doğruluk %100 olarak bulundu. Önerilen yöntem, hızlı, ucuz ve ön işlem gerektirmeyen avantajları ile GC/MS örneklerinin kümelenmesinde güvenilir sonuçlar vermektedir.

Cluster analysis is one of the multivariate statistical analysis methods that helps to separate units and variables into similar sub-clusters  whose groups are not known precisely. It is frequently used in chemometric studies. The GC/MS data of the samples were used for clustering of the stinging nettle samples. GC/MS spectroscopy is a fast and fast spectroscopic method that is frequently used in basic and health sciences, for the determination of elements in multicomponent mixtures, for advanced molecular structure determination, and for qualitative and quantitative studies. The basis of this method is based on the determination of the elements depending on the masses of the substances in the mass spectrometer by ionizing the substances in the mixture after they are separated from each other in gas chromatography. It is also a method used to extract the maximum number of analytical information from the spectrum without preprocessing the data. First of all, the number of clusters was determined by applying the Elbow method to the spectrum data obtained from the samples. As a result of this process, it was seen that the data were divided into 3 clusters. After the data were reduced to 2 dimensions with principal component analysis (PCA), clusters of samples were determined by applying Hierarchical Clustering (HCA). 20% of the data whose clusters were determined were randomly selected to be used as test data. The rest of the data was used to train deep learning. Test data was checked after training and its accuracy was found to be 100%. The proposed method gives reliable results in clustering of GC/MS samples with its fast, cheap and no pre-processing advantages.