Uluslararası Dumlupınar Fen ve Matematik Kongresi - IDUSMAC 2022, Kütahya, Türkiye, 5 - 07 Eylül 2022, ss.133-134
Isırgan otu örneklerinin kümelenmesi için örneklerin GC/MS verileri
kullanıldı. GC/MS spektroskopisi, temel bilimler ve sağlık bilimlerinde
sıklıkla kullanılan, çok bileşenli karışımlarda elementlerin
belirlenmesinde, ileri seviye molekül yapı tayininde, kalitatif ve
kantitatif çalışmalar için performanslı ve hızlı bir spektroskopik
yöntemdir. Bu yöntemin temeli, gaz kromatografisinde karışımdaki
maddeler birbirinden ayrıldıktan sonra iyonlaştırarak kütle
spektrometresinde karşımdaki maddelerin kütlelerine bağlı olarak
elementler tayin edilmesine dayanır. Ayrıca verilerden ön işleme
yapmadan, spektrumdan en fazla sayıda analitik bilgiyi çıkarmak için
kullanılan bir yöntemdir. Öncelikle örneklerden elde edilen spektrum
verilerine Elbow yöntemi uygulanarak küme sayısı belirlendi. Bu işlem
sonucunda veriler 3 kümeye ayrıldı. Veriler temel bileşenler analizi
(PCA) ile 2 boyuta indirildikten sonra, Hiyerarşik Kümeleme (HCA)
uygulanarak örneklerin kümeleri belirlendi. Kümeleri belirlenen verinin
%20’si test verisi olarak kullanılmak üzere rastgele seçildi. Kalan
eğitim verisi Deep Learning ile eğitildi. Eğitim sonrası test verisi
kontrol edildi ve doğruluk %100 olarak bulundu. Önerilen yöntem, hızlı,
ucuz ve ön işlem gerektirmeyen avantajları ile GC/MS örneklerinin
kümelenmesinde güvenilir sonuçlar vermektedir.
Cluster analysis is one of the multivariate statistical analysis methods that helps to separate units and variables into similar sub-clusters whose groups are not known precisely. It is frequently used in chemometric studies. The GC/MS data of the samples were used for clustering of the stinging nettle samples. GC/MS spectroscopy is a fast and fast spectroscopic method that is frequently used in basic and health sciences, for the determination of elements in multicomponent mixtures, for advanced molecular structure determination, and for qualitative and quantitative studies. The basis of this method is based on the determination of the elements depending on the masses of the substances in the mass spectrometer by ionizing the substances in the mixture after they are separated from each other in gas chromatography. It is also a method used to extract the maximum number of analytical information from the spectrum without preprocessing the data. First of all, the number of clusters was determined by applying the Elbow method to the spectrum data obtained from the samples. As a result of this process, it was seen that the data were divided into 3 clusters. After the data were reduced to 2 dimensions with principal component analysis (PCA), clusters of samples were determined by applying Hierarchical Clustering (HCA). 20% of the data whose clusters were determined were randomly selected to be used as test data. The rest of the data was used to train deep learning. Test data was checked after training and its accuracy was found to be 100%. The proposed method gives reliable results in clustering of GC/MS samples with its fast, cheap and no pre-processing advantages.