The Analysis of Graduate Studies on Big Data on Social Media through Text Mining


Çelik S., Zeren F.

Türkiye Araştırmaları Literatür Dergisi, vol.20, no.39, pp.157-190, 2022 (Peer-Reviewed Journal)

Abstract

Texts may contain useful information on many topics. Analyzing texts can help people make better decisions, do more effective work, and access more information. Data obtained from rich sources such as social media constitute big data belonging to these texts. Various methods are employed to understand and interpret these data. Among them, text mining and data analytics are the most widely used techniques. In addition, there may be need for more data than available through structured data to excavate the information contained in a given text data. This article examines graduate theses prepared in Turkey employing big data approach obtained from social media. These studies have been prepared by various departments and hence big data has been examined from various aspects. In this regard, this paper provides brief summaries of some these theses. The findings reveal that the majority of related theses were written in the field of computer engineering. However, their characteristics differ from each other. While some target the software aspects, others analyze social media information. The next most popular field is the various departments in the field of communications. It has been observed that the number of theses written on big data has increased over the years. This study has applied word analysis on theses written between 2008 and 2022 through the text mining method. The results confirm the congruity of the word distribution in theses to the power law distribution. The overall findings point to the problem of excessive focus in theses.

Metinler, birçok konuda yararlı bilgiler içerebilir. Metinleri analiz etmek, insanların daha iyi kararlar vermesine, daha etkili işler yapmasına ve daha fazla bilgiye ulaşmasına yardımcı olabilir. Sosyal medya gibi zengin kaynaklardan elde edilen veriler, bu metinlere ait büyük verilerdir. Bu verileri anlamak ve yorumlamak için çeşitli yöntemler kullanılmaktadır. Metin madenciliği ve veri analitiği gibi teknikler, en çok kullanılan yöntemlerdir. Ayrıca, bu metin verilerinin içerdiği bilgiyi ortaya çıkarabilmek için yapılandırılmış verilerden daha fazla veriye ihtiyaç duyulabilir. Bu çalışmada, Türkiye’de hazırlanmış sosyal medyadan sağlanan büyük veri yaklaşımı ile ilgili lisansüstü tezler incelenmiştir. Bu tezler, çeşitli anabilim dalları tarafından hazırlanmıştır ve bu nedenle büyük metinler ile ilgili pek çok boyut incelenmiştir. Bu bağlamda bu tezlerden bazılarına dair kısa özetler sunulmuştur. En fazla bilgisayar mühendisliği alanında konu ile ilgili tez yazıldığı gözlenmiştir. Ancak bu tezlerin nitelikleri birbirinden ayrışmaktadır. Bir kısmında hedef yazılım boyutuna yönelik olurken, bir kısmında ise sosyal medya informasyonu hakkında analiz yapılmasına yöneliktir. Bilgisayar mühendisliğinden sonra en fazla iletişim alanındaki çeşitli anabilim dallarında çok fazla tez yazılmıştır. Yıllara göre büyük veri konusunda yazılan tez sayısının giderek attığı gözlemlenmiştir. Çalışmada metin madenciliği yöntemi kullanılarak 2008-2022 yılları arasında yazılmış tezlere kelime analizi yapılmıştır. Analiz sonucunda tezlerin kelime dağılımlarının kuvvet yasası dağılımına uygun olduğu bulunmuştur.