Türkiye Araştırmaları Literatür Dergisi, vol.20, no.39, pp.157-190, 2022 (Peer-Reviewed Journal)
Texts may contain useful information on many topics. Analyzing texts can help
people make better decisions, do more effective work, and access more
information. Data obtained from rich sources such as social media constitute big
data belonging to these texts. Various methods are employed to understand and
interpret these data. Among them, text mining and data analytics are the most
widely used techniques. In addition, there may be need for more data than
available through structured data to excavate the information contained in a given
text data. This article examines graduate theses prepared in Turkey employing big
data approach obtained from social media. These studies have been prepared by
various departments and hence big data has been examined from various aspects.
In this regard, this paper provides brief summaries of some these theses. The
findings reveal that the majority of related theses were written in the field of
computer engineering. However, their characteristics differ from each other.
While some target the software aspects, others analyze social media information.
The next most popular field is the various departments in the field of
communications. It has been observed that the number of theses written on big
data has increased over the years. This study has applied word analysis on theses
written between 2008 and 2022 through the text mining method. The results
confirm the congruity of the word distribution in theses to the power law
distribution. The overall findings point to the problem of excessive focus in theses.
Metinler, birçok konuda yararlı bilgiler içerebilir. Metinleri analiz etmek, insanların daha iyi kararlar vermesine, daha etkili işler yapmasına ve daha fazla bilgiye ulaşmasına yardımcı olabilir. Sosyal medya gibi zengin kaynaklardan elde edilen veriler, bu metinlere ait büyük verilerdir. Bu verileri anlamak ve yorumlamak için çeşitli yöntemler kullanılmaktadır. Metin madenciliği ve veri analitiği gibi teknikler, en çok kullanılan yöntemlerdir. Ayrıca, bu metin verilerinin içerdiği bilgiyi ortaya çıkarabilmek için yapılandırılmış verilerden daha fazla veriye ihtiyaç duyulabilir. Bu çalışmada, Türkiye’de hazırlanmış sosyal medyadan sağlanan büyük veri yaklaşımı ile ilgili lisansüstü tezler incelenmiştir. Bu tezler, çeşitli anabilim dalları tarafından hazırlanmıştır ve bu nedenle büyük metinler ile ilgili pek çok boyut incelenmiştir. Bu bağlamda bu tezlerden bazılarına dair kısa özetler sunulmuştur. En fazla bilgisayar mühendisliği alanında konu ile ilgili tez yazıldığı gözlenmiştir. Ancak bu tezlerin nitelikleri birbirinden ayrışmaktadır. Bir kısmında hedef yazılım boyutuna yönelik olurken, bir kısmında ise sosyal medya informasyonu hakkında analiz yapılmasına yöneliktir. Bilgisayar mühendisliğinden sonra en fazla iletişim alanındaki çeşitli anabilim dallarında çok fazla tez yazılmıştır. Yıllara göre büyük veri konusunda yazılan tez sayısının giderek attığı gözlemlenmiştir. Çalışmada metin madenciliği yöntemi kullanılarak 2008-2022 yılları arasında yazılmış tezlere kelime analizi yapılmıştır. Analiz sonucunda tezlerin kelime dağılımlarının kuvvet yasası dağılımına uygun olduğu bulunmuştur.