Gazete yazılarındaki Türkçe kelime kullanımı ve sıklığı üzerine bir çalışma

Gazetelerdeki Türkçe kullanımı ve kelime sıklıklarını görmek adına yeni bir çalışma daha bitti. Amaç Türkçe'de çok kullanılan kelimeleri ve sıklıklarını görmek, sonrasında da bu veriler üzerinden genel kanılara ilerlemek. Pilot çalışma olarak Radikal'den Orhan Çalışlar'ın 26.11.2011 –  20.09.2011 aralığında yazıları üzerinde araştırmalar bitti.

Bu yazıların anazilizi sonunda çıkan en sık kullanılan ilk 15 kelime sırasıyla:

  1. bir
  2. ve
  3. bu
  4. da
  5. de
  6. PKK
  7. daha
  8. olarak
  9. çok
  10. gibi
  11. için
  12. Kürt
  13. ne
  14. içinde
  15. Türkiye
İlk iki kelime “bir” ve “ve” pek şaşırtıcı değil. Genlede Türkçe metinlerde en çok çıkan kelimeler bunlar oluyor. Ancak listedeki diğer kelimelere bakınca hiç yazıları okumadan da yazarın konu aldığı alanları bulmak çok da zor görünmüyor. Genel bir Türkçe sıralamasında ilk 20'de yer alma ihtimali düşük olan  PKK, Kürt ve Türkiye kelimeleri, listenin ilk soralarında yer almış. Bir bakıma bu yazarın yazdığı temel konuları kaba hatlarıyla belli ediyor. Böyle bir yaklaşımla belki de yazıları hiç okumadan sadece kelime sıklıkları üzerinden, metinlerin konusunu etkili şekilde bulmak mümkün olabilir. Bu günümüzde bilginin her geçen gün arttığı ve doğru bilgiye hızlı şekilde ulaşmanın öneminin katlandığı bir dönemde oldukça faydalı olabilir. Zaten Google gibi arama motorlarının kullandığı arama listeleme kriterlerinden biri de “keyword density” yani anahtar kelime yoğunluğu.

Bir cevap yazın

E-posta hesabınız yayımlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir