Etkisiz kelimeler

Vikipedi, özgür ansiklopedi

Bilgisayar dilinde, etkisiz kelimeler, doğal data dilinin (text) işlenmeden önce veya sonra filtrelenmiş kelimeleridir.[1] Genelde etkisiz kelimeler bir dildeki sık kullanılan kelimeleri kapsar, etkisiz kelimeler için işleme araçları tarafından kullanılan tek evrensel bir liste bulunmamaktadır, hatta tüm araçların böyle bir liste kullandığı bile söylenemez. Bazı kullanılan araçlar cümle aramalarını daha iyi destekleyebilmek için etkisiz kelimelerin çıkarılmasından kaçınmaktadır.

Herhangi bir kelime grubu, belirli bir amaç için etkisiz kelime olarak seçilebilir. Bazı arama motorlarında için İngilizce'de en yaygın, kısa işlevsel kelimeler söyledir ; “such as”, “the”, “is”, “at”, “which” ve “on”. Bu durumlarda belirtilen etkisiz kelimelerin olduğu cümleler ve isimler arandığında bazı sorunlar yaşanmaktadır, adların bazıları ; "The Who", "The The", veya "Take That". Diğer arama motorları performanslarını arttırmak için bazı genel kelimeleri de – sözlüksel kelimeler de buna dahildir, “want” (istemek) kelimesi gibi- çıkarmaktadırlar.

Bilgi erişim öncülerinden biri olan Hans Peter Luhn, bu ifadeyi icat etmek ve kavramı kullanmakla tanınır.[2] Luhn'un 1959'da yaptığı konuyla ilgili sunumunda olmamasına karşın terimin İngilizcesistop word ve ilgili diğer terimler olan stop list ya da stoplist kısa süre içinde literatürde kullanılmaya başlanmıştır.[3]

Arama motoru optimizasyonu terminolojisinde, etkisiz kelimeler çoğu arama motorunun, robotların ya da dizinleyicilerin geniş ölçekli veri işlemesi sırasında hem zaman hem de yer tasarrufu açısından kaçındığı sıkça kullanılan kelimelerdir. Bu arama motorlarına veritabanlarında yer tasarrufu konusunda yardımcı olur.[4]

Ayrıca bakınız[değiştir | kaynağı değiştir]

Kaynakça[değiştir | kaynağı değiştir]

  1. ^ Rajaraman, A.; Ullman, J. D. (2011). "Data Mining" (PDF). Mining of Massive Datasets. ss. 1-17. doi:10.1017/CBO9781139058452.002. ISBN 9781139058452. 
  2. ^ Luhn, H. P. (1959). "Keyword-in-Context Index for Technical Literature (KWIC Index)". American Documentation. 11 (4). Yorktown Heights, NY: International Business Machines Corp. ss. 288-295. doi:10.1002/asi.5090110403. 
  3. ^ Flood, Barbara J. (1999). "Historical note: The Start of a Stop List at Biological Abstracts". Journal of the American Society for Information Science. 50 (12). s. 1066. doi:10.1002/(SICI)1097-4571(1999)50:12<1066::AID-ASI5>3.0.CO;2-A. 
  4. ^ "Stop Words and Impact on SEO - Search Engine Nation". Search Engine Nation (İngilizce). 24 Nisan 2018. Erişim tarihi: 24 Mayıs 2018. 

Dış bağlantılar[değiştir | kaynağı değiştir]