Weka

Vikipedi, özgür ansiklopedi
Weka
Yeni Zelanda'da yaşayan bir kuş türü olan wekayı betimleyen belirtke
Geliştirici(ler)Waikato Üniversitesi
Güncel sürüm3.6.12 (son sürümü), 3.7.12 (geliştirme sürümü) / 15 Aralık 2014
Programlama diliJava (programlama dili)
İşletim sistemiçapraz platform
Türmakine öğrenimi
LisansGNU Genel Kamu Lisansı
Resmî sitesihttp://www.cs.waikato.ac.nz/~ml/weka/
Kod deposu Bunu Vikiveri'de düzenleyin

Weka, makine öğrenimi amacıyla Waikato Üniversitesinde geliştirilmiş ve "Waikato Environment for Knowledge Analysis" kelimelerinin baş harflerinden oluşmuş yazılımın ismidir. Günümüzde yaygın kullanımı olan çoğu makine öğrenimi algoritmalarını ve metotlarını içermektedir.

Java dilinde geliştirilmiş olması ve kütüphanelerinin .jar dosyaları halinde geliyor olması sayesinde, Java dilinde yazılan projelere kolayce entegre edilebilmesi kullanımını daha da yaygınlaştırmıştır.[1]

Yazılım, GNU Genel Kamu Lisansı ile dağıtılmaktadır.

Genel Bilgiler[değiştir | kaynağı değiştir]

Weka, tamamen modüler bir tasarıma sahip olup, içerdiği özelliklerle veri kümeleri üzerinde görselleştirme, veri analizi, iş zekası uygulamaları, veri madenciliği gibi işlemler yapabilmektedir.

Weka yazılımı, kendisine özgü olarak bir .arff uzantısı desteği ile gelmektedir. Ancak Weka yazılımının içerisinde CSV dosyalarını da ARFF formatına çevirmeye yarayan araçlar mevcuttur.

Temel olarak aşağıdaki 3 Veri Madenciliği işlemi Weka ile yapılabilir:

  • Sınıflandırma (Classification)
  • Bölütleme (Clustering)
  • İlişkilendirme (Association)

Ayrıca yukarıdaki işlemlere ilave olarak, veri kümeleri üzerinde ön ve son işlemler yapılabilir

  • Veri Ön işleme (Data Pre-Processing)
  • Görselleştirme (Visualization)

Son olarak Weka Kütüphanesi'nde veri kümelerini içeren dosyalar üzerinde çalışan çok sayıda hazır fonksiyon bulunmaktadır.

Kullanım Popülerliği[değiştir | kaynağı değiştir]

Weka, iş zekası alanında en çok kullanılan 10 yazılımdan birisi olup, yine iş zekası konusunda en çok kullanılan özgür yazılımlar sıralamasında ilk 3 sırada yer almaktadır.[2]

Weka, 200'e yakın IEEE makalesinde doğrudan geçmekte olup[3] 5,700 civarında ACM makalesinde de ismi doğrudan geçmektedir.[4]

Weka, 2011 Ağustos ayı itibarıyla sadece sourceforge.net sitesinden, 2.5 milyona yakın indirme sayısı ile en çok indirilen ilk 200 Sourceforge Projesi arasında girmiştir.

ARFF Dosya Yapısı[değiştir | kaynağı değiştir]

İngilizce, Attribute Relationship File Format kelimelerinin baş harflerinden oluşmuştur. ARFF dosya yapısı, Weka'ya özel olarak geliştirilmiştir ve dosya, metin yapısında tutulmaktadır. Dosyanın ilk satırında, dosyadaki ilişki tipi (relation) tutulmakta olup ikinci satırdan itibaren veri kümesindeki özellikler (attributes) yazılmaktadır. Özelliklerin hemen ardından veri kümesi yer alır ve veri kümesindeki her satır bir örneğe (instance) işaret etmektedir. Ayrıca veri kümesindeki her örneğin her özelliği arasında da virgül ayıracı kullanılmaktadır.

@relation havatahmini

@attribute nem numeric
@attribute sıcaklık numeric
@attribute basınç numeric
@attribute tahmin numeric

@data
53,25,1013,1
41,22,1011,-1
54,18,1012,-1
67,23,1000,1

Yukarıdaki örnek dosyada, hava tahmini için kullanılan nem, sıcaklık ve basınç değerleri bir dosya içerisinde 4 örnek içerecek şekilde gösterilmiştir. Bu değerler tip olarak sayısal değerler olduğundan "numeric" olarak ifade edilmiştir. Ancak bu değerler aşağıdaki tiplerde olabilir:

  • NOMINAL: [Küme Değerleri] Tahmin değeridir ve bir tanım kümesi alır. Örneğin tahmin {güneşli,yağmurlu,sisli} şeklinde tanımlanan bir kümede, bu özellik kümedeki tanımlı değerlerden birisini alabilir.
  • REAL: [Reel Sayılar] kümesinden bir değer verileceğinde kullanılır. Örneğin sıcaklık değeri 22.8 şeklinde ondalıklı değerleri de ifade edecek şekilde verilmek istenirse tip olarak numeric yerine reel kullanabiliriz.
  • STRING: Veri kümesinin bu özelliğinin serbest yazı şeklinde olabileceğini ifade eder. Özellikle metin madenciliği çalışmaları için sıkça kullanılan bir tiptir.
  • DATE: Veri kümesinin bu özelliğinin tarih olduğunu ifade eder. Örneğin veri kümesindeki kişilerin doğum tarihi veya örneklerin toplanma tarihi gibi özelliklerin tutulmasında kullanılabilir.

Tarihi[değiştir | kaynağı değiştir]

  • 1993 yılında, Waikato Üniversitesi tarafından ilk Weka paketi, TCL/TK, C ve Makefiles'dan oluşan bir şekilde dünyaya duyuruldu.
  • 1997 yılında, JAVA'nın da gelişmesi ile, bütün Weka paketinin yeni baştan Java dilinde yazılması kabul edildi ve proje Java'ya taşındı.[5]
  • 2005 yılında, Weka, dünyanın en prestijli veri madenciliği ödüllerinden olan SIGKDD "Data Mining and Knowledge Discovery Service Award", ödülüne layık görüldü.[6][7]
  • 2006 yılında, Pentaho Corporation firması tarafından iş zekası uygulamalarında kullanılmak üzere Weka'nın lisansı satın alındı. Bu tarihten sonra Weka "Pentaho business intelligence suite" isimli paketin içinde de yer almaya başladı.
  • 2011 yılı itibarıyla 2.487.213 indirme ile en popüler 200 Sourceforge projesinden birisi olmuştur. Tüm Zaman İndirmeleri 9 Eylül 2010 tarihinde Wayback Machine sitesinde arşivlendi.

Kaynakça[değiştir | kaynağı değiştir]

  1. ^ Şadi Evren Şeker (2013). İş Zekası ve Veri Madenciliği (Weka ile) ISBN 9786051276717. Cinius. 
  2. ^ "Analytics Training Sitesi, 2011 yılı En popüler 10 iş zekası yazılımı". 3 Temmuz 2013 tarihinde kaynağından arşivlendi. Erişim tarihi: 6 Temmuz 2013. 
  3. ^ "IEEE Xplore Weka arama sonuçları". 9 Ağustos 2020 tarihinde kaynağından arşivlendi. Erişim tarihi: 6 Temmuz 2013. 
  4. ^ "ACM Dijital Kütüphanesi arama sonuçları". 9 Ağustos 2020 tarihinde kaynağından arşivlendi. Erişim tarihi: 6 Temmuz 2013. 
  5. ^ Ian H. Witten (1999). "Weka: Practical Machine Learning Tools and Techniques with Java Implementations" (PDF). Proceedings of the ICONIP/ANZIIS/ANNES'99 Workshop on Emerging Knowledge Engineering and Connectionist-Based Information Systems. ss. 192-196. 28 Eylül 2007 tarihinde kaynağından arşivlendi (PDF). Erişim tarihi: 26 Haziran 2007. 
  6. ^ Gregory Piatetsky-Shapiro (28 Haziran 2005). "KDnuggets news on SIGKDD Service Award 2005". 14 Temmuz 2007 tarihinde kaynağından arşivlendi. Erişim tarihi: 25 Haziran 2007. 
  7. ^ "Overview of SIGKDD Service Award winners". 2005. 1 Temmuz 2007 tarihinde kaynağından arşivlendi. Erişim tarihi: 25 Haziran 2007. 

Dış bağlantılar[değiştir | kaynağı değiştir]