Veri madenciliği

Veri madenciliği, büyük ölçekli veriler arasından faydalı bilgiye ulaşma, bilgiyi madenleme işidir. Büyük veri yığınları içerisinden gelecekle ilgili tahminde bulunabilmemizi sağlayabilecek bağıntıların bilgisayar programı kullanarak aranması olarak da tanımlanabilir.^[1]^[2]

Kavram

Veri madenciliği deyimi yanlış kullanılan bir kavram olabileceğinden buna eş değer başka kullanımlar da literatüre geçmiştir. Veritabanlarında bilgi madenciliği (İng. knowledge mining in databases), bilgi çıkarımı (İng. knowledge extraction), veri ve örüntü analizi (İng. data/pattern analysis), veri arkeolojisi gibi.^[3] Bu terimler arasında "Veritabanlarında Bilgi Keşfi" (İng. VBK - knowledge discovery in databases - KDD) en yaygınıdır.^[4] Alternatif olarak veri madenciliği aslında bilgi keşfi sürecinin bir parçası şeklinde kabul görmektedir. Bu adımlar:

Veri temizleme (gürültülü ve tutarsız verileri çıkarmak)
Veri bütünleştirme (birçok veri kaynağını birleştirebilmek)
Veri seçme (yapılacak olan analizle ilgili olan verileri belirlemek)
Veri dönüşümü (verinin veri madenciliği tekniğinden kullanılabilecek hale dönüşümünü gerçekleştirmek)
Veri madenciliği (veri örüntülerini yakalayabilmek için akıllı metotları uygulamak)
Örüntü değerlendirme (bâzı ölçümlere göre elde edilmiş bilgiyi temsil eden ilginç örüntüleri tanımlamak)
Bilgi sunumu (mâdenciliği yapılmış olan elde edilmiş bilginin kullanıcıya sunumunu gerçekleştirmek).^[5]

Yöntem

Veri madenciliği adımı, kullanıcı ve bilgi tabanıyla etkileşim halindedir. İlginç örüntüler kullanıcıya gösterilir ve bunun ötesinde istenirse bilgi tabanına da kaydedilebilir. Buna göre, veri madenciliği işlemi, gizli kalmış örüntüler bulunana kadar devam eder.

Bir veri madenciliği sistemi, aşağıdaki temel bileşenlere sahiptir:^[6]

Veritabanı, veri ambarı ve diğer depolama teknikleri
Veritabanı ya da Veri Ambarı Sunucusu
Bilgi Tabanı
Veri Madenciliği Motoru
Örüntü Değerlendirme
Kullanıcı Arayüzü

Veri madenciliği, eldeki verilerden üstü kapalı, çok net olmayan, önceden bilinmeyen ancak potansiyel olarak kullanışlı bilginin çıkarılmasıdır. Bu da; kümeleme, veri özetleme, değişikliklerin analizi, sapmaların tespiti gibi belirli sayıda teknik yaklaşımları içerir.

Başka bir deyişle, veri madenciliği, verilerin içerisindeki desenlerin, ilişkilerin, değişimlerin, düzensizliklerin, kuralların ve istatistiksel olarak önemli olan yapıların yarı otomatik olarak keşfedilmesidir.

Temel olarak veri madenciliği, veri setleri arasındaki desenlerin ya da düzenin, verinin analizi ve yazılım tekniklerinin kullanılmasıyla ilgilidir. Veriler arasındaki ilişkiyi, kuralları ve özellikleri belirlemekten bilgisayar sorumludur. Amaç, daha önceden fark edilmemiş veri desenlerini tespit edebilmektir.

Veri madenciliğini istatistiksel bir yöntemler serisi olarak görmek mümkün olabilir. Ancak veri madenciliği, geleneksel istatistikten birkaç yönde farklılık gösterir. Veri madenciliğinde amaç, kolaylıkla mantıksal kurallara ya da görsel sunumlara çevrilebilecek nitel modellerin çıkarılmasıdır. Bu bağlamda, veri madenciliği insan merkezlidir ve bazen insan – bilgisayar arayüzü birleştirilir.

Veri madenciliği sahası, istatistik, makine bilgisi, veritabanları ve yüksek performanslı işlem gibi temelleri de içerir.

Veri sınıflandırma

Veri madenciliğinde üzerinde çalışılan veri farklı terimlerle sınıflandırılır. Geniş veri tek bir iş istasyonunun belleğine sığamayacak kadar büyük veri kümelerini ifade etmektedir. Yüksek hacimli veri ise, tek bir iş istasyonundaki ya da bir grup iş istasyonundaki disklere sığamayacak kadar fazla veri anlamındadır. Dağıtık veri ise, farklı coğrafi konumlarda bulunan verileri anlatır.^[7]

Ayrıca bakınız

Kaynakça

^ "5 Temel Soruda Veri Madenciliği (Data Mining) Nedir? - Vizyoner Genç". vizyonergenc.com. 6 Kasım 2020 tarihinde kaynağından arşivlendi. Erişim tarihi: 11 Mart 2021.
^ User, Alm (25 Eylül 2020). "Veri Madenciliği Nedir? Nasıl Yapılır? Süreç ve Yöntemleri | GTech Blog". G Teknoloji. 31 Ekim 2020 tarihinde kaynağından arşivlendi. Erişim tarihi: 11 Mart 2021.
^ "Data Mining Tutorial: What is | Process | Techniques & Examples". www.guru99.com. 3 Haziran 2019 tarihinde kaynağından arşivlendi. Erişim tarihi: 11 Mart 2021.
^ Pinustech. "Veri Madenciliği Nedir?". www.smartmind.com.tr. 4 Nisan 2021 tarihinde kaynağından arşivlendi. Erişim tarihi: 11 Mart 2021.
^ "Data mining | computer science". Encyclopedia Britannica (İngilizce). 3 Temmuz 2015 tarihinde kaynağından arşivlendi. Erişim tarihi: 11 Mart 2021.
^ "What is data mining?". www.sas.com (İngilizce). 12 Ocak 2014 tarihinde kaynağından arşivlendi. Erişim tarihi: 11 Mart 2021.
^ "Veri Madenciliği (Data Mining) Nedir? | Kozmos Lisesi". 25 Ağustos 2020. 28 Eylül 2020 tarihinde kaynağından arşivlendi. Erişim tarihi: 11 Mart 2021.

[1] "5 Temel Soruda Veri Madenciliği (Data Mining) Nedir? - Vizyoner Genç". vizyonergenc.com. 6 Kasım 2020 tarihinde kaynağından arşivlendi. Erişim tarihi: 11 Mart 2021.

[2] User, Alm (25 Eylül 2020). "Veri Madenciliği Nedir? Nasıl Yapılır? Süreç ve Yöntemleri | GTech Blog". G Teknoloji. 31 Ekim 2020 tarihinde kaynağından arşivlendi. Erişim tarihi: 11 Mart 2021.

[3] "Data Mining Tutorial: What is | Process | Techniques & Examples". www.guru99.com. 3 Haziran 2019 tarihinde kaynağından arşivlendi. Erişim tarihi: 11 Mart 2021.

[4] Pinustech. "Veri Madenciliği Nedir?". www.smartmind.com.tr. 4 Nisan 2021 tarihinde kaynağından arşivlendi. Erişim tarihi: 11 Mart 2021.

[5] "Data mining | computer science". Encyclopedia Britannica (İngilizce). 3 Temmuz 2015 tarihinde kaynağından arşivlendi. Erişim tarihi: 11 Mart 2021.

[6] "What is data mining?". www.sas.com (İngilizce). 12 Ocak 2014 tarihinde kaynağından arşivlendi. Erişim tarihi: 11 Mart 2021.

[7] "Veri Madenciliği (Data Mining) Nedir? | Kozmos Lisesi". 25 Ağustos 2020. 28 Eylül 2020 tarihinde kaynağından arşivlendi. Erişim tarihi: 11 Mart 2021.

[1]

[2]

[3]

[4]

[5]

[6]

[7]

g t d Bilgisayar biliminin alt dalları
Matematiksel temeller	Matematiksel mantık · Kümeler kuramı · Sayı teorisi · Çizge teorisi · Tip teorisi · Kategori teorisi · Sayısal çözümleme · Bilgi teorisi · Kombinatorik · Boole cebiri
Hesaplama teorisi	Otomat teorisi · Hesaplanabilirlik teorisi · Hesaplamalı karmaşıklık teorisi · Kuantum hesaplama teorisi
Algoritmalar ve veri yapıları	Algoritma çözümlemesi · Algoritma tasarımı · Hesaplamalı geometri
Programlama dilleri ve derleyiciler	Ayrıştırıcılar · Yorumlayıcılar · Yordamsal programlama · Nesne yönelimli programlama · Fonksiyonel programlama · Mantık programlama · Programlama paradigmaları
Eşzamanlı, paralel ve dağıtık sistemler	Çoklu işleme · Dağıtımlı hesaplama · Eşzamanlılık denetimi
Yazılım mühendisliği	Gereksinim çözümleme · Yazılım tasarımı · Bilgisayar programlama · Biçimsel yöntemler · Yazılım testi · Yazılım geliştirme süreci
Sistem mimarisi	Bilgisayar mimarisi · Bilgisayar organizasyonu · İşletim sistemi
Telekomünikasyon ve ağ oluşturma	Bilgisayar müziği · Yönlendirme · Örgü topolojisi · Kriptografi
Veritabanları	Veritabanı yönetim sistemleri · İlişkisel veritabanı · SQL · İşlem yürütme · Veritabanı indeksleme · Veri madenciliği · Metadata (Üst veri) · Ana veri (Master data)
Yapay zekâ	Otomatikleştirilmiş muhakeme · Bilgisayarlı dilbilim · Bilgisayarlı görü · Evrimsel hesaplama · Uzman sistemler · Makine öğrenimi · Doğal dil işleme · Robotik
Bilgisayar grafikleri	Görselleştirme · Bilgisayar animasyonu · Görüntü işleme
İnsan-bilgisayar etkileşimi	Bilgisayar erişilebilirliği · Kullanıcı arayüzleri · Giyilebilir hesaplama · Yaygın bilişim · Sanal gerçeklik
Bilimsel hesaplama	Yapay yaşam · Biyoenformatik · Bilişsel bilim · Bilgisayarlı kimya · Hesaplamalı nörobilim · Hesaplamalı fizik · Sayısal algoritmalar · Sembolik matematik
Bilgisayar bilimi, ACM Hesaplama ve Sınıflandırma Sistemi'ne göre farklı konu ve alanlara ayrılabilir.