Çapraz doğrulama (istatistik)

Vikipedi, özgür ansiklopedi
Çarpraz-doğrulama diyagramı.

Çarpraz doğrulama, yapılan bir istatistiksel analizin bağımsız bir veri setinde nasıl bir sonuç elde edeceğini sınayan bir model doğrulama tekniğidir.[1] Başlıca kullanım alanı bir öngörü sisteminin pratikte hangi doğrulukla çalışacağını kestirmektir. Bir öngörü probleminde, model genellikle bir "bilinen veri" kümesiyle eğitilir ("eğitim kümesi") ve bir "bilinmeyen veri" kümesiyle ("doğrulama kümesi" ya da "test kümesi") sınanır.[2] Bu sınamanın amacı, eğitilen modelin yeni verilere genelleşme kabiliyetini ölçmek ve aşırı uyma ya da seçim yanlılığı problemlerini tespit etmektir.[3]

Çapraz doğrulamanın ilk adımı farklı miktarlarda örnekler seçilerek veri kümeleri oluşturulmasıdır. Tipik olarak verilen eğitim kümesi ve test kümesi olarak birbirini tamamlayan iki kümeye ayrılır. Birinci küme üzerinde analiz yapılarak model oluşturulur ve ikinci küme üzerinde model sınanır. Varyansı azaltmak için bu doğrulama adımı birkaç defa tekrarlanır. Çapraz doğulama ismini aynı veri örneklerinin farklı şekillerde gruplanmasından (çaprazlama) alır. Çaprazlanan gruplar üzerinde yapılan sınama sonuçları birleştirilerek (örn. ortalama) modelin genel tahmin başarısı ölçülür.

Kaynakça[değiştir | kaynağı değiştir]

  1. ^ Kohavi, Ron (1995). "A study of cross-validation and bootstrap for accuracy estimation and model selection". Proceedings of the Fourteenth International Joint Conference on Artificial Intelligence. 2 (12). San Mateo, CA: Morgan Kaufmann. ss. 1137-1143. 
  2. ^ Galkin, Alexander (28 Kasım 2011). "What is the difference between test set and validation set?". Erişim tarihi: 10 Ekim 2018. [ölü/kırık bağlantı]
  3. ^ Cawley, Gavin C.; Talbot, Nicola L. C. (2010). "On Over-fitting in Model Selection and Subsequent Selection Bias in Performance Evaluation" (PDF). Cilt 11. Journal of Machine Learning Research. ss. 2079-2107. 25 Eylül 2019 tarihinde kaynağından (PDF) arşivlendi. Erişim tarihi: 18 Eylül 2019.