Histogram

Vikipedi, özgür ansiklopedi

Histogram, gruplandırılmış bir veri dağılımının sütun grafiğiyle gösterimidir. Diğer bir ifadeyle, tekrarlı sayılardan oluşan verilerin, uygulanan işlemlerden sonra önce tabloya, tablodan yararlanarak grafiğe aktarılması, yani veri gruplarının grafiğinin dikdörtgen sütunlar halinde gösterilmesidir.[1]

Açıklama[değiştir | kaynağı değiştir]

İlk olarak Karl Pearson tarafından geliştirilmiştir. Sütunlar belirlenen aralıkların sınıfını belirler. Sütunların yükseklikleri her aralığa kaç değer düştüğünü belirtir. Bölmeler eşit boyutta ve bitişik olmalıdır. Sütunların çok ve dar olması histogramın güvenilirliğini artırır. Eğer sütunların sayısı az ve geniş ise elde edilecek bilgiler ile yanlış varsayımlar yapılması daha olağandır [2].

Görüntü üzerinde oluşturulan histogramlar ise her piksel seviyesinin görüntüdeki miktarını yani frekansını gösterir[3]. Görüntü koyu tonlarda ise veya açık tonlarda ise bu görüntülerin bilgisi histogram okunarak elde edilebilir.

Histogram Eşitleme[değiştir | kaynağı değiştir]

Görüntüler için çıkarılan histogramlarda görüntüyü iyileştirmek için histogram eşitleme kullanılır. Histogramda bulunan frekans ile yapılan doğrusal olmayan bir eşitleme işlemidir. Görüntü yüksek değerli bir frekansa sahipse piksel seviyesi geniş bir piksel alanına yayılır. Görüntü düşük bir frekansa sahipse dar bir piksel alanına yayılarak histogram oluşturulur. Görüntünün histogramı bulunarak; kümülatif histogram bulunur. Değerler normalize edilip eski değerler ile birlikte elde edilen değerler birbirine karşılık düşürülür. Yeni histogram grafiği elde edilir.

Matematiksel Tanım[değiştir | kaynağı değiştir]

Matematiksel anlamda, histogram, ayrık kategorilerin her birine düşen verilerin sayısını veren bir fonksiyondur. Histogram grafiği, histogramı temsil etmenin sadece bir yoludur. Bu fonksiyonun tanımı aşağıdaki gibidir:

Kümülatif Histogram[değiştir | kaynağı değiştir]

Kümülatif histogram, belirtilen aralığa kadar tüm aralıklardaki kümülatif gözlem sayısını veren bir eşitliktir. Matematiksel olarak aşağıdaki gibi tanımlanır:

Sturges Formülü[değiştir | kaynağı değiştir]

Sturges formülü, iki terimli bir dağılımdan türetilmiştir ve yaklaşık olarak normal bir dağılım sağlar[4]. Bölme boyutlarını veri aralığına dağıtır.

Bu formülde, n <30 ise kötü performans gösterebilir. Bu sebeple bölmelerin sayısı azdır. Ayrıca verilerdeki eğilimleri iyi gösterme olasılığı düşüktür. Veriler normal olarak dağıtılmadıysa da kötü performans gösterebilir.

Pirinç Kuralı[değiştir | kaynağı değiştir]

Pirinç kuralı, Sturges kuralına alternatif olarak türetilmiştir[5].

Karekök Seçimi[değiştir | kaynağı değiştir]

Bu kural, örnekteki veri noktalarının sayısının karekökünü alır. Excel histogramları ve diğer birçok uygulama  tarafından kullanılır[6].

Ayrıca sonucu bir sonraki tam sayıya yuvarlar.

Kaynakça[değiştir | kaynağı değiştir]

  1. ^ "Histogram (Histogram Nedir?, Histogram Hazırlama ve Yorumlama)". 5 Mart 2016 tarihinde kaynağından arşivlendi. Erişim tarihi: 2 Kasım 2015. 
  2. ^ "Histogram" (PDF). Ondokuz Mayıs Üniversitesi. 22 Mayıs 2021 tarihinde kaynağından (PDF) arşivlendi. 
  3. ^ "Görüntü İşleme Teknikleri-1" (PDF). Oğuzhan Öztaş. 21 Şubat 2016 tarihinde kaynağından (PDF) arşivlendi. 
  4. ^ Sturges, Herbert A. (1 Mart 1926). "The Choice of a Class Interval". Journal of the American Statistical Association. 21 (153): 65-66. doi:10.1080/01621459.1926.10502161. ISSN 0162-1459. 
  5. ^ "Free Statistics Book". onlinestatbook.com. 6 Temmuz 2006 tarihinde kaynağından arşivlendi. Erişim tarihi: 23 Mayıs 2021. 
  6. ^ "EXCEL Univariate: Histogram". cameron.econ.ucdavis.edu. 28 Şubat 2009 tarihinde kaynağından arşivlendi. Erişim tarihi: 23 Mayıs 2021.