Çeyrekler açıklığı

Vikipedi, özgür ansiklopedi
Atla: kullan, ara

Betimsel istatistikde çeyrekler açıklığı sıralanmış bir veri dizisinin orta yarısını (%50sini) kapsayan ve üçüncü dörttebirlik ve birinci dörttebirlik aralığını veya farkını (yani Q3 - Q1) gösteren bir istatistiksel yayılma ölçüsüdür. Birinci dörttebirlik sıralanmış veri dizisinin ilk %25inden büyük ve üçüncü dörttebirlik sıralanmış veri dizisinin %25inden daha küçük olduğu için, bu iki dörttebirlik arasında kalan veri yüzdesi %50dir. Çeyrekler açıklığı ölçüm birimi veri ölçüm birimi ile aynıdır.

Çeyrekler açıklığı sıralanmış veriler içinde aşırı küçük veya aşırı büyük uçsal değerlerden (yani dışlak değerlerden) etkilenmez. Özel bir istatistiksel terimle Çeyrekler açıklığı güçlü (en:robust) bir yayılma ölçüsüdür. Bu nedenle "istatistiksel yayılma" ölçüsü olarak açıklık'a tercih edilir. Eğer alışılagelen yayılma ölçüsü olarak genellikle kullanılan varyans veya standart sapma için mevcut olduğu bilinen dezavantajlar pratik bir problem için sorun yaratıyorsa (örnegin veri dizisi içinde çok aşırı bir veya birkaç dışlak değer varsa) çeyrekler açıklığı varyans veya standart sapma ya da tercih edilir.

Örnekler[değiştir | kaynağı değiştir]

Kutu grafiği (bir çeyrekler açıklığı ile) ve bir Normal N(0,1σ2) anakitle icin olasılık yoğunluk fonksiyonu

Tablo şeklinde veri ile[değiştir | kaynağı değiştir]

i x[i] Dörttebirlik
1 102
2 104
3 105 Q1
4 107
5 108
6 109 Q2 (medyan)
7 110
8 112
9 115 Q3
10 116
11 118

Bu tabloda verilmis veriler icin "çeyrekler açıklığı"

= = 115 − 105 = 10.


Veriler bir basit kutu grafiği ile verilirse[değiştir | kaynağı değiştir]

                    |                   |
                    |       +-----+-+   | 
  o           *     |-------|     | |---|
                    |       +-----+-+   |
                    |                   | 
+---+---+---+---+---+---+---+---+---+---+---+---+   Sayılar ekseni
0   1   2   3   4   5   6   7   8   9   10  11  12  

Bu veri seti icin

  • birinci (alt) dörttebirlik (Q_1, x_{.25}) = 7
  • medyan (ikinci dörttebirlik) (Medyan, x_{.5}) = 8.5
  • üçüncü (üst) dörttebirlik (Q_3, x_{.75}) = 9
  • çeyrekler açıklığı,  = Q_3-Q_1 = 2

Olasılık dağılımları için çeyrekler açıklığı[değiştir | kaynağı değiştir]

Bir sürekli olasılık dağılımı için çeyrekler açıklığı, önce cebirsel olarak, olasılık yoğunluk fonksiyonunun integralini alarak hesaplanir ve bu yığmalı dağılım fonksiyonunu verir. Yığmalı dağılım fonksiyonunun negatif sonsuz (-∞) değerden 0,25 değere kadar bulunan integral değeri birinci dörttebirliği verir. Yine negatif sonsuzdan (-∞) 0,75 değere kadar alınan integral ise dörttebirliği verir. Bunlar formüller halinde şöyle ifade edilir:
Q1 = \text{CDF}^{-1}(0.25)

Q3 = \text{CDF}^{-1}(0.75)
Burada Q1: birinci dörttebirlik, Q3: üçüncü dörttebirlik ve CDF:yığmalı dağılım fonksiyonu olur.

Ancak birçok sürekli olasılık dağılımı için olasılık yoğunluk fonksiyonunun integralını almanın çok zor olduğu bilinmektedir. Herhangi başka bir yöntemle yığmalı dağılım fonksiyonu da bulunabilirse de uygun olur. Bir başka yöntem olarak yığmalı dağılım gösterimi kullanılabilir. Eğer gösterim çok iyi ve uygun ölçekli yapılmış ise, gösterimsel olarak da yığmalı olasılık dağılımı eğrisi üzerinde dörttebirlikler hemen bulunabilir.

Bazı olasılık dağılımları için medyan ve çeyrekler açıklığı değerleri şunlardır:

Dağılım Medyan Çeyrekler açıklığı
Normal dağılım μ 2 Φ−1(0.75) ≈ 1.349\sigma\,
Laplace dağılımı μ 2b ln(2)
Cauchy dağılımı μ 2\gamma\,

Ayrıca bakınız[değiştir | kaynağı değiştir]


[[Kategori:Betimsel istatistik]