Yates süreklilik düzeltmesi

Vikipedi, özgür ansiklopedi

İstatistik bilim dalında Yates süreklilik düzeltmesi veya Yates'in ki-kare sınaması isimsel ölçekli' veya sırasal ölçekli iki değişken için gözlemlenmiş örneklem verileri bir bağımlılık tablosu (kontenjans tablosu) halinde betimlenmiş iken, ilişkili iki değişken arasında bağımsızlık sınaması yapmak için bazı özel hallerde kullanılır.

Genel olarak, iki değişken için gözümlenmiş örneklem veriler bağımlılık tablosu (kontenjans tablosu) sunulup ilişkili iki değişken arasındaki bağımsızlık sınaması Pearson'un ki-kare bağımsızlık sınaması ile yapılır. Ancak ki-kare dağılımı surekli bir dagilim olarak yaklasik olarak eldeki aralıklı karekterli gözümlenmiş çokluklara Pearson'un ki-kare bağımsızlık sınaması için uygulanmaktadir. Bu bağımlılık tablosu büyük olursa (2 den cok sayıda satırlı ve 2 den çok sayıda sütunlu) yani her iki değişken de 2 kategoriden fazla kategoriyi kapsarsa, bu yaklaşımın sonuçlara tesir etmediği kabul edilmektedir. Ancak veriler her iki değişken için 2 kategorili olup (2× 2) büyüklükte bağımlılık tablosunda özetlenmişse sürekli ki-kare dağılımının aralıklı verilere uygulanmasının sonuca etki yaptığı bilinmektedir. Bu halde İngiliz istatistikçisi Frances Yates Pearson'un ki-kare bağımsızlık sınaması için formülü değiştirip (her bir hücre için 0.5 çıkartılmasını gerektiren) bir süreklilik düzeltmesi kullanılmasını önermiştir.[1]

Yöntem[değiştir | kaynağı değiştir]

Yates süreklilik düzeltmesi ile ki-kare sınaması için (2 × 2) büyüklükte bağımlılık tablosu için her hücre için önce beklenen çokluk (Ei,j). Sonra her hücre için
 :gözümlenmiş çokluk eksi beklenen çokluk eksi 0.5
olarak bulunur. Bu 0.5 çıkartılması Yates'in süreklilik düzeltmesidir. Böylece Yates süreklilik düzeltmeli ki-kare bağımsızlık sınaması için sınama istatistiği şu formülle bulunur:

Burada

Oi,j : i,j hücresindeki gözümlenmiş çokluk;
Ei,j : sıfır hipoteze gore i,j hücresindeki beklenen çokluk

olur.

Biraz daha ayrıntılı olarak veriler şu 2 × 2 büyüklükte bağımlılık tablosu içinde özetlenmiş olsun:

  Kategori B1 Kategori B2  
Kategori A1 a b
Kategori A2 c d
  N

Bu halde Yates süreklilik düzeltilmesi ile uygulanan ki-kare sınama istatistiği formülü basitleştirilip şu sekilde sunulabilir:

Hesaplanan ki-kare istatistiği ki-kare tablosunda serbestlik derecesi 1 olan %5 veya %1 anlamlılık düzeyi için bulunan ki-kare tablo değeri ile karşılaştırılır. Eğer ki-kare tablo değeri daha büyükse iki değişkenin birbirinden bağımsız olacağına dair sıfır hipotez kabul edilir. Eğer kompüter kullanılırsa hesaplanan istatistiği için ki-kare simulasyonu kullanılarak bir p-değer bulunur ve bu p-değer anlamlılık düzeyi olan %5 veya %1den büyükse sıfır hipotez kabul edilip iki değişkenin birbirlerinden bağımsız olduğu sonucuna varılır.

Ek açıklama[değiştir | kaynağı değiştir]

Yates düzeltmesi hesaplanan istatistiğini genel istatistiğinden daha küçük yapar. Bunun sonucu ya küçük sayıda kategoriler dolayısıyla ortaya çıkabilecek anlamlılık düzeyinin fazla tahmin yapmasını önlemiş olur ya da daha büyük bir p-değer ortaya çıkartır. Ancak Yates düzeltmesinin fazladan düzeltme yaptığı ve sıfır hipotezi reddetmesi gerekirken kabul ettiği bilinmektedir.

Yates süreklilik düzeltmesinin toplam gözlem sayısı 40dan düşük olduğu (N<40) hallerde kullanılması tavsiye edilmektedir.[2] Ancak birçok istatistikçi her 2 × 2 şekilde bağımlılık tablosu şekline konulan veri için Yates süreklilik düzeltmesi kullanmaktadırlar.

Kaynakça[değiştir | kaynağı değiştir]

  1. ^ Yates,F. (1934). "Contingency table involving small numbers and the χ2 test". Journal of the Royal Statistical Society (Supplement) No.1, say.217-235.
  2. ^ Cochran,W.G. (1954), "Some methods for strengthening χ2 tests" Biometrics C.10 say.417-451.