D'Agostino'nun K-kare sınaması

Vikipedi, özgür ansiklopedi
Atla: kullan, ara

İstatistik bilim dalında D'Agostino'nun K2 sınaması normal dağılımdan ayrılmayı ölçmek için kullanılan bir uygulama iyiliği ölçüsüdür. Örneklem basıklık ve çarpıklık ölçülerinin dönüşümlerinden elde edilmiştir. K2 istatistiği şöyle elde edilir:

n değerinin gözlem sayısı ve böylelikle genellikle serbestlik derecesi olduğu bilinmektedir. Örneklem çarpıklık ölçüsü, \sqrt{b_1}, şöyle tanımlanır:


\sqrt{ b_1 } = \frac{ \mu_3 }{ \sigma^3 } = \frac{ \mu_3 }{ \left( \sigma^2 \right)^{3/2} } = \frac{ \frac{1}{n} \sum_{i=1}^n \left( x - \bar{x} \right)^3}{ \left( \frac{1}{n} \sum_{i=1}^n \left( x - \bar{x} \right)^2 \right)^{3/2}}

Örneklem basıklık ölçüsü, \sqrt{b_2} ise şöyle tanimlanır:


b_2 = \frac{ \mu_4 }{ \sigma^4 } = \frac{ \mu_4 }{ \left( \sigma^2 \right)^{2} } = \frac{\frac{1}{n} \sum_{i=1}^n \left( x - \bar{x} \right)^4}{\left( \frac{1}{n} \sum_{i=1}^n \left( x - \bar{x} \right)^2 \right)^2}

Burada \bar{x} örneklem ortalaması, σ2 ikinci merkezsel moment veya varyans ve sırasiyla μ3 ve μ4 üçüncü ve dördüncü merkezsel moment lerdir.

Dönüştürülmüş çarpıklık[değiştir | kaynağı değiştir]

Önce, çarpıklık ölçüsü \sqrt{b_1} 'nin bir dönüşümü olan

Z\left(\sqrt{b_1}\right)

hesaplanır. Verinin normal dağılım gösterdiğine dair sıfır hipotez geçerli ise, bu ifade yaklaşık olarak normal dağılım gösterir:


Y = \sqrt{b_1} \cdot \sqrt{\frac{(n+1)(n+3)}{6(n-2)}}

\beta_2\left(\sqrt{b_1}\right) = \frac{3(n^2+27n-70)(n+1)(n+3)}{(n-2)(n+5)(n+7)(n+9)}

W^2 = -1 + \sqrt{2 (\beta_2\left(\sqrt{b_1}\right) - 1)}

\delta = 1/\sqrt{ln(W)}

\alpha = \sqrt{\frac{2}{W^2-1}}

Z\left(\sqrt{b_1}\right) = \delta ln\left(Y/\alpha + \sqrt{(Y/\alpha)^2 + 1}\right)

Dönüştürülmüş Basıklık[değiştir | kaynağı değiştir]

Sonra, basıklık ölçüsü olan b_2 'in bir dönüşümü olan Z\left(b_2\right) hesaplanır. Verinin normal dağılım gösterdiğine dair sıfır hipotez geçerli ise, bu ifade de yaklaşık olarak normal dağılım gösterir:


E\left(b_2\right) = \frac{3(n-1)}{n+1}

\sigma^2_{b_2} = \frac{24n(n-2)(n-3)}{(n+1)^2(n+3)(n+5)}

x = \frac{b_2 - E\left(b_2\right)}{\sigma_{b_2}}

Bundan sonra ise, basıklık ifadesinin çaprazlığı bulunur:


\sqrt{\beta_1\left(b_2\right)} = \frac{6(n^2-5n+2)}{(n+7)(n+9)} \sqrt{\frac{6(n+3)(n+5)}{n(n-2)(n-3)}}

A = 6 + \frac{8}{\sqrt{\beta_1\left(b_2\right)}} \left[ \frac{2}{\sqrt{\beta_1\left(b_2\right)}} + \sqrt{1+\frac{4}{\beta_1\left(b_2\right)}}\right]

Z\left(b_2\right) = \left(\left(1 - \frac{2}{9A}\right) - \sqrt[3]{\frac{1-2/A}{1+x\sqrt{2/(A-4)}}}\right)\sqrt{\frac{9A}{2}}

İçerikli K2 istatistiği[değiştir | kaynağı değiştir]

Şimdi, bu Z\left(\sqrt{b_1}\right) ile Z\left(b_2\right) ifadelerini birleştirip normallik sınaması için D'Agustino'nun sinama istatistigi şöyle tanımlanır:


K^2 = \left(Z\left(\sqrt{b_1}\right)\right)^2 + \left(Z\left(b_2\right)\right)^2

K^2 istatistiği yaklaşık olarak serbestlik derecesi 2 olan bir \chi^2 ile dağılım gösterir.

İçsel kaynaklar[değiştir | kaynağı değiştir]

Kaynak[değiştir | kaynağı değiştir]

İngilizce Vikipedi'deki 12 Ocak 2008 tarihli D'Agostino's_K-squared_test maddesi

Referanslar[değiştir | kaynağı değiştir]

  • D'Agostino, Ralph B., Albert Belanger, and Ralph B. D'Agostino, Jr. "A Suggestion for Using Powerful and Informative Tests of Normality", The American Statistician, Cilt. 44, No. 4. (Kasım., 1990), say. 316-321.