Friedman sıralamalı iki yönlü varyans analizi

İstatistik bilim dalı içinde Friedman sıralamalı iki yönlü varyans analizi sonradan çok tanınmış bir iktisatçı olan Amerikan Milton Friedman tarafından ortaya atılan bir parametrik olmayan istatistik sınamasıdır.^[1]^[2]^[3]

Bu sınama için veriler k sayıda birbirine eşlenen örneklem halindedir. Örneğin aynı örneklem elemanları k değişik koşullar altında ölçülebilir veya k tane eleman bulup bunları değişik koşullar altına rastgele dağıtarak ölçümler yapmak suretiyle olabilir. Bu çeşit deneysel tasarım için benzer parametrik sınama tekrar edilir ölçümler varyans analizi adını taşır; Ayni zamanda tamamlanmış blok tasarımı adlı deneysel tasarım verileri için kullanılan parametrik Durbin testine benzer.

Bu sınamanın kullanılmış olduğu bilinen klasik pratik problemler arasında şunlar bulunur:

n sayıda şarap ekperi k sayıda değişik şarabı tadım yapmak suretiyle değerlendirmektedirler. Değişik ekperlerin değerlendirmeleri birbirlerine uygun mudur?
n sayıda kaynakçı k sayıda değişik kaynak makinesi kullanmaktadırlar ve yaptıkları kaynaklar merkezi kalite kontrolü tarafından tekrar kontrol edilmektedir. Diğerlerinden daha iyi kaynaklar ortaya çıkartan özel bir kaynak makinası bulunmakta mıdır?

Friedman sınaması için örneklem verisi n satırlı k sütunlu bir veri tablosu halindedir. Her bir satır bir elemanı veya hali veya bloku ve her bir sütun da bu satır nesnelerinin tabi oldukları değişik koşulları gösterir. Ancak analiz yapmak için bu veriler değiştirilip yeni bir tablo kurulur. Bu her bir satır için sıralama düzeni uygulanması suretiyle başarılır; yani her bir satır elemanının sütunları 1,....,k arasında bir sıra numarası verilerek sıralanır. Friedman sınamasının amacı, her değişik koşul için sıralama düzeninin tek bir anakütleden mi geldiğini yoksa ayrı anakütlelerden mi geldiğini incelemektir. Bu sınamayı sağlamak için her sütun için sıralama numaraları toplamlarının birbirine benzer mi yoksa birbirinden çok değişik mi olduğu incelenir.

Friedman sınaması sıralama düzeni kullanılması nedeniyle Kruskal-Wallis sıralamalı tek yönlü varyans analizi hesaplarına da benzemektedir..

Yöntem[değiştir | kaynağı değiştir]

Birbirlerine eşli olan n sayıda eleman veya hal için k değişken hakkında sayısal veri toplanır. Birbirine eşli olduğu için bu verilerin bulunması için özel deneysel tasarım uygulanması gerekmektedir. Bu tamamlanmıs blok tasarımı şeklinde olduğu için varyans analizi terimleri ile satırlara blok ismi verilir. Böylece n satırlı k sütunlu (bir matris şeklinde) bir veri tablosu elde edilir ve bu veri tablosunda da her bir hücrede tek bir sayısal ölçüm $\{x_{ij}\}$ bulunur. Bu i blokunun tabi olduğu j koşuldan ortaya çıkan niceliksel ölçekli sayısal bir ölçümdür ve bütün veri ölçümleri aynı birimlerdedir.
Sınamanın amacı anakütlenin k sayıda koşula göre bölünmesinin etkili olup olmadığıdır. Eğer k sayıdakı koşul anakütlenin k bölüme ayrılmasına neden olursa eldeki örneklemde her koşula ait sıralamalar toplamı birbirinden değişik toplam verecektir. Eğer koşul değişmesi anakütle bölünmesine neden olmuyorsa, örneklem için her bir sütun birbirine eşit sıralama toplamı verecektir. Buna göre Friedman sınaması için sıfır hipotez ve karşıt hipotez şöyle verilir: H0 : k koşul etkilerinin tümü birbirine aynıdır yani koşul değişikliği anakütlenin bölünmesini sağlamaz. H1 : k koşullardan bazılarının etkileri birbirine eşittir ve diğerleri eşit olmayıp anakütlenin bölünmesini sağlarlar.
İlk yapılan hesaplar ile yeni bir veri tablosu elde edilir. Bu yeni tabloda n sayıda blok veya eleman satırı ve k sayıda da koşul sütunu bulunur. Her bir blok için koşullar sıralama düzenine konulmuştur yani yeni veri tablosunda her satırdaki veriler '1' den 'k'ye kadar sıra numarasıdır. Eğer ilk veri matrisinde bir blok satırı içinde beraberlikler bulunursa kullanılacak sıralama stratejisi beraberliklerin sıralama ortalamasının her beraberlik için kullanmasıdır; bu halde kesirler sıralama numaraları bulunabilir . Bu yeni tablodaki her eleman i=1,..,k ve j=1,...n için $r_{ij}$ sıra numaraları olur.
Bu yeni veri tablosu kullanılarak şu ortalama ve toplam kare değerleri bulunur:

${\bar {r}}_{\cdot j}={\frac {1}{n}}\sum _{i=1}^{n}{r_{ij}}$ (Sütun ortalaması)
${\bar {r}}={\frac {1}{nk}}\sum _{i=1}^{n}\sum _{j=1}^{k}r_{ij}$ (Toplam ortalaması)
$SS_{t}=n\sum _{j=1}^{k}({\bar {r}}_{\cdot j}-{\bar {r}})^{2}$ (Toplam toplam-kare);
$SS_{e}={\frac {1}{n(k-1)}}\sum _{i=1}^{n}\sum _{j=1}^{k}(r_{ij}-{\bar {r}})^{2}$ (Hatalar toplam kare)

Toplam kare hesapları kullanılarak sınama istatistiği şu ifade olarak bulunur:

Q={\frac {SS_{t}}{SS_{e}}}

Burada dikkate değer bir nokta bu formüle göre hesaplanan Q istatistiğini verilerin sıralama düzenine koyuldukları zaman bulunan beraberlikler için hiç düzeltme istemediğidir.

En son aşamada sıfır hipotez hakkında sonuç çıkartılır:

Eğer n veya k büyükse (yani n>15 veya k>4 ise), Q için olasılık dağılımı yaklaşık olarak (k-1) serbestlik dereceli bir ki-kare dağılımı gösterir. Bu halde p-değeri $\mathbf {P} (\chi _{k-1}^{2}\geq Q)$ ile bulunur. Bulunan p-değeri anlamlılık düzeyi yüzdeleri (%5 veya %1) ile karşılaştırılır. Eğer p-değeri daha küçükse sıfır hipotez reddedilir.
Eğer n veya k küçükse (yani n=<15 veya k=<4 ise), Friedman sınaması için hazırlanmış Q tabloları kullanılıp %5 veya %1 anlamlılık düzeyi değerleri bulunup bu tablo değerleri hesaplanmış Q değeri ile karşılaştırılır. Eğer hesaplanmış Q değeri daha büyükse sıfır hipotez reddedilir.
Eğer sınama sonucu olarak sıfır hipotez reddedilirse, problem sonucu kesin değildir ve kesin hangi koşulların birlikte etki yaptıklarını incelemek için (post-hoc analiz) çoklu karşılıklar sınamaları kullanmak gereklidir.

İlişkili sınamalar[değiştir | kaynağı değiştir]

Eğer bu türlü deneysel tasarım iki kategorili veri ortaya çıkartırsa, Cochran sınaması kullanılması gereklidir.

Kaynakça[değiştir | kaynağı değiştir]

^ Friedman, Milton (1937) "The use of ranks to avoid the assumption of normality implicit in the analysis of variance", Journal of the American Statistical Association C.32 No.200 say.675–701 [1]
^ Friedman, Milton (1939) "A correction: The use of ranks to avoid the assumption of normality implicit in the analysis of variance" Journal of the American Statistical Association C.34 No.109 say.109 [2]
^ Friedman, Milton (1940) "A comparison of alternative tests of significance for the problem of m rankings", The Annals of Mathematical Statistics C.11 No.1 say.86–92 [3]

Dışsal kaynaklar[değiştir | kaynağı değiştir]

Friedman test at Institute of Phonetic Sciences (IFA)
Texasoft istatistik dersnotlari 17 Mayıs 2008 tarihinde Wayback Machine sitesinde arşivlendi.
Kendall, M.G. (1970), Rank Correlation Methods 4ncu ed., Londra: Charles Griffin.
Hollander,M. ve Wolfe,D.A. (1973), Nonparametric Statistics, New York: J. Wiley.
Siegel,Sidney ve Castellan,N.John Jr. (1988), Nonparametric Statistics for the Behavioral Sciences. 2. ed.) New York: McGraw-Hill.

[1] Friedman, Milton (1937) "The use of ranks to avoid the assumption of normality implicit in the analysis of variance", Journal of the American Statistical Association C.32 No.200 say.675–701 [1]

[2] Friedman, Milton (1939) "A correction: The use of ranks to avoid the assumption of normality implicit in the analysis of variance" Journal of the American Statistical Association C.34 No.109 say.109 [2]

[3] Friedman, Milton (1940) "A comparison of alternative tests of significance for the problem of m rankings", The Annals of Mathematical Statistics C.11 No.1 say.86–92 [3]

[1]

[2]

[3]