Friedman sıralamalı iki-yönlü varyans analizi

Vikipedi, özgür ansiklopedi
Atla: kullan, ara

İstatistik bilim dalı içinde Friedman sıralamalı iki-yönlü varyans analizi sonradan çok tanınmış bir iktisatçı olan Amerikan Milton Friedman tarafından ortaya atılan bir parametrik olmayan istatistik sınamasıdır. [1][2][3]

Bu sınama için veriler k sayıda birbirine eşlenen örneklem halindedir. Örneğin aynı örneklem elemanları k değişik koşullar altında ölçülebilir veya k tane eleman bulup bunları değişik koşullar altına rasgele dağıtarak ölçümler yapmak suretiyle olabilir. Bu çeşit deneysel tasarım için benzer parametrik sınama tekrar edilir ölçümler varyans analizi adını taşır; Ayni zamanda tamamlanmış blok tasarımı adlı deneysel tasarım verileri için kullanılan parametrik Durbin testine benzer.

Bu sınamanın kullanılmış olduğu bilinen klasik pratik problemler arasında şunlar bulunur:

  • n sayıda şarap ekperi k sayıda değişik sarabı tadım yapmak suretiyle değerlendirmektedirler. Değişik ekperlerin değerlendirmeleri birbirlerine uygun mudur?
  • n sayıda kaynakçı k sayıda değişik kaynak makinesi kullanmaktadırlar ve yaptıkları kaynaklar merkezsel kalite kontrolu tarafından tekrar kontrol edilmektedir. Diğerlerinden daha iyi kaynaklar ortaya çıkartan özel bir kaynak makinası bulunmakta mıdır?

Friedman sınamasi için örneklem verisi n satırlı k sütunlu bir veri tablosu halindedir. Her bir satır bir elemanı veya hali veya bloku ve her bir sütun da bu satır nesnelerinin tabi oldukları değişik koşulları gösterir. Ancak analiz yapmak için bu veriler değiştirilip yeni bir tablo kurulur. Bu her bir satır için sıralama düzeni uygulanması suretiyle başarılır; yani her bir satır elemanının sütunları 1,....,k arasında bir sıra numarası verilerek sıralanır. Friedman sınamasının amacı, her değişik koşul için sıralama düzeninin tek bir anakütleden mi geldiğini yoksa ayrı anakütlelerden mi geldigini incelemektir. Bu sınamayı sağlamak için her sütun için sıramala numaraları toplamlarının birbirine benzer mi yoksa birbirinden çok değişik mi olduğu incelenir.

Friedman sınaması sıralama düzeni kullanılması nedeniyle Kruskal-Wallis sıralamalı tek-yönlü varyans analizi hesaplarına da benzemektedir..

Yöntem[değiştir | kaynağı değiştir]

  • Birbirlerine eşli olan n sayıda eleman veya hal için k değişken hakkında sayısal veri toplanır. Birbirine eşli olduğu için bu verilerin bulunması için özel deneysel tasarim uygulanması gerekmektedir. Bu tamamlanmıs blok tasarımı şekilinde olduğu için varyans analizi terimleri ile satırlara blok ismi verilir. Böylece n satırlı k sütunlu (bir matris şekilinde) bir veri tablosu elde edilir ve bu veri tablosundada her bir hücrede tek bir sayısal ölçüm \{x_{ij}\} bulunur. Bu i blokunun tabi olduğu j koşuldan ortaya çıkan niceliksel ölçekli sayısal bir ölçümdür ve bütün veri ölçümleri aynı birimlerdedir.
  • Sınamanın amacı anakütlenin k sayıda koşula göre bölünmesinin etkili olup olmadığıdır. Eğer k sayidaki koşul anakütlenin k bölüme ayrılmasına neden olursa eldeki örneklemde her koşula ait siralamalar toplami birbirinden değişik toplam verecektir. Eğer koşul değişmesi anakutle bölünmesine neden olmuyorsa, örneklem için her bir sütun birbirine eşit sıralama toplamı verecekdir. Buna göre Friedman sınaması için sıfır hipotez ve karşıt hipotez şöyle verilir: H0 : k koşul etkilerinin tümü birbirine aynıdır yani koşul değişikliği anakütlenin bölünmesini sağlamaz. H1 : k koşullardan bazılarinin etkileri birbirine eşitir ve diğerleri eşit olmayıp anakütlenin bölünmesini sağlarlar.
  • İlk yapılan hesaplar ile yeni bir veri tablosu elde edilir. Bu yeni tabloda n sayıda blok veya eleman satırı ve k sayıyda da koşul sütunu bulunur. Her bir blok için koşullar sıralama düzenine konulmuştur yani yeni veri tablosunda her satırdakı veriler '1' den 'k'ye kadar sıra numarasıdır. Eğer ilk veri matrisinde bir blok satırı içinde beraberlikler bulunursa kullanılacak sıralama stratejisi beraberliklerin sıralama ortalamasının her beraberlik için kullanmasıdır; bu halde kesirler sıralama numaraları bulunabilir . Bu yeni tablo daki her eleman i=1,..,k ve j=1,...n için r_{ij} sıra numaraları olur.
  • Bu yeni veri tablosu kullanılarak şu ortalama ve toplam kare değerleri bulunur:
  1. \bar{r}_{\cdot j} = \frac{1}{n} \sum_{i=1}^n {r_{ij}} (Sütun ortalaması)
  2. \bar{r} = \frac{1}{nk}\sum_{i=1}^n \sum_{j=1}^k r_{ij} (Toplam ortalaması)
  3. SS_t = n\sum_{j=1}^k (\bar{r}_{\cdot j} - \bar{r})^2 (Toplam toplam-kare);
  4. SS_e = \frac{1}{n(k-1)} \sum_{i=1}^n \sum_{j=1}^k (r_{ij} - \bar{r})^2 (Hatalar toplam kare)
  • Toplam kare hesapları kullanılarak sınama istatistiği şu ifade olarak bulunur:
Q = \frac{SS_t}{SS_e}

Burada dikkate değer bir nokta bu formüle göre hesaplanan Q istatistiğini verilerin sıralama düzenine koyuldukları zaman bulunan beraberlikler için hiç düzeltme istemediğidir.

  • En son aşamada sıfır hipotez hakkında sonuç çıkartılır:
  1. Eğer n veya k büyükse (yani n>15 veya k>4 ise), Q için olasılık dağılımı yaklaşık olarak (k-1) serbestlik dereceli bir ki-kare dağılımı gösterir. Bu halde p-değeri \mathbf{P}(\chi^2_{k-1} \ge Q) ile bulunur. Bulunan p-değeri anlamlılık düzeyi yüzdeleri (%5 veya %1) ile karşılaştırılır. Eğer p-değeri daha küçükse sıfır hipotez red edilir.
  2. Eğer n veya k küçükse (yani n=<15 veya k=<4 ise), Friedman sınaması için hazırlanmış Q tablolari kullanılıp %5 veya %1 anlamlılık düzeyi değerleri bulunup bu tablo değerleri hesaplanmış Q değeri ile karşılaştırılır. Eğer hesaplanmış Q değeri daha büyükse sıfır hipotez red edilir.
  3. Eğer sınama sonuçu olarak sıfır hipotez red edilirse, problem sonucu kesin değildir ve kesin hangi koşullarin birlikte etki yaptıklarını incelemek için (post-hoc analiz) çoklu karşılıklar sınamaları kullanmak gereklidir.

İlişkili sınamalar[değiştir | kaynağı değiştir]

Eğer bu türlü deneysel tasarım iki kategorili veri ortaya çıkartırsa, Cochran sınaması kullanılması gereklidir.

Referanslar[değiştir | kaynağı değiştir]

  1. ^ Friedman, Milton (1937) "The use of ranks to avoid the assumption of normality implicit in the analysis of variance", Journal of the American Statistical Association C.32 No.200 say.675–701 [1]
  2. ^ Friedman,Milton (1939) "A correction: The use of ranks to avoid the assumption of normality implicit in the analysis of variance" Journal of the American Statistical Association C.34 No.109 say.109 [2]
  3. ^ Friedman, Milton (1940) "A comparison of alternative tests of significance for the problem of m rankings", The Annals of Mathematical Statistics C.11 No.1 say.86–92 [3]


Dışsal kaynaklar[değiştir | kaynağı değiştir]