F-testi

Vikipedi, özgür ansiklopedi
Atla: kullan, ara

F-testi istatistik bilimi içinde bir sıra değişik problemlerde kullanılan parameterik çıkarımsal sınama yöntemidir. F-testi sıfır hipotezine göre gerçekte bir F-dağılımı gösteren sınama istatistiği bulunduğu kabul edilen hallerde, herhangi bir istatistiksel sınama yapma şeklidir. Bu çeşit bir istatistiksel sınama önce Ronald Fisher tarafından 1920li yıllarda tek yönlü varyans analizi için ortaya atılıp kullanılmış ve sonradan diğer şekillerde F-dağılım kullanan sınamalar da ortaya atılınca, bu çeşit sınamalara genel isim olarak F-testi adı verilmesi Ronald Fisher anısına George W. Snecedor tarafından teklif edilip, istatistikçiler tarafından F-testi bir genel isim olarak kabul edilmistir.

F-testinin en çok kullanıldığı sorunlar ve haller[değiştir | kaynağı değiştir]

F-testi birçok değişik parametrik çıkarımsal istatistik analizi için kullanılmaktadır. Ama elementer istatistiğe girişte fazla derin konulara girmeden f-testi şu değişik çıkarımsal analiz problem tiplerini incelemek için kullanılır:

  1. . "İki anakütle için varyans eşitliği problemi": Normal dağılım gösterdiği kabul edilen iki anakütlenin varyanslarının oranının bire (1e) eşit olup olmadığının sınanması. Anakütle varyans oranı bir (1) ise, bu test istatistiği olur ve bunun F-dağılımı olduğu gösterilmiştir. [1] Yani bu sınanma iki anakütlenin karşılaştırma problemlerinde iki anakütle varyans eşitliği sınamasıdır.
  1. . "Çoklu karşılaştırma problemi": Tek yönlü varyans analizi probleminde bir normal dağılım gösteren kantitatif değişken ve bir de buna doğrusal ilişkili etki yapan kategorik değişken vardır. Fisher bu testi deneyim de kullandığı için etki yapan kategorik değikene sağlatım değiskeni ismini vermiştir.[2] Kategorik sağlatım değişkeninin değişik kategori seviyeleri kantitatif değişken anakütlesini kategori gruplarına ayırır. Eğer kategorik değişkenin kantitatif değişkene doğrusal etkisi varsa, kategori grup ortalamaları değişiktir; yoksa yani kategori grup ortalamaları birbirine eşitse, kategorik değişkenin kantitatif değişkene etkisi yoktur. Tek bir anakütlenin içinde bulunan ikiden fazla kategorikl grubun grup ortalamalarının hepsinin birbirine eşit olup olmadığı veya grup ortalamalarının birbirine eşitliği ve eşitsizliği, çoklu karşılaştırma olarrak anılır ve F-testi ile sınanır.
  1. . "Doğrusal regresayon katsayılar kestirimlerinin genel anlamlığı problemi": Doğrusal regresyon modelinin en-küçük-kareler yöntemi ile yapılan katsayılar kestirimlerinden sonra, bu kestirim katsayılarının sıfıra eşit olmadikları (ve böylece birbirine eşit olup olmadıkları) "F-testi" ile sinanir. Eğer "F-testi" sonucu katsayıların sıfıra eşit olduğu hipotezi rededilemezse hesaplanan kestirim değerleri anlamsızdır. Böylece F-testi eldeki verileri kullarak elde edilen doğrusal regresyon katasayılar kestiriminin anakütle doğrusal modeline genel olarak uyup uymadığını sınamak için kullanılır. Bu tip F-testi R2 "çokluluk korelasyon katsayı"nın çok benzeridir.

İki anakütle varyansının eşitliği sınaması[değiştir | kaynağı değiştir]

X1, ..., Xn n gözlemli bir örneklem verileri ve Y1, ..., Ym m gözlemli diğer bir örneklem verileri olsun ve bu iki örneklemin her birinin N(\mu_X,\sigma_X^2)- ve N(\mu_Y,\sigma_Y^2)- normal dağılım gösterdiği kabul edilsin.

Bu iki anakütlenin varyanslarının (yahut anakitle standart sapmalarının) birbirine eşit olup olmadığı incelenen problemdir.

İki örneklem için örneklem ortalamaları

 \overline{X} = \frac{1}{n}\sum_{i=1}^n X_i\text{ ve }\overline{Y} = \frac{1}{m}\sum_{i=1}^m Y_i

ve örneklem varyansları

 \overline{X} = \frac{1}{n}\sum_{i=1}^n X_i\text{ ve }\overline{Y} = \frac{1}{m}\sum_{i=1}^m Y_i

formülleri ile bulunur.

"F-testi" için sıfır hipotez

H0 : F=(\frac{sigma_X^2}{sigma_Y^2}) = 1 veyahut varyanslar eşit olduğu varasayıldığı için F=\frac{S_X^2}{S_Y^2} olur.


Bu halde sınama için birbirine eşit iki anakütlenin varyans eşitliği sıfır hipoteze uyan test-istatistiği F yani

  F = \frac{S_X^2}{S_Y^2}

(n-1) ve (m-1) serbestlik derecesi gösteren F-dağılımı gösterir.

Sınamayı yapmak için once F-değeri hesaplanır. Sonra

  • ya (n-1) ve (m-1) serbestlik decereli F-dağılımı için p-değeri bulunur ve bu 0,01 veya 0,05den küçükse H0 rededilir.
  • ya da α=0,01 veya α=0,05 anlam düzeyinde (n-1) ve (m-1) serbestlik decereli F-dağılımı sınır değeri bulunur. Hesaplanan F-değeri bu sınır dışında ise H0 rededilir.

F-testi iki örneklem verisinin de normal dağılım gösteren anakütlelerden gelmesi varsayımına dayanmaktadır. Eğer verilerin normal dağılımdan ayrıldığı bilinmekte ise, test istatistiğinin sağlamlığı (robustness) incelenmesi gerekir. Yapılan araştırmalarda F-istatistiğinin normalden ayrılma halinde sağlamlığının çok düşük olduğu bulunmuştur.[3]Bu nedenle anakütle varyans eşitliği hipotezini sınayan daha yeni olarak ortaya çıkartılan Levene testi, Bartlett testi veya Bruce-Forsyth testinin kullanılması tavsiye edilmektedir.

Tek yönlü varyans analizi çoklu karşılaştırma problemi[değiştir | kaynağı değiştir]

Açıklama[değiştir | kaynağı değiştir]

Toplam sapmanın parçalarının karşılaştırılması için F-testi uygulanır. Tek yönlü veya tek faktörlü varyans analizi için istatistik anlamlılığın sınanması, F-test istatistiği olan şu

F=\dfrac{\mbox{grup ortalamalari varyansi}}{\mbox{grup-icindekiler varyansi ortalamasi}}
F^* = \frac{\mbox{MSTR}}{\mbox{MSE}}
burada:
\mbox{MSTR} = \frac{\mbox{SSTR}}{I-1}, I = sağlatımlar sayısı
ve
\mbox{MSE} = \frac{\mbox{SSE}}{n_T-I}, nT = toplam gözlem eleman sayısı

ifade ile I-1 ve nT serbestlik derecelerinde F-dağılımı ifadesini karşılaştırmak suretiyle gerçekleştirilir.

Sayısal örnek[değiştir | kaynağı değiştir]

Doğrusal regresyon katsayı kestirimlerini genel olarak anlamlı olup olmaması sınaması[değiştir | kaynağı değiştir]

Diğer çeşit F-testleri[değiştir | kaynağı değiştir]

Dipnotlar[değiştir | kaynağı değiştir]

  1. ^ Eğer bir oran bire eşitse oranın pay ve paydası birbirine eşittir.
  2. ^ Bir sağlatım değişkeni icin iki kategori tatbik edilme (ilac verilme) veya tatbik edilmeme (ilaç verilmeme) olmakta ve çoklu kategori halinde ise verilen değişik dozlar değişik kategoriler olmaktadır.
  3. ^ Markowski, Carol A; Markowski, Edward P. (1990). "Conditions for the Effectiveness of a Preliminary Test of Variance". The American Statistician 44 (4): 322–326. doi:10.2307/2684360. http://www.jstor.org/stable/2684360. 

Ayrıca bakınız[değiştir | kaynağı değiştir]

Dış kaynaklar[değiştir | kaynağı değiştir]