Ki-kare testi

Ki-kare testi veya χ² testi istatistik bilimi içinde bir sıra değişik problemlerde kullanılan bazıları parametrik olmayan sınama ve diğerleri parametrik sınama yöntemidir. Bu çeşit istatistiksel sınamalarda test istatistiği için "örnekleme dağılımı", sıfır hipotez gerçek olursa ki-kare dağılımı gösterir veya sıfır hipotez "asimptotik olarak gerçek" olursa, eğer sıfır hipotez gerçekse ve eğer örnekleme hacmi istenilen kadar yeterli olarak büyük ise bir ki-kare dağılımına çok yakın olarak yaklaşım gösterir.

Çeşitli ki-kare testleri[değiştir | kaynağı değiştir]

Ki-kare dağılımının yaklaşık olarak geçerli olduğu ki-kare testlerinin en çok kullanılan örnekleri şunlardır:

Pearson'un ki-kare testleri ve gelişmeleri[değiştir | kaynağı değiştir]

Örneklem verileri ikiden çok kategorili satırdan ve ikiden çok kategorili sütundan oluşan kontenjans tablosu olarak özetlenir ve (r-satırlı ve c-sütunlu) (rxc) tablo, hesaplar için ana veri olarak kullanılır. Bu test "bağımsızlık için ki-kare testi" veya "homojenlik testi" olarak istatistiksel çıkartımasal problemlere uygulanır. Bu çeşit problemlerde "sıfır hipotez" bir rassal değişkenin istatiksel parametre değerini sınamadığı için bu test parametrik olmayan sınama olduğu kabul edilir. Genellikle "Pearson'un ki-kare testi" en iyi bilinen "ki-kare testi" olup çok kere "ki-kare-testi" sözcüğü bu tip Pearson'un testi için kullanılır. "Pearson'un ki-kare testi"'nin çözümleme yöntemi iki değişik sınama sorunu için kullanılır ve bu iki çeşit örneklem veriler bir "kontenjans tablosu"nda özetlendikten sonra aynı şekilde uygulanır.

"Bağımsızlık için ki-kare testi":

Bu tip için ki-kare testinin uygulandığı değişik kategorik değerler taşıyan (satır için değişkende r tane kategorili bir değişken ve sütün için değişkende c tane kategorili değişken) iki tane rassal değişken bulunduğu kabul edilir. Bu iki kategorik rassal değişkenin birbirinden "bağımsız" olup olmadıkları araştırma sorusu için uygulanır. Bu tip testte, sıfır hipotez satır rassal değişkeni ile sütun rassal değişkeninin birbirinden "bağımsız" olduğudur ve "alternatif hipotez" "satır değişkeni ile sütun değişkeni birbirinden "bağımsız değildir" önerisidir. Dikkat edilirse bu testin sonucu simetrik değildir; hatta "zayıftır". Eğer sıfır hipotez test ile kabul edilirse sonuç "güçlü"dür ve uygulanmalara katkı yapabilir. Ama sıfır hipotez test ile rededilirse, yani iki rassal değişken "bağımsız değil" ise, sonuç "zayıftır ve ne derecede iki degiskenin ne derecede bağımlı oldukları bu testle gösterilmez.

"Homojenlik için ki-kare testi"'

Bu testte ise ikiden çok kategorik değerler taşıyan (yani c tane kategorili sütunla gösterilen) tek bir rassal değişken bulunduğu; ama anakitlenin içinde iki veya daha fazla sayıda (yani r tane kategorili satırla gösterilen) "kitle grubu" bulunduğu sorunu araştırma sorunu olur ve bu iki veya daha fazla kitle grubunun tek bir homojen anakitleden gelip gelmediği sınanır.

2x2 kontenjans tablosu testleri[değiştir | kaynağı değiştir]

"İki satır iki sütunlu (2z2)" kontenjans tablosu çoklu satırlı ve çoklu sütunlu kontenjans tablolarında gösterilebilinen verilerin en basitidir.. Onun için bu tip tablolarla özetlenebilen veriler üzerindeki ki-kare testleri özel şekiller alırlar. 2x2 kontenjanss tabloları halinde verilen veriler için kullanılan özel "ki-kare test"lerinden önemlileri şunlardır:

Yates'in ki-kare testi: Bu test de "bağımsızlık için ki-kare testi" olarak "iki satır iki sütunlu (2z2)" kontenjans tablosu halinde verilen veriler için istatistiksel çıkartımsal problemlere uygulanır. Bu şekilde özetlenen iki değişkenli veriler, her iki değişkende de (0-1) isimsel veya sırasal değerleri olan değişkenlerdir. Bu testin önemli niteliği 2x2 veri tablosunun her hücresine Yates'in süreklilik düzeltmesi uygulanması yani her hücre için "gözlenmiş değer - beklenen değer" çıkartımından 0,5 değerinin çıkarılmasını ve böylece istatistiğinin "hesaplanmış ki-kare değeri"'ni azaltıp "p-değeri"'ni yükseltmesidir. Hesaplanan ki-kare formülü için be değişim uygulanması haricinde istatistiksel çıkartım için kullanılan yöntemler "Pearson ki-kare testi" ile yöntemi ile aynıdır.
Eğer örneklem hacimi küçük ise Fisher'in kesin ki-kare testi $\chi ^{2}$ Pearson'un ki-kare testi yerine kullanılır.
Medyan sınaması: Rastgele iki örneklem verileri için bulunan iki örneklem meydanının tek özdeş medyanı olan iki ayrı istatistiksel yığından mı veya tek bir medyanı olan tek bir istatistiksel yığından mı ortaya çıktığı sınanır.
McNemar'ın sınaması: Eğer her iki (0-1) değer alan değişkenlerin gözümlenmesi "eşli karşılaştırma" (örneğin bir sağaltımın uygulanmasınındın önce ve sonra elde edilen veriler) şeklinde örneklem gibi toplanmışsa elde edilen 2×2 kontenjans tablosundaki iki değişkenin bağımsız olup olmadığını sınamaktadır.

G-testleri[değiştir | kaynağı değiştir]

G-testleri "maksimum olabilirlik" ve "olabilirlik-oranı" prensiplerine dayanan hipotez sınaması olup günümüzde Pearson'un ki-kare testi ve 2x2 kontenjans tabloları için ki-kare testleri yerine kullanılmaya başlanmıştır.

Ki-kare değerinde ile "birliktelik" ölçümü[değiştir | kaynağı değiştir]

"Ki-kare testi"'nin bağımsızlık testinin sonucu simetrik değildir; hatta "zayıftır". Eğer bağımsızlık sıfır hipotezi, test hesaplaması sonucunda kabul edilirse sonuç "güçlü"dür ve yapılan ki-kare testi sonucu uygulanmalara katkı yapabilir. Ama "sıfır hipotez" "Pearson'un ki-kare testi" sonucunda reddedilirse, yani iki değişken "bağımsız değilse", sonuç "zayıf"tır. Çünkü bu iki kategorik değişkenin "birliktelikleri (associaton)" (yanı ne derecede birbirine bağımlı oldukları) bu testle öğrenilmez. Onun için iki kategorik değişken arasında bağımsızlık sıfır hipotezi Pearson'un ki-kare testi ile reddedilirse ve bu iki kategorik değişken arasında "birliktelik" (yani bağımlılık derecesi) bulunması için ekstra analiz uygulanması gerekir. Bu ekstra analiz ile iki kategorik değişken arasında "birliktelik" (İngilizce "association") katsayıları bulunması, iki niceliksel değişken arasında bulunması istenilen korelasyon ilişkisine kavramsal olarak çok yakındır. İlk defa ortaya atılan "birliktelik" katsayıları kavramsal ve pratik olarak, önceden eldeki verilerle "hesaplanan ki-kare" değerlerini kullanmasına dayanmaktadır. Bu tip "birliktelik katasayıları" onun için, eğer "bağımsızlık bulunmazsa" ne derece bağımlılık bulmak hedefiyle yapılan ek işlemler halinde görülmektedir. Ama daha sonradan diğer görüşlerle ede edilen "birliktelik" analizleri ve katsayısıları ortaya atılmıştır;; örneğin Goodman ve Kruskal'ın lambda katsayıları, entropi katsayısı vb.

Hesaplanan "Ki-kare" değeri kullanılarak elde edilen "birliktelik katsayı"ları değişik isimli ve nispeten küçük fark gösteren șu nitelikli katsayilar olabilirler:

Phi katsayısı:

İki tane iki-değerli isimsel değişken için 2x2 kontenjans tabloları ile özetlenen veri kullanarak bulunur. Bu katsayının en yüksek değeri eldeki veri sayısına bağlı olmaktadır ve 0.707'ye eşittir.

Kontenjans katsayısı:

İki tane çoklu-kategorili isimsel değişken için rxc kontenjans tabloları ile özetlenen veri kullanarak bulunur. Bu katsayının en yüksek değeri de (phi- katsayısına benzer olarak) eldeki veri sayısına ve en büyük sayıda kategori sayısına bağlı olmaktadır.

Cramér'un V katsayısı:

İki tane çoklu-kategorili isimsel değişken için bulunur. Bu katsayının değeri (iki niceliksel değişken arasındaki korelasyon katsayısına benzer olarak) -1 ile +1 arasında değişebilmektedir.

Tschuprow'un T katsayısı:

Bu katsayi da iki tane çoklu-kategorili isimsel değişken için bulunur ama bu katsayının değeri 0 ile +1 arasında değişebilmektedir.

Ki-kare uygunluk iyiliği sınaması[değiştir | kaynağı değiştir]

Bu tip uygunluk iyiliği sınaması için hesaplama yöntemi "Pearson'un ki-kare testi"'ne gayet çok benzeyerek, tek bir "kategorik veri" halinde olan kategorik değişkenin veya kontenjans tablosu içinde sıniflanma yapılarak özetilmiş bir niceliksel değişken verilerinin ne türlü dağılım gösterdiğini test eder. Veriler değişkenin kategori değeri halinde özellikle "tekdüze ayrık dağılım'a uygunluk", binom dağılım'a uygunluk", Poisson dağılım'a uygunluk" ve eğer normal değerler sınıflandırılıp sınıf ortalaması kategori değeri gibi kullanılırsa "normal dağılım'a uygunluk" testleri olabilirler. Bu halde dağılımı kesin belirlemek için dağılım parametreleri "sıfır hipotez" içinde verilmesi gerekir. Bu nedenle genellikle bu tip test "parametrik olmayan istatistik" olarak kabul edilmekle beraber, sıfır hipotezde anakütle parametre değerleri belirtilmesi gerektiği için "parametrik çıkartım" nitelikleri de taşımaktadır.

Varyans değeri testi[değiştir | kaynağı değiştir]

Tek niceliksel değişken verisi için basit rassal örnekleme ile elde edilen veriler, eğer yeter derecede büyük sayıda ise elde edilen örneklem özetlenme değerleri için örnekleme varyansı hesaplanıp anakütle varyansının belirli hakkında sınama yapmak kullanılabilir. Bu varyans değeri testi genel olarak pratikte çok kullanılmaktadır çünkü verilerin varyansı hakkında çok kere araştırma sorusu çıkmamaktadır.

Diğer ki-kare testleri[değiştir | kaynağı değiştir]

Zaman serisi analizi konusunda zaman serisi verileri bulunan tek bir değişken için n tane arkaya gözlenen veri serisinde 1'den başlayarak belli bir gecikmeye (pratik olarak genellikle n/3 donem gecikmeye) kadar olan otokorelasyon bağlantısının olup olmadığını bulmak için yapılan portmanto testi.
"Genel istatistik modelleme" yönteminde arka arkaya birbirine "iç-içe" yuvalanmış şekilde en basit modelden daha karmaşık modele geçiş gerekip gerekmediği hakkında yeterli delil olup olmadığını test eden olabilirlik oran sınaması,

Ayrıca bakınız[değiştir | kaynağı değiştir]

Notlar[değiştir | kaynağı değiştir]

Dış bağlantılar[değiştir | kaynağı değiştir]

Eric W. Weisstein, Chi-Squared Test (MathWorld)
"Penn State" Üniveristesi Ki-Kare açıklaması ve örneği18 Kasım 2013 tarihinde Wayback Machine sitesinde arşivlendi. (İngilizce)
"GraphPad" siteside "Ki-Kare Hesaplamssi" 3 Aralık 2008 tarihinde Wayback Machine sitesinde arşivlendi. (İngilizce)
"QtiPlot" sitesinen Ki-kare testi (İngilizce)
"Vassar Koleji" sitesinde ki-kare değeri bulmak içni 2×2 kontenjans tablosu hücreleri için "Beklenen Değerler" hesaplaması (İngilizce)
Corder, G.W., Foreman, D.İ. (2009). Nonparametric Statistics for Non-Statisticians: A Step-by-Step Approach Wiley, ISBN 978-0-470-45461-9 (İngilizce)
Greenwood, P.E., Nıkulin, M.S. (1996) A guide to chi-squared testing. Wiley, New York. ISBN 0-471-55779-X (İngilizce)
Nıkulin, M.S. (1973). "Chi-squared test for normalıty". Proceedings of the International Vilnius Conference on Probabılıty Theory and Mathematical Statistics, C.2, s.;119–122. (İngilizce)