Ki-kare testi

Vikipedi, özgür ansiklopedi
Atla: kullan, ara

Ki-kare testi veya χ² testi istatistik bilimi içinde bir sıra değişik problemlerde kullanılan bazıları parametrik olmayan sınama ve diğerleri parametrik sınama yöntemidir. Bu çeşit istatistiksel sınamalarda test istatistiği için "örnekleme dağılımı", sıfır hipotez gerçek olursa ki-kare dağılımı gösterir veya sıfır hipotez "asımtotik olarak gerçek" olursa, eğer sıfır hipotez gerçekse ve eğer örnekleme hacmi istenilen kadar yeterli olarak büyük ise bir ki-kare dağılımına çok yakın olarak yaklaşım gösterir.

Çeşitli ki-kare testleri[değiştir | kaynağı değiştir]

Ki-kare dağılımının yaklaşık olarak geçerli olduğu ki-kare testlerinin en çok kullanılan örnekleri şunlardır:

Pearson'un ki-kare testleri ve gelişmeleri[değiştir | kaynağı değiştir]

Örneklem verileri ikiden çok kategorili satırdan ve ikiden çok kategorili sütundan oluşan kontenjans tablosu olarak özetlenir ve (r-satırlı ve c-sütunlu) (rxc) tablo, hesaplar için ana veri olarak kullanılır. Bu test "bağımsızlık için ki-kare testi" veya "homojenlik testi" olarak istatistiksel çıkartımasal problemlere uygulanır. Bu çeşit problemlerde "sıfır hipotez" bir rassal değişkenin istasıksel parametre değerini sınamadığı için bu test parametrik olmayan sınama olduğu kabul edilir. Genellikle "Pearson'un ki-kare testi" en iyi bilinen "ki-kare testi" olup çok kere "ki-kare-testi" sözcüğü bu tip Pearson'un testi için kullanılır. "Pearson'un ki-kare testi"'nin çözümleme yöntemi iki değişik sınama sorunu için kullanılır ve bu iki çeşit örneklem veriler bir "kontenjans tablosu"nda özetlendikten sonra aynı şekilde uygulanır.

  • "Bağımsızlık için ki-kare testi":

Bu tip için ki-kare testinin uygulandığı değişik kategorik değerler taşıyan (satır için değişkende r tane kategorili bir değişken ve sütün için değişkende c tane kategorili değişken) iki tane rassal değişken bulunduğu kabul edilir. Bu iki kategorik rassal değişkenin birbirinden "bağımsız" olup olmadıkları araştırma sorusu için uygulanır. Bu tip testte, sıfır hipotez satır rassal değişkeni ile sütun rassal değişkeninin birbirinden "bağımsız" ölduğudur ve "alternatif hipotez" "satır değişkeni ile sütun değişkeni birbirinden "bağımsız değildir" önerisidir. Dikkat edilirse bu testin sonucu simetrik değildir; hatta "zayıftır". Eğer sıfır hipotez test ile kabul edilirse sonuç "güçlü"dür ve uygulanmalara katkı yapabilir. Ama sıfır hipotez test ile rededilirse, yani iki rassal değişken "bağımsız değil" ise, sonuç "zayıftır ve ne derecede iki degiskenin ne derecede bağımlı oldukları bu testle gösterilmez.

  • "Homojenlik için ki-kare testi"'

Bu testte ise ikiden çok kategorik değerler taşıyan (yani c tane kategorili sütunla gösterilen) tek bir rassal değişken bulunduğu; ama anakitlenin içinde iki veya daha fazla sayıda (yani r tane kategorili satırla gösterilen) "kitle grubu" bulunduğu sorunu araştırma sorunu olur ve bu iki veya daha fazla kitle grubunun tek bir homojen anakitleden gelip gelmediği sinanir.

2x2 kontenjans tablosu testleri[değiştir | kaynağı değiştir]

"İki satır iki sütunlu (2z2)" kontenjans tablosu çoklu satırlı ve çoklu sütunlu kontenjans tablolarında gösterilebilinen verilerin en basitidir.. Onun için bu tip tablolarla özetlenebilen veriler üzerindeki ki-kare testleri özel şekiller alırlar. 2x2 kontenjanss tabloları halinde verilen veriler için kullanılan özel "ki-kare test"lerinden önemlileri şunlardır:

  • Yates'in ki-kare testi: Bu test de "bağımsızlık için ki-kare testi" olarak "iki satır iki sütunlu (2z2)" kontenjans tablosu halinde verilen veriler için istatistiksel çıkartımsal problemlere uygulanır. Bu şekilde özetlenen iki değişkenli veriler, her iki değişkende de (0-1) isimsel veya sırasal değerleri olan değişkenlerdir. Bu testin önemli niteliği 2x2 veri tablosunun her hücresine Yates'in süreklilik düzeltmesi uygulanması yani her hücre için "gözlenmiş değer - beklenen değer" çıkartımından 0,5 değerinin çıkarılmasını ve böylece istatiğinin "hesaplanmiş ki-kare değeri"'ni azaltıp "p-değeri"'ni yükseltmesidir. Hesaplanan ki-kare formülü için be değişim uygulanması hariciende istatistiksel çıkartım için kullanılan yöntemler "Pearson ki-kare testi" ile yöntemi ile aynıdır.
  • Eğer örneklem hacimi küçük ise Fisher'in kesin ki-kare testi χ² Pearson'un ki-kare testi yerine kullanılır.
  • Medyan sınaması: Rasgele iki örneklem verileri için bulunan iki örneklem medyanının tek özdeş medyanı olan iki ayrı istatistiksel yığından mı veya tek bir medyanı olan tek bir istatistiksel yığından mı ortaya çıktığı sinanir.
  • McNemar'ın sınaması: Eğer her iki (0-1) değer alan değişkenlerin gözümlenmesi "eşli karşılaştırma" (örneğin bir sağaltımın uygulanmasınından önce ve sonra elde edilen veriler) şeklinde örneklem gibi toplanmışsa elde edilen 2×2 kontenjans tablosundaki iki değişkenin bağımsız olup olmadığını sınamaktadır.

G-testleri[değiştir | kaynağı değiştir]

Ana madde: G-testleri

G-testleri "maksimum olabilirlilik" ve "olabilirlik-oranı" prensiplerine dayanan hipotez sınaması olup günümüzde Pearson'un ki-kare testi ve 2x2 kontenjans tabloları için ki-kare testleri yerine kullanılmaya başlanmıştır.

Ki-kare değerinde ile "birliktelik" ölçümü[değiştir | kaynağı değiştir]

"Ki-kare testi"'nin bağımsızlık testinin sonucu simetrik değildir; hatta "zayıftır". Eğer bağımsızlık sıfır hipotezi, test hesaplaması sonucunda kabul edilirse sonuç "güçlü"dür ve yapılan ki-kare testi sonucu uygulanmalara katkı yapabilir. Ama "sıfır hipotez" "Pearson'un ki-kare testi" sonucunda rededilirse, yani iki değişken "bağımsız değilse", sonuç "zayıf"tır. Çünkü bu iki kategorik değişkenin "birliktelikleri (associaton)" (yanı ne derecede birbirine bağımlı oldukları) bu testle öğrenilemz. Onun icin iki kategorik değişken arasında bağımsızlık sıfır hipotezi Pearson'un ki-kare testi ile rededilirse ve bu iki kategorik değişken arasında "birliktelik" (yani bağımlılık derecesi) bulunmasi icin ektara analiz uygulnamasi gerekir. Bu ekstra analiz ile iki kategorik değişken arasında "birliktelik" (İngilizce "association") katsayıları bulunması, iki niceliksel değişken arasında bulunması istenilenen korelasyon ilişkisine kavramsal olarak çok yakındır. İlk defa ortaya atılan "birliktelik" katsayıları kavramsal ve pratik olarak, önceden eldeki verilerle "hesaplanan ki-kare" değerlerini kullanmasına dayanmaktadır. Bu tip "birliktelik katasayıları" onun için, eğer "bağımsızlık bulunmazsa" ne derece bağımlılık bulmak hedefiyele yapılan ek işlemler halinde görülmektedir. Ama dshs sonradan diğer görüşlerle ede edilen "birliktelik" analizleri ve katsayısıları ortaya atılmıştır;; örneğin Goodman ve Kruskal'ın lambda katsayıları, entropi katsayısı vb.

Hesaplanan "Ki-kare" değeri kullanılarak elde edilen "birliktelik katsayı"ları değişik isimli ve nisbeten küçük fark gösteren șu nitelikli katsayilar olabilirler:

İki tane iki-değerli isimsel değişken için 2x2 kontenjans tabloları ile özetlenen veri kullanarak bulunur. Bu katsayının en yüksek değeri eldeki veri sayısina bağlı olmaktadır ve 0.707'ye esittir.

İki tane çoklu-kstegorili isimsel değişken için rxc kontenjans tabloları ile özetlenen veri kullanarak bulunur. Bu katsayının en yüksek değeri de (phi-katsayisina benzer olarak) eldeki veri sayısina ve en buyuk sayida kategori sayisina bağlı olmaktadır.

İki tane çoklu-kategorili isimsel değişken için bulunur. Bu katsayının değeri (iki niceliksel değisken arasındaki korelasyon katsayısına benzer olarak) -1 ile +1 arasında değişebilmektedir.

Bu katsayi da iki tane çoklu-kategorili isimsel değişken için bulunur ama bu katsayının değeri 0 ile +1 arasında değişebilmektedir.

Ki-kare uygunluk iyiliği sınaması[değiştir | kaynağı değiştir]

Bu tip uygunluk iyiliği sınamasi icin hesaplama yöntemi "Pearson'un ki-kare testi"'ne gayet çok benzeyerek, tek bir "kategorik veri" halinde olan kategorik değişkenin veya kontenjans tablosu içinde sıniflanma yapılarak özetlmis bir niceliksel değişken verilerinin ne türlü dağılım gösterdiğini test eder. Veriler değişkenin kategori değeri halinde özellikle "tek düze ayrık dağılım'a uygunluk", binom dağılım'a uygunluk", Poisson dağılım'a uygunluk" ve eğer normal değerler sınıflandırılıp sınıf ortalaması kategori degeri gibi kullanılırsa "normal dağılım'a uygunluk" testleri olabilirler. Bu halde dağılımı kesin belirlemek için dağılım parametreleri "sıfır hipotez" içinde verilmesi gerekir. Bu nedenle genellikle bu tip test "parametrik olmayan istatistik" olarak kabul edilmekle beraber, sıfır hipotezde anakitle parametre değerleri belirtilmesi gerektiği için "parametrik çıkartım" nitelikleri de taşımaktadır.

Varyans değeri testi[değiştir | kaynağı değiştir]

Tek niceliksel değişken verisi için basit rassal örnekleme ile elde edilen veriler, eğer yeter derecede büyük sayıda ise elde edilen örneklem özetlenme değerleri icin ornekleme varyansi hesaplanip anakitle varyansinin belirli hakkinda sinama yapmak kullanilabilir . Bu varyans değeri testi genel olarak pratikte cok kullanilmaktadir cunku verilerin varyansi hakkinda cok kere arastirma sorusu cikmamaktadir.

Diğer ki-kare testleri[değiştir | kaynağı değiştir]

  • Zaman serisi analizi konusunda zaman serisi verileri bulunan tek bir degisken icin n tane arkaya gozlenen veri serisinde 1'den baslayarak belli bir gecikmeye (pratik olarak genelikle n/3 donem gecikmeye) kadar olan otokorelasyon baglantisinin olup olmadigini bulmak icin yapilan portmanto testi.
  • "Genel istatistik modelleme" yonteminde arka arkaya birbirine "ic-ice" yuvalanmis sekilde en basit modelden daha karmasik modele gecis gerekip gerekmedigi hakkinda yeterli delil olup olmadigini test eden olabilirlik oran sınaması,


Ayrıca bakınız[değiştir | kaynağı değiştir]

Notlar[değiştir | kaynağı değiştir]

Dış bağlantılar[değiştir | kaynağı değiştir]

[[en: