Varyans analizi
|
|
Bu madde Vikipedi standartlarına uygun değildir. (Mayıs 2013) |
Varyans Analizi (veya ANOVA, Ingılızce "analysis of variance" sözcüklerinin kısaltması) istatistik bilim dalında, gözümlenen varyansı çeşitli kısımlara ayırma yöntemiyle, bazı değişkenlerin başka bir değişken üzerindeki etkisini incelemeye yarayan bir grup modelleme türü ve bu modellerle ilişkili işlemlere verilen genel isimdir. Bu tür modeller gözümlenen varyansın çeşitli açıklayıcı değişkenlerin etki parçalarına bölmesini incelerler.
Daha kısacası, ANOVA bir parametrik çıkarımsal metodu olup anakütle ortalamaları arasında farkın olup olmadığını sınamak için kullanılir.. Örneğin, 'Opel ile Toyota marka araçların benzin tüketim ortalamaları aynıdır' H0 hipotezinin sınaması yapılır. Sonuç, "ortalamalar aynıdır" veya "ortalamalar ayni değildir" şeklinde çıkartılır. Bu analizdeki iki değişken arasinda lineer bağlantı icin (regresyon analizinde yapildigi gibi) herhangi bir eğim katsayısı bulunmadığı kabul edilir. ANOVA analizi yapılabilmesi için en temel şart, ortalamaları incelenecek olan anakütlelerin varyanslarının aynı olmasıdır.
Bu yöntem ilk defa İngiliz istatistikçi ve genetikçi Ronald Fisher tarafından 1920'lı ve 1930'lu yıllarda geliştirilmiştir. Genel olarak istatistiksel anlamlılık sınamaları içinde F-dağılımını kullanmaları ile karakterize edildikleri için bazan bu analize Fisher'in varyans analizi adı da verilmektedir.
Konu başlıkları |
Genel bakış [değiştir]
Bu tür modeller için üç kavramsal sınıf ayrımı yapılabilir:
- Sabit etki modelleri, verinin normal dağılım gösteren bir anakütleden geldiğini ve ancak farklı ortalamalar dolayısıyla ayrım yapılabileceğini varsaymaktadırlar.
- Rasgele etki modelleri, verinin bir farklar hiyerarşisi ile sınırlanmış olan değişik hiyerarşi içeren anakütlelerden geldiğini varsayar.
- Karışık etki modelleri, içinde hem sabit etkiler hem de rastgele etkiler kapsayan durumları inceler.
Pratik problemlerde varyans analizi deneylemler için kullanılır ve deneylem elemanlarına uygulanan sağlatımların sayısına ve nasıl uygulandıklarına göre birkaç değişik tipe sınıflandırılmaktadırlar:
Tek-yönlü varyans analizi [değiştir]
- Ana madde: Tek-yönlü varyans analizi
Bu tür analiz iki veya daha çok sayıda bağımsız grup arasındaki farklılıkların sınanması istenildiği hallerde uygulanır. Tıpık olarak tek yönlü varyans analizi en aşağı üç değişik grup olduğu zaman uygulanmaktadır. İki-grup halinde daha kolay olarak t-sınaması aynı sonuçları vermektedir; çünkü bu halde t-sınaması ve F-sınaması birbirine çok yakından ilişkilidir. Bu yakın ilişki şöyle ifade edilir:
.
Tekrarlanan ölçülerle tek-yönlü varyans analizi [değiştir]
Bu tür varyans analizinde aynı elamanlara her değişik sağlatım uygulanır, yani elamanlar tekrarlanan ölçülere tabi tutulurlar. Bu yöntem kullanılırken elemanlar kalıntı etkilerine maruz kalabilirler.
Faktōryel varyans analizi [değiştir]
- Ana madde: Faktŏryel varyans analizi
Bu tür varyans analizi eğer deneyci iki veya daha çok sayıda sağlanım (bağımsız) değişkenin etkilerini incelemek isterse kullanılır. En çok kullanılan faktōryel varyans analizi iki bağımsız değişken ve her değişken için iki değişik değer veya seviye olduğu 2x2 (ikiye iki) tasarımdır. Faktōryel varyans analizi çoklu seviyeli, 3x3 (üçe üç) veya daha yüksek sıralı 2x2x2 (ikiye ikiye iki) v.b. deneylem tasarımlarında da kullanılabilirler. Ancak bu daha yüksek sayıda faktörler için analizler çok nadir olarak yapılmaktadır. Buna neden hesapların çok karmaşık ve uzun olması ve ortaya çıkartılan sonuçların açıklanmalarının çok zor olduğudur.
Karışık tasarım varyans analizi [değiştir]
- Ana madde: Karışık tasarım varyans analizi
Eğer iki veya daha çok sayıda bağımsız gruplar elemanlarına tekrar edilen ölçüler uygulayıp sınanmak istenirse, bir faktöryel karışık tasarım varyans analizi gerçekleştirilebilinir. Bunda bir faktör bağımsız olur ve diğer faktör tekrar edilebilir ölçülere bağlıdır. Bu, karışık etkiler modeline bir örnektir.
Çoklu değişirli varyans analizi [değiştir]
- Ana madde: Çoklu değişirli varyans analizi
Birden çok bağımlı değişken bulunduğu zaman bu tür varyans analizi kullanılır.
Modeller [değiştir]
Sabit etkiler modelleri [değiştir]
- Ana madde: sabit etkiler kestirimi
Varyans analizi içinde sabit etkiler modeli, bir deneylem içinde deneycinin deney örneklem elemanlarına yanıt değişkeni değerlerinin birkaç değişik sağlanım uyguladığı zaman değişip değişmediğini incelemek istediği hallere tatbik edilir. Bu modeller deneyciye sağlanımın tüm anakütle içinde ortaya çıkarabileceği yanıt değişken değerlerinin açıklığını kestirim yapma imkâni sağlar.
Rastgele etkiler modelleri [değiştir]
- Ana madde: rastgele etkiler kestirimi
Rastgele etkiler modelleri, sağlanımlar sabit olmadıkları hallerde kullanılırlar. Bu (faktör seviyeleri adı ile de bilinen) değişik sağlanımlar daha büyük bir anakütleden örneklem ile bulunmaları halidir. Sağlanımları kendileri rassal değişken olmaları nedeniyle, sabit etkiler modelinden daha değişik bazı varsayımların ve sağlanımların karşılaştırılmaları gerekmektedir.
Rastgele etkiler modelerinin veya karışık etki modellerinin çoğunda iyi belirenmiş örneklemi alınmış faktörleri ilgilendiren çıkarımsal istatistik analizlerle ilgili değildir. Bunu bir orneğinle açıklamak şöyle yapilabilir: Aynı mali üretmek için çok değişik makinaların kullanıldığı bir sanayi birimi ele alınsın. Bu işletmeyi inceleyen istatisikçi üç değişik makinenin birbirleri ile karşılaştırılması ile ilgilenmesi uygulanabilen pratik bir problem degildir. Buna karşılık tüm makinalar hakkında, tüm ortalama üretkenlik ve değişik makinelerde üretkenliğin yayılımı hakkında çıkarımsal istatistik analizi sınamalar arastirmaciyi ilgilendiren bir sorun olabilir.
ĭ== Varsayımlar ==
- İstatistiksel bağımsızlık: Bu varsayım deneylem tasarımı için gerekmekte ve sağlatım uygulanan elamanların bağımsız oldukları varsayılmaktadır.
- Normallik: Her bir grup içindeki elamanların normal dağılım gösteren anakütlelerden geldikleri varsayılır. Verilerinin normallik özelliği olup olmadığı ya normallik sınamaları olan Kolmogorov-Şmirnov sınaması veya Shapiro-Wilk sınaması kullanılarak incelenebilir. Normallik varsayımını incelemek için parametrik olmayan istatistik sınaması olan Kruskal-Wallis sınaması da kullanılabilir.
- Eşit varyanslar veya heteroskedastiklik: Homoskadastiklik halinde her bir grup elemanlarının geldikleri anakütlelerde varyansların aynı olduğu varsayılır. Verilerin eşit varyanslar varsayımına uyup uymadıklarını sınamak için tipik olarak Levene'in sınamasi kullanılır. Ama "Levene'in sinamasi" icin grup gözlem sayılarınin eşit olmasi gerekir. Daha degisik hallerde eger gruplarda sapan değer yoksa "Bartlet Sinamasi" veya gruplarda gözlem sayıları eşitse "Cochran Varyans Eşitliği Sinamasi" kullanılır.
Bazı istatistikçiler verilerin normallikten ayrılması halinde varyans analizinin esası olan F-sınaması'nın güvenilmez olacağını bildirmektedir [1]. Diğer istatistikçiler ise F-sınamasının "güçlü olduğunu", yani normal olmamakdan fazla etkilenmediğini savunmaktadırlar.[2]
Bu ortak varsayımlar yanında sabit etki modelleri için hataların bağımsız ve aynı şekilde normal dağılım gösterdikleri de, yani
olduğu varsayılmaktadır. Varyans analizi için kullanılan rastgele etki modelleri ve karışık etki modelleri için hataların ortalama ve varyansi için daha karmaşık varsayımlar gerekmektedir çünkü faktörler kendilerine özel dağılımlardan ortaya çıkartılabilirler.
Varyans analizinin inceleme yaklaşımı [değiştir]
Varyans analizinde temel yöntem, toplam kareler toplamını modelde kullanılan etkilere uygun olan parçalara bölmektir. Bu yönteme aşağıda verilen örnek tek bir sağlatımın değişik seviyelere uygulanması halidir.
Kareler toplamının parçalara bölünmesi [değiştir]
Örnek olarak tek bir sağlatımın değişik seviyeler uygulanması sonucu ortaya çıkan toplam kareler toplamı şu parçalara bölünür:
Serbestlik dereceleri de aynı şekilde parçalara bölünmektedir ve her ilgili parçanın bir ki-kare dağılımı gösterdiği belirlenmektedir.
F-sınaması [değiştir]
- Ana madde: F-sınaması
Toplam sapmanın parçalarının karşılaştırılması için F-sınaması uygulanır. Tek yönlü veya tek faktörlü varyans analizi için istatistik anlamlılığın sınanması, F-sınama istatistiği olan şu

- burada:
, İ = sağlatımlar sayısı- ve
, nT = toplam gözlem eleman sayısı
ifade ile I-1 ve nT serbestlik derecelerinde F-dağılımı ifadesini karşılaştırmak suretiyle gerçekleştirilir.
F-dağılımı kullanmak doğal bir uygulamadır, çünkü sınama istatistiği her biri ki-kare dağılımı gösteren iki kareler toplamları ortalamasının bir diğerine bölümüne eşittir.
Ayrıca bakınız [değiştir]
Kaynakça [değiştir]
Dış kaynaklar [değiştir]
- Oxford Üniversitesi psikoloji bölümü öğrencileri için varyans analizine giriş dersi (İngilizce) (Erişim:17.3.2010)
- Rasgeleleştirilmiş blok, ayırılmış parseller, tekrarlanan ölçüler ve Latin kareler deneylem tasarımlarını kapsayan üç sağlatıma kadar tüm varyans analizi ve çoklu değişirli varyans analizi modelleri için örnekler (İngilizce) (Erişim:17.3.2010)
- NİST/SEMATECH e-Handbook of Statistical Methods, section 7.4.3: "Are the means equal?" İstatistik Yöntemler Kılavuzu. (İngilizce) (Erişim:17.3.2010)
- TDS1 Belirsizlik Hesaplayıcısı (İngilizce) (Erişim:17.3.2010)
|
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
.



, İ = sağlatımlar sayısı
, nT = toplam gözlem eleman sayısı