Welch'in t-testi

Vikipedi, özgür ansiklopedi
Gezinti kısmına atla Arama kısmına atla

İstatistikte, Welch'in t-testi veya eşitsiz varyans t-testi, iki popülasyonun eşit araçlara sahip olduğu hipotezini test etmek için kullanılan iki örneklemli bir konum testidir. Welch'in t-testi, Student'ın t-testinin uyarlanmasıdır,[1] Yani, Student'ın t testi yardımıyla türetilmiştir ve iki numunenin eşitsiz varyanslara ve eşit olmayan örneklem boyutlarına sahip olması durumunda daha güvenilirdir.[2] Bu testlere, genellikle, karşılaştırılan iki numunenin altında yatan istatistiksel birimler çakışmaz olduğunda tipik olarak uygulandığı için "eşleştirilmemiş" veya "bağımsız örnekler" "t" testleri olarak adlandırılır.Welch'in t-testinin Student'ın t-testinden[2] daha az popüler olduğu ve okuyuculara daha az tanıdığı göz önüne alındığında, kısaca "Welch'in eşitsiz varyans t-testi" veya "eşitsiz varyans t -testi" daha bilgilendirici bir addır.

Varsayımlar[değiştir | kaynağı değiştir]

Student'ın t-testi, iki popülasyonun normal dağılımlara ve eşit varyansa sahip olduğunu varsayar. Welch'in t- testi, eşit olmayan varyanslar için tasarlanmıştır, ancak normalite varsayımı korunmaktadır.[1] Welch'in t-testi, Behrens-Fisher problemi için yaklaşık bir çözümdür.

Aspin ve Welch gibi bazı yazarlar, Welch istatistiklerinde serbestlik derecelerini (df) elde etmek için yöntemler sundular. Keselman ve ark., formüllerin hiçbiri kesinlikle doğru df sağlamaz ve bu nedenle yaklaşık df (ADF) olarak adlandırılırlar. Yaygın olarak kullanılan formül Welch tarafından önerilmiştir. Bu varyans tahmini ile ilişkili serbestlik dereceleri, Welch-Satterthwaite denklemi kullanılarak örnek verilerden yaklaşıklandırılır.[3]

Hesaplamalar[değiştir | kaynağı değiştir]

Welch'in t- testi istatistiği t'ni aşağıdaki formüle göre tanımlar:

, and sırasıyla birinci örnek ortalaması, örnek varyansı ve örnek büyüklüğüdür.Student'ın t-testinden farklı olarak, payda birleştirilmiş varyans tahmine dayalı değildir. Bu varyans tahminiyle ilişkili serbestlik dereceleri , Welch-Satterthwaite denklemi kullanılarak yaklaştırılır:

Burada , ilk varyans tahmini ile ilişkili serbestlik derecelerini, ,ikinci varyans tahminiyle ilişkili serbestlik derecelerini ifade etmektedir.

Welch'in t- testi de sıralanan veriler için hesaplanabilir ve daha sonra Welch'in U- testi olarak adlandırılabilir.[4]

İstatistiksel test[değiştir | kaynağı değiştir]

T ve hesaplandıktan sonra bu istatistikler, iki popülasyon ortalamasının eşit olduğu (iki uçlu test kullanılarak) boş hipotezi test etmek için t-dağılımı ile veya popülasyon ortalamalarının birinin Diğerinden büyük veya eşit (tek kuyruklu test kullanarak)olduğu alternatif hipotezler için kullanılabilir.

Avantaj ve sınırlamalar[değiştir | kaynağı değiştir]

Welch'in t-testi Student'ın t-testinden daha sağlamdır ve eşitsiz varyansların ve eşit olmayan örneklem boyutlarının nominaline yakın tip I hata oranlarını korur.Ayrıca, popülasyon farklılıkları eşit olduğunda ve numune boyutları dengelense bile, Welch'in t-testinin gücü Student'ın t-testinin gücüne yakındır.[2] Welch'in t-testi, tek yönlü varyans analizinden daha sağlam olan 2'den fazla numuneye genellenebilir.[5]

Eşit farklılıkları ön teste tabi tutmak ve daha sonra Student's t-testi veya Welch'in t-testi arasında seçim yapmak tavsiye edilmez. Daha ziyade, Welch'in t-testi, yukarıda belirtildiği gibi doğrudan ve Student'ın t-testine herhangi bir önemli dezavantaj olmadan uygulanabilir. Yer belirleme testinden önce kullanılan eşitliğin eşitliği için yapılan ön testler istatistikçiler tarafından artık yaygın olarak önerilmez; ancak bazı ek kitaplar ve yazılım paketlerinde de geçerlidir. Simülasyonlar, iki aşamalı prosedürün, önem seviyesini korumakta başarısız olduğunu ve genellikle durumun daha da kötüsü ön testlerin sıklıkla testin boyutunu olumsuz etkilediğini ve varyansların eşit olmadığı durumlarda Welch t-testinin Student t-testinden üstün olduğunu göstermiştir. Mevcut simülasyonlar, örneklem boyutları daha küçük olduğunda, varyanslar arasındaki farkın aşırı olmadığından daha hafif olduğu ve anlamlılık seviyesinin daha katı olduğu zaman hata oranlarındaki değişimlerin daha fazla olduğunu ortaya koymaktadır. Dahası, Welch t-testinin geçerliliği, yalnızca bir ön testin gerekli olduğunu belirttiği durumlarda kullanıldığında bozulur. Numune boyutları eşitsiz olduğunda koşulsuz olarak ayrı bir varyans testi kullanılarak optimum koruma sağlanır.[6] Welch'in t-testi çarpık dağılımlar ve büyük örnek boyutları için daha güvenilirdir.[7] Sıralanan dağılımlar ve daha küçük örnekler için güvenilirlik azalır ve burada Welch'in sıralanmış veriler üzerinde t testi yapılabilir.[4]

Örnekler[değiştir | kaynağı değiştir]

Aşağıdaki üç örnek Welch'in t-testi ve Student'ın t-testini karşılaştırmaktadır. Örnekler, R programlama dili kullanılarak rastgele normal dağılımlardan alınmıştır.

Üç örnek için de nüfus ortalamaları and dir.

İlk örnek eşit varyans () ve eşit örnek büyüklükleri () içindir. iki rassal numuneyi A1 ve A2 olarak belirtelim:

İkinci örnek eşit olmayan varyanslar(, ) ve eşit olmayan örnek büyüklükleri içindir (, ). Küçük örnek daha büyük varyansa sahiptir:

Üçüncü örnek eşit olmayan varyanslar (, ) ve eşit olmayan örnek boyutları içindir (, ). Büyük örneklemin daha büyük varyansı vardır:

Referans p-değerleri, eşit popülasyon araçlarının boş hipotez için () t istatistiklerinin dağılımlarını simüle ederek elde edildi. Sonuçlar, aşağıdaki tabloda çift-kuyruklu p-değerleri ile özetlenmiştir:

Sample A1 Sample A2 Student's t-test Welch's t-test
Example
1 15 20.8 7.9 15 23.0 3.8 −2.46 28 0.021 0.021 −2.46 25.0 0.021 0.017
2 10 20.6 9.0 20 22.1 0.9 −2.10 28 0.045 0.150 −1.57 9.9 0.149 0.144
3 10 19.4 1.4 20 21.6 17.1 −1.64 28 0.110 0.036 −2.22 24.5 0.036 0.042

Welch'in t - testi ve Student'ın t - testi, eşit varyans ve eşit örnek büyüklüğüne sahip iki örnek için pratik olarak aynı sonuçları verdi (Örnek 1). Eşit olmayan varyanslar için, Student'in t- testi, küçük örneklemin daha büyük bir varyansa (Örnek 2) ve daha büyük bir örneğin daha büyük bir varyansa sahip olduğu (örnek 3) yüksek bir p-değeri verdi. Eşit olmayan varyanslar için, Welch'in t- testi, simüle edilen p-değerlerine yakın p-değerleri verdi.

Yazılım Uygulamaları[değiştir | kaynağı değiştir]

Language/Program Function Notes
LibreOffice TTEST(Data1; Data2; Mode; Type) See [1]
MATLAB ttest2(data1, data2, 'Vartype', 'unequal') See [2]
Microsoft Excel pre 2010 TTEST(array1, array2, tails, type) See [3]
Microsoft Excel 2010 and later T.TEST(array1, array2, tails, type) See [4]
Python scipy.stats.ttest_ind(a, b, axis=0, equal_var=False) See [5]
R t.test(data1, data2, alternative="two.sided", var.equal=FALSE) See [6]
Julia UnequalVarianceTTest(data1, data2) See [7]
Stata ttest varname1 == varname2, welch See 8

Ayrıca bakınız[değiştir | kaynağı değiştir]

Referans[değiştir | kaynağı değiştir]

  1. ^ a b Welch, B. L. (1947). "The generalization of "Student's" problem when several different population variances are involved". Biometrika. 34 (1–2), s. 28–35. doi:10.1093/biomet/34.1-2.28. MR 0019277. 
  2. ^ a b c Ruxton, G. D. (2006). "The unequal variance t-test is an underused alternative to Student's t-test and the Mann–Whitney U test". Behavioral Ecology. Cilt 17, s. 688–690. doi:10.1093/beheco/ark016. 
  3. ^ Ahad, Nor Aishah; Yahaya, Sharipah Soaad Syed (2014). Sensitivity Analysis of Welch’s t -Test. AIP Publishing LLC. ss. 888-893. 
  4. ^ a b Fagerland, M. W.; Sandvik, L. (2009). "Performance of five two-sample location tests for skewed distributions with unequal variances". Contemporary Clinical Trials. Cilt 30, s. 490–496. doi:10.1016/j.cct.2009.06.007. 
  5. ^ Welch, B. L. (1951). "On the Comparison of Several Mean Values: An Alternative Approach". Biometrika. Cilt 38, s. 330–336. doi:10.2307/2332579. JSTOR 2332579. 
  6. ^ Zimmerman, D. W. (2004). "A note on preliminary tests of equality of variances". British Journal of Mathematical and Statistical Psychology. Cilt 57, s. 173–181. doi:10.1348/000711004849222. 
  7. ^ Fagerland, M. W. (2012). "t-tests, non-parametric tests, and large studies—a paradox of statistical practice?". BioMed Central Medical Research Methodology. Cilt 12, s. 78. doi:10.1186/1471-2288-12-78.