Welch'in t-testi: Revizyonlar arasındaki fark

Vikipedi, özgür ansiklopedi
[kontrol edilmiş revizyon][kontrol edilmiş revizyon]
İçerik silindi İçerik eklendi
Cengiz ÖZŞALAP (mesaj | katkılar)
başlangıç devam edecem.
 
Cengiz ÖZŞALAP (mesaj | katkılar)
Bilgi ilavesi
6. satır: 6. satır:


==Hesaplamalar==
==Hesaplamalar==

Welch'in ''t''- testi istatistiği ''t'''ni aşağıdaki formüle göre tanımlar:
Welch'in ''t''- testi istatistiği ''t'''ni aşağıdaki formüle göre tanımlar:


23. satır: 24. satır:


Welch'in ''t''- testi de sıralanan veriler için hesaplanabilir ve daha sonra Welch'in ''U''- testi olarak adlandırılabilir.<ref name=Fagerland2009>{{Cite journal | last1 = Fagerland | first1 = M. W. | last2 = Sandvik | first2 = L. | title = Performance of five two-sample location tests for skewed distributions with unequal variances | journal = [[Contemporary Clinical Trials]] | volume = 30 | pages = 490–496 | year = 2009 | doi=10.1016/j.cct.2009.06.007}}</ref>
Welch'in ''t''- testi de sıralanan veriler için hesaplanabilir ve daha sonra Welch'in ''U''- testi olarak adlandırılabilir.<ref name=Fagerland2009>{{Cite journal | last1 = Fagerland | first1 = M. W. | last2 = Sandvik | first2 = L. | title = Performance of five two-sample location tests for skewed distributions with unequal variances | journal = [[Contemporary Clinical Trials]] | volume = 30 | pages = 490–496 | year = 2009 | doi=10.1016/j.cct.2009.06.007}}</ref>

==İstatistiksel test==

T ve ''<math>\nu</math>'' hesaplandıktan sonra bu istatistikler, iki popülasyon ortalamasının eşit olduğu (iki uçlu test kullanılarak) boş hipotezi test etmek için ''t''-dağılımı ile veya popülasyon ortalamalarının birinin Diğerinden büyük veya eşit (tek kuyruklu test kullanarak)olduğu alternatif hipotezler için kullanılabilir.

==Avantaj ve sınırlamalar==

Welch'in ''t''-testi Student'ın t-testinden daha sağlamdır ve eşitsiz varyansların ve eşit olmayan örneklem boyutlarının nominaline yakın tip I hata oranlarını korur.Ayrıca, popülasyon farklılıkları eşit olduğunda ve numune boyutları dengelense bile, Welch'in t-testinin gücü Student'ın t-testinin gücüne yakındır.<ref name=Ruxton2006/> Welch'in t-testi, tek yönlü varyans analizinden daha sağlam olan 2'den fazla numuneye genellenebilir.<ref name="Welch1951">{{cite journal|last1=Welch|first1=B. L.|title=On the Comparison of Several Mean Values: An Alternative Approach|journal=Biometrika|date=1951|volume=38|pages=330–336|doi=10.2307/2332579|jstor=2332579}}</ref>

Eşit farklılıkları ön teste tabi tutmak ve daha sonra Student's ''t''-testi veya Welch'in ''t''-testi arasında seçim yapmak tavsiye edilmez.<ref name=Zimmerman2004>{{Cite journal | last = Zimmerman | first = D. W. | title = A note on preliminary tests of equality of variances | journal = [[British Journal of Mathematical and Statistical Psychology]] | volume = 57 | pages = 173–181 | year = 2004 | doi = 10.1348/000711004849222}}</ref> Daha ziyade, Welch'in ''t''-testi, yukarıda belirtildiği gibi doğrudan ve Student'ın ''t''-testine herhangi bir önemli dezavantaj olmadan uygulanabilir.Welch'in t-testi çarpık dağılımlar ve büyük örnek boyutları için daha güvenilirdir.<ref name=Fagerland2012>{{Cite journal | last = Fagerland | first = M. W. | title = t-tests, non-parametric tests, and large studies—a paradox of statistical practice? | journal = [[BioMed Central]] Medical Research Methodology | volume = 12 | pages = 78 | year = 2012 | doi = 10.1186/1471-2288-12-78}}</ref> Sıralanan dağılımlar ve daha küçük örnekler için güvenilirlik azalır ve burada Welch'in sıralanmış veriler üzerinde ''t'' testi yapılabilir. <ref name=Fagerland2009/>

==Örnekler==

Aşağıdaki üç örnek Welch'in ''t''-testi ve Student'ın ''t''-testini karşılaştırmaktadır. Örnekler, R programlama dili kullanılarak rasgele normal dağılımlardan alınmıştır.

Üç örnek için de nüfus ortalamaları <math>\mu_1 = 20</math> and <math>\mu_2 = 22</math> dir.

İlk örnek eşit varyans (<math>\sigma_1^2 = \sigma_2^2 = 4</math>) ve eşit örnek büyüklükleri (<math>N_1 = N_2 = 15</math>) içindir. iki rassal numuneyi A1 ve A2 olarak belirtelim:


: <math>A_1 = \{27.5, 21.0, 19.0, 23.6, 17.0, 17.9, 16.9, 20.1, 21.9, 22.6, 23.1, 19.6, 19.0, 21.7, 21.4\}</math>

: <math>A_2 = \{27.1, 22.0, 20.8, 23.4, 23.4, 23.5, 25.8, 22.0, 24.8, 20.2, 21.9, 22.1, 22.9, 20.5, 24.4\}</math>


İkinci örnek eşit olmayan varyanslar(<math>\sigma_1^2 = 16</math>, <math>\sigma_2^2 = 1</math>) ve eşit olmayan örnek büyüklükleri içindir (<math>N_1 = 10</math>, <math>N_2 = 20</math>). Küçük örnek daha büyük varyansa sahiptir:


: <math>\begin{align}
A_1 &= \{17.2, 20.9, 22.6, 18.1, 21.7, 21.4, 23.5, 24.2, 14.7, 21.8\}
\\
A_2 &= \{21.5, 22.8, 21.0, 23.0, 21.6, 23.6, 22.5, 20.7, 23.4, 21.8, 20.7, 21.7, 21.5, 22.5, 23.6, 21.5, 22.5, 23.5, 21.5, 21.8\}
\end{align}</math>


Üçüncü örnek eşit olmayan varyanslar (<math>\sigma_1^2 = 1</math>, <math>\sigma_2^2 = 16</math>) ve eşit olmayan örnek boyutları içindir (<math>N_1 = 10</math>, <math>N_2 = 20</math>). Büyük örneklemin daha büyük varyansı vardır:

: <math>\begin{align}
A_1 &= \{19.8, 20.4, 19.6, 17.8, 18.5, 18.9, 18.3, 18.9, 19.5, 22.0\}
\\
A_2 &= \{28.2, 26.6, 20.1, 23.3, 25.2, 22.1, 17.7, 27.6, 20.6, 13.7, 23.2, 17.5, 20.6, 18.0, 23.9, 21.6, 24.3, 20.4, 24.0, 13.2\}
\end{align}</math>


Referans p-değerleri, eşit popülasyon araçlarının boş hipotez için (<math>\mu_1 - \mu_2 =0</math>) ''t'' istatistiklerinin dağılımlarını simüle ederek elde edildi. Sonuçlar, aşağıdaki tabloda çift-kuyruklu p-değerleri ile özetlenmiştir:


{| border="1" cellspacing="0" cellpadding="5" align="center" class="wikitable"
|-
! colspan="1" |
! colspan="3" align="center" | Sample A1
! colspan="3" align="center" | Sample A2
! colspan="4" align="center" | Student's ''t''-test
! colspan="4" align="center" | Welch's ''t''-test
|-
! align="center" | Example
! align="center" | <math>N_1</math> || align="center" | <math>\overline{X}_1</math> || align="center" | <math>s_1^2</math>
! align="center" | <math>N_2</math> || align="center" | <math>\overline{X}_2</math> || align="center" | <math>s_2^2</math>
! align="center" | {{tmath|t}} || align="center" | {{tmath|\nu}} || align="center" | {{tmath|P}} || align="center" | <math>P_\mathrm{sim}</math>
! align="center" | {{tmath|t}} || align="center" | {{tmath|\nu}} || align="center" | {{tmath|P}} || align="center" | <math>P_\mathrm{sim}</math>
|-
| 1 || 15 || 20.8 || 7.9 || 15 || 23.0 || 3.8 || −2.46 || 28 || 0.021 || 0.021 || −2.46 || 25.0 || 0.021 || 0.017
|-
| 2 || 10 || 20.6 || 9.0 || 20 || 22.1 || 0.9 || −2.10 || 28 || 0.045 || 0.150 || −1.57 || 9.9 || 0.149 || 0.144
|-
| 3 || 10 || 19.4 || 1.4 || 20 || 21.6 || 17.1 || −1.64 || 28 || 0.110 || 0.036 || −2.22 || 24.5 || 0.036 || 0.042
|-
|}

Welch'in '' t '' - testi ve Student'ın '' t '' - testi, eşit varyans ve eşit örnek büyüklüğüne sahip iki örnek için pratik olarak aynı sonuçları verdi (Örnek 1). Eşit olmayan varyanslar için, Student'in ''t''- testi, küçük örneklemin daha büyük bir varyansa (Örnek 2) ve daha büyük bir örneğin daha büyük bir varyansa sahip olduğu (örnek 3) yüksek bir p-değeri verdi. Eşit olmayan varyanslar için, Welch'in ''t''- testi, simüle edilen p-değerlerine yakın p-değerleri verdi.


==Yazılım Uygulamaları==
{| class="wikitable sortable"
|-
! Language/Program !! Function !! Notes
|-
| [[LibreOffice]] || <code>TTEST(''Data1; Data2; Mode; Type'')</code> || See [https://help.libreoffice.org/Calc/Statistical_Functions_Part_Five#TTEST]
|-
| [[MATLAB]] || <code>ttest2(data1, data2, 'Vartype', 'unequal')</code> || See [http://uk.mathworks.com/help/stats/ttest2.html]
|-
| [[Microsoft Excel]] pre 2010 || <code>TTEST(''array1'', ''array2'', ''tails'', ''type'')</code> || See [http://office.microsoft.com/en-us/excel-help/ttest-HP005209325.aspx]
|-
| [[Microsoft Excel]] 2010 and later || <code>T.TEST(''array1'', ''array2'', ''tails'', ''type'')</code> || See [http://office.microsoft.com/en-us/excel-help/t-test-function-HA102753135.aspx]
|-
| [[Python (programming language)|Python]] || <code>scipy.stats.ttest_ind(''a'', ''b'', ''axis=0'', ''equal_var=False'')</code> || See [http://docs.scipy.org/doc/scipy/reference/generated/scipy.stats.ttest_ind.html]
|-
| [[R (programming language)|R]] || <code>t.test(data1, data2, alternative="two.sided", var.equal=FALSE)</code> || See [https://stat.ethz.ch/R-manual/R-devel/library/stats/html/t.test.html]
|-
| [[Julia (programming language)|Julia]] || <code> UnequalVarianceTTest(data1, data2)</code> || See [http://hypothesistestsjl.readthedocs.org/en/latest/index.html]
|-
|[[Stata]]
|'''ttest''' ''varname1'' '''==''' ''varname2''''',''' '''welch'''
|See [http://www.stata.com/help.cgi?ttest 8]
|}


==Ayrıca Bakınız==

{{Portal|Statistics}}
* [[Student'in t testi]]

==Referans==
{{Reflist|30em}}

[[Category:İstatistik]]

Sayfanın 20.56, 28 Kasım 2016 tarihindeki hâli

İstatistikte, Welch'in t-testi veya eşitsiz varyans t-testi, iki popülasyonun eşit araçlara sahip olduğu hipotezini test etmek için kullanılan iki örneklemli bir konum testidir. Welch'in t-testi, Student'ın t-testinin uyarlanmasıdır,[1] Yani, Student'ın t testi yardımıyla türetilmiştir ve iki numunenin eşitsiz varyanslara ve eşit olmayan örneklem boyutlarına sahip olması durumunda daha güvenilirdir.[2] Bu testlere, genellikle, karşılaştırılan iki numunenin altında yatan istatistiksel birimler çakışmaz olduğunda tipik olarak uygulandığı için "eşleştirilmemiş" veya "bağımsız örnekler" "t" testleri olarak adlandırılır.Welch'in t-testinin Student'ın t-testinden[2] daha az popüler olduğu ve okuyuculara daha az tanıdığı göz önüne alındığında, kısaca "Welch'in eşitsiz varyans t-testi" veya "eşitsiz varyans t -testi" daha bilgilendirici bir addır.

Varsayımlar

Student'ın t-testi, iki popülasyonun normal dağılımlara ve eşit varyansa sahip olduğunu varsayar. Welch'in t- testi, eşit olmayan varyanslar için tasarlanmıştır, ancak normalite varsayımı korunmaktadır.[1] Welch'in t-testi, Behrens-Fisher problemi için yaklaşık bir çözümdür.

Hesaplamalar

Welch'in t- testi istatistiği t'ni aşağıdaki formüle göre tanımlar:

, and sırasıyla birinci örnek ortalaması, örnek varyansı ve örnek büyüklüğüdür.Student'ın t-testinden farklı olarak, payda birleştirilmiş varyans tahmine dayalı değildir. Bu varyans tahminiyle ilişkili serbestlik dereceleri , Welch-Satterthwaite denklemi kullanılarak yaklaştırılır:

Burada , ilk varyans tahmini ile ilişkili serbestlik derecelerini, ,ikinci varyans tahminiyle ilişkili serbestlik derecelerini ifade etmektedir.

Welch'in t- testi de sıralanan veriler için hesaplanabilir ve daha sonra Welch'in U- testi olarak adlandırılabilir.[3]

İstatistiksel test

T ve hesaplandıktan sonra bu istatistikler, iki popülasyon ortalamasının eşit olduğu (iki uçlu test kullanılarak) boş hipotezi test etmek için t-dağılımı ile veya popülasyon ortalamalarının birinin Diğerinden büyük veya eşit (tek kuyruklu test kullanarak)olduğu alternatif hipotezler için kullanılabilir.

Avantaj ve sınırlamalar

Welch'in t-testi Student'ın t-testinden daha sağlamdır ve eşitsiz varyansların ve eşit olmayan örneklem boyutlarının nominaline yakın tip I hata oranlarını korur.Ayrıca, popülasyon farklılıkları eşit olduğunda ve numune boyutları dengelense bile, Welch'in t-testinin gücü Student'ın t-testinin gücüne yakındır.[2] Welch'in t-testi, tek yönlü varyans analizinden daha sağlam olan 2'den fazla numuneye genellenebilir.[4]

Eşit farklılıkları ön teste tabi tutmak ve daha sonra Student's t-testi veya Welch'in t-testi arasında seçim yapmak tavsiye edilmez.[5] Daha ziyade, Welch'in t-testi, yukarıda belirtildiği gibi doğrudan ve Student'ın t-testine herhangi bir önemli dezavantaj olmadan uygulanabilir.Welch'in t-testi çarpık dağılımlar ve büyük örnek boyutları için daha güvenilirdir.[6] Sıralanan dağılımlar ve daha küçük örnekler için güvenilirlik azalır ve burada Welch'in sıralanmış veriler üzerinde t testi yapılabilir. [3]

Örnekler

Aşağıdaki üç örnek Welch'in t-testi ve Student'ın t-testini karşılaştırmaktadır. Örnekler, R programlama dili kullanılarak rasgele normal dağılımlardan alınmıştır.

Üç örnek için de nüfus ortalamaları and dir.

İlk örnek eşit varyans () ve eşit örnek büyüklükleri () içindir. iki rassal numuneyi A1 ve A2 olarak belirtelim:



İkinci örnek eşit olmayan varyanslar(, ) ve eşit olmayan örnek büyüklükleri içindir (, ). Küçük örnek daha büyük varyansa sahiptir:



Üçüncü örnek eşit olmayan varyanslar (, ) ve eşit olmayan örnek boyutları içindir (, ). Büyük örneklemin daha büyük varyansı vardır:


Referans p-değerleri, eşit popülasyon araçlarının boş hipotez için () t istatistiklerinin dağılımlarını simüle ederek elde edildi. Sonuçlar, aşağıdaki tabloda çift-kuyruklu p-değerleri ile özetlenmiştir:


Sample A1 Sample A2 Student's t-test Welch's t-test
Example
1 15 20.8 7.9 15 23.0 3.8 −2.46 28 0.021 0.021 −2.46 25.0 0.021 0.017
2 10 20.6 9.0 20 22.1 0.9 −2.10 28 0.045 0.150 −1.57 9.9 0.149 0.144
3 10 19.4 1.4 20 21.6 17.1 −1.64 28 0.110 0.036 −2.22 24.5 0.036 0.042

Welch'in t - testi ve Student'ın t - testi, eşit varyans ve eşit örnek büyüklüğüne sahip iki örnek için pratik olarak aynı sonuçları verdi (Örnek 1). Eşit olmayan varyanslar için, Student'in t- testi, küçük örneklemin daha büyük bir varyansa (Örnek 2) ve daha büyük bir örneğin daha büyük bir varyansa sahip olduğu (örnek 3) yüksek bir p-değeri verdi. Eşit olmayan varyanslar için, Welch'in t- testi, simüle edilen p-değerlerine yakın p-değerleri verdi.


Yazılım Uygulamaları

Language/Program Function Notes
LibreOffice TTEST(Data1; Data2; Mode; Type) See [1]
MATLAB ttest2(data1, data2, 'Vartype', 'unequal') See [2]
Microsoft Excel pre 2010 TTEST(array1, array2, tails, type) See [3]
Microsoft Excel 2010 and later T.TEST(array1, array2, tails, type) See [4]
Python scipy.stats.ttest_ind(a, b, axis=0, equal_var=False) See [5]
R t.test(data1, data2, alternative="two.sided", var.equal=FALSE) See [6]
Julia UnequalVarianceTTest(data1, data2) See [7]
Stata ttest varname1 == varname2, welch See 8


Ayrıca Bakınız

Şablon:Portal

Referans

  1. ^ a b Welch, B. L. (1947). "The generalization of "Student's" problem when several different population variances are involved". Biometrika. 34 (1–2): 28–35. doi:10.1093/biomet/34.1-2.28. MR 0019277. 
  2. ^ a b c Ruxton, G. D. (2006). "The unequal variance t-test is an underused alternative to Student's t-test and the Mann–Whitney U test". Behavioral Ecology. 17: 688–690. doi:10.1093/beheco/ark016. 
  3. ^ a b Fagerland, M. W.; Sandvik, L. (2009). "Performance of five two-sample location tests for skewed distributions with unequal variances". Contemporary Clinical Trials. 30: 490–496. doi:10.1016/j.cct.2009.06.007. 
  4. ^ Welch, B. L. (1951). "On the Comparison of Several Mean Values: An Alternative Approach". Biometrika. 38: 330–336. doi:10.2307/2332579. JSTOR 2332579. 
  5. ^ Zimmerman, D. W. (2004). "A note on preliminary tests of equality of variances". British Journal of Mathematical and Statistical Psychology. 57: 173–181. doi:10.1348/000711004849222. 
  6. ^ Fagerland, M. W. (2012). "t-tests, non-parametric tests, and large studies—a paradox of statistical practice?". BioMed Central Medical Research Methodology. 12: 78. doi:10.1186/1471-2288-12-78.