Welch'in t-testi: Revizyonlar arasındaki fark

[kontrol edilmiş revizyon]

İçerik silindi İçerik eklendi

Satır içi

Sayfanın 20.56, 28 Kasım 2016 tarihindeki hâli

İstatistikte, Welch'in t-testi veya eşitsiz varyans t-testi, iki popülasyonun eşit araçlara sahip olduğu hipotezini test etmek için kullanılan iki örneklemli bir konum testidir. Welch'in t-testi, Student'ın t-testinin uyarlanmasıdır,^[1] Yani, Student'ın t testi yardımıyla türetilmiştir ve iki numunenin eşitsiz varyanslara ve eşit olmayan örneklem boyutlarına sahip olması durumunda daha güvenilirdir.^[2] Bu testlere, genellikle, karşılaştırılan iki numunenin altında yatan istatistiksel birimler çakışmaz olduğunda tipik olarak uygulandığı için "eşleştirilmemiş" veya "bağımsız örnekler" "t" testleri olarak adlandırılır.Welch'in t-testinin Student'ın t-testinden^[2] daha az popüler olduğu ve okuyuculara daha az tanıdığı göz önüne alındığında, kısaca "Welch'in eşitsiz varyans t-testi" veya "eşitsiz varyans t -testi" daha bilgilendirici bir addır.

Varsayımlar

Student'ın t-testi, iki popülasyonun normal dağılımlara ve eşit varyansa sahip olduğunu varsayar. Welch'in t- testi, eşit olmayan varyanslar için tasarlanmıştır, ancak normalite varsayımı korunmaktadır.^[1] Welch'in t-testi, Behrens-Fisher problemi için yaklaşık bir çözümdür.

Hesaplamalar

Welch'in t- testi istatistiği t'ni aşağıdaki formüle göre tanımlar:

t\quad =\quad {\;{\overline {X}}_{1}-{\overline {X}}_{2}\; \over {\sqrt {\;{s_{1}^{2} \over N_{1}}\;+\;{s_{2}^{2} \over N_{2}}\quad }}}\,

${\overline {X}}_{1}$ , $s_{1}^{2}$ and $N_{1}$ sırasıyla birinci örnek ortalaması, örnek varyansı ve örnek büyüklüğüdür.Student'ın t-testinden farklı olarak, payda birleştirilmiş varyans tahmine dayalı değildir. Bu varyans tahminiyle ilişkili serbestlik dereceleri $\nu$ , Welch-Satterthwaite denklemi kullanılarak yaklaştırılır:

\nu \quad \approx \quad {{\left(\;{s_{1}^{2} \over N_{1}}\;+\;{s_{2}^{2} \over N_{2}}\;\right)^{2}} \over {\quad {s_{1}^{4} \over N_{1}^{2}\nu _{1}}\;+\;{s_{2}^{4} \over N_{2}^{2}\nu _{2}}\quad }}

Burada $\nu _{1}=N_{1}-1$ , ilk varyans tahmini ile ilişkili serbestlik derecelerini, $\nu _{2}=N_{2}-1$ ,ikinci varyans tahminiyle ilişkili serbestlik derecelerini ifade etmektedir.

Welch'in t- testi de sıralanan veriler için hesaplanabilir ve daha sonra Welch'in U- testi olarak adlandırılabilir.^[3]

İstatistiksel test

T ve $\nu$ hesaplandıktan sonra bu istatistikler, iki popülasyon ortalamasının eşit olduğu (iki uçlu test kullanılarak) boş hipotezi test etmek için t-dağılımı ile veya popülasyon ortalamalarının birinin Diğerinden büyük veya eşit (tek kuyruklu test kullanarak)olduğu alternatif hipotezler için kullanılabilir.

Avantaj ve sınırlamalar

Welch'in t-testi Student'ın t-testinden daha sağlamdır ve eşitsiz varyansların ve eşit olmayan örneklem boyutlarının nominaline yakın tip I hata oranlarını korur.Ayrıca, popülasyon farklılıkları eşit olduğunda ve numune boyutları dengelense bile, Welch'in t-testinin gücü Student'ın t-testinin gücüne yakındır.^[2] Welch'in t-testi, tek yönlü varyans analizinden daha sağlam olan 2'den fazla numuneye genellenebilir.^[4]

Eşit farklılıkları ön teste tabi tutmak ve daha sonra Student's t-testi veya Welch'in t-testi arasında seçim yapmak tavsiye edilmez.^[5] Daha ziyade, Welch'in t-testi, yukarıda belirtildiği gibi doğrudan ve Student'ın t-testine herhangi bir önemli dezavantaj olmadan uygulanabilir.Welch'in t-testi çarpık dağılımlar ve büyük örnek boyutları için daha güvenilirdir.^[6] Sıralanan dağılımlar ve daha küçük örnekler için güvenilirlik azalır ve burada Welch'in sıralanmış veriler üzerinde t testi yapılabilir. ^[3]

Örnekler

Aşağıdaki üç örnek Welch'in t-testi ve Student'ın t-testini karşılaştırmaktadır. Örnekler, R programlama dili kullanılarak rasgele normal dağılımlardan alınmıştır.

Üç örnek için de nüfus ortalamaları $\mu _{1}=20$ and $\mu _{2}=22$ dir.

İlk örnek eşit varyans ( $\sigma _{1}^{2}=\sigma _{2}^{2}=4$ ) ve eşit örnek büyüklükleri ( $N_{1}=N_{2}=15$ ) içindir. iki rassal numuneyi A1 ve A2 olarak belirtelim:

A_{1}=\{27.5,21.0,19.0,23.6,17.0,17.9,16.9,20.1,21.9,22.6,23.1,19.6,19.0,21.7,21.4\}

A_{2}=\{27.1,22.0,20.8,23.4,23.4,23.5,25.8,22.0,24.8,20.2,21.9,22.1,22.9,20.5,24.4\}

İkinci örnek eşit olmayan varyanslar( $\sigma _{1}^{2}=16$ , $\sigma _{2}^{2}=1$ ) ve eşit olmayan örnek büyüklükleri içindir ( $N_{1}=10$ , $N_{2}=20$ ). Küçük örnek daha büyük varyansa sahiptir:

{\begin{aligned}A_{1}&=\{17.2,20.9,22.6,18.1,21.7,21.4,23.5,24.2,14.7,21.8\}\\A_{2}&=\{21.5,22.8,21.0,23.0,21.6,23.6,22.5,20.7,23.4,21.8,20.7,21.7,21.5,22.5,23.6,21.5,22.5,23.5,21.5,21.8\}\end{aligned}}

Üçüncü örnek eşit olmayan varyanslar ( $\sigma _{1}^{2}=1$ , $\sigma _{2}^{2}=16$ ) ve eşit olmayan örnek boyutları içindir ( $N_{1}=10$ , $N_{2}=20$ ). Büyük örneklemin daha büyük varyansı vardır:

{\begin{aligned}A_{1}&=\{19.8,20.4,19.6,17.8,18.5,18.9,18.3,18.9,19.5,22.0\}\\A_{2}&=\{28.2,26.6,20.1,23.3,25.2,22.1,17.7,27.6,20.6,13.7,23.2,17.5,20.6,18.0,23.9,21.6,24.3,20.4,24.0,13.2\}\end{aligned}}

Referans p-değerleri, eşit popülasyon araçlarının boş hipotez için ( $\mu _{1}-\mu _{2}=0$ ) t istatistiklerinin dağılımlarını simüle ederek elde edildi. Sonuçlar, aşağıdaki tabloda çift-kuyruklu p-değerleri ile özetlenmiştir:

	Sample A1			Sample A2			Student's t-test				Welch's t-test
Example	$N_{1}$	${\overline {X}}_{1}$	$s_{1}^{2}$	$N_{2}$	${\overline {X}}_{2}$	$s_{2}^{2}$	$t$	$\nu$	$P$	$P_{\mathrm {sim} }$	$t$	$\nu$	$P$	$P_{\mathrm {sim} }$
1	15	20.8	7.9	15	23.0	3.8	−2.46	28	0.021	0.021	−2.46	25.0	0.021	0.017
2	10	20.6	9.0	20	22.1	0.9	−2.10	28	0.045	0.150	−1.57	9.9	0.149	0.144
3	10	19.4	1.4	20	21.6	17.1	−1.64	28	0.110	0.036	−2.22	24.5	0.036	0.042

Welch'in t - testi ve Student'ın t - testi, eşit varyans ve eşit örnek büyüklüğüne sahip iki örnek için pratik olarak aynı sonuçları verdi (Örnek 1). Eşit olmayan varyanslar için, Student'in t- testi, küçük örneklemin daha büyük bir varyansa (Örnek 2) ve daha büyük bir örneğin daha büyük bir varyansa sahip olduğu (örnek 3) yüksek bir p-değeri verdi. Eşit olmayan varyanslar için, Welch'in t- testi, simüle edilen p-değerlerine yakın p-değerleri verdi.

Yazılım Uygulamaları

Language/Program	Function	Notes
LibreOffice	`TTEST(Data1; Data2; Mode; Type)`	See [1]
MATLAB	`ttest2(data1, data2, 'Vartype', 'unequal')`	See [2]
Microsoft Excel pre 2010	`TTEST(array1, array2, tails, type)`	See [3]
Microsoft Excel 2010 and later	`T.TEST(array1, array2, tails, type)`	See [4]
Python	`scipy.stats.ttest_ind(a, b, axis=0, equal_var=False)`	See [5]
R	`t.test(data1, data2, alternative="two.sided", var.equal=FALSE)`	See [6]
Julia	`UnequalVarianceTTest(data1, data2)`	See [7]
Stata	ttest varname1 == varname2, welch	See 8

Ayrıca Bakınız

Şablon:Portal

Student'in t testi

Referans

^ ^a ^b Welch, B. L. (1947). "The generalization of "Student's" problem when several different population variances are involved". Biometrika. 34 (1–2): 28–35. doi:10.1093/biomet/34.1-2.28. MR 0019277.
^ ^a ^b ^c Ruxton, G. D. (2006). "The unequal variance t-test is an underused alternative to Student's t-test and the Mann–Whitney U test". Behavioral Ecology. 17: 688–690. doi:10.1093/beheco/ark016.
^ ^a ^b Fagerland, M. W.; Sandvik, L. (2009). "Performance of five two-sample location tests for skewed distributions with unequal variances". Contemporary Clinical Trials. 30: 490–496. doi:10.1016/j.cct.2009.06.007.
^ Welch, B. L. (1951). "On the Comparison of Several Mean Values: An Alternative Approach". Biometrika. 38: 330–336. doi:10.2307/2332579. JSTOR 2332579.
^ Zimmerman, D. W. (2004). "A note on preliminary tests of equality of variances". British Journal of Mathematical and Statistical Psychology. 57: 173–181. doi:10.1348/000711004849222.
^ Fagerland, M. W. (2012). "t-tests, non-parametric tests, and large studies—a paradox of statistical practice?". BioMed Central Medical Research Methodology. 12: 78. doi:10.1186/1471-2288-12-78.

[Welch1947-1] Welch, B. L. (1947). "The generalization of "Student's" problem when several different population variances are involved". Biometrika. 34 (1–2): 28–35. doi:10.1093/biomet/34.1-2.28. MR 0019277.

[Ruxton2006-2] Ruxton, G. D. (2006). "The unequal variance t-test is an underused alternative to Student's t-test and the Mann–Whitney U test". Behavioral Ecology. 17: 688–690. doi:10.1093/beheco/ark016.

[Fagerland2009-3] Fagerland, M. W.; Sandvik, L. (2009). "Performance of five two-sample location tests for skewed distributions with unequal variances". Contemporary Clinical Trials. 30: 490–496. doi:10.1016/j.cct.2009.06.007.

[Welch1951-4] Welch, B. L. (1951). "On the Comparison of Several Mean Values: An Alternative Approach". Biometrika. 38: 330–336. doi:10.2307/2332579. JSTOR 2332579.

[Zimmerman2004-5] Zimmerman, D. W. (2004). "A note on preliminary tests of equality of variances". British Journal of Mathematical and Statistical Psychology. 57: 173–181. doi:10.1348/000711004849222.

[Fagerland2012-6] Fagerland, M. W. (2012). "t-tests, non-parametric tests, and large studies—a paradox of statistical practice?". BioMed Central Medical Research Methodology. 12: 78. doi:10.1186/1471-2288-12-78.

[1]

[2]

[3]

[4]

[5]

[6]

@@ 6. satır: / 6. satır: @@
 ==Hesaplamalar==
 Welch'in ''t''- testi istatistiği ''t'''ni aşağıdaki formüle göre tanımlar:
@@ 23. satır: / 24. satır: @@
 Welch'in ''t''- testi de sıralanan veriler için hesaplanabilir ve daha sonra Welch'in ''U''- testi olarak adlandırılabilir.<ref name=Fagerland2009>{{Cite journal | last1 = Fagerland | first1 = M. W. | last2 = Sandvik | first2 = L. | title = Performance of five two-sample location tests for skewed distributions with unequal variances | journal = [[Contemporary Clinical Trials]] | volume = 30 | pages = 490–496 | year = 2009 | doi=10.1016/j.cct.2009.06.007}}</ref>
+==İstatistiksel test==
+T ve ''<math>\nu</math>'' hesaplandıktan sonra bu istatistikler, iki popülasyon ortalamasının eşit olduğu (iki uçlu test kullanılarak) boş hipotezi test etmek için ''t''-dağılımı ile veya popülasyon ortalamalarının birinin Diğerinden büyük veya eşit (tek kuyruklu test kullanarak)olduğu alternatif hipotezler için kullanılabilir.
+==Avantaj ve sınırlamalar==
+Welch'in ''t''-testi Student'ın t-testinden daha sağlamdır ve eşitsiz varyansların ve eşit olmayan örneklem boyutlarının nominaline yakın tip I hata oranlarını korur.Ayrıca, popülasyon farklılıkları eşit olduğunda ve numune boyutları dengelense bile, Welch'in t-testinin gücü Student'ın t-testinin gücüne yakındır.<ref name=Ruxton2006/> Welch'in t-testi, tek yönlü varyans analizinden daha sağlam olan 2'den fazla numuneye genellenebilir.<ref name="Welch1951">{{cite journal|last1=Welch|first1=B. L.|title=On the Comparison of Several Mean Values: An Alternative Approach|journal=Biometrika|date=1951|volume=38|pages=330–336|doi=10.2307/2332579|jstor=2332579}}</ref>
+Eşit farklılıkları ön teste tabi tutmak ve daha sonra Student's ''t''-testi veya Welch'in ''t''-testi arasında seçim yapmak tavsiye edilmez.<ref name=Zimmerman2004>{{Cite journal | last = Zimmerman | first = D. W. | title = A note on preliminary tests of equality of variances | journal = [[British Journal of Mathematical and Statistical Psychology]] | volume = 57 | pages = 173–181 | year = 2004 | doi = 10.1348/000711004849222}}</ref> Daha ziyade, Welch'in ''t''-testi, yukarıda belirtildiği gibi doğrudan ve Student'ın ''t''-testine herhangi bir önemli dezavantaj olmadan uygulanabilir.Welch'in t-testi çarpık dağılımlar ve büyük örnek boyutları için daha güvenilirdir.<ref name=Fagerland2012>{{Cite journal | last = Fagerland | first = M. W. | title = t-tests, non-parametric tests, and large studies—a paradox of statistical practice? | journal = [[BioMed Central]] Medical Research Methodology | volume = 12 | pages = 78 | year = 2012 | doi = 10.1186/1471-2288-12-78}}</ref> Sıralanan dağılımlar ve daha küçük örnekler için güvenilirlik azalır ve burada Welch'in sıralanmış veriler üzerinde ''t'' testi yapılabilir. <ref name=Fagerland2009/>
+==Örnekler==
+Aşağıdaki üç örnek Welch'in ''t''-testi ve Student'ın ''t''-testini karşılaştırmaktadır. Örnekler, R programlama dili kullanılarak rasgele normal dağılımlardan alınmıştır.
+Üç örnek için de nüfus ortalamaları <math>\mu_1 = 20</math> and <math>\mu_2 = 22</math> dir.
+İlk örnek eşit varyans (<math>\sigma_1^2 = \sigma_2^2 = 4</math>) ve eşit örnek büyüklükleri (<math>N_1 = N_2 = 15</math>) içindir. iki rassal numuneyi A1 ve A2 olarak belirtelim:
+: <math>A_1 = \{27.5, 21.0, 19.0, 23.6, 17.0, 17.9, 16.9, 20.1, 21.9, 22.6, 23.1, 19.6, 19.0, 21.7, 21.4\}</math>
+: <math>A_2 = \{27.1, 22.0, 20.8, 23.4, 23.4, 23.5, 25.8, 22.0, 24.8, 20.2, 21.9, 22.1, 22.9, 20.5, 24.4\}</math>
+İkinci örnek eşit olmayan varyanslar(<math>\sigma_1^2 = 16</math>, <math>\sigma_2^2 = 1</math>) ve eşit olmayan örnek büyüklükleri içindir (<math>N_1 = 10</math>, <math>N_2 = 20</math>). Küçük örnek daha büyük varyansa sahiptir:
+: <math>\begin{align}
+A_1 &= \{17.2, 20.9, 22.6, 18.1, 21.7, 21.4, 23.5, 24.2, 14.7, 21.8\}
+\\
+A_2 &= \{21.5, 22.8, 21.0, 23.0, 21.6, 23.6, 22.5, 20.7, 23.4, 21.8, 20.7, 21.7, 21.5, 22.5, 23.6, 21.5, 22.5, 23.5, 21.5, 21.8\}
+\end{align}</math>
+Üçüncü örnek eşit olmayan varyanslar (<math>\sigma_1^2 = 1</math>, <math>\sigma_2^2 = 16</math>) ve eşit olmayan örnek boyutları içindir (<math>N_1 = 10</math>, <math>N_2 = 20</math>). Büyük örneklemin daha büyük varyansı vardır:
+: <math>\begin{align}
+A_1 &= \{19.8, 20.4, 19.6, 17.8, 18.5, 18.9, 18.3, 18.9, 19.5, 22.0\}
+\\
+A_2 &= \{28.2, 26.6, 20.1, 23.3, 25.2, 22.1, 17.7, 27.6, 20.6, 13.7, 23.2, 17.5, 20.6, 18.0, 23.9, 21.6, 24.3, 20.4, 24.0, 13.2\}
+\end{align}</math>
+Referans p-değerleri, eşit popülasyon araçlarının boş hipotez için (<math>\mu_1 - \mu_2 =0</math>) ''t'' istatistiklerinin dağılımlarını simüle ederek elde edildi. Sonuçlar, aşağıdaki tabloda çift-kuyruklu p-değerleri ile özetlenmiştir:
+{| border="1" cellspacing="0" cellpadding="5" align="center" class="wikitable"
+|-
+! colspan="1" |
+! colspan="3" align="center"  | Sample A1
+! colspan="3" align="center"  | Sample A2
+! colspan="4" align="center" | Student's ''t''-test
+! colspan="4" align="center" | Welch's ''t''-test
+|-
+! align="center" | Example
+! align="center" | <math>N_1</math> || align="center" | <math>\overline{X}_1</math> || align="center" | <math>s_1^2</math>
+! align="center" | <math>N_2</math> || align="center" | <math>\overline{X}_2</math> || align="center" | <math>s_2^2</math>
+! align="center" | {{tmath|t}} || align="center" | {{tmath|\nu}} || align="center" | {{tmath|P}} || align="center" | <math>P_\mathrm{sim}</math>
+! align="center" | {{tmath|t}} || align="center" | {{tmath|\nu}} || align="center" | {{tmath|P}} || align="center" | <math>P_\mathrm{sim}</math>
+|-
+| 1 || 15 || 20.8 || 7.9 || 15 || 23.0 || 3.8 || −2.46 || 28 || 0.021 || 0.021 || −2.46 || 25.0 || 0.021 || 0.017
+|-
+| 2 || 10 || 20.6 || 9.0 || 20 || 22.1 || 0.9 || −2.10 || 28 || 0.045 || 0.150 || −1.57 || 9.9 || 0.149 || 0.144
+|-
+| 3 || 10 || 19.4 || 1.4 || 20 || 21.6 || 17.1 || −1.64 || 28 || 0.110 || 0.036 || −2.22 || 24.5 || 0.036 || 0.042
+|-
+|}
+Welch'in '' t '' - testi ve Student'ın '' t '' - testi, eşit varyans ve eşit örnek büyüklüğüne sahip iki örnek için pratik olarak aynı sonuçları verdi (Örnek 1). Eşit olmayan varyanslar için, Student'in ''t''- testi, küçük örneklemin daha büyük bir varyansa (Örnek 2) ve daha büyük bir örneğin daha büyük bir varyansa sahip olduğu (örnek 3) yüksek bir p-değeri verdi. Eşit olmayan varyanslar için, Welch'in ''t''- testi, simüle edilen p-değerlerine yakın p-değerleri verdi.
+==Yazılım Uygulamaları==
+{| class="wikitable sortable"
+|-
+! Language/Program !! Function !! Notes
+|-
+| [[LibreOffice]] || <code>TTEST(''Data1; Data2; Mode; Type'')</code> || See [https://help.libreoffice.org/Calc/Statistical_Functions_Part_Five#TTEST]
+|-
+| [[MATLAB]] || <code>ttest2(data1, data2, 'Vartype', 'unequal')</code>  || See [http://uk.mathworks.com/help/stats/ttest2.html]
+|-
+| [[Microsoft Excel]] pre 2010 || <code>TTEST(''array1'', ''array2'', ''tails'', ''type'')</code> || See [http://office.microsoft.com/en-us/excel-help/ttest-HP005209325.aspx]
+|-
+| [[Microsoft Excel]] 2010 and later || <code>T.TEST(''array1'', ''array2'', ''tails'', ''type'')</code> || See [http://office.microsoft.com/en-us/excel-help/t-test-function-HA102753135.aspx]
+|-
+| [[Python (programming language)|Python]] || <code>scipy.stats.ttest_ind(''a'', ''b'', ''axis=0'', ''equal_var=False'')</code> || See [http://docs.scipy.org/doc/scipy/reference/generated/scipy.stats.ttest_ind.html]
+|-
+| [[R (programming language)|R]] || <code>t.test(data1, data2, alternative="two.sided", var.equal=FALSE)</code>  || See [https://stat.ethz.ch/R-manual/R-devel/library/stats/html/t.test.html]
+|-
+| [[Julia (programming language)|Julia]] || <code> UnequalVarianceTTest(data1, data2)</code> || See [http://hypothesistestsjl.readthedocs.org/en/latest/index.html]
+|-
+|[[Stata]]
+|'''ttest''' ''varname1'' '''==''' ''varname2''''',''' '''welch'''
+|See [http://www.stata.com/help.cgi?ttest 8]
+|}
+==Ayrıca Bakınız==
+{{Portal|Statistics}}
+* [[Student'in t testi]]
+==Referans==
+{{Reflist|30em}}
+[[Category:İstatistik]]