Tekrarlama sınaması

İstatistik bilim dalı içinde tekrarlama sınaması iki değer (0-1) alan veya iki değer alma şekline dönüştürülmüş bir kategorik değişken için örneklem veri serisinin ardı ardına bir rastgele sıralama ile gelip gelmediğini sınamak için kullanılan bir parametrik olmayan istatistik yöntemidir.

Veriler[değiştir | kaynağı değiştir]

Bu sınama icin, iki turlu veri kullanilabilir:

Eğer örneklem verisi iki değerli kategorik veri ise, hemen birbiri ile arka arkaya gelen örneklem veri değerleri veri geliş sırasıyla ikinci veriden itibaren incelenir ve +, - ve 0 dan oluşan bir gösterge veri serisi hazırlanır . Yani incelenen veri değeri bir önceki veriden çıkartılır ve bu işlemin işareti gösterge verisi olur; yani X_i-X_i-1 işareti D_i işaret verisi olur.
Eğer örneklem verisi iki değerli değilse veri ise bu verilerden ya ortalama veya medyan değeri çıkartılır ve hemen birbirini takip eden arkaarkaya gelen fark veri değerleri incelenir. Birbirini takip eden ortalama veya medyandan farklar arasındaki fark bulma sonuçları ortaya çıkan sonucun işaretlerinden yani +, - ve 0 dan oluşan bir gösterge veri serisi hazırlanır . Eğer incelenen veri değerinden ya ortalama veya medyan çıkartılır ve bulunan fark değerleri için bir fark bir önceki farkdan çıkartılır ve bu işlemin işareti gösterge verisi olur; yani X_i-X_i-1=F_i bulunup F_i-F_i-1'in işareti D_i için veri olur. Dikkat edilirse veriler çokluluğa değil sıralamalara ve sıralama içindeki farklara dayanır.

Yöntem[değiştir | kaynağı değiştir]

Bu sınamanın amacı örneklem verilerinin ardı ardına rastgele olarak ortaya çıkıp çıkmadıklarını incelemektir. Dikkat edilirse bu sınama anakütle çokluğu veya rastgeleliği hakkında değil, örneklem verileri ile ilgilidir. Daha matematiksel biçimli bir ifade ile sıfır hipotez örneklem verilerinin birbirini takip eden işaretli gösterge elemanlarinin birbirlerine karşılıklı olarak bağımsız olduğudur.

Sınama istatistiğini elde etmek için örneklem verisinden elde edilmiş olan gostergeler serisinde D_i değişmesi için tekrarlamalar (en. runs) incelenir Eğer gösterge işaret degişikligi gösterirse bu bir tekrarlamadir; yani D_i=- ve D_i+1=+ ise bir pozitif artış tekrarı ve D_i=+ D_i+1=- ise negatif azalış tekrarı olur. Bunlar sayılır: N_p toplam pozitif artış tekrarı ve N_n toplam negatif azalış tekrarı olur ve bu ikisinin toplamı (R=N_p+N_n) ise toplam tekrarlama sayısı olur.

Örneğin: Bir D(i) serisi şöyle gösterilsin: "----+++---+++--++++++" . Burada N_p=3; N_n=2 ve toplam tekrarlama sayısı R=3+2=5 olur.

Toplam tekrarlama sayısı R için örneklem dağılımının yaklaşık olarak normal olduğu bilinmektedir ve bu dağılımın parametreleri şöyle verilir:

Ortalama $\mu _{R}={\frac {2\ N_{p}\ N_{n}}{N_{p}+N_{n}}}+1\,,$
Varyans $\sigma _{R}^{2}=={\frac {2\ N_{p}\ N_{n}\ (2\ N_{p}\ N_{n}-N_{n}-N_{p})}{(N_{p}+N_{n})^{2}\ (N_{p}+N_{n}-1)}}={\frac {(\mu -1)(\mu -2)}{R-1}}\,.$

Sınamaya devam bu değerler için bir standart normal puan (z-değeri) hesaplamak ile devam edilir.

Eğer toplam artış tekrarı veya toplam azalış tekrarı 20'den azsa (yani $N_{p}<20$ veya $N_{n}<20$ ) anlamlılık düzeyi olan 0,05 için hazırlanmış özel bir tablo kullanılıp tablo z-değeri bulunur.^[1] Eğer $N_{p}>20$ ve $N_{n}>20$ ise genel standart normal tablolarından 0,05 veya 0,01 için anlamlılık düzeyi tablo z-değerleri bulunup kullanılır. Hesaplanan standart normal puanı tablodan bulunan z-değerin altında ise sıfır hipotez kabul edilir. Eğer komputer için standart normal simulasyon programı veya istatistik paketi varsa, hesaplanan z-değer karşıtı olan p-değer bulunup %1 veya %5 anlamlılık duzeyi ile karşılaştırılır ve p-değeri daha büyük ise sıfır hipotez kabul edilir.

Ek açıklama[değiştir | kaynağı değiştir]

Tekrarlama sınaması için, örneklem verilerinin birbirini takip etme sürecinde eşitlik veya adaletli oluş (yani yarıyarıya - ve + oluŞu) ele alınan konu değildir; incelenen ardı ardına gelen veri elemanlarının istatistiksel olarak bağımsız olup olmamasıdır.

Tekrarlama sınaması, ortalama ve varyans alınmadan, biraz subjektif olarak hemen kullanılabilen bir rastgellelik sınaması olarak pratikte rağbet görmüştür. Özellikle birbirini zaman içinde takip eden zaman serisi verilerinde rastgele değişme ile sistematik değişme arasında hemen ayrım yapmak için pratikte kullanılabilir.

Tekrarlama istatistiği için örneklem dağıması parametreleri bir parametrik sınama içinde tekrarlama sınamasının etkinlik gücünü bulmak için kullanılamazlar; bu nedenle bu sınamanın gücü için çıkartımsal istatistik bulunamaz. Eğer uygulama mümkün ise, etkinlik gücünün sınanması imkânını temin eden Kolmogorov-Smirnov sınamasının kullanılması tercih edilmelidir.

İçsel kaynaklar[değiştir | kaynağı değiştir]

Kolmogorov-Smirnov sınaması

Kaynakça[değiştir | kaynağı değiştir]

^ Siegel,S. ve Castellan,N.J. (1988) Nonparametric Statistics for Behavioural Science (2. rev.ed.) New York: McGraw Hill Tablo F

[1] Siegel,S. ve Castellan,N.J. (1988) Nonparametric Statistics for Behavioural Science (2. rev.ed.) New York: McGraw Hill Tablo F

[1]