Sıfır hipotez

Vikipedi, özgür ansiklopedi
Atla: kullan, ara

Bilim uygulaması "hipotezler"in formüle edilmesini ve sınanmasını içerir. Bu hipotezler gözlemlenen verileri kullanarak yanlış oldukları ispat edilebilecek açıklamalardır. Sıfır hipotez tipik olarak genel veya varsayılan duruşa karşılık gelecek şekilde hipotezdir. Örneğin, "iki ölçülen olgu arasında bir bağlantı yoktur" veya "denenen tedavinin bir etkisi yoktur" sıfır hipotez olabilirler. Çoğu hukuk sistemlerinde, "sanık (suçlu olduğu ispatlanana kadar) masumdur" karinesini kabul edilir ve bu "o kişinin masumiyeti sıfır hipotezdir" diyerek yorumlanılabilir. "Sanık suçludur" şeklinde bir "sıfır hipotez" de tamamiyle değişik başka bir hukuk sisteminde mümkün olabilir.

Bu "sıfır hipotez" terimi İngiliz asıllı istatistikçi ve genetikçi Ronald Fisher tarafından tanımlanıp kullanılmıştır. [1][2]

Tipik olarak çıkarımsal analiz için "sıfır hipotez" yanında "alternatif hipotez" adı verilen bir ikiz hipotez ile birlikte ortaya konulur. "Alternatif hipotez" kavramı R.Fisher'in formülasyonun da bulunmamaktadır. Jerzy Neyman ve Egon Pearson adlı Amerikalı istatistikçiler tarafından "alternatif hipotez" kavramı geliştirilmiştir. "Alternatif hipotez"'in mantıken "sıfır hipotez"in aksi olması gerekli değildir. Eğer bir deney yapılırsa "alternatif hipotez" gerçek ise, bu deneylerin sonucunu tahmin edip edilemiyeceğinin olasılığına işaret eder. Günümüzde istatistiksel çıkarımsal analizlerde hem "sıfır hipotez" hem de "alternatif hipotez" kullanılması bir gelenek haline girmiştir.

Prensip[değiştir | kaynağı değiştir]

"Hipotez sınaması", toplanan verinin, sıfır hipotezin doğru olduğunu varsayarak, bunun ne olasılıkla mümkün olduğunu ölçerek yapılır. Veriler fazla olanak dışıysa (genellikle  %5’inden daha az olasılıkla gözlemlenecek şekilde iseler) o zaman araştırıcı sıfır hipotezin yanlış olduğu çıkarımına varır. Şayet veriler sıfır hipotez ile çelişmiyorsa o zaman hiçbir çıkarıma varmaz. Bu halde sıfır hipotez doğru da olabilir yanlış da; veriler herhangi bir çıkarım yapabilmek için yeterli kanıt vermemektedir.

Mesela, belirli bir ilaç kalp krizi geçirme tesadüfünü düşürebiliyorsa; muhtemel sıfır hipotezler "bu ilaç kalp krizi geçirme olasılığını azaltmaz" veya "bu ilacın bir kalp krizi geçirme olasılığına bir etkisi yoktur" şeklinde olur. Hipotez sınaması, bir "denetimli deney (controlled experiment)" olarak çalışma grubundaki insanların yarısına bu ilacı vermek şeklinde olur. Veriler, ilacı alan insanlarda istatistiksel anlamlı bir değişiklik gösterirse, sıfır hipotez reddedilir.

Sıfır hipotez (H0) seçimi[değiştir | kaynağı değiştir]

Sıfır hiptotezin seçimi ve (eğer "tek-kuyruklu sınama" ise) yönlenmesi hakkında fikirler hipotez sınaması için çok kritiktir. Bir yazı-tura deneyinde havaya atılan madeni paranın yansız olup olmadığı (yani çok sayıda yapılan deneylerde %50 defa 'yazı' gelip gelmediği) sorusunu sorduğumuzu kabul edelim. Bu deney için mümkün olan bir sıfır hipotez "bu madeni para 'yazı' gelmesi için yanlı değildir" olabilir. Deney madeni parayı tekrar tekrar çok defa havaya atıp ne tarafına (yazı mı tura mı) düştüğünü kaydetmektir. Madeni parayı 5 defa havaya atarsak mümkün olan bir sonuç 5 tane 'yazı' gelmesidir. Yapılmış olan sıfır hipoteze göre, bu verilerin ortaya çıkmış olması çok az olasıdır, çünkü eğer madeni para yansız" ise ide bu deneyde 5 'yazı' gelmesi olasığı %3 olacaktır. Bu deney verisi, sıfır hipotezi yanıtlamamaktadır; bundan çıkarım, atılan madeni para yanlı olduğudur.

Alternatif olarak "madeni para yansızdır" sıfır hipotezi, 'yazı' sonuçları yanında 'tura' sonuçlarının da ele alınmasına izin verir. Bu halde 5 'yazı' veya 5 'tura' gelmesi olasılığı, (iki-kuyruklu sınama ile) %6'ya yükselir ve bu da sıfır hipotezi korumak için istatistikesl olarak anlamlı olmamaktadır. [3]

Bu gösterim hipotez sınama tekniğinin tehlikesini ortaya koymaktadır; tek bir veri setini kullanarak değişik sıfır hipotezler verilerek sınamalar yapmak, verisetindeki onu alınamaz "gürültü" nedeniyle sinanan bazı "sıfır hipotezlerin" yanlış olarak rededilmesine yol açacaktır.

Farkların sınaması[değiştir | kaynağı değiştir]

Ele alınan iki rastgele örnek içinde hem erkek hem de kadınlar rastgele bulunmakta ve örnek bunları bir test notu olduğunu farzedelim ve acaba "erkekler ortalama notu" ile "kadınlar ortalama notu" arasında bir fark olup olmadığını inceleyelim. Bir mümkün sıfır hipotez, "erkekler ortalama notu" ile "kadınlar ortalama notu"'nun aynı olduğudur; yani

H0: μ1 = μ2

burada

H0 = sıfır hipotez
μ1 = anakitle 1 (erkekler) ortalaması
μ2 = anakitle 2 (kadınlar) ortalaması.

Aynı anakitleden rastgele örneklem ile elde edilen veri-setinden daha güçlü sıfır hipotezler de ele alınabilirdi: örneğin notların varyanslarının eşitliği veya notların dağılımların belirli bir teorik olasılık dağılımı şekilde olması.

Terminoloji[değiştir | kaynağı değiştir]

Sıfır hipotezlerle bağlantılı terminoloji burada kısmen ele alınacaktır ve bunlar doğrudan istatistiksel hipotez sınaması konusu ile ilgilidirler. Fakat bu terimler daha ayrıntılı ve daha ince analizle de ele edilmektedir ve bunun için daha detaylı için bakılacak bilgiler istatistiksel hipotez sınaması maddesindedir.

Ele alınan ilk terimler

Basit hipotez
Anakitle dağılımını tüm olarak "tanımlayan" herhangi bir hipotez;
Bileşik hipotez
Anakitle dağılımını tüm olarak "tanımlamayan" herhangi bir hipotez

olur.

Nokta hipotez terimini tanımlamak çok karmaşık olabilir. Bu terim bütün mümkün anakitle dağılımlarının parametrik formda alınmaları halinde kullanılır. Bir "nokta hipotez" ya parametrelerin tümünün veya parametrelerin bir kısmı setinin tamamiyle gerçek olarak tanımlanması halleridir. Formel olarak, sadece parametrelerin bir kısmının tanımlanması halinde "bileşik hipotez" ortaya çıkar; ama buna rağmen pratikte "nokta hipotez" terimi çok kere yine de kullanılmaktadır. Özellikle bu halde hipotez sınaması öyle yapılanmıştır ki test istatistiğinin dağılımı (yani sıfır hipoteze uygun olarak verilmiş dağılımı), nokta sıfır hipoteze uygun olarak tanımlanmayan değerleri olmayan parametrelere bağlı olmaz.

Parametrelerin bir kısım altsetinde nokta hipotezlerin dikkatli olarak ele alınmaları, onların bileşik hipotez olacak incelenmesine yol açar. Böylelikle test istatistiğinin sabit kritik değeri için p-değeri ile nokta sıfır hipotezle tanımlanmayan parametrelerin birlikte değişmesi incelenir,

Bir tek-kuyruklu hipotez, bir parametrenin değerinin ya

  • belirlenen bir değerden yüksek olacağını veya
  • belirlenen bir değerin altında olacağını

tanımlayan bir hipotezdir.

Tıp alanında bir tek-kuyruklu hipotez örneği, halen bilinen bir tedavi olan A tedavisinin yeni bir tedavi olan B tedavisinden hiç olmazsa daha fena sonuç verip vermiyeceğinin incelenmesidir. Buna tekabül eden alternatif hipotez tedavi B'nin tedavi A'dan daha iyi tedavi sonucu vereceğidir. Burada eğer sıfır hipotez kabul edilirse (yani, tedavi A'nın tedavi B'ye kıyasla hiç olmazsa daha iyi olacağı hipotezinin rededilmesi için hiç bir neden bulunmaması halinde), yapılacak çıkarım tadavi A'nın kullanılmasına devam edilmesidir. Eğer sıfır hipotez rededilirse çıkarım, yeni tedavi B'nin gelecekte kullanılmasıdır; çünkü bu tedavinin A tedavisinden daha iyi olacağı hakkında kanıt bulunmaktadır. Bu halde sınama ve çıkarım A ve B tadavilerinin değişik olup olmadığı sorusunu inceleme ile yetinmemektedir; hipotez sınaması ile aranan kanıt, tedavi B'nin tedavi A'dan iyi olup olmadığı hakkındadır. Hipotezi "daha iyidir" şekilde karşılaştırma olarak formüle etme, hipoteze bir "yönleme sağlama" olarak ifade edilmektedir.

Sıfır hipotezin yönü[değiştir | kaynağı değiştir]

Orneklem buyuklugu[değiştir | kaynağı değiştir]

Kaynakça[değiştir | kaynağı değiştir]

  1. ^ "Glossary". Statistics.berkeley.edu. 2010-07-25. http://statistics.berkeley.edu/~stark/SticiGui/Text/gloss.htm#null_hypothesis. Erişim tarihi: 2010-07-29. 
  2. ^ Oxford Lügatı: 1935 R. A. Fisher, Design Experience ıı. 19, "Bu hipotezi 'sıfır hipotez' olarak adlandırabiliriz. Ama şu anlaşılmalıdır ki sıfır hipotez hiç bir zaman isbat edilemez veya kurulu prensip olarak kabul edilemez; fakat deneyler yapıldıkça kanıtılıp çürütülebilirler.
  3. ^ Bu deney veri seti sadece bir konuyu göstermek için kullanılmaktadır; gerçekte madeni parayı 5 defa havaya atma deneyi çok küçük sayıdadır ve bir sınama çıkarımı yapmak için yeterli değildir. 30 deneyimden daha az sayıda deney herhangi bir belirli sınama çıkarımının rizikosunu artırmaktadır.

Ayrica bakınız[değiştir | kaynağı değiştir]

Dış bağlantılar[değiştir | kaynağı değiştir]