Geometrik dağılım

Vikipedi, özgür ansiklopedi
Atla: kullan, ara
Geometrik
Olasılık kütle fonksiyonu
Geometricpdf.jpg
Yığmalı dağılım fonksiyonu
Geometriccdf.jpg
Parametreler 0< p \leq 1 başarı olasılığı (reel)
Destek k \in \{1,2,3,\dots\}\!
Olasılık kütle fonksiyonu (OYF) (1 - p)^{k-1}\,p\!
Yığmalı dağılım fonksiyonu (YDF) 1-(1 - p)^k\!
Ortalama \frac{1}{p}\!
Medyan \left\lceil \frac{-\log(2)}{\log(1-p)} \right\rceil\! (eğer -\log(2)/\log(1-p) bir tamsayı ise tek değildir)
Mod 1
Varyans \frac{1-p}{p^2}\!
Çarpıklık \frac{2-p}{\sqrt{1-p}}\!
Fazladan basıklık {{{basıklık}}}
Entropi -\frac{1-p}{p}\ln(1-p)-\ln p\!
Moment üreten fonksiyon (mf) \frac{pe^t}{1-(1-p) e^t}\!
Karakteristik fonksiyon \frac{pe^{it}}{1-(1-p)\,e^{it}}\!

Olasılık kuramı ve istatistik bilim dallarında geometrik dağılım şu iki şekilde ifade edilebilen ayrık olasılık dağılımıdır:

  • Bütün tamsayılar setine, yani { 1, 2, 3, .... } üzerine, bağlı olarak X sayıda Bernoulli denemesinde ilk başarıyı elde etmenin olasılık dağılımı; veya
  • Bütün tamsayılar setine, yani {1, 2 ,3 , ....} üzerine, bağlı olarak ilk başarıyı elde etmeden Y = X − 1 başarısızlık sayısı olasılık dağılımı.

İstatistikçiler aynı varsayımlara bağlı olarak geometrik dağılım için iki degişik şekilde açıklama ortaya çıkartmışlardır. Bunlar mantıken eşit olmakla beraber iki açıklamanın birbiri ile mutlak karıştırılmaması gerekir. Bunlardan ikinci açıklamaya kaydırılmış geometrik dağılımı adı verilmektedir. Bunlardan hangisinin geometrik dağılım olarak kabul edilip kullanılacağı elverişlilik ve matematiksel göreneklere göre değişir.

Birinci açıklamaya göre eğer her bir deneme için başarılılık olasılığı p ise, tek bir başarı elde etmek için gereken k deneme sayısı için olasılık şöyle verilir:

\Pr(X = k) = (1 - p)^{k-1}\,p\,

burada k = 1, 2, 3, ....

Eşit şekilde, kaydırılmış geometrik seri açıklamasına göre, eğer her bir deneme için başarılılık olasılığı p ise, ilk başarıyı elde etmeden k sayıda başarısızlık elde etme için olasılık şöyle verilir:

\Pr(Y=k) = (1 - p)^k\,p\,

burada k = 0, 1, 2, 3, ....

Dikkat edilirse burada iki değişik açıklama için değişik rassal değişken, X ve Y, kullanılmıştır. Her iki açıklamada da olasılık serileri bir geometrik seri olarak elde edilir.

Bir örnek olarak bir kusursuz zar atma deneyine bakılsın ve bir zar arka arkaya ilk defa 6 gelmesine kadar atılsın. İstenen bir sonucu elde etmek için gereken zar atılma sayısı için bir sonsuz sonuç seti (1, 2, 3, ... } bulununur ve her bir deneme için yani her zar atışı icin 6 gelmesi olasılığı p olur. Eğer 6 gelmeden önce atılması gereken zar sayısının olasılığı ilgi konusu ise bu birinci tip bir geometrik dağılımdır; eğer ilk 6 atmadan yapılan başarısız zar atması sayısı olasılığı ilgi konusu ise bu ikinci tip (kaydırılmış) geometrik dağılımdır.

Momentler ve kümülantlar[değiştir | kaynağı değiştir]

Geometrik dağılım gösteren X rassal değişkeni X için beklenen değer 1/p ve varyans değeri (1 − p)/p2 :

\mathrm{E}(X) = \frac{1}{p},
 \qquad\mathrm{var}(X) = \frac{1-p}{p^2}

olur.

Benzer şekilde, geometrik dağılım gösteren Y rassal değişkeni için beklenen değer (1-p)/p ve varyans değeri ise (1-p)/p^2

\mathrm{E}(Y) = \frac{1-p}{p},
 \qquad\mathrm{var}(Y) = \frac{1-p}{p^2}.

\mu = (1-p)/p değerinin Y için beklenen değer olduğu kabul edilsin. O zaman Y için olasılık dağılımının kümülant değeri \kappa_n şu matematik yineleme ilişkisine (recursion) uyar:

\kappa_{n+1} = \mu(\mu+1) \frac{d\kappa_n}{d\mu}.

Parametre tahminleri[değiştir | kaynağı değiştir]

Geometrik dağılımın her iki alternatif şekli için p değerinin tahmini, dağılımın beklenen değerinin örnekleme ortalamasına eşit varsayımının kabulu suretiyle yapılabilir. Bu tahmin tipi istatistik kuramında tahmin için momentler yöntemi adı ile anılır. Geometrik dağılım için p değerinin bu yönteme göre tahmin edilmesi bir maksimum olabilirlilik tahmini ortaya çıkarır.

Özellikle geometrik dağılımın birinci alternatifi için i=1,\dots,n için k_i \geq 1 olduğu zaman

k_1,\dots,k_n

bir örnekleme olduğu kabul edilsin. O zaman p değerinin tahmini şöyle verilir:

\widehat{p} = \left(\frac1n \sum_{i=1}^n k_i\right)^{-1}. \!

Bayes tipi sonuç çıkartıcı istatistik kuramına göre ise p parametresi için eşlenik önsel dağılımı bir Beta dağılımı olur. Eğer herhangi bir p parametre değeri için önsel olarak  :Beta(αβ) verilmiş ise, sonsal dağılım şöyle ifade edilir:

p \sim \mathrm{Beta}\left(\alpha+n,\ \beta+\sum_{i=1}^n (k_i-1)\right). \!

α ve β değerleri sıfıra yaklaştıkca, sonrasal ortalama olan \mathrm{E}[p] maksimum olabilirlilik tahmini olan \widehat{p} değerine yaklaşır.

Diğer alternatif halde, i=1,\dots,n için k_i \geq 0 olduğu halde bir örneklemin ifadesi k_1,\dots,k_n olsun. Bu halde p şöyle tahmin edilir:

\widehat{p} = \left(1 + \frac1n \sum_{i=1}^n k_i\right)^{-1}. \!

Bir Beta(αβ) önseli için verilmiş p için sonsal dağılım şudur:

p \sim \mathrm{Beta}\left(\alpha+n,\ \beta+\sum_{i=1}^n k_i\right). \!

Tekrar, sonsal ortalama olan \mathrm{E}[p] değerinin, αve β sıfır değerine yaklaştıkca, maksimum olabilirlilik tahmini \widehat{p} değerine yaklaşır.

Diğer özellikler[değiştir | kaynağı değiştir]

G_X(s) = \frac{s\,p}{1-s\,(1-p)}, \!
G_Y(s) = \frac{p}{1-s\,(1-p)}, \quad |s| < (1-p)^{-1}. \!
  • Geometrik dağılım, sürekli olasılık dağılım analogu olan üstel dağılım gibi, belleksiz olma özelliği gösterir. Bu demektir ki eğer bir deneyi ilk başarıyı elde edinceye kadar tekrarlarsak, birinci başarı daha ortaya çıkmadığı için, daha fazla sayıda yapılması gerek deneme sayısı için koşullu olasılık dağılımı o zamana kadar gözlemi yapılmış olan başarısızlık sayısına bağlı değildir. Deneme arka arkaya atılan zar veya havaya atılan ve tutulan madeni para ile yapılmakta ise, her deneme için önceki başarısızlıklar hakkında bilgi bulmak, sonuç bulmak icin hiç yarar sağlamaz; yani deneme belleksizdir. Geometrik dağılım gerçekte tek belleksiz olan aralıklı olasılık dağılımıdır.
  • Bütün tamsayılar seti, yani {1, 2, 3, ...), üzerinde desteklenen ve değeri verilmiş bir μ beklenen değeri bulunan, bütün aralıklı olasılık dağılımlar arasında, X rassal değişkeni için p = 1/μ parametreli geometrik dağılım en büyük entropi gösterenidir.
  • İlk başarıdan önce başarısızlık sayısı olan Y rassal değeri için geometrik dağılım, sonsuz bölünebilirlilik özelliği gösterir. Bu demektir ki her hangi bir pozitif tamsayı olan n için, bağımsız ve birbiri ile aynı dağılım gösteren Y1, ..., Yn rassal değişkenleri vardır ve bunların toplamı Y ile aynı dağılım gösterir. Yalnızca n=1 hariç, bunlar geometrik dağılım göstermezler, bunların dağılımı negatif binom dağılımı ile temsil edilir.
  • Geometrik dağılım gösteren bir Y rassal değişkeni için olasılık ondalıklı olarak yazılınca her on üssü için teksayı seri halinde bağımsızlık özelliği gösteren birer rassal değişken değeri olur. Örneğin, yüzlük sayı gösteren D teksayısı için bu rassal değişkenin olasılık dağılımı şöyle verilir:
\Pr(D=d) = {q^{100d} \over {1 + q^{100} + q^{200} + \cdots + q^{900}}},
burada q = 1 − p. Diğer on üssü teksayıları için de benzer olasılık dağılımları ortaya çıkartılabilir.

Diğer dağılımlarla ilişkiler[değiştir | kaynağı değiştir]

  • Y için geometrik dağılım r=1 olan özel bir negatif binom dağılımıdır. Daha genel olarak eğer 'Y1,...,Yr rassal değişkenleri için bağımsızlık gösteren p parametreli bir sıra geometrik dağılımlar görülüyorsa
Z = \sum_{m=1}^r Y_m
r ve p parametreleri olan bir negatif binom dağılımı gösterir.
  • Eğer Y1,...,Yr bir sıra bağımsız (olasılıkla değişik başarı parametreleri p^{(m)}) olan) geometrik dağılım gösteren değişkenlerse, bunların minimum değerlerini ifade eden
W = \min_{m} Y_m\,
terimi de p parametresi
1-\prod_{m}(1-p^{(m)})
değerde olan bir geometrik dağılım gösterir.
  • Eğer 0 < r < 1, ise ve bir rassal değişken olan k = 1, 2, 3, ... t i Xk beklenen değeri rk/k olan bir Poisson dağılımı gösteriyorsa, o zaman
\sum_{k=1}^\infty k\,X_k
(0, 1, 2, ....) setinden değerler alan ve beklenen değeri r/(1 − r) olan bir geometrik dağılım gösterir.
  • Üstel dağılım geometrik dağılımın sürekli değişkenli analog benzeridir. Eğer bir üstel dağılım

gösteren rassal değişken değerleri tabandan yukarıya doğru, tavana en yakın tamsayıya yuvarlanırlarsa bu tamsayı halindeki rassal değişken de geometrik dağılım gösterir.

Ayrıca bakınız[değiştir | kaynağı değiştir]

Kaynak[değiştir | kaynağı değiştir]

Dış bağlantılar[değiştir | kaynağı değiştir]