Üstel dağılım

Vikipedi, özgür ansiklopedi
Atla: kullan, ara
Üstel
Olasılık yoğunluk fonksiyonu
Olasılık yoğunluk fonksiyonu
Yığmalı dağılım fonksiyonu
Yığmalı dağılım fonksiyonu
Parametreler \lambda > 0 \, oran veya ters ölçek (reel)
Destek [0, \infty)\!
Olasılık yoğunluk fonksiyonu (OYF) \lambda e^{-\lambda x}
Yığmalı dağılım fonksiyonu (YDF) 1 - e^{-\lambda x}
Ortalama \frac{1}{\lambda}\,
Medyan \frac{\ln(2)}{\lambda}\,
Mod 0\,
Varyans \lambda^{-2}\,
Çarpıklık 2\,
Fazladan basıklık 6\,
Entropi 1 - \ln(\lambda)\,
Moment üreten fonksiyon (mf) \left(1 - \frac{t}{\lambda}\right)^{-1}\,
Karakteristik fonksiyon \left(1 - \frac{it}{\lambda}\right)^{-1}\,

Olasılık kuramı ve istatistik bilim dallarında üstel dağılımı bir sürekli olasılık dağılımları grubudur. Sabit ortalama değişme haddinde ortaya çıkan bağımsız olaylar arasındaki zaman aralığını modelleştirirken bir üstel dağılım doğal olarak ortaya çıkar.

Tipik karakteristikler[değiştir | kaynağı değiştir]

Olasılık yoğunluk fonksiyonu[değiştir | kaynağı değiştir]

Bir üstel dağılım için olasılık yoğunluk fonksiyonu şu şekli alır:


f(x;\lambda) = \left\{\begin{matrix}
\lambda e^{-\lambda x} &,\; x \ge 0, \\
0 &,\; x < 0.
\end{matrix}\right.

Burada λ > 0 dağılım için tek parametredir ve çok zaman oran parametresi olarak anılır. Dağılım için destek [0,∞) aralığında verilir. Eğer X rassal değişkeni bu üstel dağılım gösteriyorsa bu şöyle yazılır:

X ~ Üstel(λ).

Ancak bir diğer şekilde değişik parametreleme ile ise üstel dağılım için olasılık yoğunluk fonksiyonu şöyle ifade edilir:


f(x;\beta) = \left\{\begin{matrix}
\frac{1}{\beta} e^{-x/\beta} &,\; x \ge 0, \\
0 &,\; x < 0.
\end{matrix}\right.

Burada β > 0 bir ölçek parametresidir ve yukarıda tanımlanan oran parametresi olan λ'nın bir üstü değeri çarpım tersi, yani β=1/λ; dır. Bu çeşit tanımlamada β kalım parametresi çünkü eğer bir rassal değişken X bir biyolojik veya mekanik sistem M için ömür geçirme zaman uzunluğu ise ve X ~ Üstel(β) ise

\mathbb{E}[X] = \beta

yani M için beklenen hayatta kalım süresi zaman birimleri ile β olur.

Bu ikinci şekilde tanımlama bazan birinci tanımlamadan daha kullanışlı olur ve bazı istatistikçiler bu ikinci tanımı üstel dağılım için standard tanım kabul etmektedirler.

Bu gerçek dikkat çekilmesi gereken bir konu olarak burada işaret edilmektedir. Çünkü iki değişik tanım bazan bir kavram karmaşaklığına neden olmaktadır. Genel olarak üstel dağılımı kullanan istatistikçi birinci tanım kullanırsa

X ~ Üstel(λ)

ve ikinci tanımı kullanırsa

X ~ Üstel(β)

yazılır ve β=1/λ olur.

Yığmalı dağılım fonksiyonu[değiştir | kaynağı değiştir]

Genel olarak kullanılan bir yönteme göre yığmalı dağılım fonksiyonu şu ifade ile verilir:


F(x;\lambda) = \left\{\begin{matrix}
1-e^{-\lambda x}&,\; x \ge 0, \\
0 &,\; x < 0.
\end{matrix}\right.


Ortaya çıkma ve uygulanma[değiştir | kaynağı değiştir]

Bir homojen Poisson süreçde varışlar arasındaki zaman dönemlerini tanımlarken üstel dağılım doğal olarak ortaya çıkar.

Üstel dağılım geometrik dağılımin sürekli dağılımlara uzantısı olarak görülebilir. Geometrik dağılım durumu değiştirmek gereken Bernoulli süreçlerinin sayısını tanımlar ve bu yüzden bir ayrık süreçtir. Buna karşılık, durumu değiştirmek için sürekli bir süreç için geçen zamanı tanımlar.

Pratik gerçek hayatta bir değişme oranının (veya her zaman birimi içinde olasılığın) gerçekleşmesi çok nadirdir. Örneğin, bir mobil telefona gelen çağrılar birim saatin gün içindeki yerine değişir. Fakat araştırmamızı günün öyle bir zaman aralığına odaklayabiliriz ki (diyelim öğleden sonra 2 ile 4), bu zaman aralığından gelen telefon çağrı ortalamları kabaca sabit olabilir. Üstel dağılım o halde iyi bir yaklaşık model olarak kullanılabilir ve en son çağrıdan sonra ne zaman aralığından sonra bir yeni çağrının geleceği hakkında üstel dağılım kullanarak tahmin yapabiliriz.

Benzer şekilde uzun ve karmaşık varsayımlar ve açıklamalar pratikte yaklaşık olarak üstel dağılım gösteren değişkenlere da uygulan şu olaylar için de uygulanabilir:

  • bir radyoaktif parçacığın bozunmasına kadar geçen zaman veya bir geiger sayacının birbirini takibedecek düdük seslerinin arasında geçen zamanın tahmini;
  • gelecek telefon çağrısını en son yaptığınız çağrıdan ne kadar zaman sonra yapacağınız;
  • indirgenmis şekilde olan kredi rizikosu modelinde bir firmanın borçluları ile ilgili olarak en son borcunu ödeyemiyecegini bildiren borçludan ne zaman sonra bir başka daha borç ödeyemiyecek borçlu çıkacağını tahmin etmek.

Özellikler[değiştir | kaynağı değiştir]

Ortalama ve varyans[değiştir | kaynağı değiştir]

Bir λ oran parametresi ile üstel dağılım gösteren bir X rassal değişkeni için ortalama veya beklenen değer şöyle verilir:

\mathrm{E}[X] = \frac{1}{\lambda}. \!

Bu verilen pratik örneklerden sağduyu ile çıkarılabilir. Örneğin eğer telefon çağrı ortalama oranı saatte 3 ise (λ), her telefon çağrısı için ortalama 1/3 saat veya 20 dakika (β) beklemek gerekmektedir

X icin varyans şöyle verilir

\mathrm{Var}[X] = \frac{1}{\lambda^2}. \!

Belleksizlik[değiştir | kaynağı değiştir]

Üstel dağılımın bir önemli niteliği de belleksiz olmasıdır. Bu demektir ki eğer bir rassal değişken T üstel dağılım gösteriyorsa, onun koşullu olasılığı

P(T > s + t\; |\; T > s) = P(T > t) \;\; \hbox{butun}\ s, t \ge 0.

ifadesine uygunluk gösterir. Buna göre, bir hizmet noktasındaki hizmet ve bekleme kuyruğu problemi örneği için bir koşullu olasılık olan ilk varışın 30 saniye geçtikten sonra ortaya çıkmadığını bilerek ilk varıştan sonra 10 saniyeden daha fazla beklemek gereğinin olasılığının, birinci varıştan sonra 10 saniyeden daha fazla bekleme gereğinin koşulsuz başlangıç olasığı arasında bir fark yoktur. Bu çok kere olasılık hesaplarını ilk gören kişiler tarafından yanlış anlaşılmaktadır:

P(T > 40 | T > 30) = P(T > 10)

gerçeği

T>40 ve T>30

olayları birbirinden bağımsızdır anlamına gelmez. İlk varışa kadar T bekleme zamanının olasılık dağılımının belleksizlik karakteri olduğunu bildirmek

\mathrm{(Dogru)}\ P(T>40 \mid T>30)=P(T>10).

olur demektir; yoksa

\mathrm{(Yanlis)}\ P(T>40 \mid T>30)=P(T>40).

demek değildir çünkü bu ikinci ifade bağımsızlık kavramını açıklar ve burada olaylar bağımsız değildir.

Bütün mevcut dağılımlar arasında sadece üstel dağılımlar ve geometrik dağılımlar belleksizlik özelliği taşırlar.

Üstel dağılımının ayrıca sabit bir tehlike fonksiyonu bulunmaktadır.

Dörtebirlikler[değiştir | kaynağı değiştir]

Bir λ parametreli üstel dağılım için (ters yığmalı dağılım fonksiyonu) şudur:

F^{-1}(p;\lambda) = \frac{-\ln(1-p)}{\lambda}, \!

burada 0 ≤ p < 1.

Onun için şu ifadeler dörttebirlikler verir:

birinci dörttebirlik : \ln(4/3)/\lambda\,
medyan : \ln(2)/\lambda\,
üçüncü dörttebirlik : \ln(4)/\lambda\,

Kullback-Leibler ayrılımı[değiştir | kaynağı değiştir]

'Gerçek' üstel dağılım olan Exp(λ0) ile ('yaklaşık' dağılım) olan Exp(λ) arasında yönlendirilmiş Kullback-Leibler ayrılımı şöyle verilir:


\Delta(\lambda || \lambda_0) = \log(\lambda) - \log(\lambda_0) + \frac{\lambda_0}{\lambda} - 1.

Maksimum entropi dağılımı[değiştir | kaynağı değiştir]

[0,∞) and mean μ, de destekli bulunan bütün sürekli olasılık dağılımları arasında sadece λ = 1/μ parametresi ile üstel dağılımın en yüksek entropisi bulunmaktadır.

Üstel rassal değişirlerin minimumu için dağılım[değiştir | kaynağı değiştir]

X1, ..., Xn bağımsız oran parametreleri λ1, ..., λn olan üstel olarak dağılım gösteren rassal değişkenler olsun. Bu halde


\min\{\,X_1,\dots,X_n\,\}

ifadesi de üstel dağılımdır ve bu dağılımın parametresi


\lambda = \lambda_1+\cdots+\lambda_n.\,

olur.

Fakat,


\max\{\,X_1,\dots,X_n\,\}

üstel dağılım göstermez.

Parametre tahmin edilmesi[değiştir | kaynağı değiştir]

Verilmiş bir değişkenin üstel dağılım gösterdiği bilinmiş olsun ve oran parametresi olan λnın değerinin tahmin edilmesi gerekmektedir.

Maksimum olabilirlilik[değiştir | kaynağı değiştir]

İlgi gösterilen değişkenden bir bağımsız aynen dağılma gösteren örneklem x = (x1, ..., xn) olarak seçilsin; o halde λ için olabilirlilik fonksiyonu şöyle verilir:

 L(\lambda) = \prod_{i=1}^n \lambda \, \exp(-\lambda x_i) = \lambda^n \, \exp\!\left(\!-\lambda \sum_{i=1}^n x_i\right)=\lambda^n\exp\left(-\lambda n \overline{x}\right),

burada

\overline{x}={1 \over n}\sum_{i=1}^n x_i

örnek ortalamasıdır.

Olabilirlik fonksiyonunun logaritmasının türevi şudur:

\frac{\mathrm{d}}{\mathrm{d}\lambda} \ln L(\lambda) = \frac{\mathrm{d}}{\mathrm{d}\lambda} \left( n \ln(\lambda) - \lambda n\overline{x} \right) = {n \over \lambda}-n\overline{x}\ \left\{\begin{matrix} > 0 & \mbox{if}\ 0 < \lambda < 1/\overline{x}, \\  \\ = 0 & \mbox{if}\ \lambda = 1/\overline{x}, \\  \\ < 0 & \mbox{if}\ \lambda > 1/\overline{x}. \end{matrix}\right.

Bu nedenle oran parametresinin maksimum olabilirlilik tahmini şöyle verilir:

\widehat{\lambda} = \frac1{\overline{x}}.

Bayes tipi çıkarımsal analiz[değiştir | kaynağı değiştir]

Bir üstel dağılımın eşlenik önseli bir gamma dağılımı olur (çünkü üstel dağılım bir özel hal gamma dağılımıdır). Gamma olasılık dağılım fonksiyonunun şu çeşit parametrik tanımı analizde kullanılacaktır:

 \mathrm{Gamma}(\lambda \,;\, \alpha, \beta) = \frac{\beta^{\alpha}}{\Gamma(\alpha)} \, \lambda^{\alpha-1} \, \exp(-\lambda\,\beta). \!

Bu halde p için sonsal dağılım yukarıda tanımlanan olabilirlilik fonksiyonu ve bir gamma önsel ile şöyle ifade edilebilir:

p(\lambda) \propto L(\lambda) \times \mathrm{Gamma}(\lambda \,;\, \alpha, \beta)
= \lambda^n \, \exp(-\lambda\,n\overline{x}) \times \frac{\beta^{\alpha}}{\Gamma(\alpha)} \, \lambda^{\alpha-1} \, \exp(-\lambda\,\beta)
\propto \lambda^{(\alpha+n)-1} \, \exp(-\lambda\,(\beta + n\overline{x})).

Şimdi p için sonsal yoğunluk bir kayıp olmuş normalizasyon sabiti değerine kadar tanımlanmıştır.

Bunun dağılımı gamma olduğu için bu eksiklik hemen tamamlanabilir ve şu ifade elde edilir:

 p(\lambda) = \mathrm{Gamma}(\lambda \,;\, \alpha + n, \beta + n \overline{x}).

Burada parametre α önsel gözlemlerin sayısı olarak yorumlanabilir ve β önsel gözlemlerin toplamıdır.

Üstel değişebilirleri üretme[değiştir | kaynağı değiştir]

Üstel değişebilirler için üstel dağılım üreten kavramsal olarak bir basit yöntem ters dönüşüm örnekleme dayanır: Verilmiş olan bir birim aralıkta, yani [0,1] arasında, bulunan bir tekdüze dağılımdan çekilmiş U rassal değişebiliri verilmiş olsun,

T = F^{-1}(U) \!

değişebiliri bir üstel dağılım gösterir ve F^{-1} ifadesi

F^{-1}(p)=\frac{-\ln(1-p)}{\lambda}. \!

ile tanımlanmış bir kuantil fonksiyonu olur.

Bunun yanında, eğer U (0; 1) aralığında bir tekdüze dağılım gösterirse, 1-U için de aynı özellik gerçektir. Bu demektir ki şu şekilde üstel değişebilirler üretilebilir:

T = \frac{-\ln U}{\lambda}. \!

Üstel değişebilirlerin diğer yöntemlerle üretilebilmesi Knuth (1998)de [1] ve Luc Devroye (1986) da [2] görülebilir.

Üstel değişebilirleri üretmek için bir hızlı yöntem zigurat algoritması iledir.

İlişkili dağılımlar[değiştir | kaynağı değiştir]

\alpha = 1 veya k=1 olur.

  • Eğer
Y = X^{1/\gamma}\, ve X \sim\operatorname{Ustel}(\lambda^{-\gamma})

ise

Y \sim \operatorname{Weibull}(\gamma, \lambda),

olur yani Y Weibull dağılım gösterir. Özellikle, her üstel dağılım da bir Weibull dağılımıdır.

  • Eğer
Y = \sqrt{2X/\lambda} ve X \sim \operatorname{Ustel}(\lambda).

ise

Y \sim \operatorname{Rayleigh}(1/\lambda)

olur; yani Y bir Rayleigh dağılımı gösterir.

  • Eğer
Y = \mu - \beta \log(X/\lambda)\, ve X \sim \operatorname{Ustel}(\lambda).

ise

Y \sim \operatorname{Gumbel}(\mu, \beta),

olur yani Y Gumbel dağılımı gösterir.

  • Eğer iki bağımsız üstel dağılımı olan X_1\, ve X_2\, için Y = X_1 - X_2\, ise
Y \sim \operatorname{Laplace}

olur yani Y Laplace dağılımı gösterir.

  • Bağımsız üstel dağılımlar olan X_i\, için
Y = \min(X_1, \dots, X_N)

ise

Y \sim \operatorname{Ustel}

olur; yani Y bir üstel dağılım gösterir.

  • Eger
Y = \exp(-X\lambda)\, and X \sim \operatorname{Ustel}(\lambda)

ise

Y \sim \operatorname{Tekduze}(0,1),

olur yani Y tekdüze dağılım gösterir.

  • Eğer
X \sim \operatorname{Ustel}(\lambda = 1/2)\,\;.

ise X \sim \chi_2^2 olur yani X icin 2 serbestlik derecesi olan ki-kare dağılımı geçerlidir.

  • X_1\dots X_n \sim \operatorname{Ustel}(\lambda)\, üstel dağılımlı ve bağımsız olsun ve Y = \sum_{i=1}^n X_i\, olsun; o halde Y \sim \operatorname{Gamma}(n,1/\lambda)\,
  • X \sim \operatorname{CarpikLogistik}(\theta)\, ise \operatorname{log}(1 + e^{-X}) \sim \operatorname{Ustel}(\theta)\, olur

Kaynakça[değiştir | kaynağı değiştir]

Notlar[değiştir | kaynağı değiştir]

  1. ^ Donald E. Knuth (1998). The Art of Computer Programming, Cilt 2: Seminumerical Algorithms, 3. ed. Boston: Addison-Wesley. ISBN 0-201-89684-2. Bak bölüm 3.4.1, say. 133.
  2. ^ Luc Devroye (1986). Tekdüze olmayan rassal değişebilir üretimi. New York: Springer-Verlag. ISBN 0-387-96305-7. Bak Bölüm IX, kısım 2, say. 392–401.