Birikimli dağılım fonksiyonu

Vikipedi, özgür ansiklopedi
Atla: kullan, ara

Olasılık kuramı ve istatistik bilim dallarında birikimli dağılım fonksiyonu bir reel değerli rassal değişken olan Xin olasılık dağılımını tümüyle tanımlayan bir fonksiyondur. Olasılık dağılım fonksiyonu veya sadece dağılım fonksiyonu olarak da anılmaktadır. [1]. Her bir reel sayı olan x için X'in birikimli dağılım fonksiyonu şöyle ifade edilir:

x \to F_X(x) = \operatorname{P}(X\leq x),

Burada sağ taraf xe eşit veya xden daha küçük değerler alan rassal değişken X için olasılık değerlerini temsil eder. Böylece, Xin (ab] aralığında bulunma olasılığı

F_X(b)-F_X(a) if a < b.

olur.

Matematik notasyon kullanma kuralı şöyle uygulanır: Eğer birkaç rassal değişken X, Y, ...vb. kullanılırsa alt-endeksler verilir ama tek rassal değişken kullanılırsa alt-endeks verilmez. Bir başka notasyon kullanış kuralına göre, birikimli dağılım fonksiyonu F için, olasılık yoğunluk fonksiyonu veya olasılık kütle fonksiyonu için f kullanılmalıdır. Bu notasyon kullanılma kuralları genellikle olasılık konuları için geçerlidir; ancak bazı özel olasılık dağılımları (örneğin normal dağılım) için sırf o fonksiyonlar için özel notasyon kullanılır.

X için birikimli dağılım fonksiyonu, olasılık yoğunluk fonksiyonu olan f terimi ile şöyle ifade edilir:

F(x) = \int_{-\infty}^x f(t)\,dt

Dikkat edilmelidir ki verilen tanımlama içinde bulunan '≤' (eşit ve daha az) işareti bir klasik kullanılma alışkanlığından ortaya çıkmıştır ve diğer bir şekilde '>=' olma imkânı da vardır. '≤' genellikle kullanıldığı için bu konvensiyona uyulacaktır. Binom ve Poisson dağılımları için hazırlanmış ve pratik problem çözümleri için genellikle kullanılan olasılık tablolari da bu tür tanım kullanırlar. Karekteristik fonksiyon için Levy'nin ters bulma formülü gibi önemli formüller de bu (eşit ve daha az) kullanımına dayandırılmıştır.

Özellikler[değiştir | kaynağı değiştir]

Üsten alta doğru. Bir aralıklı dağılım için, bir sürekli dağılım için ve hem sürekli bir kısmı hem de aralıklı bir kısmı bulunan bir dağılım için birikimli dağılım fonksiyonları.

Her birikimli dağılım fonksiyonu, F, genellikle (ama mutlaka hiç değişmez şekilde değil) dört özellik gösterir:

  1. F monoton artan özelliktedir;
  2. F sağdan sürekli olur;
  3. \lim_{x\to -\infty}F(x)=0, \quad ;
  4. \lim_{x\to +\infty}F(x)=1.

Bu dört özellik gösteren her fonksiyon bir birikimli dağılım fonksiyonudur. Bu dört fonksiyon özelliği gösteren bütün birikimli dağılım fonksiyonları cadlag tipi fonksiyonlardır.

Eğer X bir aralıklı rassal değişken ise, o halde pi = P(xi) olasılıklarla x1, x2, ... değerlerini alırlar ve X için birikimli dağılım fonksiyonu xi noktalarında süreksiz olup

F(x) = \operatorname{P}(X\leq x) = \sum_{x_i \leq x} \operatorname{P}(X = x_i) = \sum_{x_i \leq x} p(x_i)

arasında sabit olur.

Eğer birikimli dağılım fonksiyonu F bir sürekli fonksiyon ise, o halde X bir sürekli rassal değişkendir. Bundan daha fazla olarak eğer F mutlak sürekli ise, o halde tüm reel a ve b sayıları için

F(b)-F(a) = \operatorname{P}(a\leq X\leq b) = \int_a^b f(x)\,dx

şeklinde bir Lebesque entegral fonksiyonu f(x) ortaya çıkmaktadır. (Genellikle, eğer dağılımın sürekli olduğu açıkca bildirilmezse, iki eşitliklerde birincisi geçerli olmayacaktır. Dağılımın sürekli olması P(X = a) = P(X = b) = 0 ifadesinin geçerli olduğunu ortaya çıkartıp, bu eşitlikler için "<" ve "≤" arasındaki farkın önemli olmasını ortadan kaldırmaktadır.) f fonksiyonu neredeyse her yerde F fonksiyonunun türevine eşittir ve X için dağılım olasılık yoğunluk fonksiyonu olarak adlandırılmaktadır.


Nokta olasılığı[değiştir | kaynağı değiştir]

Xin tıpatıp b değerine eşit olmasının nokta olasılığı şöyle bulunur:

\operatorname{P}(X=b) = F(b) - \lim_{x \to b^{-}} F(x)

Betimleyici istatistikte empirik birikimli çokluluk dağılımı tanımı[değiştir | kaynağı değiştir]

İstatistikte empirik analizlerde çokluluk dağılımlar icin birikimli çokluluk fonksiyonu ve bunun grafik gösterimi olan S-şekilli grafik (en:ogive) eğer veriler niceliksel aralıklı ölçekli ve orantılı ölçekli veya sırasal ölçekli ise bulunabilir. (Eğer veriler isimsel ölçekli ise bulunmaz.)

Notasyon olarak birikimli çokluluk fonksiyonuda basitce

\ F(x)

olarak ifade edilip gözlemlerin sayısal değerlerinin x değerine eşit veya bu değerden daha düşük olmalarının yüzde orantılarını gösterir.

Eğer x_1, ..., x_n gözlemler ise, ve bu gözlemlerin orantılı çokluluğu f_1, ..., f_n ise birikimli çokluluk fonksiyonunun analitik ifadesi şöyle verilir:

F(x)=\begin{cases}0 & x < x_1 \\F_i=\sum_{j \leq i}f_j & x_i \leq x < x_{i+1} \\ 1 & x \geq x_n \end{cases}

Burada F_i değeri birikimliçokluluk olarak anılır.

Kolmogorov-Smirnov'un ve Kuiper'in sınamaları[değiştir | kaynağı değiştir]

Kolmogorov-Smirnov sınaması birikimli dağılım fonksiyonlarına dayanır veya bir empirik dağılımın bir ideal teorik dağılımdan farklı olup olmadığını ya da iki empirik dağılımın birbirinden farklı olup olmadıklarını sınamak için kullanılır. Bu teste yakın olan Kuiper'in sınaması is eğer dağılım dalgalanma gösteriyorsa (örneğin haftanın değişik günlerinde değişik olarak) uygulanması önerilir. Örnegin, Kuiper'in sınamsı belirli bir mal satışlarının haftanın günlerine veya ayın günlerine göre değişip değişmediğini sınamak için kullanabiliriz.

Tamamlayıcı birikimli dağılım fonksiyonu[değiştir | kaynağı değiştir]

Bazan çalışma hedefi bu sorunun tersini incelemek gerektirir ve sorun rassal değişkenin ne kadar zaman belli bir değerden daha fazla olacağını araştırmak gerekir. Buna tamamlayıcı birikimli dağılım fonksiyon adı verilir ve bu fonksiyon şöyle tanımlanır:

F_c(x) = \operatorname{P}(X > x) = 1 - F(x).

Yaşam analizi sorunları için F_c(x) fonksiyonu yaşam fonksiyonu olarak adlandırılır ve olasılık notasyonu ile  S(x) olarak ifade edilir.

Bükülmüş birikimli dağılım[değiştir | kaynağı değiştir]

Bir normal dağılım fonksiyonu için bükülmüş birikimli bir dağılım denklemi

Bir birikimli dağılım fonksiyonu genel olarak S-şekilini almaktadır. Ancak alternatif bir gösterim olarak bükülmüş birikimli dağılım grafiği veya tepe gösterimi kullanılabilir. [2] Bu grafikte alt taraf için artan değerli eksen (alt-eksen) ve üst taraf için azalan değerli eksen (üst-eksen) kullanılarak S-eğrisinin üst tarafı geriye bükülmüş olarak gösterilir. Bu şekilde grafik dağılımın ya teorik dağılımın ya da emprik dağılımın medyanını ve yayılımını özellikle incelemek için kullanılır.

Örnekler[değiştir | kaynağı değiştir]

Bir örnek olarak, Xin [ [0, 1] aralığında tekdüze dağılım gösterdiği kabul edilsin. O halde X için birikimli dağılım fonksiyonu şöyle verilir:

F(x) = \begin{cases}
0 &:\ x < 0\\
x &:\ 0 \le x \le 1\\
1 &:\ 1 < x
\end{cases}

Diğer bir örnek olarak Xin sadece aralıklı olarak 0 ve 1 değerler aldığı kabul edilsin. Bu halde X için birikimli dağılım fonksiyonu şudur:

F(x) = \begin{cases}
0 &:\ x < 0\\
1/2 &:\ 0 \le x < 1\\
1 &:\ 1 \le x
\end{cases}

Ters fonksiyon[değiştir | kaynağı değiştir]

Eğer bir birikimli dağılım fonksiyonu sürekli ve kesinlikle hep artma gösterirse, o halde

 F^{-1}( y ), y \ [0,1] aralığı-için

 x tek bir reel sayıya eşittir; şöyle ki  F(x) = y

Ne yazıktır ki genellikle bu dağılım için bir ters bulunmamaktadır. y \ [0,1] aralığı-için


F^{-1}( y ) = \inf_{r \in \mathbb{R}} \{ F( r ) > y \}
.

olur.

Örneğin 1: Medyan F^{-1}( 0.5 ) olur.

Örneğin 2: Eğer  \tau = F^{-1}( 0.95 ) bu fonksiyona koyarsak,  \tau  %95inci yüzdebirlik olur.

Bir birikimli dağılım fonksiyon için ters fonksiyon kuantil fonksiyonu olarak anılır.

Çoklu değişirlilik hali[değiştir | kaynağı değiştir]

Birden fazla birlikte değişen rassal değişkenle ilgilenmekte isek, bir ortak birikimli dağılım fonksiyonuda tanımlanabilir. Örnegin, bir çift rassal değişken olan X,Y için ortak birikimli dağılım fonksiyonu şöyle verilir:

x,y \to F(x,y) = \operatorname{P}(X\leq x,Y\leq y),

Burada sağ-taraf X rassal değişkeninin xe eşit veya xden daha küçük değerler aldığında ve aynı zamanda Y rassal değişkeninin ye eşit veya yden daha küçük değerler aldığında ortaya çıkan olasılığı ifade etmektedir.

İçsel kaynaklar[değiştir | kaynağı değiştir]

Referanslar[değiştir | kaynağı değiştir]