Multinom dağılımı

Vikipedi, özgür ansiklopedi
Atla: kullan, ara
Multinom
Olasılık kütle fonksiyonu
Yığmalı dağılım fonksiyonu
Parametreler n > 0 denemeler sayısı (tamsayı)
p_1, \ldots p_k olay olasılıkları(\Sigma p_i = 1)
Destek X_i \in \{0,\dots,n\}
\Sigma X_i = n\!
Olasılık kütle fonksiyonu (OYF) \frac{n!}{x_1!\cdots x_k!} p_1^{x_1} \cdots p_k^{x_k}
Yığmalı dağılım fonksiyonu (YDF)
Ortalama E\{X_i\} = np_i
Medyan
Mod
Varyans {\mathrm{Var}}(X_i) = n p_i (1-p_i)
{\mathrm{Cov}}(X_i,X_j) = - n p_i p_j (i\neq j)
Çarpıklık
Fazladan basıklık
Entropi
Moment üreten fonksiyon (mf) \left( \sum_{i=1}^k p_i e^{t_i} \right)^n
Karakteristik fonksiyon

Olasılık kuramı ve istatistik bilim kollarında, multinom dağılımı binom dağılımının genelleştirilmesidir.

Binom dağılım n sayıda her biri istatistiksel olarak bağımsız olan 'Bernoulli denemeleri içinde her bir deneme için başarı olasılığı bilinip ve aynı olursa elde edilebilen başarılı sonuç sayısının olasılık dağılımıdır.

Bir multinom dağılımında her deneme sonlu bir sabit olan k sayıda mümkün sonuçdan sadece tek birinin gerçekleşmesi ile son bulur. Bu k sayıda mümkün sonucun her biri için sabit olasılıklar, yani

p1, ..., pk

bulunmaktadır; bunlar için

pi ≥ 0 eger i = 1, ..., k

ve \sum_{i=1}^k p_i = 1 n sayıda bağımsız deneme yapılır.

O zaman rassal değişkenler olan X_i n deneme yapılırsa i sayılı sonucun gözümlenmesi sayısını ifade eder. X=(X_1,\ldots,X_k) ifadesi ise n ve vektör p parametreleri olan bir multinom dağılımı gösterir. Vektör p=(p1, ..., pk) olarak da yazılabilir.

Tanımlama[değiştir | kaynağı değiştir]

Olasılık kütle fonksiyonu[değiştir | kaynağı değiştir]

Multinom dağılımı için olasılık kütle fonksiyonu şudur:

 \begin{align}
f(x_1,\ldots,x_k;n,p_1,\ldots,p_k) & {} = \Pr(X_1 = x_1\mbox{ ve }\dots\mbox{ ve }X_k = x_k) \\  \\
& {} = \begin{cases} { \displaystyle {n! \over x_1!\cdots x_k!}p_1^{x_1}\cdots p_k^{x_k}}, \quad &
\mbox{eger } \sum_{i=1}^k x_i=n \\  \\
0 & \mbox{diger hallerde,} \end{cases}
\end{align}

burada x1, ..., xk negatif olmayan tamsayılardır.

Özellikleri[değiştir | kaynağı değiştir]

Beklenen değer şudur:

\operatorname{E}(X_i) = n p_i.

Kovaryans matrisi şöyle gösterilir:

Bu matrisin orta çarpazında bulunan elemanlar bir binom dağılımlı rassal değişken için varyansdırlar:

\operatorname{var}(X_i)=np_i(1-p_i).

Orta çapraz dışındakı elemenlar kovaryans değerleridir:

\operatorname{cov}(X_i,X_j)=-np_i p_j

Burada i, j birinden her zaman farklıdır.

Bütün kovaryans değerleri negatif işaretlidir; çünkü sabit bir N değeri için, bir multinom vektörünün bir parçasında olan artış, diğer bir parçasında bir düşüş olmasını gerektirir.

Bu kovaryans matrisi rankı k - 1 olan bir k × k büyüklüğünde bir matristir.

Bununla ilişkili olan bir diğer matrik corelasyon matrisidir. Korelasyon matrisinin ana çapraz dışı elemanlari şöyle bulunurlar:

\rho(X_i,X_j) = -\sqrt{\frac{p_i p_j}{ (1-p_i)(1-p_j)}}.

ve ana çapraz elemanlarının 1 olduğu aşikardır. Dikkat edilirse bu matris elemanlarının hesaplanmasında örneklem büyüklüğü hiç rol oynamaz. Bu matrisin her bir k parçası uygun bir i indeksi için ayrı ayrı olarak n ve pi parametreleri olan bir binom dağılımı gösterir.

Bir multinom dağılımı için destek

\{(n_1,\dots,n_k)\in \mathbb{N}^{k}| n_1+\cdots+n_k=n\}.

değerinde sağlanır ve bunun eleman sayısı

{n+k-1 \choose k} = \left\langle \begin{matrix}n \\ k \end{matrix}\right\rangle,

olur. Bu k tipte olan bir multiset n-kombinasyonudur.

İlişkili dağılımlar[değiştir | kaynağı değiştir]

Ayrıca bakınız[değiştir | kaynağı değiştir]

Kaynakça[değiştir | kaynağı değiştir]

Dış bağlantılar[değiştir | kaynağı değiştir]

Bibliyografya[değiştir | kaynağı değiştir]

  • Merran Evans, Nicholas Hastings ve Brian Peacock (2000) Statistical Distribution 3ncu ed. Wiley: New York say.134-13 isbn = 0-471-37124-6