Pareto dağılımı

Vikipedi, özgür ansiklopedi
Atla: kullan, ara
Pareto
Olasılık yoğunluk fonksiyonu
Çeşitli k değerleri icin Pareto olasılık yoğunluk fonksiyonları
xm = 1 oldugu halde çeşitli k değerleri icin Pareto olasılık yoğunluk fonksiyonları. Yatay eksen x parametredir. Limitte k → ∞, dağılım δ(x - xm) yaklaşır; burada δ Dirac delta fonksiyonudur.
Yığmalı dağılım fonksiyonu
Çeşitli k değerleri icin Pareto yığmalı dağılım fonksiyonları
xm = 1 oldugu halde çeşitli k değerleri icin Pareto yığmalı dağılım fonksiyonları. Yatay eksen x parametredir.
Parametreler x_\mathrm{m}>0\, ölçek (reel)
k>0\, shape (reel)
Destek x \in [x_\mathrm{m}; +\infty)\!
Olasılık yoğunluk fonksiyonu (OYF) {{{OYF}}}
Yığmalı dağılım fonksiyonu (YDF) {{{YDF}}}
Ortalama \frac{k\,x_\mathrm{m}}{k-1}\! for k>1
Medyan x_\mathrm{m} \sqrt[k]{2}
Mod x_\mathrm{m}\,
Varyans \frac{x_\mathrm{m}^2k}{(k-1)^2(k-2)}\! k>2 icin
Çarpıklık \frac{2(1+k)}{k-3}\,\sqrt{\frac{k-2}{k}}\! k>3 icin
Fazladan basıklık \frac{6(k^3+k^2-6k-2)}{k(k-3)(k-4)}\! k>4 icin
Entropi \ln\left(\frac{k}{x_\mathrm{m}}\right) - \frac{1}{k} - 1\!
Moment üreten fonksiyon (mf) tanımlanmaz; ham momentler icin metine bakın
Karakteristik fonksiyon k(-ix_\mathrm{m}t)^k\Gamma(-k,-ix_\mathrm{m}t)\,

Olasılık kuramı ve istatistik bilim dallarında Pareto dağılımı birçok pratik uygulaması bulunan ve "küçük" bir nesnenin bir "büyük" nesneye dağılımında kararlılık elde edildiği hallerde kullanılan bir sürekli olasılık dağılımı veya bir güç kuramıdır. İlk olarak bir İtalyan iktisatçısı olan Vilfredo Pareto tarafından ekonomilerde bireylerin servet dağılımını göstermek için kullanılmıştır. İktisat bilim dalı dışında bu dağılım Bradford dağılımı adı altında da bilinmektedir.

Uygulama alanları[değiştir | kaynağı değiştir]

Pareto dağılımı iktisat dışında, sosyal bilimler, fen, geofizik, sigortacılık ve birçok gözümlenen doal fonomen incelemeleri için geniş bir alanda uygulanabilimektedir.

  • İktisatta, Wilfredo Pareto'nun ilk defa gösterdiği gibi, herhangi bir ülke veya idarî birim içinde servetin veya gelirin büyük bir kısmının incelenen sosyetenin küçük bir bireyler grubu tarafından sahip olunduğunu bu dağılım çok bariz bir şekilde göstermektedir. Bu öneri biraz daha az bilimsel olarak bazan Pareto prensipi veya 80-20 ilkesi olarak açıklanmakta ve bir ülkenin nüfusunun %20si, servetin veya gelirin %80ine sahip olduğu bu şekilde ifade edilmektedir.
  • Tek hisse senedi için standardize edilmiş fiyat getirileri dağılımı.
  • İçinde çok büyük sayıda sözcük bulunan ve bazı sözcükler çok tekrarlanırken diğer sözcüklerin nadir olarak kullanıldığı uzun metinlerde sözcük uzunluğu dağılımı.
  • Değişik dillerde ve ülkelerde insanlara verilmiş olan isimlerin çokluluk dağılımları.
  • TCP protokolunu kullanan İnternet trafiği için dosya büyüklüğü dağılımı.
  • Mutlak sıfır yakınında Bose-Einstein yoğunlaşmaları grupları.
  • Kum parçacıklarının büyüklük dağılımları.
  • Metoritlerin büyüklük dağılımları.
  • Orman yangınlarında yanan alanların yüzölçüm dağılımları.

Özellikler[değiştir | kaynağı değiştir]

Tanınım[değiştir | kaynağı değiştir]

Eğer X bir Pareto dağılım gösteren rassal değişken ise, Xin olasılığının değerini herhangi bir reel sayı olan xden daha büyük olması, yani tüm xxm için, şu ifade ile verilir:

\Pr(X>x)=\left(\frac{x}{x_\mathrm{m}}\right)^{-k}

Burada xm mutlaka X için verilen en küçük sayı değeri ve k ise pozitif değerde bir parametredir.

Pareto dağılımları ailesinin tanımlanması için iki tane sayısal parametre gerekmektedir:

xm ve k.

Pareto dağılımı iktisatda servet veya gelir dağılımı modelinde kullanildigi zaman k parametresi Pareto endeksi olarak adlandırılır.

Olasılık yoğunluk fonksiyonu[değiştir | kaynağı değiştir]

Bu tanınımdan hemen şu Pareto dağılımı için olasılık yoğunluk fonksiyonu ortaya çıkartılır:

f(x;k,x_\mathrm{m})= k\,\frac{x_\mathrm{m}^k}{x^{k+1}}\ \mbox{for}\ x \ge x_\mathrm{m}. \,

Diğer özellikler[değiştir | kaynağı değiştir]

E(X)=\frac{kx_\mathrm{m}}{k-1} \,

Eğer k ≤ 1 ise beklenen değer sonsuz olacaktır.

\mathrm{var}(X)=\left(\frac{x_\mathrm{m}}{k-1}\right)^2 \frac{k}{k-2}.

Eğer k \le 2 ise, varyans sonsuzdur.

\mu_n'=\frac{kx_\mathrm{m}^n}{k-n}, \,

Ancak bu momentler sadece k>n icin anlamlıdır.

\varphi(t;k,x_\mathrm{m})=k(-ix_\mathrm{m} t)^k\Gamma(-k,-ix_\mathrm{m} t),

Burada Γ(a,x) bir tamamalanmamış Gamma fonksiyonu olur.

f(x;k,x_\mathrm{m})=\mathrm{Ustel}(\ln(x/x_\mathrm{m});k).\,
\lim_{k\rightarrow \infty} f(x;k,x_\mathrm{m})=\delta(x-x_\mathrm{m}). \,

Bir karakterizasyon teoremi[değiştir | kaynağı değiştir]

Bağımsız ve hepsi aynı dağılımlı rassal değiskenler olan Xi, i = 1, 2, 3, ... in k > 0 değerleri için [k, ∞) aralığında desteklenen olasılık dağılımları bulunduğu kabul edilsin. Ayrıca, tüm n değerleri için şu iki rassal değişken olan

min{ X1, ..., Xn } ve :(X1 + ... + Xn)/min{ X1, ..., Xn }

birbirinden bağımsız değişkenler oldukları varsayılsın.

Bu halde her iki değişken de Pareto dağılım gösterir.

Zipf'in yasası ile ilişki[değiştir | kaynağı değiştir]

Pareto dağılımı sürekli olasılık dağılımdır. Zipf'in yasası veya diğer adı ile zeta dağılımı sürekli Pareto dağılımının araklıklı dağılım karşılığıdır.

Pareto, Lorenz ve Gini[değiştir | kaynağı değiştir]

Birkaç Pareto dağılımı için Lorenz eğrileri. k = ∞ kusursuzca eşit dağılımı gösterir (G = 0) ve k = 1 doğrusu ise tüm olarak eşitsiz dağılım gösterimidir (G = 1)

Lorenz eğrisi gösterimi çok kere servet veya gelir dağılımını karakterize etmek için kullanılır.[1] Herhangi bir gelir veya servet dağılımı için Lorenz eğrisi L(F) olarak ifade edilip ya bir olasılık yoğunluk fonksiyonu olan (f(x)) veya yığımlı dağılım fonksiyonu olan (F(x)) ile şöyle ifade edilebilir:

L(F)=\frac{\int_{x_\mathrm{m}}^{x(F)}
xf(x)\,dx}{\int_{x_\mathrm{m}}^\infty xf(x)\,dx}
=\frac{\int_0^F x(F')\,dF'}{\int_0^1 x(F')\,dF'}

Burada x(F) yığımlı dağılım fonksiyonunun tersidir.

Şu Pareto dağılımı için

x(F)=\frac{x_\mathrm{m}}{(1-F)^{1/k}}

Lorenz eğrisi şöyle hesaplanabilir:

L(F) = 1-(1-F)^{1-1/k},\,

L(F) ifadesinin paydası x in ortalama değeri olduğu icin, k değeri 1'e eşit veya 1den büyük olmalıdır. Birkaç Pareto dağılımı ile ilişkili Lorenz eğrileri yukarıdaki gösterimde görülebilir.

Gini katsayısı Lorenz eğrisi ile dağılımda-eşitlik ifade eden [0,0] ile [1,1] noktalarını bağlayan çapraz doğru arasındaki farkı, yani eşitlikten sapmayı, ölçen bir katsayıdır. Özellikle gösterilmiştir ki, Gini katsaysı, Lorenz eğrisi ile dağılımda-eşitlik doğrusu arasındaki alanın yuzolçümünün iki mislidir. [2].

Bu halde Pareto dağılımı icin Gini katsayısı şöyle hesaplanır:

G = 1-2\int_0^1L(F)\,dF = \frac{1}{2k-1}

Parametre kestirimi[değiştir | kaynağı değiştir]

Verilmis bir rastgele orneklem veri dizisi olan x = (x_1, x_2, \dots, x_n) icin k ve x_\mathrm{m} parametreli Paretoi dagilimi icin olabilirlilik fonksiyonu soyle verilir:

L(k, x_\mathrm{m}) = \prod _{i=1} ^n {k \frac {x_\mathrm{m}^k} {x_i^{k+1}}} = k^n x_\mathrm{m}^{nk} \prod _{i=1} ^n {\frac 1 {x_i^{k+1}}}. \!

Boylece logaritmik olabilirlilik fonskiyonu su olur:

\ell(k, x_\mathrm{m}) = n \ln k + nk \ln x_\mathrm{m} - (k + 1) \sum _{i=1} ^n {\ln x_i}. \!

Bu fonksiyondan gorulmektedir ki \ell(k, x_\mathrm{m}) terimi x_\mathrm{m} ile monotonik artis gostermektedir. Yani x_\mathrm{m} degeri ne kadar buyuk olursa olabilirlilik fonksiyonun degeri de oylece buyuk olacaktir. x \ge x_\mathrm{m} oldugu icin sonuc olarak

\widehat x_\mathrm{m} = \min _i {x_i}.

cikartilmaktadir.

k icin bir kestrimci bulmak icin, bunun gerekli kismi turevini almak; yani

\frac{\partial \ell}{\partial k} = \frac{n}{k} + n \ln x_\mathrm{m} - \sum _{i=1} ^n {\ln x_i} = 0.

ve bunun nerede ifira esit oldugunu bulmak gereklidir. Boylece, k icin maksimum olabilirlilik kestirimi su olur:

\widehat k = \frac n {\sum _i {\left( \ln x_i - \ln \widehat x_\mathrm{m} \right)}}.

Bunun beklenen istatistiksel hatasi soyle ifade edilir:

\sigma = \frac {\widehat k} {\sqrt n}. [3]

Grafik olarak gösterim[değiştir | kaynağı değiştir]

Pareto dağılımı için dogrusal ölçek kullanılarak elde edilen gösterimdeki eğrinin genel olarak ortaya çıkartığı uzun kuyruk özelliği, ayni veri dizisi logaritma-logaritma ölçekli bir grafikte gösterilince ortadan kalkmakta ve negatif eğim gösteren bir doğru ortaya çıkmaktadır.

Pareto dağılımı simulasyonu[değiştir | kaynağı değiştir]

Pareto olasilik dagilimi simulasyonu icin bircok komputer istatistik paketinden yardim gorme imkâni su anda bulunmamaktadir. Oysaki Pareto dagilimi ozellikle aktureya hesaplari icin, ozellikle portfoy maliyetlerinin hesaplamasi icin, cok sik olarak kullanilmasi gerekmektedir ve bu hesaplar icin istatistik paketleri ozel Pareto dagilimi simulasyonlari vermemektedirler.

Diger taraftan istatistik paketlerinin verdikleri bazi ozel olasilik dagilimi simulasyonlarini birbirine ekliyerek Pareto dagilimi gosteren rassal degisken simulasyon sonuclari cikartmak zor degildir. Bu surec kolayca basarilmasi icik yordam soyle verilebilir:

Birinci sekilde bir gamma dagilimi tarafinda uretilen bir rastgele orneklem icin bulunan λ ile bir ustel dagilimdan rasgele sayilar ortaya cikartilir; yani

\displaystyle k_\mathrm{Gamma}=k_\mathrm{Pareto}\,

ve

\theta_\mathrm{Gamma}=\frac1{x_{\mathrm{m}_\mathrm{Pareto}}}.

Bu hesaplar 0da baslayan bir rasgele veri serisi uretirler. Bunun ustune x_\mathrm{m} eklemek gerekir.

Diger bir sekilde simulasyon, ters donusum orneklem alma islemi kullanilarak elde edilir. (0; 1) birim araklita bulunan surekli tekduze dagilimdan U degisebiliri icin rastgele olarak elde edilir. Bu degisebilir icin

T=\frac{x_\mathrm{m}}{U^{1/k}}

fonksiyonu Pareto-dagilimi gosterir. [4]

Ayrıca bakınız[değiştir | kaynağı değiştir]

Kaynakça[değiştir | kaynağı değiştir]

  1. ^ Lorenz,M.O. (1905). "Methods of measuring the concentration of wealth." Publications of the American Statistical Association. C.9 say.209–219.
  2. ^ Aabergé,R. (2005) kaynak International Conference to Honor Two Eminent Social Scientists, Mayıs 2005 toplantısında bildiri -- http://www.unisi.it/eventi/GiniLorenz05/25%20may%20paper/PAPER_Aaberge.pdf
  3. ^ http://aps.arxiv.org/PS_cache/cond-mat/pdf/0412/0412004v3.pdf
  4. ^ http://www.stat.psu.edu/~dhunter/R/2006mle.html

Dış bağlantılar[değiştir | kaynağı değiştir]