Merkezi limit teoremi

Vikipedi, özgür ansiklopedi
Atla: kullan, ara

Merkezi limit teoremi büyük bir sayıda olan bağımsız ve aynı dağılım gösteren rassal değişkenler (eğer sonlu varyans değerleri bulunuyorsa) aritmetik ortalamasının, yaklaşık olarak normal dağılım (yani Gauss dağılımı ) göstereceğini ifade eden bir teoremdir. Matematiksel bir ifade ile, bir merkezi limit teoremi olasılık kuramı içinde bulunan bir zayıf yakınsama sonucu setidir. Bunların hepsi, birçok bağımsız aynı dağılım gösteren rassal değişkenlerin herhangi bir toplam değerinin limitte belirli bir "çekim gücü gösteren dağılıma" göre dağılım gösterme eğiliminde olduğu gerçeğini önerir.

Pratik gerçekte birçok anakütle, sonlu varyans gösteren dağılımlar ortaya çıkardıkları için, bu teorem normal olasılık dağılımının önemini açığa çıkartır.

Bu teoreminin kapsamını genişletip sonuçlarını genelleştiren eklere göre (Lindeberg koşulu, Lyapunov koşulu, Gnedenko durumu ve Kolmogorov durumu) sonlu varyans gösterme için mutlaka aynı dağılım gerekmemektedir.

Tarihçe[değiştir | kaynağı değiştir]

Tijms (2004, p.169) [1] yazdığına göre:

Merkezi limit teoreminin tarihi gelişmesi çok enterasandır. Bu teoremin ilk şekli Fransız matematikçi Abraham de Moivre tarafından 1733'te yayınlanarak gayet dikkati çeken bir yazıda bulunmakta ve bu yazıda bir yansız madeni paranın yazı-tura atış sonuçların da kaç defa yazı gelme sayısının dağılımının bir normal dağılım ile yaklaşık olarak açıklanabileceğini ortaya çıkartmıştır. Bu gelişme zamanı için çok zor görünüp nerdeyse unutulmuştur. Bu unutulmuş konu tanınmış Fransız matematikçisi Pierre-Simon Laplace'ın 1812'de yayınladığı çok tanınmış eseri Thoerie Analytique des Probabilites (Olasılıklar İçin Analitik Kuram)'da yeniden ortaya çıkarılmıştır; Laplace, De Moivre'in buluşunu daha da geliştirerek binom dağılımlarının yaklaşık olarak normal dağılım ile ifade edilip hesaplanabileceği sonucunu ortaya atmıştır. Ancak De Moivre gibi Laplace gelişmeleri de yaşadığı çağda çok az dikkati çekmiştir. Sonunda 19. yüzyılın içinde merkezi limit teoreminin önemi anlaşılmış ve 1901 Rus matematikçisi Aleksandr Lyapunov bu teoremi genel bir şekilde açıklamış ve matematik olarak nasıl ortaya çıktığını çok kesin bir şekilde ispatlamıştır. Bugün merkezi limit teoremi olasılık kuramının en önemli ögesi, gayriresmi kralı, olduğu kabul edilmektedir."

[2]

Klasik merkezi limit teoremi[değiştir | kaynağı değiştir]

Merkezi limit teoremi olasılık kuramı için ikinci temel teorem olarak kabul edilmektedir. (Birinci temel teorem büyük sayılar yasasıdır.) Eğer X1, X2, X3, ... n tane bağımsız ve aynı şekilde sonlu sayıda ve μ ortalaması ve σ2 varyansı olan dağılım gösteren rassal değişkenler olsun. Merkezi limit teoremine göre örneklem büyüklüğü n artış gösterdikce, orijinal dağılım her ne şekilde olursa olsun, limitte örneklem ortalamasının dağılımı, ortalaması μ ve varyansı &sigma2/n olan, bir normal dağılıma yakinsanma gösterir.

Rassal değişkenlerin Sn ile ifade edilen toplamı şöyle verilsin:

Sn = X1 + ... + Xn

ve

Z_n = \frac{S_n - n \mu}{\sigma \sqrt{n}}\,,

bir standart normal μ ortalamalı ve \sigma \sqrt{n} varyanslı standart normal dağılım olsun.

Bu yakınsama teoremine göre limitte n-->∞, S'nin dağılımı olan Zn dağılımı N(0,1) standart normal dağılımına yaklaşır.

Bu demektir ki; eğer Φ(z) N(0,1) dağılımının yığmalı dağılım fonksiyonu ise o halde her z reel sayısı için

\lim_{n \to \infty} \mbox{P}(Z_n \le z) = \Phi(z)\,,

veya,

\lim_{n\rightarrow\infty}\mbox{P}\left(\frac{\overline{X}_n-\mu}{\sigma/ \sqrt{n}}\leq z\right)=\Phi(z)\,,

olur. Burada

\overline{X}_n=S_n/n=(X_1+\cdots+X_n)/n\,

örneklem ortalaması olur.

Yillarca, büyük örneklem hacmi pratik olarak n>29 olarak kabul edilmekteydi. Fakat 1990li yıllarda yapılan araştırmalar ortaya çıkarmıştır ki bu pratik kural her zaman geçerli değildir. Eğer anakitle dağılımı çok çarpıklık gösteriyorsa Merkezi Limit Teoreminin geçerli olduğu büyük örneklem hacmi 100 veya hatta 250 bile olması gerekmektedir. Anakütle ne kadar çok çarpıklık gösterirse gereken büyük örneklem hacminin gittikce daha büyük olması gerekmektedir. Bu şekilde çarpıklık gösteren anakütleler pratikte çok nadir bulunabilirler. Bu pratik kurala dayanan ve çıkarımsal istatistik için kullanılan Student t dağılımı tablolari ancak n=30 verilmektedir ama simulasyon ve kompüter animasyon ile gösterilmiştir ki Student t dağılımı tabloları için seçilen en yüksek örneklem hacmi olan n>29 yeterli büyüklükte değildir. [3] [4]


Merkezi limit teoreminin ispatı[değiştir | kaynağı değiştir]

Olasılık kuramı ve istatistik bilimleri için temel önem taşıyan bu "merkezi limit teoremi"'nin ispatı karakteristik fonksiyonu kullanarak kolayca yapılabilir. Bu ispat zayıf büyük sayılar yasasını ispat etmek için kullanılan yönteme çok benzemektedir.

Herhangi, ortalaması 0 varyansı birim olan, bir rassal değişken Y (yani E(Y)=0 ve var(Y)=1) alalım; Taylor teoremi kullanılarak Y için karekteristik fonksiyonun şu olduğu bilinir:

\varphi_Y(t) = 1 - {t^2 \over 2} + o(t^2), \quad t \rightarrow 0

Burada t2 ifadesinden daha hızla 0a yaklaşan herhangi bir t  için :o (t2 ) --> 0 olur. Yi ifadesini Xi standardize edilmiş değeri yani (Xi − μ)/σ olarak koyalım. Bu halde X1, X2, ..., Xn gözlem noktalarının standardize edilmiş ortalaması

Z_n = \frac{n\overline{X}_n-n\mu}{\sigma\sqrt{n}} = \sum_{i=1}^n {Y_i \over \sqrt{n}}.

olur. Karekteristik fonksiyonun basit nitekliklerine dayanarak, Zn için karekteristik fonksiyonun

\left[\varphi_Y\left({t \over \sqrt{n}}\right)\right]^n = \left[ 1 - {t^2 
\over 2n} + o\left({t^2 \over n}\right) \right]^n \, \rightarrow \, e^{-t^2/2}, \quad n \rightarrow \infty.

olduğu çıkartılır. Bu limit ise açıkça N(0,1) standart normal dağılımı için karekteristik fonksiyondur ve merkezi limit teoremi, karekteristik fonksiyonların yakınsalamasının dağılımın yakınsamasına eşit olduğunu bildiren Levy süreklilik teoremi kullanarak isbat edilmiş olur.

Limite yakınsama[değiştir | kaynağı değiştir]

Eğer üçüncü merkezsel moment E((X1 − μ)3) bulunuyorsa ve sonlu ise, yukarıda açıklanan yakınsalaşma Berry-Eseen teoremi ile yakınsalaşma hızı asgari 1/n½ olur. Yakınsalaşma normali monotoniktir yani Z_n'nin enformasyon entropisi bir normal dağılım entropisine monotonik olarak yakınsalaşır.

Bir dağılımın toplama ile "düzgünleştirilmesi" için grafikler orijinal olasılık dağılım fonksiyonu ve diğer üç (dağılım fonksiyonların konvolusyonu ile elde edilen) toplama için şu grafiklerde görülür:

Central limit thm 1.png Central limit thm 2.png Central limit thm 3.png Central limit thm 4.png

Merkezi limit teoreminin bir grafiksel temsili bir anakütlenin rassal ortalamalarının grafiği ile gösterilebilir. Bir An alalım ve bu bir rassal örneklem için örneklem ortalaması ve herbir örneklemden tek bir rassal değişken de Xn olsun:

An = (X1 + ... + Xn) / n

1den verilen bir örneklem hacmine kadar An ifadesini bulalım:

A1 = (X1) / 1

A2 = (X1 + X2)/ 2

A3 = (X1 + X2 + X3)/3

Merkezi limit teoremi için ortalamaları örneklem hacmi 90a kadar yani 30 nokta olarak gösterilmesi gerekir. Eğer An

Zn = (An − μ) / (σ / n½)

kullanılarak standartize edilirse, yukarıda verilen Zn değişkeninin aynısı ortaya çıkar ve bu bir standart normal dağılımına yakınsanır.

Merkezi Limit teoremi sonlu sayıda gözlemler için bir tahmin olarak kullanılması gerek bu sayılar normal dağılımın zirvesi etrafında toplanırsa iyi sonucdur; dağılımın kuyruklarında olan gözlemler için bu tahminin yeterince doğru olması için çok sayıda gözlem elde edilmesi gerekir.

Merkezi Limit Teoremi özellikle bağımsız ve aynen dağılım gösteren ayrık rassal değişkenler için uygulanır. Ayrık rassal değişken için bir toplama ile elede edilen değerde bir ayrık rassal değişkendir ve böylece bir seri ayrık rassal değişken için tek tek yığmalı olasılık dağılım fonksiyonu bir sürekli değişken için bir yığmalı olasılık dağılım fonksiyonua (yani normal dağılıma) yakınsalaşır.

Bu demektir ki eğer n sayıda bağımsız ve özdeş ayrık değişkenlerin toplamının gerçekleşmelerinin bir histogramını kurarsak, histogramı şekillendiren dikdörtgenlerin yukarı yüzlerinin merkezlerini birleştiren eğri, n' \infty değerine yakınsalaştıkça, bir Gauss-tipi çan eğrisine gittikçe benzemeye başlar. Basit sadece iki değer alan bir ayrık değişkeni içeren binom dağılımı gösterdiği simüle edilen bir halde bile bu merkezi limit teoremi uygulandığı görülebilir.

Büyük sayılar yasasına ilişkisi[değiştir | kaynağı değiştir]

Hem büyük sayılar yasası hem de Merkezi Limit Teoremi daha genel bir problemin kısmı çözümleri olmaları çok olasıdır. Bu genel problem şöyle ifade edilebilir: "Eğer n sonsuz değere yakınsamaktaysa Sn ifadesinin yakınsama davranışı ne olur?". Matematik analizde bu çeşit sorulara yaklaşmak için en popüler matematik araç asimtotik seriler konumuna dayanır.

f(n) fonsksiyonunun asimtotik genişletilmesin şu olduğunu kabul edelim:

f(n)= a_1 \varphi_{1}(n)+a_2 \varphi_{2}(n)+O(\varphi_{3}(n)) \  (n \rightarrow \infty).

Bu ifadenin her iki tarafını da \varphi_{1}(n) ile bölersek ve limit alırsak, en  f(n) fonksiyonunun en baştaki terimin değişme haddini temsil eden, genişletilmenin en yüksek-sıradaki katsayısı olan  a_{1} ifadesini üretiriz:

\lim_{n\to\infty}\frac{f(n)}{\varphi_{1}(n)}=a_1.

Formel olmadan bu şöyle açıklanabilir: "fonksiyon ile onu yakalsık olarak ifadenin arasındaki fark  a_2 \varphi_{2}(n) haddinde büyür". Bu kavramın ana sonucu şöyledir: fonksiyonu uygun bir yaklaşık veren normalize eden fonksiyonlar ile bölersek ve bu sonucun limitteki davranışına bakarsak, bu netice orijinal fonksiyonun limitteki davranışı hakkında epeyce çok açıklama yapar.

Sn ifadesinin klasik olasılık teoride incelenmesinde de aynı usulde açıklama yapılmaktadır. Belirli düzenleme koşulları altında, eğer \xi ifadesi  N(0,\sigma^2) olarak dağılım gösterirse, hem Büyük Sayılar Yasası yani

\frac{S_n}{n} \rightarrow \mu

hem de Merkezi Limit Teoremi yani

 \frac{S_n-n\mu}{\sqrt{n}} \rightarrow \xi

şu formel olmayan ifadenin ilk iki sabitlerinin değerlerini verirler:

S_n \approx \mu n+\xi \sqrt{n}.


Eğer X1, X2, X3, ... bağımsız ve özdeş ifadeler ise ve belli bir 1 \le \beta <2 için  E(|X_1|^{\beta}) < \infty ifadesi geçerli ise, o zaman

 \frac{S_n-n\mu}{n^{\frac{1}{\beta}}} \to 0

olur ve böylece  \sqrt{n} sıfır olmayan limitleyici davranışı temin eden bir normalize etme fonksiyonu hizmetini gören n nin en yüksek üssü olur. "Takrarlanan logaritma yasası" ise çok ilgi çekici olarak,  \sqrt{n\log\log n} normalize edici fonksiyonun, Büyük Sayılar Yasası için n ile Merkezi Limit Teoremi için  \sqrt{n} ifadeleri arasında olduğunu bildirir ve bu iki teorem ifadesi de bu değerin iki tarafında bulunan limitleri gösterir demektedir.

Teoremin alternatif şekillerde ifade edilmesi[değiştir | kaynağı değiştir]

Yoğunluk fonksiyonları[değiştir | kaynağı değiştir]

Pozitif rassal değişkenlerinin çarpımları[değiştir | kaynağı değiştir]

Lyapunov koşulu[değiştir | kaynağı değiştir]

Main: Lyapunov'un merkezsel limit teoremi.

Lindeberg koşulu[değiştir | kaynağı değiştir]

Uygulamalar ve örneğinler[değiştir | kaynağı değiştir]

Sinyal işleme[değiştir | kaynağı değiştir]

Ayrıca bakınız[değiştir | kaynağı değiştir]

Notlar[değiştir | kaynağı değiştir]

  1. ^ Henk Tijms, Understanding Probability: Chance Rules in Everyday Life, Cambridge: Cambridge University Press, 2004.
  2. ^ Merkezi limit teoreminin gelişmesinin çok geniş ayrıntıları ile açıklanması, özellikle Laplace'in teoreminin temelleri hakkındaki çalışmaları ve Cauchy, Bessel ve Poisson'un katkıları Hald tarafından incelemektedir. Bakınız: Andreas Hald, History of Mathematical Statistics from 1750 to 1930, Ch.17.
  3. ^ Bakın "Identification of Misconceptions in the Central Limit Theorem and Related Concepts and Evaluation of Computer Media as a Remedial Tool" Yu, Chong Ho ve Dr. John T. Behrens, Arizona State University ve Spencer Anthony, Univ. of Oklahoma: "American Educational Research Association" Yıllık Toplantısı için makale. Sunma tarihi: 19 Nisan, 1995 ve revizyon: 12 Şubat, 1997, CWisdom-rtf(Erişme:25.10.2007).
  4. ^ Marasinghe, M., Meeker, W., Cook, D. & Shin, T.S.(1994 August), "Using graphics and simulation to teach statistical concepts", American Statistician Association'un, Toronto, Kanada 1994 yılı için yıllık konferansına sunulan bir makale.

Referanslar[değiştir | kaynağı değiştir]

  • Henk Tijms (2004), Understanding Probability: Chance Rules in Everyday Life, Cambridge: Cambridge University Press.
  • S. Artstein, K. Ball, F. Barthe ve A. Naor, (2004) "Solution of Shannon's Problem on the Monotonicity of Entropy", Journal of the American Mathematical Society C.17, say. 975-982 .
  • S.N.Bernstein (1945), On the work of P.L.Chebyshev in Probability Theory, Nauchnoe Nasledie P.L.Chebysheva. Vypusk Pervyi: Matematika. (Rusca) [The Scientific Legacy of P. L. Chebyshev. First Part: Mathematics] Editor S. N. Bernstein.] Academiya Nauk SSSR, Moscow-Leningrad, 174 say.
  • G. Rempala ve J. Wesolowski, (2002) "Asymptotics of products of sums and U-statistics", Electronic Communications in Probability, C. 7, say. 47-54.

Dışsal bağlantılar[değiştir | kaynağı değiştir]