Olasılık kuramı

Vikipedi, özgür ansiklopedi
Atla: kullan, ara

Olasılık kuramı rastgele olayların analizi ile ilgilenen bir matematik bilim dalıdır.[1] Olasılık kuramının ana öğeleri rassal değişkenler, saf rassal süreçler, olaylar olarak sayılabilir. Bunlar ya tek olarak ortaya çıkan veya bir zaman dönemi içinde gelişerek meydana gelen, ilk görünüşü rastgele bir şekilde olan deterministik olmayan olayların veya ölçülebilir miktarların matematiksel soyutlamalarıdır. Bir madeni parayı yazı-tura denemesi için havaya atmak, veya bir zarı atmak ile ortaya çıkan sonuç ilk bakışta rastgele bir olay olarak görülebilirse bile eğer birbirini takip eden rastgele olaylar tekrar tekrar ortaya çıkartılırsa, incelenebilecek ve tahmin edilebilecek belirli bir istatistiksel seyir takip ettikleri görülecektir. Bu türlü olaylar ve sonuçların seyirlerini betimleyen iki temsilci matematiksel sonuc büyük sayılar yasası ve merkezsel limit teoremidir.

İstatistik bilim dalının matematiksel temelini oluşturan olasılık kuramı, büyük veri serilerinin niceliksel analizini gerektiren birçok insan faaliyetinin incelenebilmesi ve anlanabilmesi için temel esasları oluşturur. Bunun yaninda, olasılık kuramının yöntemleri, durumları hakkında sadece kısımsal bilgimiz olabilecek karmaşık sistemlerin tanımlanmasına da uygulanabilir; (örneğin istatistiksel mekanik). Yirminci yüzyılda fizik biliminde en büyük buluşlardan biri, atomik düzeyde fiziksel olayların tabiatının olasılıklı olduğu ve bunların kuantum mekanik bilgisi ile açıklanıp, incelenip, kullanılabileceğidir.

Tarihçe[değiştir | kaynağı değiştir]

Matematiksel olasılık kuramının tarihsel kökleri 16. yüzyılda Gerolamo Cardano ve 17. yüzyılda Pierre de Fermat ile Blaise Pascal tarafından yapılan şans oyunlarının matematiksel incelemelerine dayanır.

Başlangıçta, olasılık kuramı genellikle ayrık olayları incelemek için geliştirilmiş ve kullanılan yöntemler genellikle tümleşik matematik kurallarına dayandırılmıştır. Fakat giderek matematik analiz görüşleri daha ağır basarak olasılık kuramamına sürekli değişkenlerin incelenmesinin de katılması gerekmiştir. Bu gelişmenin şu andaki en son aşamasının temelleri, Andrey Nikolaevich Kolmogorov tarafından, ölçüm kuramına bağlantili olan modern olasılık kuramı olarak ortaya çıkartılmışstır. Kolmogorov, Richard von Mises tarafından ortaya atılan örneklem uzayı kavramlarını ölçüm kuramı kavramları ile birleştirerek 1933'te modern olasılık kuramı için esas olan Kolmogorov aksiyomlarını ortaya atmıştır. Bu gelişme bilim camiası tarafından çabucak, hiç karşı çıkan kuram olmadan, modern olasılık kuramının ana aksiyom sistemi olarak benimsenmiştir.[2]

İnceleme[değiştir | kaynağı değiştir]

Olasılık kuramına girişlerin çoğunda, ayrık olasılık dağılımları ve sürekli olasılık dağılımları ayrı ayrı olarak incelemeye alınmaktadır. Halbuki olasılığın daha ileri matematiksel yaklaşımla incelenmesinin, hem ayrık, hem sürekli ve hem de bunların karışığı ve daha ilerisinde olan dağılımların hep birlikte yapılmasını gerektirmektedir.

Ayrık olasılık dağılımları[değiştir | kaynağı değiştir]

Ayrık olasılık kuramı sayılabilir örneklem uzayında ortaya çıkan olayları inceler. Örnegin: Zar atılması, küp deneyleri, iskambil kartlarını çekmek veya rastgale yürüyüş olayları.

Klasik tanım: Olasılık kuramı geliştirilmesinin ilk safhalarında, belirtilmiş bir olay ortaya çıkması için olasılık, her mümkün sonucu eşit olasılıklı olan örneklem uzayında incelendiği kabul edilmiş ve incelenen olaya uygun sonuç sayısının toplam tüm sonuçlar sayısına oranı olarak tanımlanmıştı. Örnegin, incelenecek sorun "tek bir zar atılınca çift sayıların gelme olasılığı nedir" şeklinde sorulursun. Zar yansiz olup her altı yüzü de eşit olasılıkla gelebileceği için, 2, 4, 6 sonuçları 3 tane olduğu ve toplam mümkün sonuç sayısı 6 yüze dayanarak 6 olduğu icin, aranan olasılık

P( 2 veya 4 veya 6 ) = \tfrac{3}{6}=\tfrac{1}{2}

olarak bulunur.

Modern tanım: Modern tanıma örneklem uzayı adı verilen bir set ile başlanır; bu klasik tanımda kullanılan mümkün tüm sonuçlar seti ile aynı anlamlıdır; ve şu notasyon kullanılarak ifade edilir: \Omega=\left \{ x_1,x_2,\dots\right \}. Sonra, x \in \Omega\, içinde bulunan her matematik elemana bir olasılık değeri f(x)\, bağlı olduğu varsayılır ve bu olasılık değerinin şu özellikler bulunduğu kabul edilir:

  1. f(x)\in[0,1]\mbox{ butun }x\in \Omega\,;
  2. \sum_{x\in \Omega} f(x) = 1\,.

Bu demektir ki olasılık fonksiyonu olan f(x) Ω örneklem uzayında bulunan her x değeri için 0 ile 1 arasında bulunmaktadır ve x için tüm mümkün değerler için f(x) değerlerinin toplamı tama tam (1'e) eşit olur. Bir olay \Omega\, örneklem uzayının herhangi bir E\, altseti olarak tanımlanır. E\, olayının 'olasılık değeri ise şöyle tanımlanır:

P(E)=\sum_{x\in E} f(x)\,.

Buna göre tüm örneklem uzayının olasılığı 1e eşittir ve boş örneklem uzayı veya 0 olay için de olasılık 0a eşit olur.

Örneklem uzayındaki bir noktayı "olasılık" değerine eşleyen fonksiyona, yani f(x)\, fonksiyonuna, olasılık kütle fonksiyonu adı verilir. Modern tanım olasılık kütle fonksiyonunun nasıl ortaya çıktığını açıklayan bir kuram yaratmaz; sadece bu fonksiyonların varolduğunu kabul eden bir kuram ortaya çıkartır.

Sürekli olasılık dağılımları[değiştir | kaynağı değiştir]

Sürekli olasılık kuramı sürekli örneklem uzayında ortaya çıkan olayları inceler.

Klasik tanım: Sürekli olasılık halleri ile karşılaşınca klasik tanım geçerli olmaz. Bernard'in paradoksu maddesine bakin.

Modern tanım: Eğer örneklem uzayı reel sayılardan oluşursa (yani \mathbb{R}), yığmalı dağılım fonksiyonu adı verilen bir fonsksiyonun var olduğu kabul edilir; bu bir rassal değişken olan X için P(X\le x) = F(x)\,</math> ifadesini gösterir yani P(X\le x) = F(x)\,</math> rassal değişkenin X x sayı değerine eşit veya xden daha düşük olması halindeki olasılığı gösterir.

Yığmalı dağılım fonksiyonu şu özellikleri göstermelidir:

  1. F\, monotonik azalma göstermeyen, sağda-sürekli bir fonksiyondur;
  2. \lim_{x\rightarrow -\infty} F(x)=0\,;
  3. \lim_{x\rightarrow \infty} F(x)=1\,.

Eğer F\, fonksiyonun türevi alınabilirse, rassal değişken X için bir olasılık yoğunluk fonksiyonu

f(x)=\frac{dF(x)}{dx}\,.

bulunur.

E \subseteq \mathbb{R} seti için, rassal değişken Xin E\, seti içinde bulunma olasılığı şöyle tanımlanır:

P(X\in E) = \int_{x\in E} dF(x)\,.

Eğer bir olasılık yoğunluk fonksiyonu var ise, bu şöyle ifade edilebilir:

P(X\in E) = \int_{x\in E} f(x)\,dx\,.

Olasılık yoğunluk fonksiyonu sadece sürekli rassal değişkenler için var olmakta ise de, yığmalı dağılım fonksiyonu \mathbb{R}\,. içinde değerleri olan (aralıklı rassal değişkenler dahil) tüm rassal değişken için mevcut bulunmaktadır.

Bu kavramlar \mathbb{R}^n ve diğer sürekli örneklem uzayları için çoklu boyutlu hallere de genelleştirilmiştir.

Ölçüm kuramsal olasılık kuramı[değiştir | kaynağı değiştir]

Modern olasılık kuramı yaklaşımı ölçüm kuramı kullanılması suretiyle yapılmakta ve bu kuram olasılık uzayında Kolmogorov aksiyomlarına dayandırılmaktadır. Olasılık uzayı üç kısımdan oluşmustur. Olasılığın bu ölçüm kuramına göre uygulanmasının esas nedeni bu kuramın ayrık ve sürekli değişkenleri birlikte ele alabilmesinden ve aralarindaki farkları kullanılan ölçü ile açıklamasındandır. Bundan başka saf ayrık veya saf sürekli dağılımlar yanında bu iki kategoriye tam uymayan dağılımları da inceleme imkânı sağlamaktadır.

Herhangi bir set \Omega verilsin ve bu örneklem uzayı olarak da anılmaktadır. Bu set üzerinde bir sigma-cebiri ile \mathcal{F}\, bulunsun; bir ölçüm Pnin bir olasılık ölçümü olarak adlandırması ancak ve ancak şu koşullar altında mümkün olur:

  1. P\, non-negatifdir;
  2. P(\Omega)=1\,.

Eğer \mathcal{F}\, bir Borel σ-cebiri ise o halde herhangi bir yığmalı dağılım fonksiyonu \mathcal{F}\, üzerinde tek ve tek bir olasılık olcumu bulunur ve bunun aksi önerim de doğrudur. Bu ölçüm ayrık değişkenler için olasılık kütle fonksiyonu ve sürekli değişkenler için olasılık yoğunluk fonksiyonu ile çakışmaktadır ve böylece ölçüm kuramına bağlı yaklaşım yanıltıcı mantıktan uzaklaştırmaktadır.

σ-cebiri \mathcal{F}\, içinde E\, seti için olasılık şöyle tanımlanır:

P(X\in E) = \int_{x\in E} dF(x)\,.

Burada entegrasyon F\, tarafından ortaya çıkartılan ölçüye göredir.

Temel Prensipler[değiştir | kaynağı değiştir]

Belirli bir olay A için olasılık \textstyle\mathbb{P}(A) 0 ile 1 arasında değişen bir sayı ile temsil edilir. Hiç olanaksız bir olay için olasılık 0 olur ve kesinlikle olacak bir olayın olasılığı 1 olur. Bazı istatistikçiler bu uçsal olasılık değerlerinin sadece teorik olduğunu iddia etmektedirler çünkü kabul ettikleri olasılık açıklaması deneylemelerle limitte göresel çokluluk (relatif frekans) değerine dayanır. Diğer Bayes-tipi, özellikle subjektif, olasılık açıklamasına göre bu uçsal olasılık değerlerini sübjektif olarak düşünmek ve olaylara bu değerleri koymak imkân dahilindedir.

Bazı temel özellikler
Olay Olasılık
A olayı olması için olasılık \mathbb{P}(A)\in[0,1]\,
A olayı olmaması için olasılık \mathbb{P}(A^c)=1-\mathbb{P}(A)\,
A veya B olması için olasılık \begin{align}
\mathbb{P}(A\cup B) & = \mathbb{P}(A)+\mathbb{P}(B)-\mathbb{P}(A\cap B) \\
\end{align}
A ve B olması için olasılık \begin{align}
\mathbb{P}(A\cap B) & = \mathbb{P}(A|B)\mathbb{P}(B)\\
& = \mathbb{P}(A)\mathbb{P}(B) \qquad\mbox{eger A ve B bagimsizlarsa}\\
\end{align}
A verilmiş B olması (B koşullu A) \mathbb{P}(A|B)=\frac{\mathbb{P}(A\cap B)}{\mathbb{P}(B)}\,

Olasılık dağılımları[değiştir | kaynağı değiştir]

Bazı rassal değişkenler olasılık kuramı içinde daha sık olarak isimleri geçmektedir; çünkü bu değişkenler birçok doğal veya fiziksel süreçleri belirlemektedirler veya özellikle çıkarımsal istatistikte çok öneme haizdirler. Bunun için bu tür değişkenler için olasılık dağılımları olasılık kuramı içinde özel önem taşımaktadırlar.

Temel ayrık olasılık dağılımları listesi şöyle verilebilir:

Temel sürekli olasılık dağılımları listesi şöyle verilebilir:

Rassal değişkenlerin yakınsaması[değiştir | kaynağı değiştir]

  • Olasılık kuramı içinde rassal değişkenler in yakınsama kavramı birkaç değişik şekilde tanımlanır. Aşağıdaki listede bu değişik tanımlar tanımın geçerlilik gücüne göre sıralanmışdır. Bu sıralamaya göre sıranın içindeki herhangi bir tanım daha önce verilmiş olan tüm tanımları da içinde kapsamaktadır.
  • Dağılım içinde yakınsama: Bir seri rassal değişken olan X_1,X_2,\dots,\,, X\, rassal değişkenine dağılım içinde yakınsama göstermesi, ancak herbir X_i rassal değişkeni için yığmalı dağılım fonksiyonu olan F_1,F_2,\dots\, fonksiyonlarının X\,in yığmalı dağılım fonksiyonu olan F\,ye yakınsama göstermesi halinde ortaya çıkar. Burada F\, sürekli bir fonksiyondur.
En iyi bilinir kısaltılmış notasyon ile: X_n \, \xrightarrow{\mathcal D} \, X\,.
  • Zayıf yakınsama: Bir seri rassal değişken olan X_1,X_2,\dots,\, X\, rassal değişkenine zayıf yakınsama gösterirlerse, her ε > 0 için
\lim_{n\rightarrow\infty}P\left(\left|X_n-X\right|\geq\varepsilon\right)=0

olur. Zayıf yakınsama 'olasılık içinde yakınsama olarak da bilinmektedir.

En iyi bilinir kısaltılmış notasyon ile: X_n \, \xrightarrow{P} \, X\,.
  • Güçlü yakınsama: Bir seri rassal değişken olan X_1,X_2,\dots,\, X\, rassal değişkenine güçlü yakınsama gösterirlerse
P(\lim_{n\rightarrow\infty} X_n=X)=1

ifadesi gerçekleşir. Güçlü yakınsama hemen hemen kesinlikle yakınsama olarak da isimlendirilir.

En iyi bilinir kısaltılmış notasyon ile: X_n \, \xrightarrow{\mathrm{a.s.}} \, X\,.

Güçlü yakınsamanın bir zayıf yakınsamanın daha güçlü bir şekli olduğu gerçeğinin sezilmesi kolaydır ve her iki halde de rassal değişkenler X_1,X_2,\dots\,, X\, ile artan bir korelasyon göstermektedirler. Ancak dağılım için yakınsama halinde, rasssal değişkenlerin gerçekleşen değerlerinin gerçekte yakınsama göstermeleri gerekli değildir ve bunların arasındaki herhangi bir korelasyonun hiçbir pratik önemi bulunmaz.

Büyük sayılar yasası[değiştir | kaynağı değiştir]

Yaygın olan bir sezgiye göre eğer yansiz olan bir madeni para birkaç kere havaya atılıp yazı-tura sonuçları kayıt edilirse, sonuçların kabaca yarısı yazı olacak ve kalan yarısı da tura olacaktır. Üstelik, madeni parayi daha da çok defa havaya atıp sonuç kayit edildikçe giderek yazı sonuçları sayısının tura sonuçları sayısına oranının gittikçe daha çok bire yaklaştığı gözümlenecektir. Bu sezgi ile geliştirilen bu düşünce prensibine istatistik bilimde daha formel bir şekil verilmekte ve bunu büyük sayılar yasasi olarak isimlendirilmektedir. Bu dikkate değerdir; çünkü bu yasa olasılık kuramının hiçbir yerinde, bu kuramın temel taşdır şeklinde bir bahis görmemektedir; fakat bu yasa olasılık kuramı temelinden bir teorem olarak geliştirilip ortaya çıkarılmaktadır. Bununla beraber, teorik olarak elde edilen olasılıkları, pratik reel hallerde gerçek olarak ortaya çıkan çokluklara (frekanslara) bağladığı için, bu yasa istatistik kuramının tarihinin içinde çok önemli bir orta direk taşı olarak kabul edilmektedir.[3]

Büyük sayılar yasasına göre örneklem ortalaması, yani bağımsız ve birbiri ile sonsuz olmayan beklenen değeri \mu olan aynı bir dağılım gösteren rassal değişkenler, limitte teorik beklenen değere (yani \muya) yaklaşılık gösterirler. Yaklaşıklık gösteren rassal değişkenlerin gösterdikleri değişik şekillere göre bu yasa iki şekilde matematik olarak ifade edilebilir:

Zayıf yasa: \overline{X}_n \, \xrightarrow{P} \, \mu \qquad\textrm{for}\qquad n \to \infty.
Güçlü yasa: \overline{X}_n \, \xrightarrow{\mathrm{a.s.}} \, \mu \qquad\textrm{for}\qquad n \to \infty .

Ayrıca bakınız[değiştir | kaynağı değiştir]

Kaynak[değiştir | kaynağı değiştir]

Bibliyografya[değiştir | kaynağı değiştir]

  • Billingsley, P., (1995) Probability and Measure, 3ncu ed., John Wiley, New York
  • Gut, A., (2005) Probability: A Graduate Course. Springer-Verlag. ISBN 0-387-22833-0.
  • Jeffreys, H., (1939) The Theory of Probability
  • Kolmogorov, A.N., (1933) Grundbegriffe der Wahrscheinlichkeitrechnung.
  • Laplace, P.S., (1812) Theorie Analytique des Probabilités.
  • Nelson, E., (1987) Radically Elementary Probability Theory