Kupon toplayıcısının problemi

Vikipedi, özgür ansiklopedi
Atla: kullan, ara

Kupon toplayıcısının problemi bir olasılık kuramı pratik problemi olarak "bütün kuponları topla ve ödün kazan" tipli yarışmalar için olasılık modeli içerir. Sorulan soru şöyle ifade edilebilir:

Yarışma için n sayıda kupon olduçu kabul edilsin ve kuponların geri koyup tekrar seçme ile toplandığı varsayılsın. Bütün n kuponları toplamak icin t sayıda örneklem deneysel seçiminden daha fazla sayıda seçim yapılması gerekliliğinin olasılığı nedir?"

Bu problemin matematik analizi gereken deneysel seçimin beklenen sayısı'nın O(n\log(n)) haddinde büyüyeceğini açıklamaktadır. Örneğin n=50 olursa bütün 50 kuponun toplanması için gereken örneklem yaklaşık sayısı 225 olmalıdır.

Problemin anlaşılması[değiştir | kaynağı değiştir]

Bu problemi çözmeye anahtar ilk düşük sayıda kuponun toplanması zamanının çok küçük olduğudur. Son birkaç kuponun toplanması ise, buna tam karşıt olarak, gayet çok zaman alması gerekmektedir. Örnegin 50 kuponlu bir problem için 49uncu kuponu topladıktan sonra 50. kuponu bulmak için asgari 50 deneysel seçim yapmak gerekmektedir. Beklenen zaman dönemini hesap edebilmek için toplam zamanı 50 zaman aralığına bölmek gerekmektedir.

Çözüm[değiştir | kaynağı değiştir]

Bekleyişin hesaplanması[değiştir | kaynağı değiştir]

Tum n kuponu toplamak icin gerekli zaman T olarak ve ti i - 1 kupon toplandıktan sonra iinci kuponu toplamak için gerekli zaman olduğu kabul edilsin. T ve ti rassal değişkenler olarak görülebilir. i - 1 kupon elde bulunduğu verilmiş ise bir yeni kuponu toplama olasılığı
'pi = (n - i + 1)/n
olduğu gözümlenebilir. Bundan dolayı ti beklenen değeri 1/pi olan bir geometrik dağılım gösterir. beklenen değerlerin doğrusallığı dolayısıyla şu yazılabilir:


\begin{align}
\operatorname{E}(T)& = \operatorname{E}(t_1) + \operatorname{E}(t_2) + \cdots + \operatorname{E}(t_n) 
= \frac{1}{p_1} + \frac{1}{p_2} +  \cdots + \frac{1}{p_n} \\
& = \frac{n}{n} + \frac{n}{n-1} +  \cdots + \frac{n}{1}  = n \cdot \left(\frac{1}{1} + \frac{1}{2} + \cdots + \frac{1}{n}\right) \, = \, n \cdot H_n.
\end{align}

Burada Hn bir harmonik sayı olur ve harmonik sayıların "asimptotik" özelliğini kullanarak, şu ifade bulunur:


\operatorname{E}(T)  = n \cdot H_n = n \ln n + \gamma n + \frac1{2} + o(1), \ \ 
\text{as}  \ n \to \infty,

Burada \gamma \approx 0.5772156649 Euler–Mascheroni sabiti olur.

Şimdi Markov eşitsizliği kullanarak istenilen olasılık sayısı için sınırlar konulur:

\operatorname{P}(T \geq c \, n H_n) \le \frac1c.

Varyansın hesaplanması[değiştir | kaynağı değiştir]

ti rassal degişkenlerinin bağımsızlığı özelliği kullanılarak şu elde edilir:


\begin{align}
\operatorname{Var}(T)& = \operatorname{Var}(t_1) + \operatorname{Var}(t_2) + \cdots + \operatorname{Var}(t_n) \\ 
& = \frac{1-p_1}{p_1^2} + \frac{1-p_2}{p_2^2} +  \cdots + \frac{1-p_n}{p_n^2} \\
& \leq \frac{n^2}{n^2} + \frac{n^2}{(n-1)^2} +  \cdots + \frac{n^2}{1^2} \\
& \leq n^2 \cdot \left(\frac{1}{1^2} + \frac{1}{2^2} + \cdots \right) = \frac{\pi^2}{6} n^2 \leq 2 n^2,
\end{align}

Burada son eşitlilik baz problem olarak anılan Riemann zeta fonksiyonunun değeridir.

Şimdi istenilen olasılık değerine sınırlar koymak için Çebişev eşitsizliği kullanılır:

\operatorname{P}\left(|T- n H_n| \geq c\, n\right) \le \frac{2}{c^2}.

Kuyruk kestirimleri[değiştir | kaynağı değiştir]

Diğer bir yaklaşım kullanılarak başka bir yukarı sınır ifadesi de elde etmek mümkündür: İlk r sayıda deneysel seçimde i-inci kuponun ele geçmeme olayı {Z}_i^r ile ifade edilsin. O zaman


\begin{align}
P\left [ {Z}_i^r \right ] = \left(1-\frac{1}{n}\right)^r \le e^{-r / n}
\end{align}

Böylece, r = \beta n \log n, için şu elde edilir P\left [ {Z}_i^r \right ] \le e^{(-\beta n \log n ) / n} = n^{-\beta}.


\begin{align}
P\left [ T > \beta n \log n \right ] \le P \left [ \bigcup_i {Z}_i^{\beta n \log n} \right ] \le n \cdot P [ {Z}_1 ] \le n^{-\beta + 1}
\end{align}

Olasılık üretici fonksiyonları ile bağlantı[değiştir | kaynağı değiştir]

Kupon toplayıcısının problemini çözmek için üretici fonksiyon yaklaşımı da kullanılabilir.

Ayrıca bakınız[değiştir | kaynağı değiştir]

Kaynakça[değiştir | kaynağı değiştir]

  • Paul Erdős ve Alfréd Rényi, "On a classical problem of probability theory (Olasılık kuramında bir klasik problem)", Magyar Tud. Akad. Mat. Kutato Int. Kozl, 1961.(İngilizce)

Dış bağlantılar[değiştir | kaynağı değiştir]