Büyük O gösterimi

Vikipedi, özgür ansiklopedi
Atla: kullan, ara

Büyük O (Big-Oh) gösterimi matematiksel bir gösterim olup işlevlerin (fonksiyonların) asimptotik davranışlarını tarif etmek için kullanılır. Daha açık şekilde anlatmak gerekirse, bir işlevin büyümesinin asimptotik üst sınırını daha basit başka bir işlev cinsinden tanımlanması demektir. İki temel uygulama alanı vardır: matematik alanında genellikle kırpılmış bir sonsuz serinin kalan terimini karakterize etmek için kullanılır; bilgisayar bilimlerinde ise algoritmaların bilgi işlemsel karmaşıklığının çözümlemesi için kullanılır.

Bu gösterim ilk olarak Alman sayılar kuramcısı Paul Bachmann tarafından 1892 yılında yazdığı Analytische Zahlentheorie kitabında kullanılmıştır. Gösterim bir başka Alman matematikçi olan Edmund Landau tarafından yaygın kullanıma sokulmuştur, bundan ötürü bazen Landau sembolü olarak da anılır. Büyük O, İngiliz dilindeki "order of" yani bir şeyin derecesi anlamına gelen söz öbeğini hatırlatmak amacı ile kullanılıyordu ve ilk olarak büyük omicron harfi idi; günümüzde büyük O kullanılmakta ve 0 sayısı hiç kullanılmamaktadır.

Kullanım alanları[değiştir | kaynağı değiştir]

Bu gösterimin biçimsel olarak yakın ama temelde farklı iki kullanımı vardır: sonsuz asimptotikler ve infinitesimal asimptotikler. Bu ayrım sadece uygulamadadır ancak "büyük O"nun biçimsel tanımı her iki durumda aynı olup işlev argümanının limitleri değişmektedir.

Sonsuz asimptotikler[değiştir | kaynağı değiştir]

Büyük O gösterimi algoritma başarım çözümlemesinde faydalıdır. Söz gelimi n boyundaki bir problemi çözmek için gereken zaman (adım sayısı) T(n) = 4n² - 2n + 2 olarak bulunabilir.

n büyüdükçe n² terimi o kadar hızlı büyüyecektir ki diğer terimlerin büyüme hızı buna kıyasla ihmal edilebilecek kadar düşük kalacaktır; örneğin n = 500 için 4n² terimi 2n teriminin 1000 katı büyüklüğünde olacaktır ve dolayısıyla bu ikinci terimin değeri tüm ifadenin değerini belirlemede çoğu amaç bakımından ihmal edilebilir bir etkiye sahip olacaktır.

Buna ek olarak, aynı ifadeyi n³ veya 2n terimleri içeren bir ifade ile kıyaslayacak olursak katsayılar da anlamlarını yitirecektir. T(n) = 1.000.000n² ve U(n) = n³ olsa bile ikinci ifade, n 1.000.000'u geçtikçe birinci ifadeye kıyasla daima daha büyük olacaktır (T(1.000.000) = 1.000.000³ = U(1.000.000)).

O halde Büyük O gösterimi işin özünü sade biçimde sunmaktadır: şu şekilde yazabilir

T(n)\in O(n^2)

ve algoritmanın n2 dereceden zaman karmaşıklığına sahip olduğunu söyleyebiliriz.

Sonsuz küçük asimptotikler[değiştir | kaynağı değiştir]

Büyük O aynı zamanda bir matematiksel işlev için geliştirilen yaklaşık işlevin hata terimini tarif etmek için de kullanılabilir. Örneğin, :e^x=1+x+x^2/2+\hbox{O}(x^3)\hbox{  } x \to 0 \hbox{ }\hbox{iken} ifadesi hatanın (yani e^x - (1 + x + x^2/2) farkının) mutlak değer bakımından, sıfıra yeterince yakın x değerleri için bir sabit çarpı x3 değerinden daha küçük olduğunu belirtir.

Biçimsel tanım[değiştir | kaynağı değiştir]

f(x) ve g(x) gerçel sayılar kümesinin bir alt kümesi üzerinde tanımlanmış iki işlev olsun. Bu durumda deriz ki

f(x), O(g(x))dir; x  \to

yalnız ve yalnız

öyle x0 ve M sayıları varsa ki |f(x)| ≤ M |g(x)|; x > x0 için.

Aynı gösterim f işlevinin bir a gerçel sayısı civarındaki davranışını tarif etmek için de kullanılabilir: Deriz ki

f(x) O(g(x))dir; x  \to a

yalnız ve yalnız

öyle δ>0 ve M sayıları varsa ki |f(x)| ≤ M |g(x)|; |x - a| < δ için.

Eğer g(x) a sayısına yeterince yakın x değerleri için sıfırdan farklı ise yukarıdaki iki tanım limit superior kullanılarak birleştirilebilir:

f(x) O(g(x))dir;x  \to a

yalnız ve yalnız

\limsup_{x\to a} \left|\frac{f(x)}{g(x)}\right| < \infty iken.

Matematikte hem ∞ hem de a civarındaki asimptotikler kullanılır. bilgi işlemsel karmaşıklık kuramında ise sadece ∞a giden asimptotikler kullanılır. Ayrıca sadece pozitif değerli işlevler ele alındığından mutlak değer de kullanılmadan yazılabilir.

Örnek[değiştir | kaynağı değiştir]

Şu çokterimlilere bakalım:

 f(x) = 6x^4 -2x^3 +5 \,
 g(x) = x^4.  \,

f(x), O(g(x)) ya da O(x4) derecesindedir diyebiliriz. Tanıma göre, tüm x>1 degerleri için ve C bir sabit iken, |f(x)| ≤ C |g(x)| ifadesi geçerlidir.

İspat:

 |6x^4 - 2x^3 + 5| \le 6x^4 + 2x^3 + 5 \,         x > 1 iken
 |6x^4 - 2x^3 + 5| \le 6x^4 + 2x^4 + 5x^4 \,     çünkü x3 < x4, ve devam eder.
 |6x^4 - 2x^3 + 5| \le 13x^4 \,
 |6x^4 - 2x^3 + 5| \le 13 \,|x^4 |. \,

Dikkat edilmesi gereken hususlar[değiştir | kaynağı değiştir]

Yukarıda bahsi geçen "f(x) O(g(x))dir" ifadesi genellikle f(x) = O(g(x)) şeklinde yazılır. Bu, gösterimin bir nebze kötüye kullanılması demektir. Elbette kastettiğimiz iki işlevin birbirine eşit olmaları değildir. O(g(x)) olma hali simetrik değildir:

\mbox{O}(x)\,=\,\mbox{O}(x^2) fakat \mbox{O}(x^2)\,\ne\,\mbox{O}(x).

Bu yüzden bazı yazarlar küme gösterimini tercih ederler ve f \in O(g) yazarlar, bunu yaparken de O(g)yi g işlevinin altında kalan tüm işlevlerin kümesi olarak düşünürler.

Ayrıca, aşağıdaki gibi bir "eşitlik"

f(x) = h(x) + \mbox{O}(g(x))

"f(x) ile h(x)nin farkı O(g(x))dir" olarak anlaşılmalıdır.

Sık rastlanan işlev dereceleri[değiştir | kaynağı değiştir]

Aşağıda algoritma çözümlemesinde sıkça karşılaşılan işlev derecelerini görebilirsiniz. Tüm bunlar n sonsuza giderken durumunda belirtilmiştir. Daha yavaş büyüyen işlevler önce listelenmiştir. c keyfi bir sabit değerdir.

gösterim isim
O(1) sabit
O(\log^*n) tekrarlı logaritmik
O(\log n) logaritmik
O([\log n]^c) logaritmik çokterimli
o(n) alt doğrusal
O(n) doğrusal
O(n \log n) doğrusal logaritmik (linearitmik),

sözde doğrusal veya üst doğrusal

O(n^2) karesel
O(n^c), c > 1 çokterimli, bazen "cebirsel" de denir
O(c^n) üssel, bazen "geometrik" de denir
O(n!) faktöriyel, bazen "kombinatoryel" de denir

Pek sık rastlanmasa da, Büyük O gösterimi ile kullanılan çok daha hızlı büyüyen işlevler mevcuttur, mesela A(n,n) olarak temsil edilen Ackermann işlevinin tek değerli hâli. Bunun tam tersi çok yavaş büyüyen işlevler da vardır, ör. Ackermann işlevinin ters işlevi olan ve genellikle α(n) ile gösterilen işlev. Her ne kadar bu işlevler sınırsız olsa da pratik amaçlar için sabit çarpanlar olarak kabul edilirler.

Özellikler[değiştir | kaynağı değiştir]

Eğer bir f(n) işlevi diğer işlevlerin sonlu toplamı olarak yazılabiliyorsa o zaman bunların içinden en hızlı büyüyeni f(n) işlevinin derecesini belirler. Örneğin

f(n) = 10 \log n + 5 (\log n)^3 + 7n + 3n^2 + 6n^3 \in \hbox{O}(n^3)\,\!.

Özel olarak eğer bir işlev n terimine bağlı birçokterimli tarafından üstten sınırlandırılabiliyorsa o zaman n değeri sonsuza gittikçe çokterimlinin düşük dereceli terimleri ihmal edilebilir.

O(nc) ve O(cn) çok farklıdır. İkincisi çok çok daha hızlı büyür ve c sabitinin değeri, bu değer 1 sayısından büyük olduğu sürece, bu durumu değiştirmez. n'nin herhangi bir kuvvetinden daha hızlı büyüyen bir işleve yüksek çokterimli (superpolynomial) denir. cn biçimindeki herhangi bir üssel işlevden daha yavaş büyüyen işleve ise altüssel denir. Bir algoritmanın zaman karmaşıklığı hem yüksek çokterimli hem de altüssel olabilir, bu tür algoritmalara örnek olarak bilinen en hızlı çarpanlara ayırma algoritmaları verilebilir.

O(log n) tam olarak O(log(nc)) ile aynıdır. Logaritmalar arasındaki fark sadece sabit değerden kaynaklanan farktır (çünkü log(nc)=c log n) ve bundan ötürü büyük O gösteriminde ihmal edilir. Benzer şekilde farklı tabanlara göre yazılmış logaritmalar da denk kabul edilir.

Çarpma[değiştir | kaynağı değiştir]

O(f(n)) O(g(n)) 
= O(f(n)g(n)) \,

Toplama[değiştir | kaynağı değiştir]

O(f(n)) + O(g(n)) = O(\max \lbrace f(n),g(n) \rbrace) \,

Bir sabit ile çarpma[değiştir | kaynağı değiştir]

O(k g(n)) = O(g(n)) \!\,, k≠0

Bir sabit ile toplama[değiştir | kaynağı değiştir]

Ayrıştırılamadı (lexing hatası): O(k\ + jghfbdgfdgghhghdhtgdb ebjufnmnb rıjg fımtot njkojoıjf9jy uıhydfedgrghbgb hyuıouyhthyjuyj uıkouju7ıoy9ujıyıhujjn uhıuuıu9n joıbguguhuyyu ytgu7t7 :) hvbhbuyhnujjhıjkııoknn mj junmı nk 0ok0m opm oll lmokjojokohsaxszzfxgxdggmk..jkhıhjhujhuhj:) Diğer faydalı özellikler aşağıda belirtilmiştir. == İlişkili asimptotik gösterimler: ''O'', ''o'', Ω, ω, Θ, ''Õ'' == Büyük O işlevleri kıyaslamak için en sık kullanılan asimptotik gösterimdir ancak genellikle Θ yerine geçen resmi olmayan bir gösterim şeklidir ([[Theta]], bk. aşağısı). Burada konuyla ilgili bazı gösterimleri "büyük O" cinsinden tanımlayacağız: {| border="1" cellpadding="4" cellspacing="0" !Gösterim !Tanım !Matematiksel tanım |- |<math>f(n) \in O(g(n))

|asimptotik üst sınır |\lim_{x \to \infty} \left|\frac{f(x)}{g(x)}\right| < \infty |- |f(n) \in o(g(n)) |asimptotik olarak ihmal edilebilir |\lim_{x \to \infty} \frac{f(x)}{g(x)} = 0 |- |f(n) \in \Omega(g(n)) |asimptotik alt sınır | \lim_{x \to \infty} \left|\frac{f(x)}{g(x)}\right| > 0 |- |f(n) \in \omega(g(n)) |asimptotik baskın |\lim_{x \to \infty} \frac{g(x)}{f(x)} = 0 |- |f(n) \in \Theta(g(n)) |asimptotik keskin sınır |f\in O(g) and g\in O(f) |}

f(n) = o(g(n)) ilişkisi "f(n) g(n)nin küçük o'sudur" olarak okunur. Sezgisel olarak bunun anlamı şu demektir: g(n), f(n) işlevinden çok daha hızlı büyür. Biçimsel olarak söylemek gerekirse bu ifadenin anlamı şudur:

f(n)/g(n) ifadesinin limiti sıfırdır.

Büyük O gösterimi bir yana, Θ ve Ω sembolleri ile yapılan gösterim de bilgisayar bilimlerinde çok sık kullanılır. "Küçük o" daha ziyade matematikte kullanılır ve bilgisayar bilimlerinde kullanımı daha nadirdir. Küçük ω nadiren kullanılır.

Genelgeçer kullanımda O Θ kullanılması gereken yerlerde kullanılır, söz gelimi keskin bir sınır kastetildiğinde. Örneğin birisi "Yığın sıralaması ortalama durumda O(n log n)dir" diyebilir oysa asıl kastedilen "Yığın sıralaması ortalama durumda Θ(n log n)dir". Her iki ifade de doğru olmakla birlikte ikincisi daha güçlü bir iddiadır.

Bilgisayar bilimlerinde kullanılan bir başka sembol ise Õdir (Yumuşak-O olarak okunur). f(n) = Õ(g(n)) şeklindeki gösterim f(n) = O(g(n) logkg(n)) (bazı k değerleri için) için kısa yoldur. Temelde logaritmik çarpanları ihmal eden büyük O gösteriminden başka bir şey değildir. Bu gösterim daha çok algoritma başarımında "küçük kusurlar"ı belirlemeye yönelik başarım kestirimlerinde kullanılır (zira logkn, herhangi bir k sabiti için, daima o(n)'dir).

Büyük O ve küçük o[değiştir | kaynağı değiştir]

Aşağıdaki özellikleri bilmek faydalı olabilir:

  • o(f ) + o(f ) ∈ o(f )
  • o(f ) o(g ) ∈ o(fg )
  • o(o(f )) ∈ o(f )
  • o(f ) ∈ O(f ) (ve dolayısıyla yukarıdaki özellikler o ve O ile kombinasyonların çoğuna uygulanabilir).

Çoklu değişkenler[değiştir | kaynağı değiştir]

Büyük O (ve küçük o ve Ω...) birden çok değişken için de kullanılabilir. Örneğin,

f(n,m) = n^2 + m^3 + \hbox{O}(n+m) \mbox{ as } n,m\to\infty

ifadesine göre öyle C ve N sabitleri vardır ki

\forall n, m>N:f(n,m) \le n^2 + m^3 + (n+m)C.

Çift anlamlılığı engellemek için hangi değişkenin esas kabul edildiği daima belirtilmelidir çünkü

f(n,m) = \hbox{O}(n^m) \mbox{ as } n,m\to\infty

ifadesi,

\forall m: f(n,m) = \hbox{O}(n^m) \mbox{ as } n\to\infty.

ifadesinden çok farklıdır.

Kaynakça[değiştir | kaynağı değiştir]