İçeriğe atla

Büyük O gösterimi

Vikipedi, özgür ansiklopedi
(Big-O sayfasından yönlendirildi)
Büyük O gösterimi örneği, f ( x ) ∈ O ( g ( x ) )

Büyük O (Big-Oh) gösterimi matematiksel bir gösterim olup işlevlerin (fonksiyonların) asimptotik davranışlarını tarif etmek için kullanılır. Bir işlevin büyümesinin asimptotik üst sınırını daha basit başka bir işlev cinsinden tanımlanması demektir. İki temel uygulama alanı vardır: matematik alanında genellikle kırpılmış bir sonsuz serinin kalan terimini karakterize etmek için kullanılır; bilgisayar bilimlerinde ise algoritmaların bilgi işlemsel karmaşıklığının çözümlemesi için kullanılır.

Bu gösterim ilk olarak Alman sayılar kuramcısı Paul Bachmann tarafından 1892 yılında yazdığı Analytische Zahlentheorie kitabında kullanılmıştır. Gösterim bir başka Alman matematikçi olan Edmund Landau tarafından yaygın kullanıma sokulmuştur, bundan ötürü bazen Landau sembolü olarak da anılır. Büyük O, İngiliz dilindeki "order of" yani bir şeyin derecesi anlamına gelen söz öbeğini hatırlatmak amacı ile kullanılıyordu ve ilk olarak büyük omicron harfi idi; günümüzde büyük O kullanılmakta ve 0 sayısı hiç kullanılmamaktadır.

Kullanım alanları

[değiştir | kaynağı değiştir]

Bu gösterimin biçimsel olarak yakın ama temelde farklı iki kullanımı vardır: sonsuz asimptotikler ve infinitesimal asimptotikler. Bu ayrım sadece uygulamadadır ancak "büyük O"nun biçimsel tanımı her iki durumda aynı olup işlev argümanının limitleri değişmektedir.

Sonsuz asimptotikler

[değiştir | kaynağı değiştir]

Büyük O gösterimi algoritma başarım çözümlemesinde faydalıdır. Söz gelimi n boyundaki bir problemi çözmek için gereken zaman (adım sayısı) T(n) = 4n² - 2n + 2 olarak bulunabilir.

n büyüdükçe n² terimi o kadar hızlı büyüyecektir ki diğer terimlerin büyüme hızı buna kıyasla ihmal edilebilecek kadar düşük kalacaktır; örneğin n = 500 için 4n² terimi 2n teriminin 1000 katı büyüklüğünde olacaktır ve dolayısıyla bu ikinci terimin değeri tüm ifadenin değerini belirlemede çoğu amaç bakımından ihmal edilebilir bir etkiye sahip olacaktır.

Buna ek olarak, aynı ifadeyi n³ veya 2n terimleri içeren bir ifade ile kıyaslayacak olursak katsayılar da anlamlarını yitirecektir. T(n) = 1.000.000n² ve U(n) = n³ olsa bile ikinci ifade, n 1.000.000'u geçtikçe birinci ifadeye kıyasla daima daha büyük olacaktır (T(1.000.000) = 1.000.000³ = U(1.000.000)).

O halde Büyük O gösterimi işin özünü sade biçimde sunmaktadır: şu şekilde yazabilir

ve algoritmanın n2 dereceden zaman karmaşıklığına sahip olduğunu söyleyebiliriz.

Sonsuz küçük asimptotikler

[değiştir | kaynağı değiştir]

Büyük O aynı zamanda bir matematiksel işlev için geliştirilen yaklaşık işlevin hata terimini tarif etmek için de kullanılabilir. Örneğin, : ifadesi hatanın (yani farkının) mutlak değer bakımından, sıfıra yeterince yakın x değerleri için bir sabit çarpı x3 değerinden daha küçük olduğunu belirtir.

Biçimsel tanım

[değiştir | kaynağı değiştir]

f(x) ve g(x) gerçel sayılar kümesinin bir alt kümesi üzerinde tanımlanmış iki işlev olsun. Bu durumda deriz ki

f(x), O(g(x))dir; x

yalnız ve yalnız

öyle x0 ve M sayıları varsa ki |f(x)| ≤ M |g(x)|; x > x0 için.

Aynı gösterim f işlevinin bir a gerçel sayısı civarındaki davranışını tarif etmek için de kullanılabilir: Deriz ki

f(x) O(g(x))dir; x a

yalnız ve yalnız

öyle δ>0 ve M sayıları varsa ki |f(x)| ≤ M |g(x)|; |x - a| < δ için.

Eğer g(x) a sayısına yeterince yakın x değerleri için sıfırdan farklı ise yukarıdaki iki tanım limit superior kullanılarak birleştirilebilir:

f(x) O(g(x))dir;x a

yalnız ve yalnız

iken.

Matematikte hem ∞ hem de a civarındaki asimptotikler kullanılır. bilgi işlemsel karmaşıklık kuramında ise sadece ∞a giden asimptotikler kullanılır. Ayrıca sadece pozitif değerli işlevler ele alındığından mutlak değer de kullanılmadan yazılabilir.

Şu çokterimlilere bakalım:

f(x), O(g(x)) ya da O(x4) derecesindedir diyebiliriz. Tanıma göre, tüm x>1 değerleri için ve C bir sabit iken, |f(x)| ≤ C |g(x)| ifadesi geçerlidir.

İspat:

        x > 1 iken
    çünkü x3 < x4 ve devam eder.

Dikkat edilmesi gereken hususlar

[değiştir | kaynağı değiştir]

Yukarıda bahsi geçen "f(x) O(g(x))dir" ifadesi genellikle f(x) = O(g(x)) şeklinde yazılır. Bu, gösterimin bir nebze kötüye kullanılması demektir. Elbette kastettiğimiz iki işlevin birbirine eşit olmaları değildir. O(g(x)) olma hali simetrik değildir:

fakat .

Bu yüzden bazı yazarlar küme gösterimini tercih ederler ve f O(g) yazarlar, bunu yaparken de O(g)yi g işlevinin altında kalan tüm işlevlerin kümesi olarak düşünürler.

Ayrıca, aşağıdaki gibi bir "eşitlik"

"f(x) ile h(x)nin farkı O(g(x))dir" olarak anlaşılmalıdır.

Sık rastlanan işlev dereceleri

[değiştir | kaynağı değiştir]

Aşağıda algoritma çözümlemesinde sıkça karşılaşılan işlev derecelerini görebilirsiniz. Tüm bunlar n sonsuza giderken durumunda belirtilmiştir. Daha yavaş büyüyen işlevler önce listelenmiştir. c keyfi bir sabit değerdir.

gösterim isim
sabit
tekrarlı logaritmik
logaritmik
logaritmik çokterimli
alt doğrusal
doğrusal
doğrusal logaritmik (linearitmik),

sözde doğrusal veya üst doğrusal

karesel
, çokterimli, bazen "cebirsel" de denir
üssel, bazen "geometrik" de denir
faktöriyel, bazen "kombinatoryel" de denir

Pek sık rastlanmasa da, Büyük O gösterimi ile kullanılan çok daha hızlı büyüyen işlevler mevcuttur, mesela A(n,n) olarak temsil edilen Ackermann işlevinin tek değerli hâli. Bunun tam tersi çok yavaş büyüyen işlevler da vardır, ör. Ackermann işlevinin ters işlevi olan ve genellikle α(n) ile gösterilen işlev. Her ne kadar bu işlevler sınırsız olsa da pratik amaçlar için sabit çarpanlar olarak kabul edilirler.

Eğer bir f(n) işlevi diğer işlevlerin sonlu toplamı olarak yazılabiliyorsa o zaman bunların içinden en hızlı büyüyeni f(n) işlevinin derecesini belirler. Örneğin

.

Özel olarak eğer bir işlev n terimine bağlı birçokterimli tarafından üstten sınırlandırılabiliyorsa o zaman n değeri sonsuza gittikçe çokterimlinin düşük dereceli terimleri ihmal edilebilir.

O(nc) ve O(cn) çok farklıdır. İkincisi çok çok daha hızlı büyür ve c sabitinin değeri, bu değer 1 sayısından büyük olduğu sürece, bu durumu değiştirmez. n'nin herhangi bir kuvvetinden daha hızlı büyüyen bir işleve yüksek çokterimli (superpolynomial) denir. cn biçimindeki herhangi bir üssel işlevden daha yavaş büyüyen işleve ise altüssel denir. Bir algoritmanın zaman karmaşıklığı hem yüksek çokterimli hem de altüssel olabilir, bu tür algoritmalara örnek olarak bilinen en hızlı çarpanlara ayırma algoritmaları verilebilir.

O(log n) tam olarak O(log(nc)) ile aynıdır. Logaritmalar arasındaki fark sadece sabit değerden kaynaklanan farktır (çünkü log(nc)=c log n) ve bundan ötürü büyük O gösteriminde ihmal edilir. Benzer şekilde farklı tabanlara göre yazılmış logaritmalar da denk kabul edilir.

Bir sabit ile çarpma

[değiştir | kaynağı değiştir]
, k≠0

Bir sabit ile toplama

[değiştir | kaynağı değiştir]
g(n) ∈ o(1) olmadığı takdirde ki bu durumda O(1)dir.

Diğer faydalı özellikler aşağıda belirtilmiştir.

İlişkili asimptotik gösterimler: O, o, Ω, ω, Θ, Õ

[değiştir | kaynağı değiştir]

Büyük O işlevleri kıyaslamak için en sık kullanılan asimptotik gösterimdir ancak genellikle Θ yerine geçen resmi olmayan bir gösterim şeklidir (Theta, bk. aşağısı). Burada konuyla ilgili bazı gösterimleri "büyük O" cinsinden tanımlayacağız:

Gösterim Tanım Matematiksel tanım
asimptotik üst sınır
asimptotik olarak ihmal edilebilir
asimptotik alt sınır
asimptotik baskın
asimptotik keskin sınır and

f(n) = o(g(n)) ilişkisi "f(n) g(n)nin küçük o'sudur" olarak okunur. Sezgisel olarak bunun anlamı şu demektir: g(n), f(n) işlevinden çok daha hızlı büyür. Biçimsel olarak söylemek gerekirse bu ifadenin anlamı şudur:

f(n)/g(n) ifadesinin limiti sıfırdır.

Büyük O gösterimi bir yana, Θ ve Ω sembolleri ile yapılan gösterim de bilgisayar bilimlerinde çok sık kullanılır. "Küçük o" daha ziyade matematikte kullanılır ve bilgisayar bilimlerinde kullanımı daha nadirdir. Küçük ω nadiren kullanılır.

Genelgeçer kullanımda O Θ kullanılması gereken yerlerde kullanılır, söz gelimi keskin bir sınır kastetildiğinde. Örneğin birisi "Yığın sıralaması ortalama durumda O(n log n)dir" diyebilir oysa asıl kastedilen "Yığın sıralaması ortalama durumda Θ(n log n)dir". Her iki ifade de doğru olmakla birlikte ikincisi daha güçlü bir iddiadır.

Bilgisayar bilimlerinde kullanılan bir başka sembol ise Õdir (Yumuşak-O olarak okunur). f(n) = Õ(g(n)) şeklindeki gösterim f(n) = O(g(n) logkg(n)) (bazı k değerleri için) için kısa yoldur. Temelde logaritmik çarpanları ihmal eden büyük O gösteriminden başka bir şey değildir. Bu gösterim daha çok algoritma başarımında "küçük kusurlar"ı belirlemeye yönelik başarım kestirimlerinde kullanılır (zira logkn, herhangi bir k sabiti için, daima o(n)'dir).

Büyük O ve küçük o

[değiştir | kaynağı değiştir]

Aşağıdaki özellikleri bilmek faydalı olabilir:

  • o(f) + o(f) ∈ o(f)
  • o(f) o(g) ∈ o(fg)
  • o(o(f)) ∈ o(f)
  • o(f) ∈ O(f) (ve dolayısıyla yukarıdaki özellikler o ve O ile kombinasyonların çoğuna uygulanabilir).

Çoklu değişkenler

[değiştir | kaynağı değiştir]

Büyük O (ve küçük o ve Ω...) birden çok değişken için de kullanılabilir. Örneğin,

ifadesine göre öyle C ve N sabitleri vardır ki

Çift anlamlılığı engellemek için hangi değişkenin esas kabul edildiği daima belirtilmelidir çünkü

ifadesi,

ifadesinden çok farklıdır.