Ortalama

Vikipedi, özgür ansiklopedi
Atla: kullan, ara

Ortalama veya merkezsel konum ölçüleri matematik ana biliminde , özellikle istatistik bilim dalında, bir anakütle veya örneklem veri dizisi değerlerini temsil eden tek bir orta değeri veya beklenen değeri, yani tüm veri dizisinin orta konumunu, tek bir sayı ile ifade eden betimsel istatistik ölçüsüdür. Genel olarak günlük pratik hayatta çok popüler olarak kullanılan ortalama aritmetik ortalama olmakla beraber, bu ölçünün çok belirli dezavantajları olduğu göz önüne alınarak, birçok değişik merkezsel konum ölçüleri geliştirilmiş ve pratikte kullanılmaktadır. İstatistikde bilimsel olarak ortalamalar kavramına bir aksiyomatik yaklaşım J.Bibby (1974) tarafından verilmiştir.[1]

Tarihçe[değiştir | kaynağı değiştir]

Ortalama kavramı başlangiçta deniz nakliyatında ortaya çıkan zarar kavramından geliştirilmiştir. Deniz nakliyatinda zarar ya zarar gören esya sahibi tarafından özel avarya olarak tümüyle yüklenilir veya nakil edilen eşyaların satış kârını ortak olarak paylaşanlar tarafından genel avarya ortaklık payına göre olarak karşılanır. Genel avarya hesabının yapılması için geliştirilip kullanılan matematiksel hesaplar aritmetik ortalamanın ilk kullanılma alanı olmuştur. Bu kavrama Arapça avar, Italyanca avaria, Türkçede (pek çok denizcilik terimi gibi İtalyanca'dan alınan) avarya ve İngilizce average adı verilmektedir. İngilizce'de ayni sözcük, ve bazı günlük pratik hallerde Turkçe'de kullanılan avaraj sözcüğü ortalamaya eşit anlamda kullanılmaktadır.

Ortalama tipleri[değiştir | kaynağı değiştir]

Ortalama bir sayısal veri dizisininin merkezsel konumunu temsil etmek için seçilen tek bir sayı halinde bir özettir. Eğer veri dizisinde tüm elemanlar aynı sayı ise ortalama bu tek sayıdır. Ancak bu tip veri dizisi pratikte gayet az olarak bulunduğu, hatta nerede ise hiç bulunmadığı, için, bir pratik veri dizisinin merkezsel konumunu farklı şekilde temsil edecek ortalamalar geliştirilmiştir. Önce bu ortalamalardan en çok kullanılanları kısaca ele alınacak ve sonra daha geniş kapsamlı bir tablo sunulacaktır.

En çok kullanılan ortalama tipleri[değiştir | kaynağı değiştir]

Aritmetik ortalama[değiştir | kaynağı değiştir]

Aritmetik ortalama bir anakütle veya bir örneklem veri değerlerinin toplamlarının o anakütledeki terim sayısına veya örneklem büyüklüğüne bölünerek elde edilen merkezsel konum değeridir. Bu tanınım şu formülle gösterilir:

 \bar{x} = {1 \over n} \sum_{i=1}^n{x_i}

Burada  \bar{x} örneklem aritmetik ortalaması sembolüdür; anakütle aritmetik ortalaması için μ kullanılır.

İstatistikte sıkça kullanılır. Fakat bazı eksik yönleri vardır.

  • Verilerin ölçülme ölçeğinin ya aralıklı veya oransal olması gerekir. İsimsel ölçekli veriler için aritmetik ortalama anlamsızdır. Birçok istatistikçi sırasal ölçekli veriler için aritmetik ortalamanın anlamsız olduğunu kabul etmektedirler; ancak pratikte, özellikle bir anketten ortaya çıkarılan, sırasal ölçekli veriler için aritmetik ortalama hesaplanıp önemli alanlarda kullanılmaktadir.
  • Eğer anakütle veya örneklem veri dağılımı simetrik olmayıp çarpıklık gösteriyorsa, aritmetik ortalama merkezsel değer olmaktan çıkıp çarpıklık kuyruğunun bulunduğu tarafa doğru gitmeye eğilimlidir. Bu halde aritmetik ortalama istatistik bilenlerin, istatistik bilmeyenlere karşı kullanabilecekleri bir aldatmaca yolu olarak da kullanılabilir.

Örnek: Bir işyerinde işçiler maaşlarının düşük olmasından dolayı şikayetçidirler. Fakat yöneticiler tam tersini savunabilirler. Maaş dağılımları şöyle olsun:

1 Genel Müdür: 15.000,00 YTL
2 tane Genel Müdür Yardımcısı: her biri 5.500,00 YTL
5 tane idari işler sorumluları (Halkla ilişkiler, İnsan kaynakları...vb): her biri 1.500,00 YTL
30 tane normal personel = her biri 1.000,00 YTL
Böyle bir durumda maaşların aritmetik ortalaması alınırsa
[15000+(2x5500)+(5x1500)+(30x1000)]/38 = 1.671,05 YTL

olarak ortalama aylık maaş hesaplanır. Ama bu ortalama merkezsel konumu göstermez. 38 personelden ancak 3u ortalamadan fazla maaş almakta görülmektedir ve maaş dağılımı çok bariz şekilde çarpıktır. Çok küçük sayıda kişi (müdür ve 2 yardımcısı) karşılaştırılmalı olarak çok büyük değerde maaş almakta ama çok büyük sayıda kişi düşük değerde maaş almaktadır. Böylece maaş dağılımı gayet asimetrik olup sağda bir ince uzun bir kuyruk bulunmaktadır; veri dağılımı pozitif çarpıklık göstermektedir. Bu nedenle maaş aritmetik ortalaması merkezsel konum göstergesi olmaktan çıkmıştır.

Geometrik ortalama[değiştir | kaynağı değiştir]

Geometrik ortalama bir anakütle veya bir örneklem veri değerlerinin çarpımlarının o anakütledeki terim sayısına veya örneklem büyüklüğüne eşit kökü alınmak suretiyle elde edilen bir merkezsel konum değeridir. Bu tanımlama için formül şöyle verilir:

 G = \sqrt[n]{x_1 \cdot x_2 \cdot \ldots \cdot x_n}  = \sqrt[n]{\prod_{i=1}^n{x_i}}

Burada G geometrik ortalama sembolüdür.

Bu tür ortalamanın da dezavantajları bulunmaktadır:

  • Büyük bir sayıda kök almak el hesabı ile imkânsız olduğu için bu tür ortalama genel olarak elektronik hesap makinelerinin veya kompüterlerin gelişmesinden önce kullanılması çok zor olmaktaydı. Verilerin logaritması alınıp; bu logaritma verilerinin toplamı bulunup; eldeki veri büyüklük sayısına bölünmesi ile geometrik ortalamanın logaritma değeri bulunup; bunun antilogaritmasının alınması gerekmekteydi. Orta basitlikte hesaplar yapabilen elektronik hesap makinaları veya kompüter kullanılarak geometrik ortalama almak çok kolaylaşmıştır.
  • Geometrik ortalama bulabilmek için verilerin pozitif değerde olması gerekmektedir yani veri değerlerinin özellikle sıfır veya negatif olmaması gerekmektedir. Eğer tek bir veri değer sıfır ise, geometrik ortalama almak anlamsız olacaktır.
  • Ayrıca verilerin ölçülme ölçeğinin oransal olması gerekir; isimsel ölçekli, sırasal ölçekli ve aralıksal ölçekli veri değerleri için geometrik ortalama anlamsız olur.

Mod[değiştir | kaynağı değiştir]

Ana madde: Mod

Mod veri dizisi içinde en çok defa tekrarlanan veri değeridir. Mod isimsel ölçekli veriler için anlamlı olan tek ortalama ölçüsüdür. Ancak veri dizisi içinde tek bir mod olmayabilir. Yahut ta birden fazla sayıda mod bulunabilir.

Medyan[değiştir | kaynağı değiştir]

Medyan bir veri dizisinin küçükten büyüğe veya büyükten küçüğe sıralanmasından sonra bu dizinin tam ortasında bulunan değerdir. Eğer veri büyüklüğü tek sayılı ise medyan verilen bir veri değerine eşit olur. Eğer veri büyüklüğü çift sayılı ise medyan orta iki değerin ortalaması olur. Medyan bulmak için basit bir algoritmaya göre, sıralanmış veri değerlerinin kalan en küçük ve en büyük değerleri birer birer elimine edilir; veri sayısı tek ise en son kalan tek veri medyandır; eğer veri sayısı çift ise son kalan iki veri çiftinin ortalaması medyan olur.

Genelleştirilmiş ortalama türleri[değiştir | kaynağı değiştir]

İstatistikçiler ortalama türlerini genelleştiren tek bir formül bulmak için değişik yaklaşımlar kullanmışlardır:

\bar{x}(m) = \sqrt[m]{\frac{1}{n}\sum_{i=1}^n{x_i^m}}

Bu formülde m için değişik değerler değişik ortalama türü verirler: :

    • eğer m = 1 ise aritmetik ortalama;
    • eğer m = 2 ise kuadratik ortalama;
    • eğer m = -1 ise harmonik ortalama;
    • limit m → 0 ise \bar{x}(m) geometrik ortalamaya yaklaşır.
y = f^{-1}\left(\frac{f(x_1)+f(x_2)+\cdots+f(x_n)}{n}\right),

Burada f tersi alınabilir bir fonksiyondur. Bu formül değişik ortalamalar için şu şekilleri alır:

    • Geometrik ortalama için f(x)=log x olur.
    • Harmonik ortalama için f(x)= 1/x olur.
    • Çok az bilinen üstel ortalama için f(x)=ex olur.

Ancak bu genelleştirme ile tüm ortalamaların ayrı ayrı formüllerini bulmak imkânsızdır.

  • Diğer bir genelleştirme, ortalamalar listesi elamanlarının permütasyonu halinde simetrik olan bir g(x1, x2, ..., xn) fonksiyonunun değişik şekillerde ifadesi ile yapılır:[2]
    • Aritmetik ortalama için g(x1, x2, ..., xn) =x1+x2+ ...+ xn.
    • Geometrik ortalama için g(x1, x2, ..., xn) =x1·x2· ...· xn.
    • Harmonik ortalama için g(x1, x2, ..., xn) =x1−1+x2−1+ ...+ xn−1.

Değişik ortalama tipleri özeti[değiştir | kaynağı değiştir]

İstatistik bilim dalında bir sıra değişik ortalama tipleri geliştirilmiş ve bunlardan araştırıcının isteğine göre birinin veya bir kaçının eldeki veriler için merkezsel konum ölçüsü olarak kullanılması imkânı sağlanmıştır.

İsim Denklem veya betimleme
Aritmetik ortalama \bar{x} = \frac{1}{n}\sum_{i=1}^n x_i  =  \frac{1}{n} (x_1+\cdots+x_n)
Medyan (ortanca) Bu yüksek değerde olan veriler ile düşük değerde olan verilerin tam ortasında bulunan bir sayı.
Geometrik medyan Rn düzeyindeki noktalar için, medyan kavramının, matematik rotasyon dönüşümünde sabit kalan bir genişletilmesi,
Mod (tepedeğer) Verilerin en çok defa tekrarlanmış değeri
Geometrik ortalama \bigg(\prod_{i=1}^n x_i \bigg)^{1/n} = \sqrt[n]{x_1 \cdot x_2 \dotsb x_n}
Harmonik ortalama \frac{n}{\frac{1}{x_1} + \frac{1}{x_2} + \cdots + \frac{1}{x_n}}
Kuadratik ortalama
(veya ortalama kareler karekökü)
\sqrt{\frac{1}{n} \sum_{i=1}^{n} x_i^2} =
\sqrt {\frac{x_1^2 + x_2^2 + \cdots + x_n^2}{n}}
Genelleştirilmiş ortalama \sqrt[m]{\frac{1}{n} \cdot \sum_{i=1}^n x_{i}^m}
Ağırlıklı ortalama \frac{ \sum_{i=1}^n w_i x_i}{\sum_{i=1}^n w_i} = \frac{w_1 x_1 + w_2 x_2 + \cdots + w_n x_n}{w_1 + w_2 + \cdots + w_n}
Kesilmiş ortalama Belirli bir yüzde oranda en yüksek ve en düşük veri değerlerinin bertaraf edilmelerinden sonra hesaplanan aritmetik ortalamadır.
Çeyrekler açıklığı ortası Çeyrekler açıklığı kullanılarak kesilmiş ortalamanın özel bir hali.
Açıklık-ortası \frac{\max x + \min x}{2}
Winsorize ortalaması Bir çeşit kesilmiş ortalama olup belirli bir yüzde olarak kesilen en yüksek ve en düşük değerler bertaraf edileceğine kalan sayılar için en yuksek ve en düşük veri değerleri yerine ikame edilirler.
Anualizasyon -1 + {\prod (1+Rt)}^{1/\sum t_i}

Ayrıca bakınız[değiştir | kaynağı değiştir]

Kaynakça[değiştir | kaynağı değiştir]

  1. ^ Bibby, J. (1974) "Axiomatisations of the average and a further generalization of monotonic sequences" Glasgow Mathematical Journal C.15, say.63–65.
  2. ^ Bakın Bibby,J. (1974) "Axiomatisations of the average and a further generalisation of monotonic sequences", Glasgow Mathematical Journal, C.15, say. 63–65,

Dış bağlantılar[değiştir | kaynağı değiştir]