En küçük kareler yöntemi

Vikipedi, özgür ansiklopedi
Atla: kullan, ara

En küçük kareler yöntemi, birbirine bağlı olarak değişen iki fiziksel büyüklük arasındaki matematiksel bağlantıyı, mümkün olduğunca gerçeğe uygun bir denklem olarak yazmak için kullanılan, standart bir regresyon yöntemidir. Bir başka deyişle bu yöntem, ölçüm sonucu elde edilmiş veri noktalarına "mümkün olduğu kadar yakın" geçecek bir fonksiyon eğrisi bulmaya yarar. Gauss-Markov Teoremi'ne göre en küçük kareler yöntemi, regresyon için optimal yöntemdir.

Doğrusal örnek[değiştir | kaynağı değiştir]

Kırmızı noktalar ölçümle elde edilmiş veri noktalarını, mavi çizgi ise en küçük kareler yöntemi ile bulunmuş teorik bağlantıyı ifade eder.

Basit bir örnek vermek gerekirse, aralarında doğrusal (lineer) bir bağlantı olan, X ve Y adında iki fiziksel büyüklük düşünelim. (Mesela, X belli bir ağaç türünün yaşı, Y aynı tür ağacın gövde çapı olabilir.) Y 'yi X 'in fonksiyonu olarak yazmak istiyoruz. Bu iki büyüklük arasındaki bağlantı doğrusal olduğuna göre, şöyle bir denklem halinde ifade edilebilir:

Y = aX + b\,.

Bizim aradığımız şey, bu denklemdeki a ve b sayıları için mümkün olan en doğru değerlerdir. Bu değerleri belirlemek için bir dizi ölçüm yaptığımızı düşünelim. (Ağaç örneğine dönersek, ilgilendiğimiz türden pek çok ağacın yaşını ve gövde çapını ölçelim.) Bu ölçümler bize bir dizi (xi, yi) çifti verecektir. Bir kartezyen düzlem üzerinde bu çiftlere karşılık gelen noktaları tek tek işaretlersek, kabaca düz bir çizgi üzerinde yayılmış bir "noktalar bulutu" elde ederiz. Noktalar, çeşitli sebeplerden dolayı (ölçüm hataları, istisnai durumlar, modele katılmayan dış etkiler, vs) kusursuz bir çizgi üzerinde çıkmayacaktır.

X ve Y arasındaki bağlantıyı tek bir doğrusal denklem olarak ifade etmek istiyorsak, bu noktalara mümkün olduğunca yakın geçecek bir çizgi bulmalıyız. Bir başka deyişle, yukarıdaki denklemde a ve b'yi öyle seçmeliyiz ki, ortaya çıkan çizgi veri noktalarına mümkün olduğunca yakın olsun.

En küçük kareler yöntemi, denklemin verdiği (teorik) Y değerleri ile ölçümlerin verdiği (gerçek) Y değerleri arasındaki farkların karelerinin toplamını küçültme fikrine dayanır. Bu yöntem, denklemdeki a ve b sayılarını, bahsedilen kareler toplamını en küçük yapacak şekilde seçer (ve adını da buradan alır).

Doğrusal Olmayan Örnek[değiştir | kaynağı değiştir]

Aralarında doğrusal olmayan (non-lineer) bir bağlantı olan, fiziksel büyüklükler için de benzer şekilde en küçük kareler (EKK) yöntemi kullanılabilir.

EKK yöntemi denklem formunun bilinmesini gerektir. Bu formda bağımsız değişkenin üsleri ile birlikte birden çok bağımsız değişkenin çeşitli biçimleri bulunabilir.

Q = aX + bY + cZ\,.
Q = aX + bX^2 + cY + dY^2 + eXY\,.

EKK'nın işe yaraması için değişkenler arasındaki ilişkiyi gösteren formun katsayılardan bağımsız olarak biliniyor olması gerekir. Bunun için Ekonometri biliminde çok çeşitli yöntemler mevcuttur.

Formun nasıl olacağına karar verdikten sonra katsayılar bulunur. Tüm örnek sonuçlarına bakılarak hata terimlerinin karelerini en düşük yapan katsayılar türev yardımıyla bulunur. Burada türevin sıfır olduğu noktanın en küçük değer olması kuralından faydalanılır.


Doğrusal EKK'nin Uygulanışı[değiştir | kaynağı değiştir]

Aşağıdaki ikinci dereceden polinomun denklem formu olarak belirlendiğini kabul edelim.

Q = aX + bX^2 + cY + dY^2 + eXY + f\,

Bu ifadedeki 2. dereceden terimler başka bir değişkenle değiştirilirse (X^2=K, Y^2=L, XY=M) ikinci dereceden polinom doğrusal bir ifadeye dönüşmüş olur. Bu durumda polinom daha genel bir ifadeyle yazılabilir:

Q = \beta _0 + \beta _1X_1 + \beta _2X_2 + \beta _3X_3 + \cdots + \beta _kX_k\,

n adet veri ile regresyon yaptığımızı varsayarsak, elimizdeki veride n tane Q değeri ile beraber her X_i için n tane değer bulunmaktadır. Bu durumda regresyon işlemi aşağıdaki işlem ile ifade edilebilir:

q=X\beta+\varepsilon

Yukarıdaki ifadede bulunan dizey ve diziler aşağıdaki gibi açıklanabilir:

q = \left\{ {\begin{array}{*{20}c}
   {Q_1 }  \\
   {Q_2 }  \\
    \vdots   \\
   {Q_n }  \\
\end{array}} \right\}\quad X = \left[ {\begin{array}{*{20}c}
   1 & {X_{11} } & {X_{12} } &  \cdots  & {X_{k1} }  \\
   1 & {X_{21} } & {X_{22} } &  \cdots  & {X_{k2} }  \\
    \vdots  &  \vdots  &  \vdots  &  \ddots  &  \vdots   \\
   1 & {X_{1n} } & {X_{2n} } &  \cdots  & {X_{kn} }  \\
\end{array}} \right]\quad \beta  = \left\{ {\begin{array}{*{20}c}
   {\beta _0 }  \\
   {\beta _1 }  \\
    \vdots   \\
   {\beta _k }  \\
\end{array}} \right\}\quad \varepsilon  = \left\{ {\begin{array}{*{20}c}
   {\varepsilon _1 }  \\
   {\varepsilon _2 }  \\
    \vdots   \\
   {\varepsilon _n }  \\
\end{array}} \right\}

Yukarıdaki \epsilon dizisi hataları ifade eder.

\beta parametrelerinin tahmini için aşağıdaki ifade kullanılabilir:

\beta _{tahmin}=(X^TX)^{-1}X^Tq\,

Tarihi[değiştir | kaynağı değiştir]

Bilindiği kadarıyla, en küçük kareler yöntemi ilk olarak 1795'te Carl Friedrich Gauss tarafından geliştirilmiştir. Gauss 1801 yılında bu yöntemi kullanarak, keşfinden kısa süre sonra kaybedilen Ceres asteroidinin tekrar gözlemlenebileceği pozisyonu hesaplayabilmiş, bu başarısıyla büyük üne kavuşmuştur. Gauss bu yöntemi ilk olarak 1809'da yayımlamıştır. 1806'da Fransız matematikçi Adrien-Marie Legendre ve 1808'de Amerikalı matematikçi Robert Adrain, Gauss'tan (ve muhtemelen birbirlerinden) bağımsız olarak bu yöntemi geliştirip kullanmışlardır.

En küçük kareler yöntemi, bugün neredeyse tüm bilim dallarında ve mühendislikte yaygın olarak kullanılmaktadır.