Doğrusal olmayan regresyon

Vikipedi, özgür ansiklopedi
Atla: kullan, ara
Ayrıntılar için İngilizce Michaelis-Menten kinetics sayfasına bakabilirsiniz.

Doğrusal olmayan regresyon, istatistik bilimde gözlemi yapılan verilerin bir veya birden fazla bağımsız değişkenin model parametrelerinin doğrusal olmayan bileşiği olan ve bir veya daha çok sayıda bağımsız değişken ihtiva eden bir fonksiyonla modelleştirilmesini içeren bir regresyon (bağlanım) analizi türüdür. Veriler arka-arkaya yapılan yaklaşımlarla kurulan modele uydurularak çözümleme yapılır.

Genel açıklama[değiştir | kaynağı değiştir]

Veriler hiç hatadan arınmış bağımsız değişkenler olan açıklayıcı değişken, x, ve bunlara bileşik olan gözümlenen bağımlı değişken açıklanan değişken, y değişkeninden oluşur. Her y ortalama'sı verilmiş bir doğrusal-olmayan fonksiyon f(x,β) olan bir rassal değişken olarak modelleştirilmiştir. Sistematik hata bulunabilir ama bunların ele alınması regresyon analizi içeriğinde bulunmaz. Eğer bağımsız değişkenler hatadan arınmamışlarsa, bu daha karmaşık olan değişkenlerde-hata modeli kullanılması gerektirecektir ve burade ele alınan yöntem daha basit oilup bu fazladan karmaşıklığı ele almamaktadır.

Örneğin, enzim kinetik amalizleri için Michaelis–Menten şöyle idafe edilir:

 v = \frac{V_\max[\mbox{S}]}{K_m + [\mbox{S}]}

Bu ifade şöyle de yazılabilir:

 f(x,\boldsymbol\beta)= \frac{\beta_1 x}{\beta_2 + x}

Bu ifadede \beta_1, V_\max parametresi; \beta_2, K_m parametresi ve [S] bağımsız değişken olan x dir. Bu fonksiyon doğrusal olamayan bir fonksiyondur, çünkü \beta lerin bir doğrusal bileşimi ile ifade edilemezler.

Doğrusal olmayan fonksiyonlara diğer örneğinler Üstel fonsksiyonlar, logaritmik fonksiyonlar, trigonometrik fonksiyonlar, üstel ifadeler ihtiva eden [[eksponanasyon fonksiyonları, Gauss-tipi fonksiyon ve Lozernz-tipi fonksiyonlardır. Üstel fonsksiyonlar veya logaritmik fonksiyonlar gibi bazı fonksiyonlar dönüşüm kullanılarak doğrusal fonskiyon olarak ifade edilebilirler. Böyle bir dönüşümden sonra standart doğrusal regresyon analizi tatbik edilebilir ama bunun uygulanmasında çok dikkatli bulunmak gerekmektedir.

Genel olarak, doğrusal regresyon'da olduğu gibi en-uygun-olarak yerleştirilme ile tahmin edilmiş parametreler için kapalı-şekilli ifadeler bulunmaz. Çok kere sayısal matematik optimazisyon algoritmalarını kullanarak, optimize edilecek fonksiyon için çoklu yerel maksimum/minimum bulunabilir ve göbal optimiüm bulunsa bile yanlı kestirimler ortaya çıkarabilir. Uygulamada bir kareler toplamının global minimum ifadesini bulmaya çalışma sırasında, optimazisyon algorimi ile birlikte parametrelerin kestirim tahminleri kullanılır.

Regresyon istatistikleri[değiştir | kaynağı değiştir]

Bu yordamın altında yatan varsayım, modelin şu şekilde bir doğrusal fonksiyonla yaklaşımı yapılabilme imkânı olduğudur

 f(x_i,\boldsymbol\beta)\approx f^0+\sum_j J_{ij}\beta_j o

Burada

J_{ij}=\frac{\partial f(x_i,\boldsymbol\beta)}{\partial \beta_j}.

Bundan çıkartılan sonuç, en küçük kareler kestrimleri şu formülle verilir:

\hat\boldsymbol\beta \approx \mathbf { (J^TJ)^{-1}J^Ty}.

Doğrusal olmayan istatistiklerin hesaplanması da doğrusal regresyon gibi kestirimi yapılır ama formüllerde X yerine J kullanılması gerekir. Doğrusal yaklaşım kullanmak çıkartılan sonucu yanlı olmasına sonuç verir. Bunun için doğrusal olamayan regresyon modelinin kullanılması ile ortaya çıkartılan sonuçların alışılagelenden daha şüpheci bir şekilde kullanılması gerekir.

Alelade ve ağırlıklı en küçük kareler[değiştir | kaynağı değiştir]

"En iyi uyan" eğri çok kere artıkların karelerinin toplamını minimize edenidir. Buna (alelade) en küçük kareler yaklaşımı adı verilir. Fakat, eğer bağımlı değişkenin sabit varyansı bulunmuyorsa, ağırlıklı karesi alınmış artıklar kullanılabilir (bakınız ağırlıklı en küçük kareler). İdeal olarak kullanılan her bir ağırlık, bir üstü gözlemi yapılan değerin varyasyonu olması tercih edilmelidir. Ama tekrarlanan hesaplı ağırlıklı en küçük kareler algorıtması kullanılıp her bir hesaplama için ağırlıklar tekrar hesaplanıp değiştirilebilir.

Doğrusallaştırma[değiştir | kaynağı değiştir]

Dönüştürme[değiştir | kaynağı değiştir]

Bazı doğrusal olmayan regresyon problemleri modelin uygun olan dönüştürmesiyle bir doğrusal çerçeveye geçirtilebilir.

Örneğin, (hataları ele almadan) şu doğrusal olmayan regresyon modelini ele alalım:

 y = a e^{b x}. \,\!

Eşitliğin her iki tarafının logaritmaları alınırsa, model şu yeni şekle dönüşür:

 \ln{(y)} = \ln{(a)} + b x, \,\!

Bu şekildeki model bilinmeyen katsayılarının kestirimi için bağımlı değişkeni ln(y) ve bağımlı değişkeni x olan bir doğrusal regresyon modelidir ve tekrarlanan optimizasyon yöntemi kullanılması istemeden; doğru doğruya en alelade en küçük kareler regreson yöntemi ile yapılabilir. Fakat doğrusal dönüşüm kullanılmasının çok dikkatle yapılması gerekir. Dönüşümlü modeller için kullanılan vei değerleri başkadır; hatalar bünyesi ve kestirimler üzerinde çıkarımsal sonuçlar da değişik olduğu iyi bilmesi gerekir. Bunlar istenilmeyen sonuçların elde edilmesine yol açabilir. Diğer taraftan, hataların en yüksek kaynağının ne olduğuna bağlı olarak, bir doğrusal dönüşüm hataların normal dağılım göstermesine sonuç olabilir. Bu nedenle bir doğrusal dönüşüm kullanmayı seçmek için modelin karakterlerini iyi bilme gerekir.

Michaelis–Menten kinetik analizi için, 1/v ile 1/[S] eksenleri olan bir doğrusal "Lineweaver-Burk" gösterimi, yani

 \frac{1}{v} = \frac{1}{V_\max} + \frac{K_m}{V_\max[S]}

çok defa kullanılmaktadır. Fakat bu veri hatalarına karşı çok hassaslık gösterir ve [S] bağımsız değişkenin belirli bir açıklığı içinde verileri kullanıp model kurma yanlılığına yol açtığı bilinmektedir. Bu nedenle bu dönüşümün pratikte kullanılması tavsiye edilmemekte ve başka yaklaşımlarain kullanılması salık verilmektedir..

Bölümleme[değiştir | kaynağı değiştir]

Hardal bitkisinin randımanı ve toprak tuzluluğu
Ana madde: Bölümlenmiş regresyon

"Bağımsız değişken" veya "açıklayıcı değişken (diyelim X) bölümlere veya parçalara veya sınıflara bölünebilir ve her bir bölüm için doğrusal regresoyon ayrı ayrı uygulanabilir. Kestirim aralığı ile birlikte uygulanan bölümler için regresyon, her bir bölüm için bağımlı değişken veya açıklanan değişken (diyelim Y) için değişik davranış gösterdiğini ortaya çıkaran bir sonuç elde edilebilir. [1].

Yandaki gösterimde X = "toprak tuzluğu" kolza yetiştirilmesinde "ürün randımanına" (Y) ilk önce hiç etki yapmamaktadır. Fakat (kırılma noktası adı verilebilecek) belirli bir kritik veya eşik değer geçilince randıman menfi olarak etkilenmektedir. [2].

Bu gösterim SegReg adlı bir komputer programı kullaılarak hazırlanmıştır. <reg>SegReg komputer programı hiç parasız [3] adlı websitesinde yüklenebilir.

Dipnotlar[değiştir | kaynağı değiştir]

  1. ^ R.J.Oosterbaan, 1994, Frequency and Regression Analysis (Sıklık ve Regresyon Analizi) . Kaynak: H.P.Ritzema (ed.), Drainage Principles and Applications, Publ. 16, pp. 175-224, International Institute for Land Reclamation and İmprovement (İLRİ), Wageningen, The Netherlands. ISBN 90 70754 3 39 . PDF : [1]
  2. ^ R.J.Oosterbaan, 2002. Tarımcıların tarlalarında şu çekimi: veri analizi. Uluslararası Toprak Reklamasyonu ve Geliştirilmesi Enstitüsü (İLRİ) Wageningen, Holland. (PDF) : [2]

Ayrıca bakınız[değiştir | kaynağı değiştir]


Dış kaynaklar[değiştir | kaynağı değiştir]

  • İngilizce Wikiopedia "Nonlienar regression" maddesi:[4] (İngilizce) (Erişme:21.5.2010).