Serbestlik derecesi (istatistik)

Vikipedi, özgür ansiklopedi
06.27, 14 Nisan 2016 tarihinde 194.27.127.99 (mesaj) tarafından oluşturulmuş 16910059 numaralı sürüm (cümlenin anlaşılmasını kolaylaştırma amacıyla değiştirilmiştir.)
Diğer bilimler için serbestlik derecesi üzerindeki bilgiler için, bakın serbestlik derecesi:

Serbestlik derecesi istatistik'te bir istatistiğin kesin hesaplanmasında kullanılan değerlerin sayısının ne kadar değişme serbestisi olduğunu sayısal olarak verir. [1]

İstatistiksel parametrelerin kestirimleri değişik nicelikte veriye veya bilgiye dayanabilir. Bir parametrenin kestirimi için kullanılması gereken bağımsız bilgi parçalarının sayısına serbestlik derecesi denir. Genellikle, bir kestirim için serbestlik derecesi bu kestirimi elde etmek için kullanılan bağımsız skorlar sayısı eksi bu parametrenin kendisinin kestirimini yapma etaplarında kullanılan parametreler sayısına eşittir.[2]

Matematiksel terimlerle, serbestlik derecesi bir rastgele vektörun sahasının boyutu olur veya vektörün tümünün belirlenmesi için bilinmesi gereken parçaların sayısıdır.

Serbestlik derecesi terimi çok defa olasılık dağılımlarında, hipotez sınamasında ve doğrusal modeller (yani doğrusal regresyon ve varyans analizi) alanlarında kullanılır. İstatistiğe giriş kitap veya makalelerinde çok kere bu kavram hipotez sınamasında veya olasılık dağılımları parametreleri olarak ilk defa ortaya çıkartılır. Fakat bu kavramin derinden anlaşılabilmesi için kritik olan, kavramın altında bulunan geometrinin kavranmasıdır. Eğer N boyutlu geometri bilinmezse veya modern örnekleme kuramı ikinci elden sadece istatistiğe giriş kitaplarından öğrenilirse, bu kavram pratik anlamı olmayan bir mistik sözcük olmaktan ileri gitmemektedir.

Bu kavram için notasyon ünlü istatistikçi Ronald Fisher tarafından n olarak kullanılmıştır; ama modern istatistik metinlerinde n örneklem büyüklüğü olarak kullanılır. Bu nedenle serbestlik derecesi notasyon olarak (s.d.) veya İngilizceden esinlenerek d.f. ("degree of freedom") olarak ifade edilir.

Artıklar

İstatistiksel modelin veriye uyarlanmasında, hata ve artık vektörleri genelde vektördeki bileşenlerin sayısından daha kısıtlı bir boyuta sahiptir. Artık veya hata vektörünün bu daha küçük boyuta sahip olma durumuna hatanın "serbestlik derecesi" adı verilir.

Basit bir örnekle açıklanması gerektiğinde:

ifadesindeki x'ler, μ beklenen değerine sahip rassal değişkenler olsun ve

örneklem ortalaması olsun. Öyleyse

büyüklüğü Xi - μ hata tahmininin artıklarını oluşturan bir büyüklüktür.

Hata terimlerinin aksine, artıkların toplamının 0 olması gerekir. Yani n - 1 boyutlu bir uzayda yer alma kısıntı içindedirler. Eğer artıklardan n - 1 tanesi bilinirse, sonuncusu da bulunabilir. Dolayısıyla hata terimi için n - 1 serbestlik derecesi vardır.

modelindeki a ve b'nin en küçük kareler yöntemiyle tahmininde

i, ve dolayısıyla Yi rassaldır). ve , a ve b tahmin ettiğimiz değerler olsun. O zaman;

artıkları iki denklemin tanımladığı uzay içinde yer alacak şekilde kısıtlıdırlar:

Dolayısıyla hata terimi için n - 2 serbestlik derecesi vardır.

(Model tanımlanırken büyük y harfi (Y), artıklar tanımlanırken küçük y harfi (y) kullanılmıştır. Birinci ifade teorik rassal değişkenlere bağlıyken ikinci ifade gerçek veriye dayalıdır.)

Olasılık Dağılımlarındaki Parametreler

Hata terimlerinin olasılık dağılımları genelde bu serbestlik dereceleri ile parametrelendirilir. Bu yüzden Ki-kare dağılımından söz edilirken belli bir serbestlik derecesi gerekir, F-dağılımı, t-dağılımı, veya bir Wishart dağılımı pay veya paydalarında serbestlik derecesi içerir.

Bu dağılımlarının genel uygulamalarında, serbestlik derecesi yalnızca tamsayı değeri alır. Hâlbuki, konunun temelinde yer alan matematik, çoğu durumda kesirli serbestlik derecesinin alınmasına müsaade eder ki bu da daha karmaşık kullanımlar ortaya çıkarabilir.

Kaynakça

Dış kaynaklar