Doğruluk ve kesinlik

Vikipedi, özgür ansiklopedi
Atla: kullan, ara

Mühendislik, endüstri ve istatistikte, bir ölçüm sisteminin doğruluğu, bir niceliğin ölçüm değerinin asıl (gerçek) değerine olan yakınlık derecesidir. Bir ölçüm sisteminin kesinliği, (tekrarlanabilirliği veya yinelenebilirliği de denir), aynı şartlarda tekrarlanan ölçümlerin aynı sonucu verme derecesidir.[1] Gündelik dilde iki terim eş anlamlı kullanılsa dahi, bilimsel yöntem bağlamında ikisi özellikle ayrı ayrı kullanılır.

Doğruluk ölçüm sonuçlarının birbirine yakınlığını gösterir, kesinlik ise ölçümün tekrarlanabilirliği veya yinelenebilirliğini gösterir.

Bir ölçüm sistemi doğru olup kesin olmayabilir, kesin olup doğru olmayabilir, ikisi de olmayabilir veya her ikisi de olabilir. Mesela, bir deneyde sistematik hata varsa, örneklem büyüklüğünü artırmak genelde kesinliği artırır ama doğruluğu iyileştirmez. Sistematik hatayı yok etmek doğruluğu iyileştirir ama kesinliği artırmaz.

Bir ölçüm sistemi hem doğru hem de kesinse, ona geçerli denir. Yanlılık (İng. bias), (bağımsız değişken ile ilintisiz bir unsur veya unsurların neden olduğu rassal olmayan ve yönlü etkilerdir. Bir diğer ilgili terim olan hata ise rassal değişkenlik olarak tanımlanır.

Doğruluk ve kesinlik terimleri dolaylı ölçümlere de uygulanır, yani gözlemlenen verilerden hesaplanan değerler için de.

Bu iki terime ek olarak, ölçümlerde ölçüm çözünürlüğünden de bahsedilebilir, bu, ölçümde bir farklılık yaratan, ölçülen cisimdeki en küçük değişikliktir. Bunun kesinliği düşük olabilir.

Doğruluk ve kesinlik; hedef benzetmesi[değiştir | kaynağı değiştir]

Yüksek doğruluk ama düşük kesinlik
Yüksek kesinlik ama düşük doğruluk

Doğruluk ve kesinlik arasındaki farkı anlatmak için bir hedef benzetmesi yapılabilir. Bu benzetmede, tekrar edilen ölçümler bir hedefe atılan oklar olarak düşünülmektedir. Doğruluk, okların hedefin merkezine olan yakınlığına karşılık gelir, merkeze yakın saplanan oklar daha "doğru" sayılır. Bir ölçme sisteniyle elde edilen değerler kabul edilen değere ne kadar yakınsa bu sistemin o kadar doğrudur.

Benzetmeye devam edersek, eğer çok sayıda ok atılırsa, saplanmış oklar kümesinin genişliği kesinliktir (tek bir ok atılması söz konusuysa, bu işlemi pek çok kere tekrar edilirse elde edilecek kümenin genişliği kesinliğe karşılık gelir). Eğer tüm oklar sıkıca bir arada yer alıyorsa bu grup "kesin"dir, çünkü hepsi aynı noktaya yakın saplanmışlardır, bu nokta hedefin merkezi olmasa dahi. Ölçümler kesindir ama doğru olmayabilir.

Ancak, kesinlik olmadan doğruluk elde etmek mümkün değildir. Eğer oklar birbirine yakın bir öbek oluşturmamışsa hepsi birden hedef merkezine yakın olamaz. Ortalama pozisyonları hedef ortasının doğru bir kestirimi olabilir ama oklar teker teker hatalıdır. Kesinlik kavramın balistik bilminde uygulaması için dairesel hata olasılığı maddesine bakınız.

Doğruluk ve kesinliğin nicelenmesi[değiştir | kaynağı değiştir]

İdealde bir ölçüm aracı hem kesin hem doğrudur, ölçümlerin hepsi bilinen değere yakın ve onun etrafında sıkıca toplanmıştır. Bir ölçümün doğruluk ve kesinliği, kaynağı bilinen bir referans standardının tekrarlı olarak ölçümüyle belirlenir. Bu tür standartlar genelde Uluslararası Birimler Sistemi ile tanımlıdır ve Türk Standardları Enstitüsü gibi millî standart kuruluşları tarafından korunur.

Ölçümler tekrarlanıp ortalamaları alındığında, "standart hata" teriminin kullanımı uygundur: ortalamanın kesinliği, işlemin bilinen standart sapması bölü, ortalaması alınan ölçümlerin sayısının kareköküdür. Merkezsel limit teoremine göre, ölçümlerin ortalamalarının olasılık dağılımı, bireysel ölçümlerin dağılımdan daha çok bir normal dağılıma benzediğini ifade eder.

Doğrulukla ilgili olarak, iki kavramı ayırt etmek gerekir:

  • Ölçümlerin ortalaması ile referans değer arasındaki fark, yanlılıktır. Kalibrasyon yapabilmek için yanlılık ölçülmeli ve düzeltilmelidir.
  • Yanlılık ile kesinliliğin birleşik etkisi

Bilim ve mühendislikte yaygın bir konvansiyon, doruluk ve/veya kesinliği anlamlı rakamlar kullanarak örtük şekilde ifade etmektir. Burada, eğer kesinlik, belirtik (net) bir şekilde ifade edilmemişse, hata payı son anlamlı basamağın yarısı olarak anlaşılır. Örneğin, 843,6 m, veya 843,0 m, veya 800,0 m olarak kaydedilmiş bir ölçüm, 0.05 m'lik bir hata payı olduğunu ima eder (son anlamlı basamak onda birler basamağıdır), buna karşın 8.436 m olarak kaydedilen bir ölçümde hata payı 0.5 m'dir, çğnkü son anlamlı basamak bir basamağıdır.

8,000 m olarak kaydedilmiş bir ölçüm, sonunda sıfırlar varsa ama ondalık ayracı yoksa, belirsizdir; sondaki sıfırlar anlamlı basamaklar olarak belirtilmiş olabilir veya olmayabilir. Bu belirsizlikten kaçınmak için ölçüm bilimsel notasyon ile gösterilebilir: 8.0 × 103 m ilk sıfırın anlamlı olduğunu (dolayıyla 50 m'lik bir hata payı vardır), buna karşın 8.000 × 103 m her üç sıfırın da anlamlı olduğunu belli eder ve hata payı dolayısıyla 0.5 m olur. Benzer şekilde, temel birimin bir katı kullanılabilir: 8.0 km, 8.0 × 103 m'ye karşılık gelir ve 0.05 km (50 m)'lik bir hata payı olduğu anlaşılır. Ancak bu konvansiyona güvenmek sahte kesinlik hatalarına yol açabilir, eğer bu konvansiyonu kullanmayan kaynaklardan veri elde ediliyorsa.

Bu konuya başka bir şekilde bakarsak, 8 değeri, bu ölçümün 1'lik bir kesinlikle yapıldığı anlamına gelir (ölçüm cihazı sadece 1'ler basamağına kadar ölçebilmiştir), buna karşın 8,0'lık bir değer (matematiksel olarak 8'e eşit olsa dahi), ilk ondalık basamağın da ölçüldüğü ve değerinin sıfır olduğu anlamını taşır. İkinci değer daha kesindir. Bu değerlerin ikisi de doğru olmayabilir (gerçek değer 9,5 olabilir ve her iki seferinde de 8 olarak ölçülmüş olabilir). Yani, doğruluk, ölçümün gerçeğe yakınlığına karşılık gelir, kesinlik ise küşük farklılıkları ayrıştırabilme gücünü ifade eder.

Kesinlik bazen ikiye ayrıştırılır:

  • Tekrarlanabilirlik — aynı araç ve aynı ölçücü kişiyi muhafaza edip kısa bir zaman aralığında ölçümleri tekrar edilmesine rağmen meydana gelen varyasyonlar.
  • Yinelenebilirlik — farklı araçlar ve ölçen kişiler kullanılınca ve ölçümle ruzun zaman aralıkları içinde yapılınca meydana gelen varyasyonlar.

İkili sınıflandırmada doğruluk ve kesinlik[değiştir | kaynağı değiştir]

Doğruluk ayrıca, ikili bir sınıflandırma yönteminin bir şartı doğru olarak tanımladığı ve dışladığını gösteren bir istatistik değerdir.

Şart (örn., hastalık)
Altın standarda göre belirlenmiş
Doğru Yanlış
Test
Sonucu
Positif Gerçek positif Yanlış positif → Positif yordama değer
Negatif Sahte negatif Gerçek negatif → Negatif yordama değeri

Duyarlılık

Özgüllük
Doğruluk

Yani, doğruluk, doğru sonuçların (hem doğru pozitifler ve doğru negatifleri) genel popülasyona oranıdır. Testin bir parametresidir.

\text{dogruluk}=\frac{\text{gercek pozitiflerin sayısı}+\text{gercek negatiflerin sayısı}}{\text{gercek pozitiflerin sayisi}+\text{sahte pozitifler} + \text{sahte negatifler} + \text{gercek negatifler}}

Buna karşın, kesinlik, gerçek pozitiflerin tüm pozitif sonuçlara (hem gerçek pozitif hem sahte pozitifler) oranı olarak tanımlanır.

\text{presisyon}=\frac{\text{gercek pozitiflerin sayisi}}{\text{gercek pozitifler sayisi}+\text{sahte pozitifler}}

%100'lük bir kesinlik, ölçülen değerlerin gerçek değerlerin tam aynısı olduğu anlamına gelir.

Ayrıca bakınız duyarlılık ve özgüllük

Eğer prevalans (yaygınlık) biliniyorsa kesinliği hesaplamak için duyarlılık ve özgüllük kullanılabilir, şu denklem ile:


\text{kesinlik}=(\text{duyarlılık})(\text{yaygınlık}) + (\text{özgüllük})(1-\text{yaygınlık})

yordama çözümleme (predictive analytics) için doğruluk paradoksu, belli bir doğruluk seviyesine sahip yordama modellerinin yordama gücü (prediktif gücü), daha yüksek doğruluğa sahip modellerinkinden daha yüksek olabilir. Doğruluk ölçütünden kaçınıp, kesinlik ve geriçağırım gibi başka ölçütler kullanılması daha avantajlı olabilir.

Psikometi ve psikofizikde doğruluk ve kesinlik[değiştir | kaynağı değiştir]

Psikometri ve psikofizikte, kesinlik terimi ile geçerlilik ve sabit hata terimleri birbiri yerine kullanılır. Kesinlik ise güvenilirlik ve değişken hata ile eşanlamlıdır. Bir ölçme aracının veya bir psikolojik testin geçerliliği deney veya davranışlarla bağıntı yoluyla belirlenir. Güvenilirlik, çeşitli istatistiksel yöntemlele (klasik Cronbach'in alfa testi gibi dahili tutarlılık testi aracılıyla), ilişkili soruların cevaplarının da ilişkili olduğunu göstererek kanıtlanır, sonra referans ve hedef topluluklar karşılaştırılır.

Mantıksal benzetmede doğruluk ve kesinlik[değiştir | kaynağı değiştir]

Mantık benzetiminde (simülasyonunda), doğru modellerin değerlendirilmesinde sık yapılan bir hata, bir mantık benzetim modelini bir transistör devre benzetim modeli ile karşılaştırmaktır. Oysa bu bir kesinlik değil, doğruluk karşılaştırmasıdır. Kesinlik, ayrıntılara göre ölçülür, doğruluk ise gerçeğe göre ölçülür.[2][3].

Ayrıca bakınız[değiştir | kaynağı değiştir]

Kaynaklar[değiştir | kaynağı değiştir]

  1. ^ John Robert Taylor (1999). An Introduction to Error Analysis: The Study of Uncertainties in Physical Measurements. ss. 128–129. ISBN 093570275X. http://books.google.com/books?id=giFQcZub80oC&pg=PA128. 
  2. ^ John M. Acken, Encyclopedia of Computer Science and Technology, Vol 36, 1997, page 281-306
  3. ^ 1990 Workshop on Logic-Level Modelling for ASICS, Mark Glasser, Rob Mathews, and John M. Acken, SIGDA Newsletter, Vol 20. Number 1, June 1990

Dış bağlantılar[değiştir | kaynağı değiştir]