Otomatik hedef tanıma

Vikipedi, özgür ansiklopedi

Otomatik hedef tanıma (Automatic target recognition; ATR), bir algoritmanın veya cihazın, sensörlerden elde edilen verilere dayanarak hedefleri veya diğer nesneleri tanıma yeteneğidir.

Hedef tanıma ilk olarak, radar tarafından aydınlatılan hedefi sınıflandırmak için bu sesi deşifre edecek eğitimli bir operatörün, alınan sinyalin sesli bir temsili kullanılarak yapıldı. Bu eğitimli operatörler başarılı olurken, sınıflandırmada daha fazla doğruluk ve hız sağlayan otomatik yöntemler geliştirildi ve geliştirilmeye devam edilmektedir. ATR, kara ve hava araçları gibi insan yapımı nesnelerin yanı sıra hayvanlar, insanlar ve bitkisel dağınıklık gibi biyolojik hedefleri tanımlamak için de kullanılmaktadır. Bu, bir savaş alanındaki bir nesneyi tanımaktan, Doppler hava radarındaki büyük kuş sürülerinin neden olduğu parazitleri filtrelemeye kadar her şey için faydalı olabilmektedir.

Olası askeri uygulamalar, IFF transponder gibi basit bir tanımlama sistemini içermektedir. Ayrıca insansız hava araçları ve seyir füzeleri gibi diğer uygulamalarda kullanılmaktadır. ATR'nin yerel uygulamalar için de kullanılmasına giderek daha fazla önem verilmiştir. Sınır güvenliği, metro hattındaki nesneleri veya insanları tanımlamak için güvenlik sistemleri, otomatikleştirilmiş araçlar ve diğerleri için ATR'nin kullanılmasına yönelik araştırmalar yapılmıştır.

Tarihçe[değiştir | kaynağı değiştir]

Hedef tanıma, neredeyse radardan beri var olmuştur. Radar operatörleri, yansıyan sinyal tarafından alınan ses gösterimi aracılığıyla düşman bombardıman uçaklarını ve savaşçılarını tanımlayacaktı (Örneğin II. Dünya Savaşı'nda kullanılan radar teknikleri).

Hedef tanıma, temel bant sinyalinin operatöre çalınmasıyla yıllarca yapılmıştır. Bu sinyali dinleyen eğitimli radar operatörleri, aydınlatılan hedef hakkında, aracın türü, hedefin boyutu gibi çeşitli bilgileri tanımlayabilir ve potansiyel olarak biyolojik hedefleri bile ayırt edebilmektedir. Ancak, bu yaklaşımın birçok sınırlaması vardır. Operatör, her bir hedefin nasıl ses çıkaracağı konusunda eğitilmelidir. Eğer hedef yüksek hızda hareket ediyorsa artık duyulamayabilir ve bu durum hata olasılığını yükseltir. Bununla birlikte, sinyali sesli olarak temsil etme fikri, hedeflerin otomatik olarak sınıflandırılması için bir temel sağlamıştır. Geliştirilen çeşitli sınıflandırma şemaları, konuşma tanıma gibi diğer ses uygulamalarında kullanılan temel bant sinyalinin özelliklerini kullanmaktadır.

Genel bakış[değiştir | kaynağı değiştir]

Mikro-Doppler Etkisi[değiştir | kaynağı değiştir]

Radar, iletilen sinyalin bu sinyal tarafından aydınlatılan hedeften geri dönmesinin ne kadar sürdüğünü hesaplayarak bir nesnenin uzaklığını belirler. Bu nesne sabit olmadığında, Doppler etkisi olarak bilinen frekansta bir kaymaya neden olur. Tüm nesnenin öteleme hareketine ek olarak, nesnenin titreşmesi veya dönmesi, frekansta ek bir kaymaya neden olabilir. Bu olduğunda, Doppler kaydırılmış sinyal modüle edilir. Sinyalin modülasyonuna neden olan bu ek Doppler etkisi, mikro-Doppler etkisi olarak bilinir. Bu modülasyon, ATR için algoritmaların geliştirilmesine izin verecek belirli bir desene veya imzaya sahip olabilir. Mikro-Doppler etkisi, hedefin hareketine bağlı olarak zamanla değişecek ayrıca zaman ve frekans değişen bir sinyale neden olacaktır.[1]

Zaman-frekans analizi[değiştir | kaynağı değiştir]

Fourier dönüşümü zamanla değişen bileşeni hesaba katamadığı için bu sinyalin Fourier dönüşümü analizi yeterli değildir. Frekans ve zamanın bir fonksiyonunu elde etmenin en basit yöntemi, kısa zamanlı Fourier dönüşümünü (short-time Fourier transform; STFT) kullanmaktır. Ancak, Gabor dönüşümü veya Wigner dağıtım fonksiyonu gibi daha sağlam yöntemler, frekans ve zaman alanının eşzamanlı bir temsilini sağlamak için kullanılabilir. Ancak tüm bu yöntemlerde, frekans çözünürlüğü ile zaman çözünürlüğü arasında bir değiş tokuş olacaktır.[2]

Tespit etme[değiştir | kaynağı değiştir]

Bulunan spektral bilgi çıkarıldıktan sonra, sistemin tanımlayacağı hedefler hakkında bilgi içeren mevcut bir veri tabanı ile karşılaştırılabilir ve aydınlatılan hedefin ne olduğuna karar verilebilir. Bu, alınan sinyalin modellenmesi ve ardından kütüphanedeki hangi hedefin alınan sinyal kullanılarak oluşturulan modele en uygun olduğuna karar vermek için maksimum olabilirlik (maximum likelihood; ML), çoğunluk oylaması (majority voting; MV) veya maksimum a posteriori (maximum a posteriori MAP) gibi istatistiksel bir tahmin yöntemi kullanılarak yapılır.

Yaklaşım[değiştir | kaynağı değiştir]

Özniteliklerin çıkarılması[değiştir | kaynağı değiştir]

Sesten ilham alan bu katsayılara dayalı olarak hedefleri tanımlayacak otomatik hedef tanıma sistemleri oluşturmak için konuşma tanımada kullanılan ses özellikleri ile ilgili çalışmalar yapılmıştır. Bu katsayılar şunları içermektedir:

  • Doğrusal öngörücü kodlama (Linear predictive coding; LPC) katsayıları
  • Cepstral doğrusal öngörücü kodlama (Cepstral linear predictive coding ; LPCC) katsayıları
  • Mel frekansı cepstral katsayıları (Mel-frequency cepstral coefficients; MFCC).

Bu katsayıları elde etmek için temel bant sinyali işlenir, ardından veritabanındaki hangi hedefin elde edilen katsayılara en çok benzediğine karar vermek için istatistiksel bir süreç kullanılır. Hangi özelliklerin ve hangi karar şemasının kullanılacağının seçimi sisteme ve uygulamaya bağlıdır.

Bir hedefi sınıflandırmak için kullanılan özellikler, konuşmadan ilham alan katsayılarla sınırlı değildir. ATR'yi gerçekleştirmek için çok çeşitli özellikler ve algılama algoritmaları kullanılabilir.

Algılama algoritmaları[değiştir | kaynağı değiştir]

Hedeflerin tespitinin otomatik hale getirilmesi için bir eğitim veri tabanının oluşturulması gerekmektedir. Bu genellikle hedef bilindiğinde toplanan deneysel veriler kullanılarak yapılır ve daha sonra ATR algoritması tarafından kullanılmak üzere saklanmaktadır.

Cepstrum Özelliklerini ve GMM'yi Kullanan ATR
Cepstrum Özelliklerini ve GMM'yi Kullanan ATR

Akış şemasında bir algılama algoritması örneği gösterilmektedir. Bu yöntem, M veri bloklarını kullanır, her birinden istenen özellikleri (yani LPC katsayıları, MFCC) çıkarır ve ardından bunları bir Gauss karışım modeli (Gaussian mixture model ; GMM) kullanarak modeller. Toplanan veriler kullanılarak bir model elde edildikten sonra eğitim veri tabanında yer alan her bir hedef için koşullu olasılık oluşturulur. Bu örnekte, M veri bloğu vardır. Bu, veri tabanındaki her hedef için M olasılık koleksiyonu ile sonuçlanır. Bu olasılıklar, hedefin maksimum olabilirlik kararını kullanarak ne olduğunu belirlemek için kullanılır. Bu yöntemin araç tiplerini (örneğin tekerlekli ve paletli araçlar) ayırt edebildiği ve hatta başarı olasılığı yüksek olan üç kişiye kadar kaç kişinin bulunduğuna karar verebildiği gösterilmiştir.[3]

CNN Tabanlı Hedef Tanıma[değiştir | kaynağı değiştir]

Evrişimli sinir ağı (Convolutional neural network; CNN) tabanlı hedef tanıma, geleneksel yöntemlerden daha iyi performans gösterebilir.[4][5] Sentetik görüntülerle eğitimden sonra gerçek sahnelerin kızılötesi görüntülerinde hedeflerin (yani muharebe tanklarının) tanınmasında yararlı olduğu kanıtlanmıştır. Çünkü bu hedeflerin gerçek görüntüleri çok azdır. Eğitim setinin sınırlaması nedeniyle, gerçek sahneler test setini tanımak söz konusu olduğunda, sentetik görüntülerin ne kadar gerçekçi olduğu çok önemlidir.

Genel CNN ağ yapısı, çıktı olarak 7 evrişim katmanı, 3 maksimum havuzlama (pooling) katmanı ve bir softmax katmanı içerir. Maksimum havuzlama katmanları, ikinci, dördüncü ve beşinci evrişim katmanından sonra yer alır. Çıktıdan önce bir global ortalama havuzlama da uygulanır. Tüm evrişim katmanları, Leaky ReLU doğrusal olmayan etkinleştirme işlevini kullanır.[6]

Kaynakça[değiştir | kaynağı değiştir]

  1. ^ Chen, Victor C. (2011). The Micro-doppler effect in radar. Boston: Artech House. ISBN 978-1-60807-058-9. OCLC 706118851. 
  2. ^ Chen, V. (February 2011). Micro-Doppler Effect in Radar. Norwood, MA: Artec House. pp. 21–28. ISBN 9781608070589.
  3. ^ Bilik, I.; Tabrikian, J. (January 2006). "GMM-Based target classification for ground surveillance doppler radar". IEEE Transactions on Aerospace and Electronic Systems. 42 (1): 267–277. doi:10.1109/TAES.2006.1603422.
  4. ^ Yoon, Seok Pil; Song, Taek Lyul; Kim, Tae Han (2013-02-01). "Automatic target recognition and tracking in forward-looking infrared image sequences with a complex background". International Journal of Control, Automation and Systems. 11 (1): 21–32. doi:10.1007/s12555-011-0226-z. ISSN 2005-4092.
  5. ^ Venkataraman, Vijay; Fan, Guoliang; Yu, Liangjiang; Zhang, Xin; Liu, Weiguang; Havlicek, Joseph P. (2011-12-07). "Automated target tracking and recognition using coupled view and identity manifolds for shape representation". EURASIP Journal on Advances in Signal Processing. 2011 (1): 124. doi:10.1186/1687-6180-2011-124. ISSN 1687-6180.
  6. ^ d’Acremont, Antoine; Fablet, Ronan; Baussard, Alexandre; Quin, Guillaume (30 Nisan 2019). "CNN-Based Target Recognition and Identification for Infrared Imaging in Defense Systems". Sensors (İngilizce). 19 (9): 2040. doi:10.3390/s19092040. ISSN 1424-8220. 1 Kasım 2020 tarihinde kaynağından arşivlendi. Erişim tarihi: 18 Haziran 2021.