Video İzleme

Vikipedi, özgür ansiklopedi

Video izleme/ Nesne Takip, bir kamera kullanarak zaman içinde hareket eden bir veya birden çok nesneyi bulma işlemidir. İnsan-bilgisayar etkileşimi, güvenlik ve gözetim, video iletişimi ve sıkıştırma, artırılmış gerçeklik, trafik kontrolü, tıbbi görüntüleme[1] ve video düzenleme gibi çeşitli kullanımları vardır.[2][3] Video izleme, videonun içerdiği veri miktarı nedeniyle zaman alıcı ve yavaş çalışabilen bir süreç olabilmektedir. Tek başına kullanımda bile zor bir problem olan bu metot, nesne tanıma teknikleriyle birlikte de kullanılarak daha işlevsel hale getirilmektedir.

Amaç[değiştir | kaynağı değiştir]

Video izlemenin amacı, hedef nesneleri ardışık video karelerinde ilişkilendirmektedir. Yani amaç, ilk karede bulanan görselin art arda gelen karelerin hepsinde bulunarak işaretlenmesidir. Bu ilişkilendirme durumu, nesneler kare hızına göre daha hızlı hareket ettiğinde zorlaşmaktadır. Sorunun karmaşıklığını artıran diğer bir durum, izlenen nesnenin zaman içinde yönünü değiştirmesidir. Bu sebepten ötürü video izleme sistemleri nesnenin olası hareketleri için hedef görüntüsünün nasıl değişebileceğini açıklayan bir hareket modeli kullanmaktadır.[4]

Hareket modellerine örnekler:

Robot elin nesne takibiyle bir topu yakalamasına yönelik çalışma[5]
  1. Düzlemsel bir nesne izlenirken, nesnenin görüntüsü 2 boyuta çevrilebilir.
  2. Nesne 3 boyutlu olduğunda, nesnenin 3 boyutlu konumu ve yönüne bağlı olarak açısı tanımlanabilir.
  3. Video sıkıştırma için anahtar kareleri makro bloklara bölme. Bu model, her bir makro bloğun hareket parametreleri tarafından verilen bir hareket vektörünün çevrelediği bir anahtar karenin bozulması üzerine çalışır.
  4. Deforme olabilen nesnelerin görüntüsü bir ağ ile kaplanabilir. Nesnenin hareketi, ağın düğümlerinin konumu ile tanımlanır.

Algoritmalar[değiştir | kaynağı değiştir]

Video izleme gerçekleştirmek için bir algoritma, sıralı video karelerini analiz ederek çerçeveler arasındaki hedeflerin hareketini çıkarmaktadır. Her biri güçlü ve zayıf yönlere sahip çeşitli algoritmalar vardır. Hangi algoritmanın kullanılacağını seçerken amaçlanan kullanımı dikkate almak önemlidir. Görsel izleme sisteminin iki ana bileşeni vardır. Bunlar hedef gösterimi ve yerelleştirme ile filtreleme ve veri ilişkilendirmesidir.

Hedef temsili ve yerelleştirme çoğunlukla aşağıdan yukarıya bir süreçtir. Bu yöntemler, hareketli nesneyi tanımlamak için çeşitli araçlar sağlamaktadır. Hedef nesneyi başarıyla bulmak ve izlemek, algoritmaya bağlıdır. Örneğin, blob izleme kullanmak insan hareketini tanımlamak için kullanışlıdır çünkü bir kişinin profili dinamik olarak değişmektedir. Tipik olarak bu algoritmalar için hesaplama karmaşıklığı düşüktür. Aşağıda bazı yaygın hedef gösterimi ve yerelleştirme algoritmaları verilmiştir:

Çekirdek Tabanlı Takip (Mean-Shift)[değiştir | kaynağı değiştir]

Çekirdek Tabanlı (Kernel-Based / MeanShift) izleme, benzerlik ölçüsünün maksimize edilmesine dayanan yinelemeli bir yerelleştirme algoritmasıdır.

Kontur Takibi[değiştir | kaynağı değiştir]

Kontur izleme, nesne sınırının tespit edilmesidir. Kontur izleme yöntemi, önceki çerçeveden başlatılan bir ilk konturu geçerli çerçevedeki yeni konumuna yinelemeli olarak geliştirme işlemidir. Bu yaklaşım, gradyan inişini kullanıp kontur enerjisini en aza indirerek konturu doğrudan geliştirimektedir. Bu yöntemler, karmaşık nesnelerin izlenmesine ve engellerin arkasında hareket eden nesneleri izleme gibi daha karmaşık nesne etkileşimine izin vermektedir.

Filtreler[değiştir | kaynağı değiştir]

Filtreleme ve veri ilişkilendirme yukarıdan aşağıya bir izlenim şeklinde ilerlemektedir. Ayrıca nesne hakkında önceki bilgileri birleştirmeyi, nesne dinamikleriyle ilgilenmeyi ve farklı hipotezlerin değerlendirilmesini içermektedir.[6]

Ek olarak, izleyici hareket halinde ise karmaşıklık artmaktadır. Burada tipik olarak, kamera sisteminin gerekli dinamiklerini ve bant genişliğini azaltmak için ve izleyiciyi önceden stabilize etmek için bir eylemsizlik ölçüm sistemi kullanılmaktadır. Ancak bu algoritmalar için hesaplama karmaşıklığı genellikle çok daha yüksektir.[7]

Kalman Filtresi[değiştir | kaynağı değiştir]

Kalman filtresi, Gauss gürültüsüne maruz kalan doğrusal fonksiyonlar için en uygun özyinelemeli Bayessian filtresidir. Zaman içinde gözlemlenen, gürültü vediğer yanlışlıkları içeren bir dizi ölçümü kullanmaktadır. Ayrıca tek başına bir ölçüme dayalı olanlardan daha kesin olma eğiliminde olan bilinmeyen değişkenlerin tahminlerini üreten bir algoritmadır.[8]

Partikül Filtresi[değiştir | kaynağı değiştir]

Parçacık filtresi, doğrusal ve Gauss olmayan süreçlerin temelindeki durum uzayı dağılımını örneklemek için kullanılmaktadır.[9]

Kaynakça[değiştir | kaynağı değiştir]

  1. ^ Mountney, Peter; Stoyanov, Danail; Yang, Guang-Zhong (Temmuz 2010). "Three-Dimensional Tissue Deformation Recovery and Tracking". IEEE Signal Processing Magazine. 27 (4): 14-24. doi:10.1109/MSP.2010.936728. ISSN 1558-0792. 25 Şubat 2021 tarihinde kaynağından arşivlendi. Erişim tarihi: 23 Mayıs 2021. 
  2. ^ Mihaylova, Lyudmila; Brasnett, Paul; Canagarajah, Nishan; Bull, David. Object Tracking by Particle Filtering Techniques in Video Sequences. 4 Mart 2016 tarihinde kaynağından arşivlendi. Erişim tarihi: 23 Mayıs 2021. 
  3. ^ Kato, H.; Billinghurst, M. (Ekim 1999). "Marker tracking and HMD calibration for a video-based augmented reality conferencing system". Proceedings 2nd IEEE and ACM International Workshop on Augmented Reality (IWAR'99): 85-94. doi:10.1109/IWAR.1999.803809. 8 Mart 2021 tarihinde kaynağından arşivlendi. Erişim tarihi: 23 Mayıs 2021. 
  4. ^ "Ishikawa Group Laboratory - Basic Concept and Technical Terms". ishikawa-vision.org. 7 Aralık 2019 tarihinde kaynağından arşivlendi. Erişim tarihi: 23 Mayıs 2021. 
  5. ^ "Sensor Fusion: High Speed Robots". ishikawa-vision.org. 15 Ocak 2020 tarihinde kaynağından arşivlendi. Erişim tarihi: 23 Mayıs 2021. 
  6. ^ Black, James; Ellis, Tim; Rosin, Paul (2003). "A Novel Method for Video Tracking Performance Evaluation". In Joint IEEE Int. Workshop on Visual Surveillance and Performance Evaluation of Tracking and Surveillance (VS-PETS: 125-132. 4 Mart 2016 tarihinde kaynağından arşivlendi. Erişim tarihi: 23 Mayıs 2021. 
  7. ^ "iIPSC-TR: Complete Target Tracking Range System Delivery". www.imar-navigation.de. 23 Mayıs 2021 tarihinde kaynağından arşivlendi. Erişim tarihi: 23 Mayıs 2021. 
  8. ^ Arulampalam, M.S.; Maskell, S.; Gordon, N.; Clapp, T. (Şubat 2002). "A tutorial on particle filters for online nonlinear/non-Gaussian Bayesian tracking". IEEE Transactions on Signal Processing. 50 (2): 174-188. doi:10.1109/78.978374. ISSN 1941-0476. 15 Mayıs 2021 tarihinde kaynağından arşivlendi. Erişim tarihi: 23 Mayıs 2021. 
  9. ^ Knuth, Donald E. (25 Eylül 2013). Art of Computer Programming, Volume 4, Fascicle 4,The: Generating All Trees--History of Combinatorial Generation (İngilizce). Addison-Wesley Professional. ISBN 978-0-13-270234-8. 23 Mayıs 2021 tarihinde kaynağından arşivlendi. Erişim tarihi: 23 Mayıs 2021.