Video içerik analizi

Vikipedi, özgür ansiklopedi

Video içerik analizi veya video analizi olarak da bilinen video içerik analizi, zamansal ve uzamsal olayları algılamak ve belirlemek için videoyu otomatik olarak analiz etme yeteneğidir.

Bu teknik yetenek, eğlence, video alma ve video tarama,[1] sağlık hizmetleri, perakende, otomotiv, ulaşım, ev otomasyonu, alev ve duman algılama, ve güvenlik dahil olmak üzere çok çeşitli alanlarda kullanılmaktadır. Algoritmalar, genel amaçlı makinelerde yazılım olarak veya özel video işleme birimlerinde donanım olarak uygulanabilir.

Video içerik analizinde birçok farklı işlev uygulanabilmektedir. Video Hareket Algılama, sabit bir arka plan sahnesine göre hareketin algılandığı daha basit biçimlerden biridir. Daha gelişmiş işlevler, video izleme[2] ve egomotion tahmini içerir[3].

Video içerik analizinin makinede oluşturduğu dahili temsile dayalı olarak, video özetleme,[4] tanımlama, davranış analizi veya diğer durum farkındalığı biçimleri gibi başka işlevler oluşturmak mümkündür.

Video içerik analizi, iyi video girişine dayanmaktadır. Bu nedenle genellikle video gürültü azaltma, görüntü sabitleme, keskin olmayan maskeleme ve süper çözünürlük gibi video geliştirme teknolojileriyle birleştirilmektedir.

İşlevler[değiştir | kaynağı değiştir]

Birkaç makale, video analitik uygulamalarının geliştirilmesinde yer alan modüllere genel bir bakış sağlaöaktadır[5][6].

Bu, bilinen işlevlerin bir listesi ve kısa bir açıklaması aşağıda yer almaktadır:

Fonksiyon Açıklama
Dinamik maskeleme Örneğin, gizlilik endişeleri nedeniyle, sinyalin kendisine dayalı olarak video sinyalinin bir kısmının engellenmesi.
Alev ve duman algılama Akıllı video gözetim teknolojisine sahip IP kameralar, dahili DSP çipi sayesinde 15-20 saniye veya daha kısa sürede alev ve dumanı algılamak için kullanılabilir. Çip, renk krominansı, titreme oranı, şekil, desen ve hareket yönü gibi alev ve duman özellikleri için yakalanan videoları analiz eden algoritmaları işler.
Egomotion tahmini Egomotion tahmini, çıkış sinyalini analiz ederek bir kameranın konumunu belirlemek için kullanılır.
Hareket algılama Hareket algılama, gözlemlenen sahnede ilgili hareketin varlığını belirlemek için kullanılır.
Şekil tanıma Şekil tanıma, giriş videosundaki, örneğin daireler veya kareler gibi şekilleri tanımak için kullanılır. Bu işlevsellik tipik olarak nesne algılama gibi daha gelişmiş işlevlerde kullanılır.
Nesne algılama Nesne algılama, örneğin bir kişi veya araba gibi bir nesne veya varlığın varlığını belirlemek için kullanılır. Diğer örnekler yangın ve duman algılamayı içerir.
Tanıma Yüz tanıma ve Otomatik Plaka Tanıma, kişileri veya arabaları tanımak ve dolayısıyla muhtemelen tanımlamak için kullanılır.
Stil algılama Stil algılama, örneğin televizyon yayını için video sinyalinin üretildiği ayarlarda kullanılır. Stil algılama, üretim sürecinin stilini algılar.
Müdahale tespiti Dış müdahale algılama, kameranın veya çıkış sinyalinin kurcalanıp kurcalanmadığını belirlemek için kullanılır.
Video izleme Video izleme, muhtemelen harici bir referans ızgarası ile ilgili olarak, video sinyalindeki kişilerin veya nesnelerin konumunu belirlemek için kullanılır.
Video hata düzeyi analizi Ücretsiz yazılım kullanarak video sahne içeriği kurcalama analizidir.
Nesne ortak segmentasyonu Bir veya daha fazla ilgili video dizisinde ortak nesne keşfi, hedeflerin sınıflandırılması ve segmentasyonu

Ticari uygulamalar[değiştir | kaynağı değiştir]

Video içerik analizi, 2000'li yılların ortalarında video içerik analizi ile geliştirilmiş ürünler piyasaya süren çok sayıda şirket ile nispeten yeni bir teknolojidir[7][8][9]. Pek çok uygulama olsa da, farklı video içerik analizi çözümlerinin sicili büyük ölçüde farklılık göstermektedir. Hareket algılama, insan sayma ve silah algılama gibi işlevler, ticari olarak hazır ürünler olarak mevcuttur ve iyi bir geçmişe sahip olduklarına inanılmaktadır (örneğin, dsprobotics Flowstone gibi ücretsiz yazılımlar bile hareket ve renk analizini işleyebilir). COVID-19 pandemisine yanıt olarak birçok yazılım üreticisi, yüz maskesi algılama veya sosyal mesafe takibi gibi yeni halk sağlığı analizlerini tanıtmıştır[10][11][12].

Birçok alanda video içerik analizi, ya kameralara dağıtılmış (en uçta) ya da özel işleme sistemlerinde merkezileştirilmiş CCTV sistemlerinde uygulanmaktadır. Video Analizi ve Akıllı CCTV, güvenlik alanındaki video içerik analizi için ticari terimlerdir. Birleşik Krallık'ta BSIA, güvenlik alanında video içerik analizi için bir giriş kılavuzu geliştirmiştir. Video analizine ek olarak ve onu tamamlamak için ses analizi de kullanılabilir[13].

Video yönetim yazılımı üreticileri, mevcut video analiz modüllerinin yelpazesini sürekli olarak genişletmektedir. Yeni şüpheli takip teknolojisi ile bu deneğin tüm hareketlerini kolaylıkla takip etmek mümkündür: nereden geldikleri ve ne zaman, nerede ve nasıl hareket ettikleri. Belirli bir gözetim sistemi içinde, indeksleme teknolojisi, belirli bir süre boyunca veya belirli bir süre içinde kameraların bakış açıları içinde bulunan benzer özelliklere sahip kişileri bulabilmektedir. Genellikle sistem, benzer özelliklere sahip birçok farklı insan bulur ve bunları anlık görüntüler şeklinde sunmaktadır. Operatörün yalnızca izlenmesi gereken resimlere ve konulara tıklaması yeterlidir. Yaklaşık bir dakika içinde, belirli bir kişinin tüm hareketlerini izlemek ve hatta hareketlerin adım adım bir videosunu oluşturmak mümkündür.

Kinect, kullanıcı girişinin bir kısmı için video içerik analizi kullanan Xbox 360 oyun konsolu için ek bir çevre birimidir[14].

Perakende sektöründe, video içerik analizi, mağaza içindeki alışveriş yapanları izlemek için kullanılır[15]. Bu sayede mağaza tasarımı ve pazarlama optimizasyonları için faydalı olan mağazanın bir ısı haritası elde edilebilir. Diğer uygulamalar, bir ürüne bakarken bekleme süresini ve öğenin kaldırıldığını/bırakıldığını algılamayı içerir.

Ticari ortamda video içerik analizinin kalitesini belirlemek zordur. Kullanım durumu, uygulama, sistem konfigürasyonu ve bilgi işlem platformu gibi birçok değişkene bağlıdır. Ticari ortamlarda kalite hakkında objektif bir fikir edinmenin tipik yöntemleri arasında bağımsız kıyaslama[16] ve belirlenmiş test yerleri bulunur.

Video içerik analizi, özellikle Londra'daki The O2 Arena ve The London Eye'da kalabalık yönetimi amacıyla kullanılmıştır.

Kanun yaptırımı[değiştir | kaynağı değiştir]

Polis ve adli bilim adamları, suç faaliyetlerini araştırırken CCTV videosunu analiz ediyor. Polis, videodaki önemli olayları aramak ve şüphelileri bulmak için video içerik analizi yapan Kinesense gibi bir yazılım kullanır. Anketler, vakaların %75'ine kadarının CCTV içerdiğini göstermiştir. Polis, önemli olaylar için uzun videoları aramak için video içerik analiz yazılımı kullanır.

Akademik araştırma[değiştir | kaynağı değiştir]

Video içerik analizi, bilgisayarlı görünün ve dolayısıyla yapay zekanın bir alt kümesidir. İki büyük akademik kıyaslama girişimi, i-LIDS video görüntüsünün küçük bir bölümünü kullanan TRECVID[17] ve PETS Benchmark Data'dır[18]. Takip, sol bagaj algılama ve sanal eskrim gibi işlevlere odaklanırlar. UCF101 gibi karşılaştırmalı video veri kümeleri, zamansal ve uzamsal görsel dikkati evrişimli sinir ağı ve uzun kısa süreli bellek ile birleştiren eylem tanıma araştırmalarına olanak tanır. Video analiz yazılımı ayrıca, görüntüleri kamuya açıklanacak şekilde daha kolay yeniden düzenlemek ve videolardaki olayları ve kişileri tanımlamak için vücuda takılan ve gösterge paneli kameralarından alınan görüntülerle eşleştiriliyor[19].

Avrupa Birliği, gömülü sistemlerde video içerik analitiğini polis ve ulaşım güvenliği veri tabanlarıyla bütünleştirmek için P-REACT[20] adlı bir FP7 projesini finanse ediyor[21].

Yapay zeka[değiştir | kaynağı değiştir]

Video gözetimi için yapay zeka, insanları, araçları, nesneleri ve olayları tanımak için video gözetim kameralarından gelen ses ve görüntüleri analiz eden bilgisayar yazılım programlarını kullanır. Güvenlik müteahhitleri programı, kamera gözetimi ile korunan mülk için kameranın görüşü (örneğin çitle çevrili bir alan, bir park yeri gibi, ancak park yeri dışındaki kaldırım veya halka açık cadde değil) ve günün saatleri için (örneğin iş kapanışından sonra) programlanan kısıtlı alanları tanımlayan yazılımdır. Yapay zeka, günün o saatinde o bölgeye kimsenin girmesine izin verilmeyen "kural" setini ihlal eden bir kişi tespit ederse bir uyarı gönderir.

Ayrıca bakınız[değiştir | kaynağı değiştir]

  • Etkinlik tanıma
  • Video gözetimi için yapay zeka
  • Adli video analizi
  • Nesne ortak segmentasyonu
  • Hareketten yapı
  • Video tarama
  • Video hareket analizi
  • Video işleme

Kaynakça[değiştir | kaynağı değiştir]

  1. ^ "Video-içerik analizi ve erişim uygulamaları" (PDF). IEEE multimedia 9.3 (2002): 42-55. 3 Eylül 2006 tarihinde kaynağından (PDF) arşivlendi. 
  2. ^ "Towards an ontology design pattern for UAV video content analysis". IEEE Access 7 (2019): 105342-105353. 26 Haziran 2021 tarihinde kaynağından arşivlendi. 
  3. ^ Cavaliere, Danilo; Loia, Vincenzo; Saggese, Alessia; Senatore, Sabrina; Vento, Mario. "A human-like description of scene events for a proper UAV-based video content analysis". Knowledge-Based Systems (İngilizce). 178: 163-175. doi:10.1016/j.knosys.2019.04.026. 7 Ağustos 2020 tarihinde kaynağından arşivlendi. Erişim tarihi: 26 Haziran 2021. 
  4. ^ "A user attention model for video summarization". Proceedings of the tenth ACM international conference on Multimedia. 2002. 
  5. ^ "Introduction to Video Analytics". 16 Haziran 2011 tarihinde kaynağından arşivlendi. 
  6. ^ "Video Analytics". 16 Haziran 2011 tarihinde kaynağından arşivlendi. 
  7. ^ "The Rise of Smart Camera Networks, and Why We Should Ban Them". 27 Ocak 2020 tarihinde kaynağından arşivlendi. 
  8. ^ "Aimetis". 
  9. ^ "Infographic: History of Video Surveillance". IFSEC Global | Security and Fire News and Resources. 2013-12-12. 21 Ekim 2020 tarihinde kaynağından arşivlendi. 
  10. ^ ""COVID-19 makes face mask detection essential video analytics - asmag.com"". 27 Temmuz 2020 tarihinde kaynağından arşivlendi. 
  11. ^ "Functionality Beyond Security: The Advent of Open Platform Cameras". www.securityinformed.com. 9 Ağustos 2020 tarihinde kaynağından arşivlendi. 
  12. ^ "StackPath". www.securityinfowatch.com. 6 Mart 2021 tarihinde kaynağından arşivlendi. 
  13. ^ "UK based startup that provides audio analytics into the CCTV industry". 15 Temmuz 2015 tarihinde kaynağından arşivlendi. 
  14. ^ "Project Natal 101". 8 Mart 2021 tarihinde kaynağından arşivlendi. Erişim tarihi: 26 Haziran 2021. 
  15. ^ "Heat map Intelligent module". 17 Mart 2015 tarihinde kaynağından arşivlendi. 
  16. ^ "i-Lids". 7 Mart 2016 tarihinde kaynağından arşivlendi. 
  17. ^ "TRECVID". 30 Nisan 2007 tarihinde kaynağından arşivlendi. 
  18. ^ "PETS Benchmark Data". 24 Eylül 2006 tarihinde kaynağından arşivlendi. 
  19. ^ "Police Body Cameras Will Do More Than Just Record You | Fast Company | The Future Of Business". 3 Mart 2017 tarihinde kaynağından arşivlendi. 
  20. ^ "P-REACT Project Website". 28 Mayıs 2014 tarihinde kaynağından arşivlendi. 
  21. ^ "Kinesense launches P-REACT, an FP7 project against Petty Crime". 18 Mart 2016 tarihinde kaynağından arşivlendi.