Uzun kısa süreli bellek
Uzun kısa süreli bellek (İngilizce: Long Short-Term Memory) derin öğrenme alanında kullanılan yapay bir yinelemeli sinir ağı (RNN) mimarisidir . Standart ileri beslemeli sinir ağlarının aksine, LSTM'nin geri bildirim bağlantıları vardır. Yalnızca anlık veriyi (resim gibi) değil, veri dizilerini (konuşma veya video gibi) de işleyebilir. Örneğin, LSTM bölümlenmemiş, bağlı el yazısı tanıma, konuşma tanıma[1][2] ve ağ trafiğinde anomali veya IDS'lerde (saldırı tespit sistemleri) tespiti gibi görevler için geçerlidir.
Sıradan bir LSTM ünitesi, bir hücre, bir giriş kapısı, bir çıkış kapısı ve bir unut kapısından oluşur. Hücre, değişken uzunlukta zaman aralıklarındaki değerleri hatırlar ve bu üç kapı, hücreye giren ve çıkan bilgi akışını düzenler.
LSTM ağları, zaman serisi verilerine dayanarak sınıflandırmak, işlemek ve tahminler yapmak için çok uygundur, çünkü bir zaman serisindeki önemli olaylar arasında bilinmeyen süreli gecikmeler olabilir. LSTM'ler, geleneksel RNN'leri eğitirken karşılaşılabilecek patlayan ve yok olan gradyan problemleriyle başa çıkmak için geliştirilmiştir.[kaynak belirtilmeli]
Tarihi
[değiştir | kaynağı değiştir]LSTM, 1997 yılında Sepp Hochreiter ve Jürgen Schmidhuber tarafından ortaya atıldı. LSTM, Sabit Hata Karuseli (CEC) birimlerini tanıtarak, patlayan ve yok olan gradyan problemlerini ele alır. LSTM bloğunun ilk sürümü hücreler, giriş ve çıkış kapılarını içeriyordu.
Ayrıca bakınız
[değiştir | kaynağı değiştir]- Yinelemeli sinir ağı
- Derin öğrenme
- Uzun vadeli güçlendirme
- Prefrontal korteks bazal gangliyon çalışma belleği
- Zaman serisi
Kaynakça
[değiştir | kaynağı değiştir]- ^ Sak, Hasim; Senior, Andrew; Beaufays, Francoise (2014). "Long Short-Term Memory recurrent neural network architectures for large scale acoustic modeling" (PDF). 22 Eylül 2019 tarihinde kaynağından (PDF) arşivlendi.
- ^ Li, Xiangang; Wu, Xihong (15 Ekim 2014). "Constructing Long Short-Term Memory based Deep Recurrent Neural Networks for Large Vocabulary Speech Recognition". arXiv:1410.4281 $2.
Dış bağlantılar
[değiştir | kaynağı değiştir]- Jürgen Schmidhuber'ın IDSIA grubundaki 30'dan fazla LSTM makalesi ile tekrarlayan Sinir Ağları 2 Ocak 2014 tarihinde Wayback Machine sitesinde arşivlendi.
- Gers, Felix (2001). "Long Short-Term Memory in Recurrent Neural Networks" (PDF). PhD thesis. 11 Temmuz 2019 tarihinde kaynağından (PDF) arşivlendi. Erişim tarihi: 16 Ocak 2020.
- Gers, Felix A.; Schraudolph, Nicol N.; Schmidhuber, Jürgen (Aug 2002). "Tekrarlayan LSTM ağları ile kesin zamanlamayı öğrenme" (PDF) . Makine Öğrenimi Araştırmaları Dergisi . 3 : 115-143.
- Abidogun, Olusola Adeniyi (2005). Veri Madenciliği, Sahtekarlık Tespiti ve Mobil Telekomünikasyon: Denetimsiz Yapay Sinir Ağları ile Çağrı Patern Analizi . Yüksek Lisans Tezi (Tezli). Batı Cape Üniversitesi. hdl : 11394/249 . 22 Mayıs 2012 tarihinde kaynağından arşivlendi (PDF) .
- Orijinal 30 Ağustos 2020 tarihinde Wayback Machine sitesinde arşivlendi. tekrarlayan sinir ağları, özellikle LSTM açıklayan adamış iki bölümden ile.
- Monner, Derek D.; Reggia, James A. (2010). "A generalized LSTM-like training algorithm for second-order recurrent neural networks" (PDF). 23 Nisan 2013 tarihinde kaynağından arşivlendi (PDF). Erişim tarihi: 16 Ocak 2020.
High-performing extension of LSTM that has been simplified to a single node type and can train arbitrary architectures
- Herta, Christian. "How to implement LSTM in Python with Theano". Tutorial. 3 Ocak 2015 tarihinde kaynağından arşivlendi. Erişim tarihi: 16 Ocak 2020.