Makine öğrenimi

Vikipedi, özgür ansiklopedi

Makine öğrenimi veya makine öğrenmesi, bilgisayarların algılayıcı verisi ya da veritabanları gibi veri türlerine dayalı öğrenimini olanaklı kılan algoritmaların tasarım ve geliştirme süreçlerini konu edinen bir bilim dalıdır. Makine öğrenimi araştırmalarının odaklandığı konu bilgisayarlara karmaşık örüntüleri algılama ve veriye dayalı akılcı kararlar verebilme becerisi kazandırmaktır. Bu, makine öğreniminin istatistik, olasılık kuramı, veri madenciliği, örüntü tanıma, yapay zekâ, uyarlamalı denetim ve kuramsal bilgisayar bilimi gibi alanlarla yakından ilintili olduğunu göstermektedir.

Özet[değiştir | kaynağı değiştir]

Makine öğrenimi, bilgisayarların, açıkça programlanmadan görevleri nasıl yerine getirebileceklerini keşfetmelerini içerir. Belirli görevleri yerine getirmeleri için sağlanan verilerden öğrenen bilgisayarları kapsar. Bilgisayarlara atanan basit görevler için, makineye eldeki sorunu çözmek için gereken tüm adımları nasıl uygulayacağını bildiren algoritmalar programlamak mümkündür; bilgisayar tarafında öğrenmeye gerek yoktur. Daha gelişmiş görevlerde insan için gerekli algoritmaları elle oluşturmak zor olabilir. Uygulamada, insan programcıların gerekli her adımı belirlemesinden ziyade, makinenin kendi algoritmasını geliştirmesine yardımcı olmak daha etkili olabilir.[1]

Makine öğrenimi disiplini, bilgisayarlara tam olarak tatmin edici bir algoritmanın bulunmadığı görevleri gerçekleştirmeyi öğretmek için çeşitli yaklaşımlar kullanır. Çok sayıda olası yanıtın olduğu durumlarda, doğru yanıtlardan bazılarını geçerli olarak etiketlemek bir yaklaşımdır. Bu, daha sonra bilgisayarın doğru yanıtları bulmak için kullandığı algoritmayı/algoritmaları geliştirmede eğitim verisi olarak kullanılabilir. Örneğin, sayısal karakter tanıma görevinde sistemi eğitmek için el yazısıyla yazılmış rakamların MNIST veri kümesi sıklıkla kullanılır.[1]

Tarihi ve diğer alanlarla ilişkileri[değiştir | kaynağı değiştir]

Makine öğrenimi terimi 1959'da bilgisayar oyunları ve yapay zeka alanında öncü ve IBMer olan Amerikalı Arthur Samuel tarafından icat edildi.[2][3] 1960'larda makine öğrenimi araştırmasının temsili bir kitabı, Nilsson'un Öğrenme Makineleri hakkındaki kitabıydı ve çoğunlukla örüntü sınıflandırması için makine öğrenimi ile ilgiliydi.[4] Model tanıma ile ilgili ilgi, 1973'te Duda ve Hart tarafından tanımlandığı gibi 1970'lerde de devam etti.[5] 1981'de, bir sinir ağı 'nın bir bilgisayar terminalinden 40 karakteri (26 harf, 10 rakam ve 4 özel sembol) tanımayı öğrenmesi için öğretme stratejilerinin kullanımına ilişkin bir rapor verildi.[6]

Tom M. Mitchell, makine öğrenimi alanında incelenen algoritmaların geniş ölçüde alıntılanan daha resmi bir tanımını yaptı: "Bir bilgisayar programının performans ölçüsü "P" ve bazı "T" görev sınıflarıyla ilgili olarak "T" görevlerindeki performansı "E" deneyimiyle iyileşiyorsa "P" ile ölçüldüğü gibi E deneyiminden öğrendiği söylenir.[7] Makine öğreniminin söz konusu olduğu görevlerin bu tanımı, alanı bilişsel terimlerle tanımlamak yerine temelde operasyonel tanım sunar. Bu, Alan Turing 'in "Computing Machinery and Intelligence" adlı makalesinde "Makineler düşünebilir mi?" "Makineler bizim (düşünen varlıklar olarak) yapabildiğimizi yapabilir mi?" sorusuyla değiştirilir.[8]

Günümüzün modern makine öğreniminin iki amacı vardır, biri verileri geliştirilen modellere göre sınıflandırmak, diğer amaç ise bu modellere dayalı olarak gelecekteki sonuçlar için tahminler yapmaktır. Verileri sınıflandırmaya özgü varsayımsal bir algoritma, kanserli benleri sınıflandırmada onu eğitmek için denetimli öğrenmeyle birleştirilen mollerin bilgisayar görüşü kullanabilir. Hal böyle olunca, hisse senedi ticareti için bir makine öğrenme algoritması, tüccara gelecekteki potansiyel tahminler hakkında bilgi verebilir.[9]

Yapay zeka[değiştir | kaynağı değiştir]

Yapay Zekanın (AI) alt alanı olarak Makine Öğrenimi[10]
Yapay Zekanın alt alanı olarak Makine Öğreniminin bir parçası veya Makine Öğreniminin alt alanı olarak YZ'nin bir parçası[11]

Bilimsel bir çaba olarak makine öğrenimi, yapay zeka arayışından doğdu. Yapay zekanın bir akademik disiplin olarak ilk günlerinde bazı araştırmacılar makinelerin verilerden öğrenmesini sağlamakla ilgileniyordu. Soruna çeşitli sembolik yöntemlerle ve daha sonra "sinir ağları" olarak adlandırılan yöntemlerle yaklaşmaya çalıştılar; bunlar çoğunlukla perceptronlar ve diğer modellerdi daha sonra istatistiklerin genelleştirilmiş doğrusal modellerin yeniden icatları oldukları anlaşıldı.[12] Olasılık muhakeme de özellikle otomatik tıbbi teşhis için kullanıldı.[13]:488

Ancak, mantıksal, bilgiye dayalı yaklaşım üzerindeki artan vurgu, yapay zeka ile makine öğrenimi arasında bir sürtüşmeye neden oldu. Olasılıklı sistemler, veri toplama ve gösteriminin teorik ve pratik problemleriyle boğuşuyordu.[13]:488 1980 yılına gelindiğinde, uzman sistemler yapay zekaya hâkim oldu ve istatistik gözden düştü.[14] Sembolik/bilgiye dayalı öğrenme üzerine çalışmalar AI içinde devam etti ve endüktif mantık programlama 'ya yol açtı ancak daha istatistiksel araştırma hattı artık örüntü tanıma da (ingilizce:pattern recognition) ve bilgi geri alma daydı.[13]:708–710; 755 Sinir ağları araştırması, yapay zeka ve bilgisayar bilimi tarafından aynı zamanlarda terk edildi. Bu çizgi de diğer disiplinlerden Hopfield, Rumelhart ve Hinton ‘i içeren araştırmacılar tarafından AI/CS alanının dışında "bağlantısallık" (ingilizce:connectionism) olarak devam ettirildi. Ana başarıları, 1980'lerin ortasında geri yayılım 'ın (ingilizce:backpropagation) yeniden icadıyla geldi.[13]:25

Ayrı bir alan olarak yeniden düzenlenen makine öğrenimi (ML), 1990'larda gelişmeye başladı. Alan, amacını yapay zeka elde etmekten ziyade pratik nitelikteki çözülebilir problemlerle mücadele etmeye değiştirdi. Odağı, AI'dan miras aldığı sembolik yaklaşımlar 'dan, istatistik ve olasılık teorisi’nden ödünç alınan yöntem ve modellere kaydırdı.[14]

2020 itibarıyla birçok kaynak, makine öğreniminin yapay zekanın bir alt alanı olmaya devam ettiğini iddia etmeye devam ediyor.[10][15][16] Ana anlaşmazlık, tüm makine öğreniminin Yapay zeka(YZ)'nın (AI) bir parçası olup olmadığıdır çünkü bu, makine öğrenimini kullanan herhangi birinin YZ kullandığını iddia edebileceği anlamına gelir. Diğerleri, tüm makine öğreniminin yapay zekanın bir parçası olmadığı görüşüne sahiptir [17][18][19] burada, makine öğreniminin yalnızca 'akıllı' bir alt kümesi YZ'nin bir parçasıdır.[20]

Makine öğrenimi ve yapay zeka arasındaki farkın ne olduğu sorusu, "The Book of Why" adlı kitabında Judea Pearl tarafından yanıtlanır.[21] Buna göre, makine öğrenimi pasif gözlemlere dayanarak öğrenir ve tahmin eder, oysa AI, hedeflerine başarılı bir şekilde ulaşma şansını en üst düzeye çıkaran eylemleri öğrenmek ve gerçekleştirmek için çevre ile etkileşime giren bir aracı ifade eder.[24]

Uygulamalar[değiştir | kaynağı değiştir]

Makine öğreniminin başlıca uygulamaları makine algılaması, bilgisayarlı görme, doğal dil işleme, sözdizimsel örüntü tanıma, arama motorları, tıbbi tanı, biyoinformatik, beyin-makine arayüzleri ve kiminformatik, kredi kartı dolandırıcılığı denetimi, borsa çözümlemesi, DNA dizilerinin sınıflandırılması, konuşma ve elyazısı tanıma, bilgisayarlı görmede nesne tanıma, oyun oynama, yazılım mühendisliği, uyarlamalı web siteleri ve robot gezisidir.

İnsan etkileşimi[değiştir | kaynağı değiştir]

Makine öğrenimi sistemlerinin bir bölümü insan sezgisine olan gereksinimi tümüyle ortadan kaldırmaya çalışırken bazıları insan ve makine arasında işbirliğine dayalı bir yaklaşım benimsemektedir. Ne var ki, sistemi tasarlayan kişinin verinin kodlanma biçimi üzerinde tümüyle egemen oluşu insan sezgisinin tümüyle ortadan kaldırılmasını olanaksızlaştırmaktadır. Makine öğrenimi deneysel yöntemin otomatikleştirilmesi çabası olarak görülmektedir.[kaynak belirtilmeli]

Bazı istatistiksel makine öğrenimi araştırmacıları Bayes istatistiği çerçevesi kapsamında kullanılabilen yöntemler geliştirmektedirler.

Öğrenme yaklaşımları[değiştir | kaynağı değiştir]

Makine öğrenimi algoritmaları hedeflenen sonuca göre birkaç sınıfa ayrılabilmektedir:[25]

Kuram[değiştir | kaynağı değiştir]

Makine öğrenimi algoritmaları ve bunların başarımına ilişkin berimsel çözümleme berimsel öğrenme kuramı olarak adlandırılan bir kuramsal bilgisayar bilimi dalıdır. Deney kümelerinin sonlu oluşu ve geleceğin tam olarak kestirilememesi nedeniyle öğrenme kuramı söz konusu algoritmaların başarımına ilişkin mutlak güvence verememektedir. Bunun yerine, başarımın olasılıksal sınırları öngörülmeye çalışılmaktadır.

Berimsel öğrenme kuramcıları başarım sınırlarının yanı sıra öğrenmenin zaman karmaşıklığı ve uygulanabilirliği konusunda da çalışmaktadırlar. Berimsel öğrenme kuramında bir berimin uygulanabilir olması için polinomsal zamanda çalışması gerekmektedir. Zaman karmaşıklığı sonuçları iki öbeğe ayrılabilmektedir. Olumlu sonuçlar belirli bir işlev sınıfının polinomsal zamanda öğrenilebileceğini gösterirken olumsuz sonuçlar bu olgunun tam karşıtını ifade etmektedir.

Makine öğrenimi kuramı ve istatistik temelde farklı kavramlar olsalar da birbiriyle yakından ilintilidir.

Ayrıca bakınız[değiştir | kaynağı değiştir]

Kaynakça[değiştir | kaynağı değiştir]

  1. ^ a b Ethem Alpaydin (2020). Introduction to Machine Learning (Fourth bas.). MIT. ss. xix, 1-3, 13-18. ISBN 978-0262043793. 
  2. ^ Samuel, Arthur (1959). "Some Studies in Machine Learning Using the Game of Checkers". IBM Journal of Research and Development. 3 (3): 210-229. CiteSeerX 10.1.1.368.2254 $2. doi:10.1147/rd.33.0210. 
  3. ^ R. Kohavi and F. Provost, "Glossary of terms," Machine Learning, vol. 30, no. 2–3, pp. 271–274, 1998.
  4. ^ Nilsson N. Learning Machines, McGraw Hill, 1965.
  5. ^ Duda, R., Hart P. Pattern Recognition and Scene Analysis, Wiley Interscience, 1973
  6. ^ S. Bozinovski "Teaching space: A representation concept for adaptive pattern classification" COINS Technical Report No. 81-28, Computer and Information Science Department, University of Massachusetts at Amherst, MA, 1981. https://web.cs.umass.edu/publication/docs/1981/UM-CS-1981-028.pdf
  7. ^ Mitchell, T. (1997). Machine Learning. McGraw Hill. ss. 2. ISBN 978-0-07-042807-2. 
  8. ^ Harnad, Stevan (2008), "The Annotation Game: On Turing (1950) on Computing, Machinery, and Intelligence", Epstein, Robert; Peters, Grace (Edl.), The Turing Test Sourcebook: Philosophical and Methodological Issues in the Quest for the Thinking Computer, Kluwer, ss. 23-66, ISBN 9781402067082 
  9. ^ "Introduction to AI Part 1". Edzion (İngilizce). 8 Aralık 2020. 18 Şubat 2021 tarihinde kaynağından arşivlendi. Erişim tarihi: 9 Aralık 2020. 
  10. ^ a b "AN EMPIRICAL SCIENCE RESEARCH ON BIOINFORMATICS IN MACHINE LEARNING – Journal". Erişim tarihi: 28 Ekim 2020. 
  11. ^ "rasbt/stat453-deep-learning-ss20" (PDF). GitHub (İngilizce). 
  12. ^ Şablon:Cite citeseerx
  13. ^ a b c d Şablon:Cite AIMA
  14. ^ a b Langley, Pat (2011). "The changing science of machine learning". Machine Learning. 82 (3): 275-279. doi:10.1007/s10994-011-5242-y.  Geçersiz |doi-access=free (yardım)
  15. ^ Garbade, Dr Michael J. (14 Eylül 2018). "Clearing the Confusion: AI vs Machine Learning vs Deep Learning Differences". Medium (İngilizce). 16 Eylül 2018 tarihinde kaynağından arşivlendi. Erişim tarihi: 28 Ekim 2020. 
  16. ^ "AI vs. Machine Learning vs. Deep Learning vs. Neural Networks: What's the Difference?". www.ibm.com (İngilizce). Erişim tarihi: 28 Ekim 2020. 
  17. ^ "Chapter 1: Introduction to Machine Learning and Deep Learning". Dr. Sebastian Raschka. 5 Ağustos 2020. 28 Eylül 2020 tarihinde kaynağından arşivlendi. Erişim tarihi: 28 Ekim 2020. 
  18. ^ August 2011, Dovel Technologies in (15 Mayıs 2018). "Not all Machine Learning is Artificial Intelligence". CTOvision.com. 30 Mart 2019 tarihinde kaynağından arşivlendi. Erişim tarihi: 28 Ekim 2020. 
  19. ^ "AI Today Podcast #30: Interview with MIT Professor Luis Perez-Breva -- Contrary Perspectives on AI and ML". Cognilytica. 28 Mart 2018. 26 Haziran 2018 tarihinde kaynağından arşivlendi. Erişim tarihi: 28 Ekim 2020. 
  20. ^ "rasbt/stat453-deep-learning-ss20" (PDF). GitHub (İngilizce). Erişim tarihi: 28 Ekim 2020. 
  21. ^ Pearl, Judea; Mackenzie, Dana. The Book of Why: The New Science of Cause and Effect (2018 bas.). Basic Books. ISBN 9780465097609. Erişim tarihi: 28 Ekim 2020. 
  22. ^ Poole, Mackworth & Goebel 1998, p. 1.
  23. ^ Russell & Norvig 2003, s. 55.
  24. ^ Definition of AI as the study of intelligent agents: * Poole, Mackworth & Goebel (1998), which provides the version that is used in this article. These authors use the term "computational intelligence" as a synonym for artificial intelligence.[22] * Russell & Norvig (2003) (who prefer the term "rational agent") and write "The whole-agent view is now widely accepted in the field".[23] * Nilsson 1998 * Legg & Hutter 2007
  25. ^ Stuart Russel; Peter Norvig (2003) [1995]. Artificial Intelligence: A Modern Approach (2. bas.). Prentice Hall. ISBN 978-0137903955. OCLC 359890490. 

Ek okuma[değiştir | kaynağı değiştir]

Kaynakça[değiştir | kaynağı değiştir]

Dış bağlantılar[değiştir | kaynağı değiştir]