in

Makine öğrenimi (Machine Learning) hakkında her şey

Makine öğrenimi (machine learning ya da ML) nedir, tipleri, denetimli, yarı-denetimli ve denetimsiz ML nasıl çalışır, pekiştirmeli öğrenme nedir, kullanım alanları ve en iyi örnekleri

Yapay zekanın önemli bir ayağı olan ve bazen ana terimle karıştırılan makine öğrenimi (machine learning ya da ML) nedir, tipleri, denetimli, yarı-denetimli ve denetimsiz ML nasıl çalışır, pekiştirmeli öğrenme nedir, kullanım alanları ve en iyi örnekleri nelerdir, avantajları ve dezavantajları, doğru model nasıl seçilir, makine öğreniminin geleceği ve tarihi bu kapsamlı yazıda yer alıyor.

Makine öğrenimi nedir?

Makine öğrenimi (ML), yazılım uygulamalarının, özel olarak programlanmadan sonuçları tahmin etmedeki doğruluk olanlarını artıran bir yapay zeka (AI) türüdür. Makine öğrenimi algoritmaları, çıktıları oluşturmak (tahmin etmek) için geçmiş verilerden faydalanır.

Öneri motorları, makine öğreniminin yaygın bir kullanım örneğidir. Diğer popüler kullanımlar arasında dolandırıcılık algılama, spam filtreleme, kötü amaçlı yazılım tehditlerini algılama, iş süreci otomasyonu (BPA) ve kestirimci bakım (predictive maintenance) yer alır.

Makine öğrenimi türleri

Klasik makine öğrenimi, genellikle bir algoritmanın doğru tahminlerde bulunmayı nasıl öğrendiğine göre sınıflandırılır. Dört temel yaklaşım vardır: Denetimli  öğrenme, denetimsiz öğrenme, yarı denetimli öğrenme ve pekiştirmeli öğrenme. Bir veri bilimcinin kullanmayı seçtiği algoritma türü, çıktı almak istediği veri türüne bağlıdır.

Denetimli öğrenme

Bu makine öğrenimi türünde, veri bilimciler, algoritmaları tedarik ettikleri eğitim verileri ve onları algoritma korelasyonları için değerlendirmek isteyen değişkenleri tanımlarlar. Algoritmanın hem girişi hem de çıkışı belirtilir.

Denetimsiz öğrenme

Bu tür makine öğrenimi, etiketlenmemiş veriler üzerinde çalışan algoritmaları içerir. Algoritma, anlamlı bir bağlantı arayan veri kümelerini tarar. Bu aşamada hem veri algoritmaları eğitim alır hem de çıkardıkları tahminler veya öneriler önceden belirlenir.

Yarı denetimli öğrenme

Makine öğrenimine yönelik bu yaklaşım, önceki iki türün bir karışımını içerir. Veri bilimcileri, çoğunlukla eğitim verilerini içeren bir algoritmayı besleyebilir, ancak model verileri kendi başına keşfetmekte ve veri kümesine ilişkin kendi anlayışını geliştirmekte özgürdür.

Pekiştirmeli öğrenme

Pekiştirmeli öğrenme, tipik olarak bir makineye açıkça tanımlanmış kuralların olduğu çok adımlı bir süreci, görevi tamamlamayı öğretmek için kullanılır. Veri bilimcileri, bir görevi tamamlamak için bir algoritma programlar ve bir görevi nasıl tamamlayacaklarını belirlerken ona olumlu veya olumsuz ipuçları verir. Ancak algoritma çoğunlukla, yol boyunca hangi adımları atacağına kendi başına karar verir.

Denetimli makine öğrenimi nasıl çalışır?

Denetimli makine öğrenimi, veri bilimcinin  algoritmayı hem etiketli girdiler hem de istenen çıktılarla eğitmesini gerektirir. Denetimli öğrenme algoritmaları aşağıdaki görevler için kullanılabilir:

  • İkili sınıflandırma
  • Çok sınıflı sınıflandırma
  • Regresyon modellemesi
  • Birleştirme

Denetimsiz makine öğrenimi nasıl çalışır?

Denetimsiz makine öğrenimi algoritmaları, verilerin etiketlenmesini gerektirmez. Veri noktalarını alt kümeler halinde gruplamak için kullanılabilecek modelleri aramak için etiketlenmemiş verileri elerler. Sinir ağları (neural networks) dahil, çoğu derin öğrenme türü denetimsiz algoritmalardır. Denetimsiz öğrenme algoritmaları aşağıdaki görevler için kullanılabilir:

  • Kümeleme
  • Anormallik tespiti
  • Dernek madenciliği
  • Boyut Azaltma

Yarı denetimli makine öğrenimi nasıl çalışır?

Yarı denetimli öğreniminde, bir algoritmaya az kısmı etiketlenmiş eğitim verileri beslenir. Algoritma bu sayede veri kümesinin boyutlarını öğrenir ve daha sonra bunları yeni, etiketlenmemiş verilere uygulayabilir. Algoritmaların performansı, genellikle etiketli veri kümeleri üzerinde eğitim aldıklarında artar. Ancak veri etiketleme zaman alabilir ve dolayısıyla, bu işlem daha maliyetli olabilir. Yarı denetimli öğrenme, denetimli öğrenmenin performansı ile denetimsiz öğrenmenin verimliliği arasında bir performans ortaya koyar. Yarı denetimli öğrenmenin kullanıldığı bazı alanlar şunlardır:

  • Makine çevirisi
  • Dolandırıcılık tespiti
  • Veri etiketleme

Pekiştirmeli öğrenme nasıl çalışır?

Pekiştirmeli öğrenme, farklı bir hedefe sahip bir algoritma ve bu hedefe ulaşmak için önceden belirlenmiş bir kurallar dizisi programlayarak çalışır. Veri bilimcileri, algoritmayı, nihai hedefe yönelik faydalı bir eylem gerçekleştirdiğinde pozitif ödül almaya, bu hedeften uzaklaştıran bir eylem gerçekleştirdiğinde de ceza alacak şekilde programlar. Pekiştirmeli öğrenme genellikle aşağıdaki alanlarda kullanılır:

  • Robotik
  • Oyunlar
  • Kaynak yönetimi

Makine öğreniminin örnekleri ve kullanım alanları

Günümüzde makine öğrenimi çok çeşitli uygulamalarda kullanılmaktadır. Belki de makine öğreniminin en iyi bilinen örneklerinden biri,  Facebook, Instagram ve Twitter ana sayfalarındaki akışları sağlayan öneri motorudur.

Facebook, her kullanıcının ana sayfasını kişiselleştirmek için makine öğrenimini kullanır. Örneğin kullanıcı belirli bir gruptaki gönderileri okumak için durursa, öneri motoru o grubun içeriklerini daha çok göstermeye başlar.

Öneri motorlarına ek olarak, makine öğreniminin diğer kullanım alanları şu şekildedir:

Müşteri ilişkileri yönetimi

İşletmeler CRM yazılımı, e-posta analizi gibi alanlarda makine öğrenimi modellerini kullanabilir. Gmail’deki gibi daha gelişmiş sistemler, potansiyel olarak size vereceğiniz yanıtları bile önerebilir.

İş zekası

İş zekası ve analitik yazılımı üreticileri, potansiyel olarak önemli veri noktalarını, veri noktası modellerini ve anormallikleri tanımlamak için yazılımlarında makine öğrenimini kullanır.

İnsan kaynakları bilgi sistemleri

HRIS sistemleri, uygulamaları filtrelemek ve açık bir pozisyon için en iyi adayları belirlemek için makine öğrenimi modellerini kullanabilir.

Otonom araçlar

Makine öğrenme algoritmaları, yarı otonom bir arabanın kısmen görünür bir nesneyi tanımasını ve sürücüyü uyarmasını mümkün kılabilir.

Sanal asistanlar

Akıllı asistanlar, konuşmaları doğru yorumlamak ve bağlamı anlayabilmek için genellikle denetimli ve denetimsiz makine öğrenimi modellerini birleştirir.

Makine öğreniminin avantajları ve dezavantajları

Makine öğrenimi, örneğin otonom araçlar için işletim sistemini oluşturan ve insan davranışını edebilen çok çeşitli güçlü kullanım örneklerine sahip.

Avantajlarının başında, işletmelerin müşterilerini daha derinlemesine anlamalarına yardımcı olmak geliyor. Makine öğrenimi algoritmaları, müşteri verilerini toplayarak ve zaman içindeki davranışlarla ilişkilendirerek, ilişkileri öğrenebilir ve ekiplerin ürün geliştirme ve pazarlama çalışmalarını müşteri talebine göre uyarlamasına yardımcı olabilir.

Bazı internet şirketleri, makine öğrenimini iş modellerinde birincil itici güç olarak kullanır. Örneğin Uber, sürücüleri sürücülerle eşleştirmek için algoritmalar kullanır. Google, aramalarda doğru reklamları ortaya çıkarmak için makine öğrenimini kullanır .

Ancak makine öğreniminin bazı dezavantajları da vardır. Her şeyden önce yüksek maliyetlidir. Makine öğrenimi projeleri, genellikle uzman veri bilimciler tarafından yönlendirilir, bu ekip maliyetini artırırken, çalışılan projeler yüksek maliyetli olabilecek yazılım altyapısı da gerektirir.

Makine öğrenimi konusunda bir önyargı sorunu da var. Toplumun belirli kesimlerini dışlayan veya hatalar içeren veri kümeleri üzerinde eğitilen algoritmalar, en iyi durumda başarısız ve en kötü ihtimalle ayrımcı olan yanlış dünya modellerine yol açabilir. Bir kuruluş, temel iş süreçlerini önyargılı modellere dayandırdığında, yasal açıdan sıkıntı yaşayabileceği gibi itibarı da zarar görebilir.

Doğru makine öğrenimi modeli nasıl seçilir?

  • Sorunu çözmek için dikkate alınması gereken potansiyel veri girişlerini belirleyin.
  • Verileri toplayın, biçimlendirin ve gerekirse verileri etiketleyin.
  • Hangi algoritmaları kullanacağınızı seçin ve ne kadar iyi performans gösterdiğini görmek için test edin.
  • Bu algoritmaları kabul edilebilir doğruluk seviyeye gelene kadar ayarlayın.

Makine öğreniminin geleceği

Makine öğrenimi algoritmaları, onlarca yıldır piyasada olmalarına karşın, yapay zekanın (AI) önem kazanmasıyla yeni bir popülerlik kazandılar. Bu sayede de, özellikle derin öğrenme modelleri, günümüzün en gelişmiş yapay zeka uygulamalarına güç katıyor.

Makine öğrenimi platformları, kurumsal teknolojinin en rekabetçi alanları arasındadır ve Amazon, Google, Microsoft, IBM gibi çoğu büyük üretici, müşterileri veri toplama, veri hazırlama, veri sınıflandırma, model oluşturma, eğitim ve uygulama dağıtımı gibi makine öğrenimi faaliyetlerinin yelpazesini kapsayan platform hizmetleri sunuyorlar.

Makine öğreniminin iş operasyonları için önemi artmaya devam ettikçe ve yapay zeka kurumsal ortamlarda her zamankinden daha pratik hale geldikçe, makine öğrenimi platform savaşları da kızışacak.

Derin öğrenme ve yapay zeka ile ilgili devam eden araştırmalar, giderek daha genel uygulamalar geliştirmeye odaklanıyor. Günümüzün yapay zeka modelleri, tek bir görevi yerine getirmek için son derece optimize edilmiş bir algoritma üretmek için kapsamlı bir eğitim gerekmektedir. Ancak bazı araştırmacılar, modelleri daha esnek hale getirmenin yollarını araştırıyor ve bir makinenin bir görevden öğrenilen bağlamı, farklı görevlere uygulamasına izin veren teknikler arıyor.

Makine öğreniminin tarihi

1642 – Blaise Pascal, toplama, çıkarma, çarpma ve bölme yapabilen mekanik bir makine icat etti.

1679 – Gottfried Wilhelm Leibniz ikili  kod sistemini tasarladı.

1834 –  Charles Babbage, delikli kartlarla programlanabilen genel bir çok amaçlı cihaz fikrini buldu.

1842 –  Ada Lovelace, Charles Babbage’ın teorik delikli kart makinesini kullanarak matematiksel problemleri çözmek için bir dizi işlem tanımladı ve bilinen ilk programcı oldu.

1847 – George Boole, tüm değerlerin doğru veya yanlış ikili değerlerine indirgenebileceği bir cebir biçimi olan Boole mantığını yarattı.

1936 – İngiliz mantıkçı ve kriptoanalist Alan Turing, evrensel deşifre sistemi hazırladı. Çalışma, bu alanın temeli olarak kabul ediliyor.

1952 – Arthur Samuel, bir IBM bilgisayarının dama oynadıkça daha iyi olmasına yardımcı olacak bir program yarattı.

1959 – MADALINE, gerçek dünyadaki bir soruna uygulanan ilk yapay sinir ağı oldu. Sistem, telefon hatlarındaki yankıları gideriyordu.

1985 – Terry Sejnowski ve Charles Rosenberg’in yapay sinir ağı, bir haftada 20,000 kelime nasıl doğru şekilde telaffuz edilir, kendi kendine öğrendi.

1997 – IBM Deep Blue, satranç ustası Garry Kasparov’u yendi.

1999 – Bir CAD akıllı iş istasyonu, 22.000 mamogramı inceledi ve kanseri radyologlardan %52 daha başarılı şekilde tespit etti.

2006 – Bilgisayar bilimcisi Geoffrey Hinton, sinir ağı araştırmasını tanımlamak için derin öğrenme terimini icat etti.

2012 – Google tarafından oluşturulan denetimsiz bir sinir ağı, YouTube videolarındaki kedileri %74,8 doğrulukla tanımayı öğrendi.

2014 – Eugene Goostman adlı Ukraynalı bir gencin hazırladığı sohbet robotu (chatbot), karşısındakinin insan mı robot mu olduğunu anlamada %33 orana ulaşarak Turing Testi’ni geçti.

2014 – Google’ın AlphaGo Go dünyanın en zor masa oyunu kabul edilen Go’da dünya şampiyonunu yendi.

2016 – DeepMind’ın yapay zeka sistemi LipNet, %93,4’lük bir doğruluk oranıyla videodaki kişilerin dudaklarını okuyarak kelimeleri tahmin etti.

2019 – Amazon, ABD’deki sanal asistanlar için pazar payının %70’ini kontrol etmeye başladı.