Makine öğrenimi, yaklaşık yetmiş yıl önceki başlangıcından bu yana gelişmeye devam ederken, derin öğrenme, makine öğreniminin evriminde yeni bir aşamayı tetikledi.
Araştırmacılar ve kurumlar, istatistikleri iyileştirmek, konuşmayı tanımak, riskleri tahmin etmek ve diğer uygulamaları geliştirmek için çeşitli modeller geliştirmek adına makine öğrenimi algoritmalarını kullanıyorlardı.
Son 20-30 yılda geliştirilen birçok makine öğrenme algoritması, günümüzde halen kullanılıyor. Makine öğreniminin yapay sinir ağlarına dayalı bir biçimi olan derin öğrenme ise yapay zekaya olan ilgiyi tazelerken, daha iyi araçlar, süreçler ve altyapı gelişimine ilham verdi.
- Yapay Zeka hakkında doğru bilinen yanlışlar
- Makine öğrenimi (Machine Learning) hakkında her şey
- Derin öğrenme (deep learning) nedir?
Makine Öğrenimi’nin tarihi
Makine öğreniminin hikayesi, nörofizyolog Warren McCulloch ve matematikçi Walter Pitts’in bir sinir ağının matematiksel modelini tanıtmasıyla 1943’te başladı. Alan, 1956’da Dartmouth College kampüsündeki bir yaz konferansında sinir ağlarından bahsetti. Konferansta otomata teorisi ve sembolik akıl yürütmeyi içeren yeni bir alanın temelini atmak için altı hafta boyunca 10 araştırmacı bir araya geldi .
Birçoğu bu yeni alana ufuk açıcı katkılar yapmaya devam edecek olan bu seçkin grup, bahsettikleri bu yeni kavrama, kontrol sistemlerine odaklanan rakip bir araştırma alanı olan sibernetik ile karışmasın diye yapay zeka adını verdi.
O zamanlar kullanılan tek katmanlı sinir ağları olan perceptron’lar, yalnızca doğrusal olarak ayrılabilir kalıpları öğrenebiliyordu. Marvin Minsky ve Seymour Papert , 1969’da mevcut sinir ağı algoritmalarının sınırlamalarını vurgulayan ve AI araştırmalarındaki vurgunun değişmesine neden olan Perceptrons kitabını 1969’da yayınladıktan sonra, bunlara olan ilgi azaldı.
Richard Duda ve Peter Hart’ın 1973 tarihli Pattern Classification and Scene Analysis yayını, nöral ağlardan uzaklaşmayı güçlendiren diğer makine öğrenme algoritmalarını tanıttı. On yıl sonra, Ryszard S. Michalski, Jaime G. Carbonell ve Tom M. Mitchell tarafından yazılan Makine Öğrenimi: Bir Yapay Zeka Yaklaşımı adlı kitap, makine öğrenimini büyük ölçüde sembolik yaklaşımla yönlendirilen bir alan olarak tanımladı.
1990’larda, internetin yükselişi ve kullanılabilir verilerin artışıyla yönlendirilen alan, bilgi odaklı bir yaklaşımdan veri odaklı bir yaklaşıma geçmeye başladı ve bugün gördüğümüz makine öğrenimi modellerinin önünü açtı.
- AI (yapay zeka) hızlandırıcı nedir?
- Yapay sinir ağları (ANN) nedir, nasıl çalışır?
- Hizmet Olarak Yapay Zeka (AIaaS) nedir?
Derin Öğrenme’nin tarihi
1990’larda veriye dayalı makine öğrenimine dönüş başlarken, çalışmalar 1980’lerin ortasında Geoffrey Hinton tarafından Toronto Üniversitesi’nde yapılan araştırmalar üzerine inşa edildi. Hinton ve ekibi, daha derin sinir ağları oluşturmak için geri yayılımı (backpropogation) kullandılar ve ağlara yeni katmanlar eklediler. Ağdaki birçok katman boyunca bağlantıları güçlendirmenin veya zayıflatmanın bir yolunu bularak Derin Öğrenme terimini de ortaya attılar.
Başlarda pratik uygulamalar sadece laboratuvar ortamında üretilebildiğinden, Derin Öğrenme konusunda ilerleme durdu.
Bu arada, yapay zekaya olan ticari ilgi de azalmaya başlıyordu, çünkü insan zekasıyla aynı düzeyde bir yapay zeka geliştirmeye yönelik çabalar, sonuçların önüne geçmiş ve 1980’leri de kapsayan bir Yapay Zeka Kışı’na yol açmıştı. İvme kazanan şey ise, pratik ticari uygulamaları mümkün kılan kernel metotları ve karar ağaçlarını kullanan bir tür makine öğrenmesi oldu.
Yine de, derin öğrenme alanı tamamen durmadı. İnternetin yükselişine ve mevcut verilerdeki artışa ek olarak, pratik uygulamalar yaratmak için bir başka faktörün sinir ağları için bir hızlandırıcı olduğu kanıtlandı. Buna dağıtılmış hesaplama (distributed computing) adı veriliyor.
Hesaplama gücünün demokratikleşmesi ve Derin Öğrenme’nin yükselişi
Makine öğrenimi, yüksek bilgi işlem gücüne ihtiyaç duyuyor. İlk günlerde araştırmacılar projelerini küçük tutmak ya da pahalı süper bilgisayarlara erişmek zorundaydı. 2000’li yılların başlarında dağıtılmış hesaplamanın demokratikleşmesi, araştırmacıların nispeten düşük maliyetli ticari bilgisayar kümeleri arasında hesaplamalar yapmasını sağladı.
Şimdi, veri özelliklerinin, parametrelerin ve algoritmaların en iyi kombinasyonunu bulmak için yüzlerce modeli denemek, o günlere göre daha ucuz ve kolay. Sektör, bu demokratikleşmeyi , DevOps ilkelerini makine öğrenimi dağıtımına getiren makine öğrenimi işlemlerine yönelik uygulamalar ve ilgili araçlarla daha da ileriye taşıyor.
Makine öğrenimi de yalnızca sistemin eğitildiği veriler kadar iyi sonuç veriyor ve veri kümeleri küçükse, modellerin kalıpları çıkarması güçleşiyor. Mobil, sosyal medya, IoT ve dijital müşteri etkileşimleri tarafından oluşturulan veriler büyüdükçe, olgunlaşmak için gereken eğitim materyali derin öğrenme tekniklerinin yaygınlaşmasını sağladı.
Derin öğrenme, Hinton’un ekibinin sinir ağlarını kullanarak görüntüleri sınıflandırmaya yönelik çalışmaları nedeniyle popüler bir veri bilimi mücadelesi olan ImageNet’i kazandıktan sonra 2012’ye kadar adeta patlama yaşadı. Google’ın daha sonra dağıtılmış bilgisayar kümeleri arasında derin öğrenmeyi ölçeklendirme yaklaşımını göstermesi de işleri gerçekten hızlandırdı.
Derin Öğrenme, Makine Öğrenimi alanını nasıl değiştirecek?
Derin sinir ağları doğrudan kullanılmadığında bile, dolaylı olarak makine öğrenimi alanında aşağıdakiler de dahil olmak üzere temel değişikliklere yol açmaya devam ediyor:
Sorunları çerçevelemek mümkün olacak
Derin öğrenmenin öngörücü gücü, veri bilimcilerini, diğer makine öğrenimi türlerinde ortaya çıkan sorunları çerçevelemenin farklı yollarını düşünmeye teşvik etti.
Örneğin, dil işlemede odak bir çok metinde, sonradan ne geleceğine yöneliktir. Bilgisayar Görüşü‘nde de de birçok problem yeniden formüle edilmiştir, böylece geometriyi anlamaya çalışmak yerine, algoritmalar bir görüntünün farklı bölümlerinin etiketlerini tahmin etmektedir.
İnsan içgörüsü otomasyona dahil olacak
Büyük verilerin ve derin öğrenmenin gücü, modellerin oluşturulma şeklini değiştiriyor. İnsan analizi ve içgörülerinin yerini ham bilgi işlem gücü alıyor.
Bir makine öğrenimi problemi oluşturma işi, artık gelişmiş algoritmalar tarafından devralındı ve milyonlarca saatlik CPU süresi, önceden eğitilmiş modellere dönüştürüldü, böylece veri bilimciler başka projelere odaklanabilecek veya modelleri özelleştirmeye daha fazla zaman ayırabilecekler.
Veriler daha verimli kullanılabilecek
Derin öğrenme, veri bilimcilerinin daha küçük veri kümeleriyle sorunları çözmelerine ve verilerin etiketlenmediği durumlarda sorunları çözmelerine de yardımcı oluyor.
Bu teknikler, elle etiketlenen ve işlenen verilere olan ihtiyacı azaltıyor. Bu, araştırmacıların, yalnızca eldeki görevi temsil eden ilişkileri değil, verilerin doğasını temsil eden karmaşık ilişkileri yakalayabilen büyük modeller oluşturmasını sağlıyor.
Daha iyi bağlam tanıma geliyor
Derin öğrenmenin görüntü, konuşma ve doğal dil işlemede çok fazla değer sağladığı, örneğin deprem, hava durumu tahmini, astronomi, ekonometri, desen tanıma gibi alanlarla kullanılan zaman serisi tahmininde olduğu gibi, belirli alanlar vardır.
Örneğin, derin öğrenme, karakterlerin ve kelimelerin ham metnini kelimelerin benzerliğini ve farklılıklarını temsil eden vektörlere otomatik olarak kodlamanın daha verimli yollarını bulabilir. Bu da onu işlemek için kullanılan makine öğrenimi algoritmalarının verimliliğini artırabilir. Resimlerdeki insanları tanıyan derin öğrenme algoritmaları, insanlar arasındaki ilişkileri bulan diğer algoritmaların kullanılmasını kolaylaştırır.
Kısa süre önce, ortak arayüzler aracılığıyla görüntü, metin ve konuşma işlemenin kullanımını iyileştirmek için derin öğrenmeyi kullanan önemli sıçramalar yaşandı. İnsanlar akıllı telefonlarında sanal asistanlarla konuşmaya ve cihazların kilidini açmak ve sosyal medyada arkadaşlarını tanımlamak için yüz tanıma kullanmaya alıştılar.
Araçlar da demokratikleşecek
Erken makine öğrenimi araştırmaları, pahalı yazılım lisansları gerektiriyordu. Ancak derin öğrenmenin öncüleri, her tür makine öğrenimi için bir emsal oluşturan en güçlü araçlardan bazılarını açık kaynak olarak kullanmaya başladı.
Makine öğrenimi araçlarına erişimi demokratikleştirmedeki bir başka faktör de Python’un yükselişi oldu. Farklı ticari ve ücretsiz seçeneklerin çoğu, yaygın kullanım için değiştirildi, entegre edildi veya bir Python katmanına bağlandı. Sonuç olarak, Python, makine öğrenimi geliştirme için fiili ortak dil haline geldi.
Derin öğrenme, açık kaynak topluluğuna makine öğrenimi geliştirme yaşam döngüsünün diğer yönlerini otomatikleştirmek ve basitleştirmek için de ilham verdi.