DeepMind MuZero ile yapay zeka yeni bir boyut kazanıyor

Google’ın çatı şirketi Alphabet bünyesinde bulunan ve yapay zeka araştırmaları ile adını duyuran DeepMind MuZero ile yapay zeka dünyasına yeni bir boyut kazandırıyor. Verilen bilgilere göre DeepMind’ın son yapay zekası, kuralları söylenmediği halde satranç, Go ve şogi gibi pek çok oyunda kendi kendine ustalaşabiliyor. Önceki yapay zeka algoritmalarından çok daha yetenekli ve iyi olan yeni yapay zeka, bulunduğu duruma çok çabuk bir şekilde adapte olup, başarmak için bir plan oluşturabiliyor.

DeepMind, 2016 yılında en iyi Go oyuncularını bile yenebilen oldukça gelişmiş bir yapay zeka algoritması olan AlphaGo’yu yarattı. Kuruluş bundan yaklaşık bir yıl sonra ise AlphaGo’yu daha da geliştirerek AlphaGo Zero isimli yeni bir yapay zeka algoritması duyurdu. AlphaGo Zero, selefinin amatör ve profesyonel olarak yaptığı Go maçlarını izleyerek Go oyununda ustalaştı. Ve ardından kendisine karşı oynayarak bu oyundaki ustalığını çok daha ileri bir seviyeye ulaştırmayı başardı.

DeepMind daha sonra tek bir algoritma ile Go, satranç, şogi gibi pek çok oyunda kendi kendine ustalaşabilen AlpaZero isimli yeni bir yapay zeka geliştirdi. DeepMind tarafından geliştirilen tüm bu yapay zekaların ortak noktası, ustalaşmaları gereken oyunların kurallarını bilmeleriydi. Yani herhangi bir oyunda ustalaşabilmesi için yapay zekaya ilgili oyunun kurallarının verilmesi gerekiyordu.

DeepMind MuZero isimili yapay zeka algoritması ile bu durumu tamamen değiştiriyor. Şirket tarafından yapılan açıklamaya göre MuZero, kurallarını bilmediği bir oyunda bile ustalaşabiliyor. Yani yukarıda ifade ettiğimiz yapay zeka algoritmalarının aksine, MuZero’ya herhangi bir oyun hakkında bilgi vermek gerekmiyor. Algoritma, go, satranç, şogi ve bir dizi atari oyununda herhangi bir kural bilgisi olmadan ustalaşmayı başarıyor.

MuZero, bu yönü ile DeepMind’ın önceki algoritmalarından çok daha yetenekli ve daha iyi bir yapıya sahip bulunuyor. Verilen bilgilere göre MuZero, bir simülasyonu yöneten tüm kuralları bilmediği halde, içinde bulunduğu durumdan başarı ile çıkmak için yeni algoritmalar geliştiriyor. Böylece çok hızlı bir şekilde oyuna adapte olabiliyor.

DeepMind’ın bir süreden beridir üzerinde çalıştığı yapay zeka, ileriye dönük arama adı verilen bir yaklaşım kullanarak sorunu sürekli olarak çözmeye çalışıyor. Bu yöntemle, bir algoritma geliştirmek ve bir eylem planı hazırlamak için gelecekteki durumları dikkate alıyor. Nasıl ki bizler, satranç gibi bir oyunda bir hamle yapmadan önce rakibimizin nasıl tepki vereceğini düşünerek, buna göre plan yapmaya çalışarak hareket ediyorsak, DeepMind MuZero da önden okuma yöntemini kullanarak çeşitli hamleler planlıyor. Ve maçı kazanma olasılığı en yüksek olan hamleye öncelik veriyor.