Alphabet’in yapay zeka teknolojileri ile ilgili birimi DeepMind tarafından geliştirilen AlphaZero, satranç kurallarının yeninden yazılmasına yardımcı olacak. DeepMind araştırmacıları, oyunu nasıl iyileştireceklerini öğrenmek için, AlphaZero’nun farklı kurallarla oynamasına izin veriyor.
DeepMind yapay zeka programı AlphaZero satranç kurallarını yeniden yazıyor
DeepMind ve Google tarafından geliştirilen yapay zeka programı AlphaZero ile ilgili çalışmalar genişletiliyor. DeepMind araştırmacıları, bu sefer de satranç oyununun yapay zeka destekli yeni varyantlarını tasarlamak ve denemek için eski satranç dünya şampiyona Vladimir Kramnik ile birlikte çalışıyor.
Bilim adamları, Kramnik’in de yardımıyla, önceden bilinmeyen dokuz farklı satranç çeşidinin sonuçlarını test etmek için, kendine sıfırdan yeni kurallar öğretebilen ve insanüstü oyun seviyelerine ulaşabilen uyarlanabilir bir öğrenme sistemi olan AlphaZero’yu kullanıyorlar.
AlphaZero, bugüne kadar her varyant için kendisine karşı on binlerce oyun oynadı. Herhangi bir satranç hamlesi konusunda atılabilecek her hareketi analiz etti. Kendine yeni stratejiler ve oyun kalıpları üretti. Kramnik ve araştırmacılar daha sonra, farklı kural setlerinin oyunu iyileştirip iyileştiremeyeceğini anlamak için, bu varyantlar benimsenirse insan oyuncular arasındaki oyunların nasıl görünebileceğini değerlendirdiler.
Kuralların değiştirilmesi oyun stratejisi, oynanabilirlik ve dinamikler üzerinde büyük bir etkiye sahip olabilir. Ancak tarihsel olarak, belirli bir satranç varyantını uygulamanın sonuçlarını anlamak ancak zamanla, yeterli sayıda insan oyuncuyu gözlemleyerek mümkün olmaktadır. DeepMind ile bu sorunun üstesinden gelinmiştir.
DeepMind araştırmacılarının da ifadesiyle, yapılan kural değişikileri altında bir AlpaZero modeli geliştirmek, onlarca yıllık insan oyununu etkili bir şekilde simüle etmeye imkan doğurdu. Her bir değişkende, oyunun potansiyel olarak neye benzeyeceği ortaya çıkarıldı.
Bilim adamları, değişikliklerin oyunların kalitesini nasıl etkilediğini olabildiğince nesnel olarak belirlemek için bir dizi faktöre baktılar. Bunlardan bir tanesi de çok eski zamanlardan beri satranç oyuncularını hayal kırıklığına uğratan beraberlik oranıydı.
Bu kapsamda denenen çoğu varyant, bazı yönlendirmelerle birlikte, belirleyici sonuçların miktarını artırdı. Araştırmacılar ayrıca zaman kontrollerinin, oyunun kararlığını etkilediğini de tespit ettiler. Hareket başına bir saniyedeki oyunların, hamle başına bir dakika olan oyunlara göre bir berabere bitme olasılığı çok daha düşüktü.
Sonuçlar ayrıca, oyunların büyük bir yüzdesinde, AlphaZero’nun kesinlikle klasik hareketlere bağlı kalmak yerine, yeni kurallar sayesinde, ek hamleleri aktif olarak kullandığını gösterdi. Araştırmacılar, “Bu, yeni seçeneklerin gerçekten yararlı olduğunu ve oyuna katkıda bulunduğunu gösteriyor” dedi.