Google DeepMind, yapay zeka ajanlarının geleceğini yeniden şekillendirebilecek bir duyuruyla karşımızda: SIMA 2. Geçen yıl tanıtılan ve sanal dünyalarda temel komutları yerine getirebilen SIMA’nın (Scalable Instructable Multiworld Agent) bu yeni versiyonu, sadece bir “komut uygulayıcı” olmaktan çıkıp, sizinle sohbet edebilen, hedefleri hakkında akıl yürütebilen ve zamanla kendi kendini geliştirebilen interaktif bir “oyun arkadaşına” dönüşüyor.
Bu, sadece oyun dünyası için değil, aynı zamanda robotik ve yapay zekanın fiziksel dünyadaki geleceği için de devasa bir adım anlamına geliyor.
Komut almaktan akıl yürütmeye geçiş
İlk SIMA modeli, “sola dön”, “merdivene tırman” gibi 600’den fazla dil komutunu farklı video oyunlarında uygulamayı öğrenmişti. Bunu, oyunun koduna erişmeden, tıpkı bir insan gibi ekrana “bakarak” ve sanal bir klavye-fare kullanarak yapıyordu.
SIMA 2 ise, çekirdeğine Google’ın en gelişmiş yapay zeka modeli olan Gemini‘nin entegre edilmesiyle bir üst seviyeye çıkıyor. Artık SIMA 2, sadece komutlara yanıt vermekle kalmıyor, onlar hakkında “düşünüp” akıl yürütebiliyor. Bir kullanıcının üst düzey hedefini anlıyor, bu hedefe ulaşmak için karmaşık adımlar planlıyor ve bu adımları oyun içinde ustaca uyguluyor.
Eğitim sürecinde hem insan tarafından etiketlenmiş videoların hem de Gemini tarafından üretilen etiketlerin kullanılması sayesinde SIMA 2, artık size ne yapmayı planladığını ve hedefine ulaşmak için hangi adımları attığını da anlatabiliyor. Bu, ajanla etkileşimi bir komut verme-alma ilişkisinden çıkarıp, adeta bir “yol arkadaşıyla” iş birliği yapma hissine dönüştürüyor.
Genelleme yeteneğinde dev bir sıçrama
Gemini entegrasyonu, SIMA 2’nin en etkileyici yönlerinden biri olan genelleme yeteneğini de arşa çıkarmış. SIMA 2, artık daha karmaşık ve nüanslı talimatları anlayabiliyor ve bunları, daha önce hiç eğitilmediği oyunlarda bile (örneğin yeni Viking hayatta kalma oyunu ASKA veya Minecraft’ın bir araştırma versiyonu olan MineDojo) çok daha yüksek bir başarı oranıyla yerine getirebiliyor.
- Karmaşık görevler: Uzun ve çok adımlı talimatları başarıyla tamamlayabiliyor.
- Çok modlu istemler: Sadece metin değil, ekrana çizdiğiniz bir taslağı veya emojileri bile anlayıp ona göre hareket edebiliyor.
- Farklı diller: Farklı dillerde verilen komutları da yerine getirebiliyor.
En önemlisi, bir oyunda öğrendiği “madencilik” (mining) kavramını, başka bir oyundaki “hasat etme” (harvesting) görevine uygulayabilmesi gibi yetenekleri, insan bilişinde görülen türden geniş bir genelleme yeteneğine yaklaştığını gösteriyor. Başarı oranı grafikleri, SIMA 2’nin birçok görevde insan performansına önemli ölçüde yaklaştığını kanıtlıyor.
Nihai test: Yapay zekanın yarattığı dünyalarda oynamak
SIMA 2’nin sınırlarını test etmek için Google DeepMind, onu bir başka çığır açan projesi olan Genie 3 ile birleştirdi.
Genie 3, tek bir görüntüden veya metin isteminden gerçek zamanlı olarak yeni 3D sanal dünyalar yaratabiliyor. SIMA 2, daha önce hiç görmediği bu tamamen yeni dünyalarda bile yönünü bulmayı, kullanıcı talimatlarını anlamayı ve hedeflere yönelik anlamlı eylemlerde bulunmayı başardı. Bu, eşi görülmemiş bir uyum yeteneği sergiliyor.
Kendi kendine öğrenme döngüsü
SIMA 2’nin en heyecan verici yeni yeteneklerinden biri de kendi kendini geliştirebilmesi. İnsan gösterimlerinden ilk öğrenme aşamasından sonra SIMA 2, yeni oyunlarda tamamen kendi kendine, deneme-yanılma ve Gemini tabanlı geri bildirimlerle öğrenmeye devam edebiliyor. Hatta SIMA 2’nin kendi oyun deneyimlerinden elde ettiği veriler, bir sonraki, daha da yetenekli bir SIMA versiyonunu eğitmek için kullanılabiliyor. Bu, insan müdahalesi olmadan sürekli öğrenen ve gelişen bir yapay zeka yolunda atılmış dev bir adım.
Robotik ve fiziksel dünyadaki asistanlar
SIMA 2, genel bir yapay zeka olma yolunda önemli bir araştırma projesi olsa da, hala sınırlamaları var. Uzun ve çok adımlı akıl yürütme gerektiren görevlerde zorlanabiliyor ve etkileşim hafızası henüz kısa. Ancak bu araştırma, eylem odaklı yapay zeka için yeni bir yolu doğruluyor.
SIMA 2’nin öğrendiği navigasyon, araç kullanma ve iş birliğine dayalı görevler gibi beceriler, gelecekte fiziksel dünyada bize yardımcı olacak yapay zeka asistanları ve robotlar için gereken temel yapı taşlarını oluşturuyor. Bugün sanal bir dünyada oyun oynayan bu ajan, yarın evimizde veya iş yerimizde bize yardım eden bir robotun beyni olabilir.




