DeepMind Interactions API ile yapay zeka ajanları hafızaya kavuşuyor • Digital Report

Üretken yapay zeka geliştirme dünyası, son iki yıldır “unutkan” modellerle boğuşuyordu. Geliştiriciler, her yeni istekte modelin geçmişi hatırlaması için tüm konuşma kaydını tekrar tekrar göndermek zorundaydı. Bu “stateless” (durumsuz) mimari, basit sohbet botları için yeterli olsa da, karmaşık görevleri yerine getiren özerk ajanlar için büyük bir darboğaz oluşturuyordu.

Google DeepMind, geçen hafta duyurduğu Interactions API‘nin halka açık betasıyla bu soruna köklü bir çözüm getiriyor. Artık yapay zeka modelleri, sunucu tarafında “durum yönetimi” (stateful) yeteneğine kavuşarak, konuşmaları, araç çıktılarını ve düşünce süreçlerini hatırlayabiliyor.

Stateless’tan Stateful’a geçiş ne anlama geliyor?

Geleneksel yöntemde, bir modelden yanıt almak için ona her seferinde “bak daha önce bunları konuştuk” diyerek megabaytlarca veriyi tekrar göndermeniz gerekiyordu. Interactions API ile geliştiriciler, sadece bir previous_interaction_id parametresi göndererek, Google’ın altyapısında saklanan tüm geçmişe erişebiliyor. Bu, hem veri trafiğini azaltıyor hem de token maliyetlerini düşürüyor.

Arka planda çalışan zeki ajanlar: “Background Execution”

Bu yeni API’nin en çarpıcı özelliklerinden biri Background Execution (Arka Planda Yürütme). Saatlerce süren web taraması veya rapor sentezleme gibi uzun işlemler, standart API’lerde zaman aşımı hatalarına neden oluyordu. Artık geliştiriciler, ajanı tetikleyip bağlantıyı kesebiliyor ve sonuç hazır olduğunda sorgulayabiliyor. Bu, API’yi adeta zeka odaklı bir “iş kuyruğuna” dönüştürüyor.

İlk örnek: Gemini Deep Research

Google, bu altyapıyı kullanarak geliştirdiği ilk yerleşik ajanı olan Gemini Deep Research‘i de tanıttı. Bu ajan, standart modellerin aksine, bir sonraki kelimeyi tahmin etmekle yetinmiyor; arama, okuma ve sentezleme döngülerini tekrarlayarak uzun vadeli araştırma görevlerini yürütüyor.

OpenAI’dan farkı ne?

OpenAI da benzer bir hamle yapmıştı ancak Google’ın yaklaşımı şeffaflıkla ayrışıyor. OpenAI, token verimliliği için geçmişi sıkıştırıp gizlerken (compaction), Google tam konuşma geçmişini geliştiricilerin erişimine açık ve incelenebilir tutuyor. Bu, özellikle hata ayıklama (debugging) süreçlerinde geliştiricilere büyük avantaj sağlıyor.

Uzmanlar ne diyor?

Google Geliştirici Uzmanı Sam Witteveen, bu gelişmeyi “gerekli bir evrim” olarak nitelendiriyor. Witteveen, “Artık sadece metin girip çıktı aldığınız bir modelle değil, araçlar kullanan, kod çalıştıran ve döngüler kurabilen bir sistemle etkileşimdesiniz,” diyor. Ayrıca, konuşma geçmişinin Google sunucularında tutulmasının (Implicit Caching), token maliyetlerini düşürdüğünü vurguluyor.

Ancak eleştiriler de var. Witteveen, Deep Research ajanının verdiği kaynak linklerinin (URL) bazen doğrudan çalışmadığını ve Google’ın iç yönlendirmeleriyle sarıldığını belirterek, bunun raporlama süreçlerinde zorluk yaratabileceği konusunda uyarıyor.

Erişim ve fiyatlandırma

Interactions API, şu anda Google AI Studio üzerinden halka açık beta olarak erişilebilir durumda. Gemini 3.0 Pro Preview ve Gemini 2.5 serisi modeller destekleniyor. Fiyatlandırma standart token oranlarına dayanırken, etkileşim geçmişi ücretsiz katmanda 1 gün, ücretli katmanda ise 55 gün boyunca saklanıyor.