OpenAI, kullanıcıların bilgisayarlarını kontrol ederek onlar adına görevleri yerine getirebilen bir yapay zeka aracını piyasaya sürmeye hazırlanıyor olabilir.
Yazılım mühendisi Tibor Blaho, uzun süredir konuşulan ve “Operator” olarak bilinen bu araca dair kanıtlar bulduğunu iddia etti. Bloomberg gibi yayın organları daha önce Operator’ın kod yazma ve seyahat rezervasyonu gibi görevleri özerk bir şekilde yerine getirebilen bir “yapay zeka ajanı” olabileceğini bildirmişti.
OpenAI Operator için tarih yaklaşıyor olabilir
The Information’a göre de OpenAI, Operator’ı Ocak ayında piyasaya sürmeyi hedefliyor. Tibor Blaho tarafından hafta sonu keşfedilen kodlar bu iddiaları destekler nitelikte.
Confirmed – the ChatGPT macOS desktop app has hidden options to define shortcuts for the desktop launcher to “Toggle Operator” and “Force Quit Operator” https://t.co/rSFobi4iPNpic.twitter.com/j19YSlexAS
— Tibor Blaho (@btibor91) January 19, 2025
Blaho, OpenAI’nin macOS için ChatGPT uygulamasında şu anda gizli olan “Operator’ı Aç/Kapat” ve “Operator’ı Zorla Kapat” seçeneklerinin yer aldığını belirtti. Ayrıca, OpenAI’nin web sitesinde Operator’a dair bazı referanslar bulunduğunu, ancak bunların henüz kamuya açık olmadığını söyledi.
Blaho’nun keşfine göre, OpenAI’ın sitesinde Operator’ın diğer yapay zeka sistemleriyle performansını karşılaştıran tablolar da yer alıyor. Bu tablolar şimdilik taslak olabilir, ancak doğruysa Operator’ın belirli görevlerde %100 güvenilir olmadığı görülüyor.
OpenAI Operator performans testleri ve eksiklikler
Sızdırılan bilgilere göre Operator, OSWorld adlı bir bilgisayar ortamı simülasyonunda %38,1 başarı sağladı. Bu oran, OpenAI’nin rakiplerinden Anthropic’in modelinin üzerinde olsa da insan performansının (%72,4) oldukça gerisinde. Operator, WebVoyager adlı web gezintisi ve etkileşim testlerinde insanlardan daha iyi sonuç alırken, başka bir web tabanlı test olan WebArena’da insan seviyesinin altında kaldı.
Bazı pratik görevlerde ise Operator’ın performansı oldukça düşük. Örneğin, bir bulut sağlayıcısına kaydolup sanal bir makine başlatma görevinde başarı oranı %60 olarak ölçüldü. Bitcoin cüzdanı oluşturma görevindeyse başarı oranı yalnızca %10 oldu.
OpenAI Operator güvenlik ve rekabet
OpenAI’ın Operator ile yapay zeka ajanı pazarına giriş yapması, Anthropic ve Google gibi rakiplerin bu alanda ilerleme kaydettiği bir döneme denk geliyor. Yapay zeka ajanları hâlâ gelişim aşamasında olsa da teknoloji devleri bu sistemlerin gelecekteki büyük yeniliklerden biri olacağını savunuyor. Markets and Markets adlı analiz şirketine göre yapay zeka ajanlarının pazar değeri 2030 yılına kadar 47,1 milyar dolara ulaşabilir.
Operator’ın sızdırılan güvenlik değerlendirme raporlarında yasa dışı faaliyetlerde bulunma veya hassas kişisel verileri arama gibi riskli davranışlara karşı başarılı bir şekilde test edildiği görülüyor. Ancak güvenlik testleri, Operator’ın uzun süren geliştirme sürecinin nedenlerinden biri olarak gösteriliyor.
OpenAI’ın kurucu ortaklarından Wojciech Zaremba, rakibi Anthropic’in güvenlik önlemlerinden yoksun bir aracı piyasaya sürmesini eleştiren bir sosyal medya gönderisiyle dikkat çekti. Zaremba, OpenAI benzer bir yayın yapsaydı, bunun büyük tepkilere yol açabileceğini belirtti.
Yine de OpenAI, bazı eski çalışanlar ve araştırmacılar tarafından güvenlik çalışmalarını göz ardı edip teknolojisini hızla ticarileştirdiği gerekçesiyle eleştiriliyor. Operator’ın piyasaya sürülmesi durumunda bu eleştirilerin artması muhtemel görünüyor.




