Yeni ChatGPT ajanı her işin altından kalkacak • Digital Report

OpenAI, kullanıcılar adına çok çeşitli bilgisayar tabanlı görevleri tamamlayabilen yeni bir genel amaçlı yapay zeka ajanı olan ChatGPT Agent’ı piyasaya sürdü. Bu yenilik, şirketin daha önce sunduğu Agent özellikli araçların yeteneklerini birleştirerek, ChatGPT’yi yalnızca soruları yanıtlamanın ötesinde, eylemler gerçekleştirebilen ve görevleri üstlenebilen bir ürüne dönüştürme konusunda şimdiye kadarki en cesur girişimini temsil ediyor.

ChatGPT Agent, bir kullanıcının takviminde otomatik olarak gezinme, düzenlenebilir sunumlar ve slayt gösterileri oluşturma ve kod çalıştırma gibi işlevlere sahip. Araç, OpenAI’nin önceki Agent araçlarından Operator’ın web sitelerinde gezinme yeteneği ile Deep Research’ün düzinelerce web sitesinden bilgiyi özlü bir araştırma raporuna sentezleme yeteneğini bir araya getiriyor. Kullanıcılar, ChatGPT Agent iledoğal dil komutları aracılığıyla etkileşime girebilecekler.

ChatGPT Agent, OpenAI’nin Pro, Plus ve Team planlarına abone olan kullanıcılara Perşembe günü sunulmaya başlandı. Agent etkinleştirmek için kullanıcılar, ChatGPT’nin açılır menüsünden “Agent modu”nu seçebilecekler.

OpenAI’ye göre, ChatGPT Agent modelinin temelini oluşturan model, çeşitli kıyaslamalarda son teknoloji performans sunuyor. Şirket, ChatGPT Agent modelinin, yüzün üzerinde konuda binlerce sorudan oluşan zorlu bir test olan Humanity’s Last Exam (pass@1) testinde %41,6 puan aldığını belirtiyor. Bu, OpenAI’nin o3 ve o4-mini modellerinin testte elde ettiği puanın yaklaşık iki katı. Ayrıca, en zorlu matematik kıyaslamalarından biri olan FrontierMath’te, ChatGPT Agent, kod yürütme için bir terminal gibi araçlara erişimi olduğunda %27,4 puan alıyor. Önceki en iyi skor olan o4-mini’nin sadece %6,3 puan aldığı düşünüldüğünde bu önemli bir gelişme.

OpenAI, ChatGPT Agent’ın, kullanıcıların Gmail ve GitHub gibi uygulamaları bağlamasına olanak tanıyan ChatGPT bağlantılarına erişebildiğini belirtiyor. Bu sayede Agent, komutlarınızla ilgili bilgileri bulabiliyor. Şirket, ChatGPT Agent’ın bir terminale erişimi olduğunu ve belirli uygulamalara erişmek için API’leri kullanabileceğini de ekliyor. OpenAI, kullanıcıların ChatGPT Agentnı “dört kişilik Japon kahvaltısı yapmak için malzemeleri planlamak ve satın almak” veya “üç rakibi analiz etmek ve bir slayt gösterisi oluşturmak” gibi görevler için kullanabileceğini öneriyor. Bu tür yetenekler, ChatGPT Agentnın web sitelerini analiz etmesini, bir eylem planı oluşturmasını ve araçları kullanmasını gerektiriyor; bu da OpenAI’nin daha önce yapay zeka ajanlarıyla ele almaya çalıştığı görevlerden çok daha karmaşık.

OpenAI, ChatGPT Agent’ı güvenlik göz önünde bulundurularak geliştirdiğini özellikle vurguluyor. Ürün, kötü niyetli kişilerin elinde daha tehlikeli olabilecek bazı yeni yetenekler sunuyor. OpenAI daha önce, Agent modellerin daha tehlikeli yetenekler sunabileceği konusunda uyarıda bulunmuştu. ChatGPT Agent için hazırlanan güvenlik raporunda OpenAI, modeli biyolojik ve kimyasal silah alanlarında “yüksek yetenekli” olarak tanımladığını belirtiyor. Bu tanım, OpenAI’nin Hazırlık Çerçevesi’nde “ciddi zarara yol açan mevcut yolları güçlendirme yeteneğine sahip bir model” olarak tanımlanıyor. OpenAI, bunun doğrudan bir kanıtına sahip olmadığını, ancak ihtiyati bir yaklaşım benimsemeye ve bu riskleri azaltmak için yeni güvenlik önlemlerini etkinleştirmeye karar verdiğini belirtiyor.

ChatGPT Agent için yeni güvenlik önlemleri arasında, kullanıcılar ürünle etkileşim kurarken gerçek zamanlı olarak çalışan bir monitör bulunuyor. OpenAI, ChatGPT Agent’ına girilen her komutta bir sınıflandırıcı çalıştırdığını ve isteğin biyoloji ile ilgili olup olmadığını belirlediğini belirtiyor. Eğer öyleyse, OpenAI, ChatGPT Agent’ın yanıtını, içeriğin biyolojik bir tehdidi tetiklemek için kullanılıp kullanılamayacağını belirleyen ikinci bir monitörden geçiriyor.

OpenAI ayrıca, kötüye kullanımı önlemek için bu Agent için ChatGPT’nin bellek özelliğini devre dışı bıraktığını belirtiyor. ChatGPT’nin diğer bölümlerinde, OpenAI’nin bellek özelliği, sohbet robotunun önceki kullanıcı sohbetlerinden bilgi almasına olanak tanıyor. Ancak OpenAI, kötü niyetli kişilerin bu özelliği ChatGPT Agent’da komut enjeksiyon saldırıları aracılığıyla hassas verileri sızdırmak için kullanabileceğini belirtiyor. Şirket, gelecekte bu özelliği eklemeyi yeniden düşünebileceğini de ekliyor.

ChatGPT Agent etkileyici görünse de, gerçek dünyada ne kadar yetenekli olduğu henüz tam olarak belli değil. Şimdiye kadar, yapay zeka ajanı teknolojisi gerçek dünyayla etkileşimde nispeten kırılgan olduğunu kanıtlamıştı. Ancak OpenAI, yapay zeka ajanlarının vaadini yerine getirebilecek daha yetenekli bir model geliştirdiğini iddia ediyor.