"Ciddi biyolojik zarar verebilir": OpenAI'nin ChatGPT Agent'ı Sam Altman'ı bile korkutuyor • Digital Report

OpenAI, yapay zeka yeteneklerini bir adım daha ileri taşıyan yeni ürünü ChatGPT Agent’ı dün piyasaya sürdü.

Bu yeni araç, tatil planlamaktan sizin adınıza alışveriş yapmaya kadar oldukça karmaşık, çok adımlı görevleri tamamlayabilme yeteneğiyle göz dolduruyor. Ancak bu etkileyici lansmanın ardında, OpenAI’nin kendi kelimeleriyle ifade ettiği endişe verici bir uyarı yatıyor: Bu ürün, “deneyimsiz birinin ciddi biyolojik zarar vermesine anlamlı bir şekilde yardımcı olabilir.”

Bu itiraf, yapay zekanın artan yeteneklerinin, biyogüvenlik ve genel insan güvenliği için ne gibi riskler barındırdığına dair küresel tartışmaları yeniden alevlendirdi.

ChatGPT Agent nedir?

ChatGPT Agent, OpenAI’nin bilgisayar kullanım özelliği olan Operator ile Deep Research (Derin Araştırma) yeteneğini birleştiriyor. Sonuç, oldukça karmaşık görevleri yerine getirebilen, neredeyse bir “ajan” gibi çalışan bir yapay zeka. OpenAI’nin kendi iç kıyaslamalarına göre Agent, “karmaşık, ekonomik olarak değerli bilgi işi görevlerinin” yaklaşık yarısında insanlarla “karşılaştırılabilir veya daha iyi” bir performans sergiliyor.

Her ne kadar ilk kullanıcı yorumları bu kadar parlak olmasa da, genel kanı aracın yeteneklerinin hala etkileyici olduğu yönünde.

Yüksek kabiliyet endişe verici

Artan performans, aynı zamanda artan risk anlamına geliyor. OpenAI, Agent’ın sistem kartında (system card), ilk kez bir ürün lansmanını “Hazırlıklılık Çerçevesi” kapsamında “Biyolojik ve Kimyasal Alanda Yüksek Kabiliyetli” olarak değerlendirmeye karar verdiğini ve ilgili güvenlik önlemlerini etkinleştirdiğini belirtiyor.

Şirket, “Bu modelin deneyimsiz birinin ciddi biyolojik zarar vermesine anlamlı bir şekilde yardımcı olabileceğine dair kesin bir kanıtımız olmasa da – ki bu bizim Yüksek Kabiliyet için tanımladığımız eşiktir – ihtiyati bir yaklaşım benimsemeyi seçtik,” diyor.

Belirli güvenlik testlerinde, Agent gerçekten de önceki modellere göre daha büyük bir risk teşkil ediyor gibi görünüyor.

“Dünya Standartlarında Biyoloji” kıyaslamasında Agent, o3 modelini “önemli ölçüde geride bırakarak” 10 sorudan 4’ünü doğru yanıtladı (o3’ün skoru 1.5 idi).
Bir patojen edinme kıyaslamasında ise Agent, “önceki modellerin genellikle başarısız olduğu yaygın bir hatayı aşabildi.”

Uzmanlar, ChatGPT Agent’ın özellikle laboratuvar deneyimi olan kullanıcıların yeteneklerini önemli ölçüde artırma potansiyeli olduğunu ve “potansiyel olarak günlerce süren araştırmayı dakikalara sıkıştırabileceğini” belirtiyorlar.

ChatGPT Agent biyolojik tehlike

Yapay zeka şirketlerinin sorumluluğu ve sektördeki güven krizi

Tüm bunlar neden önemli? Çünkü görünüşe göre, eğer güvenlik önlemleri uygulanmazsa yapay zeka sistemlerinin ciddi bir biyorisk teşkil edebileceği bir noktaya ulaşıyoruz. Ve bu önlemleri almak için yapay zeka şirketlerinin iyi niyetine güveniyoruz.

OpenAI, bu konuda övgüyü hak edecek şekilde, biyolojiyle ilgili tüm komutları çıktılar üretmeden önce daha yüksek bir inceleme katmanına yönlendirmek gibi ihtiyati tedbirler almaya karar verdi. OpenAI’de güvenlik üzerine çalışan Boaz Barak, “Bu modeli, uygulamaya koyduğumuz gibi kapsamlı hafifletici önlemler olmadan yayınlamak son derece sorumsuzluk olurdu” dedi.

Ancak ne yazık ki, sektördeki tüm şirketler aynı derecede sorumlu davranmıyor. Geçen hafta, Elon Musk’ın şirketi xAI, Grok 4’ü herhangi bir güvenlik bilgisi olmadan yayınladı. Güvenlik testçileri, o zamandan beri modelin Tabun ve VX gibi iki tehlikeli sinir gazının yapımı için detaylı talimatlar vermeye istekli olduğunu tespit etti. Ve sorun Elon Musk’ın çok ötesinde.

Kar amacı gütmeyen kuruluşlar SaferAI ve Future of Life Institute (FLI) tarafından bu hafta yayınlanan çalışmalara göre, xAI en kötü suçlu olabilir, ancak dünyanın en iyi yapay zeka şirketlerinin hepsinin “güvenliğin birçok alanında çarpıcı bir bağlılık eksikliği” ve kabul edilemez risk yönetimi seviyeleri var. Meta dahil birçok şirket, güvenli hale getirilmesi imkansız olan güçlü açık kaynak (open-weight) modeller yayınlamaya devam ediyor.

Devlet denetiminin ilk başarısı

Bu karamsar tablonun ortasında, küçük de olsa olumlu bir gelişme var: Birleşik Krallık Yapay Zeka Güvenlik Enstitüsü (UK AISI), Agent’ı daha güvenli hale getirdi.

Hem UK AISI hem de ABD Yapay Zeka Standartları ve İnovasyon Merkezi’ne modele erken erişim verildi. UK AISI, sistem için “toplam 7 evrensel saldırı” tespit etti ve bunların hepsi OpenAI tarafından Agent’ın yayınlanmasından önce yamalandı. OpenAI, “UK AISI’nin saldırı araştırmalarının kapsamlı ve öğretici olduğunu, güvenlik önlemlerimizi verimli bir şekilde iyileştirmemizi ve buldukları güvenlik açıklarını gidermemizi sağladığını gördük,” dedi.

ChatGPT Agent’ın lansmanı, yapay zeka teknolojisinin ulaştığı baş döndürücü gücü ve bu gücün beraberinde getirdiği devasa sorumluluğu gözler önüne seriyor. Bir yanda karmaşık görevleri dakikalar içinde çözebilen bir potansiyel, diğer yanda ise kötüye kullanıldığında ciddi zararlar verebilecek bir risk var. Sektör, kendi kendini denetleme, şeffaflık ve devlet kurumlarıyla iş birliği gibi konularda zorlu bir sınavdan geçiyor.

Güvenliğin, inovasyon hızına kurban edilip edilmeyeceğini önümüzdeki dönemde göreceğiz.

ChatGPT Agent nedir?

Yüksek kabiliyet endişe verici

Yapay zeka şirketlerinin sorumluluğu ve sektördeki güven krizi

Devlet denetiminin ilk başarısı

İLGİNİZİ ÇEKEBİLİR

Haber bülteni