OpenAI ve Paradigm akıllı kontrat güvenliğini yapay zekayla test ediyor • Digital Report

Yapay zeka ajanlarının blokzincir üzerindeki savunma ve saldırı yeteneklerini ölçmek amacıyla OpenAI, kripto odaklı yatırım firması Paradigm ile iş birliği yaparak EVMbench sistemini tanıttı.

Sektörün DeFi saldırıları nedeniyle sadece 2026 Ocak ayında 86 milyon dolar kaybettiği bir dönemde yayına giren platform; yapay zekanın akıllı kontratlardaki açıkları ne kadar hızla bulabildiğini, yamayabildiğini ve suistimal edebildiğini denetliyor.

GPT-5.3-Codex saldırı modunda rekor kırdı

Benchmark testlerinde OpenAI’ın en yeni modeli GPT-5.3-Codex, suistimal (exploit) kategorisinde yüzde 72,2 gibi çarpıcı bir başarı oranı yakaladı. Bu rakam, sadece altı ay önce yayınlanan GPT-5’in yüzde 31,9’luk skorunun iki katından fazla bir gelişmeye işaret ediyor. Ancak veriler, ajanların “saldırı” konusunda çok daha yetenekli olduğunu, “tespit” ve “onarım” (patching) konularında ise hala istenen seviyeye ulaşamadığını gösteriyor.

Duyurulan sistemin üç temel çalışma modu

EVMbench, yapay zeka ajanlarını 40 farklı profesyonel denetimden geçmiş 120 kritik güvenlik açığıyla test ediyor.

Test süreci şu üç ana başlıkta toplanıyor:

Tespit: Ajanlar kontrat kodlarını tarayarak açıkları bulmaya çalışıyor.
Onarım: Bulunan açıklar, kontratın işlevselliği bozulmadan kapatılıyor.
Suistimal: İzole bir Ethereum ortamında açıklar kullanılarak fon çekme denemeleri yapılıyor.
Siber savunma için 10 milyon dolarlık hibe

OpenAI, bu yeni benchmark sistemiyle birlikte siber savunma çalışmalarını desteklemek için 10 milyon dolarlık API kredisi taahhüt etti. Şirketin “Yüksek Kapasiteli” siber güvenlik modeli olarak sınıflandırdığı ilk yapay zeka olan GPT-5.3-Codex, açık kaynaklı yazılımların ve kritik altyapıların korunmasında kullanılacak.

İyi niyetli güvenlik araştırmacıları, OpenAI Siber Güvenlik Grant Programı üzerinden bu kredilere başvurabiliyor.

Açık kaynaklı kripto kontratlarında rutin olarak 100 milyar doların üzerinde varlık saklanıyor. Yapay zeka bu açıkları bulmada hızlandıkça, bu gücün savunma tarafında kullanılması hayati önem taşıyor.

Ajanların gerçek dünya senaryolarındaki limitleri

Her ne kadar test sonuçları umut verici olsa da, OpenAI EVMbench’in gerçek dünya karmaşıklığını tam olarak yansıtmadığını kabul ediyor. Özellikle çok katmanlı kontrat ekosistemlerinde yapay zekanın “bağlam farkındalığı” hala sınırlı kalıyor.

Ajanlar genelde tek bir hata bulduğunda taramayı durdurma eğilimi gösteriyor; bu da kapsamlı denetimlerde insan gözetiminin hala vazgeçilmez olduğunu kanıtlıyor.