OpenAI, kod yazma yeteneklerini geniş bir otonom operasyon yelpazesiyle birleştiren GPT-5.3-Codex modelini tanıttı. Önceki sürümlere göre yüzde 25 daha hızlı çalışan bu yeni mimari, sadece bir yazılım yardımcısı değil, araştırma yapabilen, araç kullanabilen ve karmaşık dijital süreçleri uçtan uca yönetebilen bir yapay zeka ajanı olarak kurgulandı.
Modelin en dikkat çekici özelliği, geliştirme sürecindeki hataları ayıklamak ve dağıtım hatlarını yönetmek için bizzat kendi kapasitesinden yararlanılmış olmasıdır.
Otonom yetenekler benchmark testlerinde rekor kırdı
GPT-5.3-Codex, gerçek dünya mühendislik senaryolarını ölçen SWE-Bench Pro ve terminal kullanım becerilerini sınayan Terminal-Bench 2.0 testlerinde endüstri liderliğini ele geçirdi. OSWorld-Verified testlerinde sergilediği görsel masaüstü kullanım performansı, modelin bir insan gibi işletim sistemi üzerinde navigasyon yapabildiğini kanıtlıyor.
| Kategori | Benchmark Testi | GPT-5.3-Codex | GPT-5.2-Codex | GPT-5.2 |
|---|---|---|---|---|
| Yazılım Mühendisliği | SWE-Bench Pro (Public) | %56,8 | %56,4 | %55,6 |
| Terminal Becerileri | Terminal-Bench 2.0 | %77,3 | %64,0 | %62,2 |
| Bilgisayar Kullanımı | OSWorld-Verified | %64,7 | %38,2 | %37,9 |
| Profesyonel Bilgi | GDPval (Galibiyet/Beraberlik) | %70,9 | – | %70,9 |
| Siber Güvenlik | CTF Challenges | %77,6 | %67,4 | %67,7 |
| Freelance Yazılım | SWE-Lancer IC Diamond | %81,4 | %76,0 | %74,6 |
GPT-5.3-Codex, yazılım yaşam döngüsünün tamamını desteklemek üzere inşa edildi.
Modelin yetenekleri kod yazmanın ötesine geçerek; hata ayıklama, dokümantasyon oluşturma, kullanıcı araştırması ve veri analizi gibi profesyonel iş akışlarını kapsıyor. Özellikle GDPval ölçümlerinde sergilediği performans, modelin 44 farklı meslek grubunda uzman düzeyinde bilgi üretimi yapabildiğini gösteriyor.
Siber güvenlikte yüksek kapasite dönemi başlıyor
GPT-5.3-Codex, OpenAI tarafından siber güvenlik alanında “Yüksek Kapasite” sınıfına dahil edilen ilk model oldu. Yazılım açıklarını doğrudan tanımlayabilen bu sistem, hem savunma hem de saldırı potansiyeli taşıyan çift kullanımlı yapısı nedeniyle özel bir güvenlik protokolüyle sunuluyor.
Şirket, bu kapasitenin savunma amaçlı kullanımını teşvik etmek için siber güvenlik araştırma topluluklarına 10 milyon dolarlık API kredisi sağlayacağını duyurdu.
NVIDIA donanımlarıyla optimize edilen altyapı
Modelin yüksek hızı ve işlem kapasitesi, NVIDIA GB200 NVL72 sistemleri üzerinde yapılan ortak çalışma ve altyapı optimizasyonlarına dayanıyor. Şu an için ücretli ChatGPT planları, CLI ve IDE eklentileri üzerinden erişime açılan GPT-5.3-Codex için API erişiminin de kısa süre içinde aktif edilmesi planlanıyor.




