OpenAI, pazartesi günü GPT-5.1-Codex-Max modelini duyurdu. Bu ajan tabanlı kodlama modeli, karmaşık ve saatler süren programlama projelerini ele alan geliştiriciler için büyük bir ilerleme olarak konumlandırıldı. Model, iç testlerde 24 saatlik bir geliştirme görevini tamamladı ve milyonlarca token boyunca tutarlı çalışmasını sağlayan “sıkıştırma” tekniğini tanıttı.
Duyuru, Google’ın Gemini 3 Pro modelini açıklamasından bir gün sonra geldi. Bu durum, yapay zeka devleri arasındaki geliştirici araçları rekabetini artırdı. OpenAI’ye göre, GPT-5.1-Codex-Max artık tüm Codex platformlarında varsayılan model olarak GPT-5.1-Codex’in yerini aldı.
Model, SWE-Bench Verified kıyaslamasında %77,9 doğruluk oranı elde etti. Bu skor, Gemini 3 Pro’nun %76,2’sini az farkla geçti. SWE-Lancer IC SWE’de %79,9 puana ulaşırken, önceki modelin %66,3’üne kıyasla iyileşme gösterdi. TerminalBench 2.0’da ise %58,1 skor yaptı.
GPT-5.1-Codex-Max, GPT-5.1-Codex’e göre yaklaşık %30 daha az token kullanıyor. Gerçek dünya kodlama görevlerini %27 ila %42 daha hızlı tamamlıyor. ZDNET’e göre, bu verimlilik kazanımları ChatGPT Plus aboneleri için kullanım sınırları nedeniyle ekstra bir saat programlama süresi sağlayabilir.
Sıkıştırma sistemi, bağlam penceresi dolmaya yaklaştığında oturum geçmişini otomatik olarak sıkıştırıyor ve temel bilgileri koruyor. OpenAI’nin sistem kartına göre, model ilk kez sıkıştırma süreciyle birden fazla bağlam penceresinde doğal olarak eğitildi. The Decoder’a göre, “Model bağlam penceresini doldurduğunda oturum geçmişini otomatik olarak sıkıştırıyor.”
Model, Codex üzerinden ChatGPT Plus, Pro, Business, Edu ve Enterprise kullanıcıları için hemen erişilebilir. API erişimi OpenAI’ye göre “yakında” sağlanacak. GPT-5.1-Codex-Max, Windows ortamları için optimize edilmiş ilk Codex sürümü olarak dikkat çekiyor.
OpenAI’nin ekim ayındaki duyurusuna göre, şirket mühendislerinin %95’i Codex’i haftalık kullanıyor. Araç benimsendikten sonra pull-request birleştirmeleri %70 arttı. OpenAI, “Neredeyse tüm mühendisler bugün Codex kullanıyor, temmuz ayındaki yarısından fazla” dedi.
Model, güvenlik risklerini azaltmak için varsayılan olarak ağ erişimi devre dışı bırakılmış kum havuzu ortamlarında çalışıyor. Bu, prompt enjeksiyonu ve veri sızdırma gibi tehditlere karşı koruma sağlıyor.




