Anthropic ve OpenAI arasında ajan savaşı kızışıyor • Digital Report

Yapay zeka dünyasında rekabet, Anthropic’in Claude Opus 4.6 modelini duyurmasıyla yeni bir boyuta taşındı. OpenAI’ın GPT-5.3-Codex lansmanından sadece saatler sonra gelen bu hamle, kurumsal pazarın kontrolü için yürütülen teknoloji savaşını hızlandırdı.

Finansal analiz, hukuk araştırmaları ve otonom kodlama yetenekleriyle öne çıkan Opus 4.6, özellikle “ajan ekipleri” kurabilme becerisiyle karmaşık iş süreçlerini eş zamanlı yönetmeyi hedefliyor.

Claude Opus 4.6 finans ve hukuk odağında yükseliyor

Anthropic, yeni modelini özellikle finans profesyonelleri için bir merkez üssü haline getirdi. SEC dosyalarını analiz etme ve kamuya açık şirket verilerini araştırma becerisini ölçen Finance Agent benchmark testinde selefine göre önemli bir sıçrama kaydeden model, TaxEval testinde yüzde 76 ile zirveye yerleşti.

1 milyon tokenlik devasa bağlam penceresi sayesinde, koca bir kod tabanını veya binlerce sayfalık hukuk dosyasını tek seferde işleyebilen sistem, kurumsal iş akışlarını otomatikleştirme iddiasını güçlendiriyor.

Yazılım dünyasında karşı karşıya gelen iki dev

Sektörün en prestijli iki modeli arasındaki performans farkı, otonom yetenekler üzerinden netleşiyor. GPT-5.3-Codex ve Claude Opus 4.6 arasındaki rekabet, benchmark tablolarında şu şekilde somutlaşıyor:

Benchmark testi	Odak alanı	GPT-5.3-Codex	Claude Opus 4.6
Terminal-Bench 2.0	Terminal ve Ajan Yetenekleri	%77,3	%65,4
GDPval-AA / Elo	Gerçek Dünya Bilgi İşçiliği	1,600+	1,606
Finance Agent	Finansal Muhakeme	–	%60,7
Siber Güvenlik (CTF)	Zafiyet Tespiti	%77,6	Yüksek Skor*

Claude, küçük görevlere yanıt veren bir modelden, kapsamlı işleri kendi başına yürüten bir iş ortağına evrildi.

Siber güvenlikte 500 yeni açık tespit edildi

Anthropic’in Frontier Red Team ekibi, Opus 4.6’nın hiçbir özel talimat almadan açık kaynaklı yazılımlarda 500’den fazla yüksek riskli güvenlik açığını tespit ettiğini açıkladı. GhostScript ve OpenSC gibi kritik projelerde onlarca yıldır fark edilmeyen hataları bulan model, sadece kod taraması yapmakla kalmıyor; Git geçmişini okuyarak sorunlu paternleri bir insan araştırmacı gibi analiz ediyor.

OpenAI’ın GPT-5.3-Codex ile getirdiği “Yüksek Kapasite” siber güvenlik sınıflandırmasına karşılık, Anthropic de yapay zeka tarafından keşfedilen bu hataların onarılması için yeni bir iş akışı öneriyor.

Kurumsal entegrasyonda PowerPoint hamlesi

Anthropic, modelin yeteneklerini doğrudan iş dünyasının merkezine taşımak için Microsoft PowerPoint entegrasyonunu başlattı. Max ve Enterprise aboneleri, Claude’u bir yan panel asistanı olarak kullanarak marka şablonlarına uygun sunumlar hazırlayabiliyor.

OpenAI’ın Codex ile sunduğu “bilgisayar kontrolü” vizyonuna karşılık Anthropic, mevcut ofis yazılımlarının içine derinlemesine entegre olmayı ve paralel çalışan ajan ekipleriyle verimliliği artırmayı tercih ediyor.