Anthropic, Claude Haiku 4.5 adlı yeni yapay zeka modelini piyasaya sürdü. Bu küçük ve gecikme optimizasyonlu model, Claude Sonnet 4 ile benzer seviyede kodlama performansı sunuyor. Bununla birlikte Haiku 4.5, Sonnet 4’e göre iki kattan daha hızlı çalışırken maliyeti üçte bir oranında daha düşük. Model, duyurulduğu andan itibaren Anthropic’in API’ı ve iş ortağı platformları üzerinden geliştiricilerin kullanımına açıldı. Haiku 4.5, maliyete duyarlı ve etkileşimli iş yüklerinde Haiku 3.5 ve Sonnet 4 için doğrudan bir alternatif olarak sunuluyor.
Anthropic, Haiku 4.5’i özellikle gecikme süresinin kritik olduğu ve yüksek verim gerektiren alanlar için konumlandırıyor. Bu alanlar arasında gerçek zamanlı asistanlar, müşteri desteği otomasyonları ve çiftli programlama (pair-programming) gibi iş yükleri bulunuyor. Model, Claude for Chrome gibi ürünlerdeki grafik arayüzü ve tarayıcı manipülasyonunu içeren “bilgisayar kullanımı” görevlerinde Sonnet 4’ü geride bırakıyor. Ayrıca, çok aracılı projeler ve hızlı prototipleme için kullanılan Claude Code’daki yanıt verme yeteneğini de önemli ölçüde iyileştiriyor.
Şirket, Claude Sonnet 4.5’in halen en üst düzey model ve “dünyanın en iyi kodlama modeli” olduğunu açıkça belirtiyor. Haiku 4.5 ise en üst düzeye yakın performansı daha yüksek maliyet verimliliğiyle sunan bir alternatif olarak öne çıkıyor. Anthropic tarafından önerilen dağıtım modeli, çok adımlı planlama görevleri için Sonnet 4.5’in kullanılmasını ve ardından yürütme işlemlerinin bir grup Haiku 4.5 çalışanı arasında paralelleştirilmesini içeriyor.
Geliştiriciler, claude-haiku-4-5 model tanımlayıcısını kullanarak Anthropic’in API’ı üzerinden modele erişebilirler. Model aynı zamanda Amazon Bedrock ve Google Cloud Vertex AI platformlarında da mevcut. Fiyatlandırma, 1 milyon girdi token’ı için 1 dolar ve 1 milyon çıktı token’ı için 5 dolar olarak belirlendi. İstek önbellekleme (prompt-caching) ücretleri ise 1 milyon yazma token’ı için 1,25 dolar ve 1 milyon okuma token’ı için 0,10 dolar olarak açıklandı.
Anthropic, modelin performansını çeşitli test paketlerindeki sonuçlarla özetledi. SWE-bench Verified testinde, iki araç (bash ve dosya düzenlemeleri) içeren basit bir yapı kullanılarak 50 deneme üzerinden ortalama %73,3’lük bir başarı oranı elde edildi. Bu testte 128 K’lık bir düşünme bütçesi kullanıldı ve test zamanı hesaplaması yapılmadı. Diğer performans ölçümleri arasında Terminus-2 aracısını kullanan Terminal-Bench, 100 maksimum adım ve 128 K toplam düşünme bütçesi ile yürütülen OSWorld-Verified ve varsayılan örnekleme ile 128 K düşünme bütçesi kullanılan AIME/MMMLU testleri yer alıyor.
Bu test sonuçları, belirtilen yapılar altında Haiku 4.5’in Sonnet 4 ile kodlama alanında eşdeğer performans gösterdiğini ve bilgisayar kullanımı görevlerinde Sonnet 4’e göre kazanımlar sağladığını vurguluyor. Şirket, kullanıcıların genelleme yapmadan önce kendi düzenlemeleri, araç setleri ve düşünme bütçeleri ile bu sonuçları doğrulamalarını tavsiye ediyor. Model, ASL-2 lisansı altında yayınlandı ve Anthropic’in kendi testlerine göre Sonnet 4.5 ve Opus 4.1’den daha düşük bir ölçülmüş yanlış hizalanma oranına sahip.




