Stability AI, görüntü oluşturma alanındaki lider konumunu korumak için yepyeni bir yapay zeka modeli olan Stable Cascade’i görücüye çıkardı. Şirket, endüstride öncü selefi Stable Diffusion’dan dahi daha hızlı ve güçlü olacağını iddia ettiği modelin, diğer metinden görüntüye dönüştürme araçlarının temelini oluşturmasını hedefliyor.
Stable Cascade fotoğraf üretebilmenin yanı sıra, oluşturduğu görseller üzerinde varyasyonlar sunabiliyor veya mevcut bir resmin çözünürlüğünü artırabiliyor. Diğer metinden görüntüye düzenleme özellikleri arasında “inpainting” ve “outpainting” de yer alıyor. Kullanıcılar bu sayede resmin yalnızca belirli bir bölümünde düzenleme yapabiliyor. Modelin “canny edge” (kenar bulma algoritması) özelliğiyse mevcut bir resmin yalnızca iç yapısını kullanarak yepyeni bir fotoğraf oluşturabiliyor.

Stable Cascade nedir?
Araştırmacıların GitHub üzerinden erişebildiği yeni model henüz ticari kullanıma açılmadı. Yine de Google ve hatta Apple gibi şirketlerin kendi görüntü oluşturma modellerini piyasaya sürmesine karşın, bu yeni teknoloji kullanıcılarına çok daha fazla seçenek sunuyor.
Stability AI’ın amiral gemisi Stable Diffusion modellerinden farklı olarak, Stable Cascade tek bir büyük dil modeli (LLM) değil, Würstchen mimarisine dayanan üç farklı modelden oluşuyor. Birinci aşama (stage C), metin isteklerini sıkıştırarak daha az bellek gerektiren latentlere (veya daha küçük kod parçalarına) dönüştürüyor. Bu latentler daha sonra, isteği çözümlemek için ikinci ve üçüncü aşamalara (stage A ve B) geçiyor.
İstekleri daha küçük parçalara bölmek, modelin daha az bellek tüketmesini (GPU’ların bulunmasının zorluğunu düşündüğümüzde, saatlerce süren eğitimlerin azaltılmasını) ve daha hızlı çalışmasını sağlıyor. Dahası, modelin performansı “hem komut uyumluluğu hem de görsel estetik kalitesi” açısından artıyor. Şu anda kullanılan SDXL modeliyle 22 saniye kadar süren görüntü oluşturma işlemi, Stable Cascade ile yaklaşık 10 saniyeye düşüyor.

Stable Cascade vs Stable Diffusion
Stable Cascade, Stable Diffusion’a göre daha hızlı, daha performanslı ve daha verimli bir model. Ayrıca inpainting, outpainting ve canny edge gibi ek özellikler de sunar. Henüz ticari kullanıma sunulmasa da, Stable Cascade’in görüntü oluşturma alanında önemli bir gelişme olması ve sektörde yeni bir çığır açması bekleniyor.
Stable Diffusion ve Stable Cascade’in her ikisinin de kendine özgü avantajları ve dezavantajları var. Hangi modelin sizin için daha uygun olduğu, ihtiyaçlarınıza ve kullanım amacınıza bağlı.
| Özellik | Stable Diffusion | Stable Cascade |
|---|---|---|
| Mimari | Tek büyük dil modeli | Würstchen mimarisine dayanan üç farklı model |
| Hız | 22 saniye | 10 saniye |
| Performans | Daha düşük | Daha yüksek |
| Verimlilik | Daha düşük | Daha yüksek |
| Kullanım | Hem araştırmacılar hem de ticari kullanıcılar | Sadece araştırmacılar |
| Ek Özellikler | Inpainting, outpainting | Inpainting, outpainting, canny edge |
Stable Diffusion yöntemini popülerleştirmeye yardımcı olan Stability AI, veri setinde izin alınmadan telif hakkıyla korunan içeriğin kullanıldığı iddiasıyla birden fazla davayla karşı karşıya kaldı. İngiltere’de Getty Images tarafından Stability AI aleyhine açılan davanın, Aralık ayında görüleceği açıklandı. Aralık ayında sunulmaya başlanan ticari lisans sistemi ise araştırma fonlarını desteklemek için bir zorunluluk olarak gösteriliyor.
Bluesky ve Mastodon çatışması: Sosyal medyanın geleceği tehlikede mi?
Stability AI’ın görüntü oluşturma konusundaki atılımlarına ve yapay zeka alanındaki hızlı ilerlemeye tanıklık ediyoruz. Stable Cascade’in sağlayabileceği hız ve performans, sektörde önemli yeniliklere yol açabilir.
Öne çıkan kaynak görseli: Stability AI




