Stability AI, Stable Cascade ile rakiplerine meydan okuyor
Teknoloji

Stability AI, Stable Cascade ile rakiplerine meydan okuyor

Stability AI, görüntü oluşturma alanındaki lider konumunu korumak için yepyeni bir yapay zeka modeli olan Stable Cascade’i görücüye çıkardı. Şirket, endüstride öncü selefi Stable Diffusion’dan dahi daha hızlı ve güçlü olacağını iddia ettiği modelin, diğer metinden görüntüye dönüştürme araçlarının temelini oluşturmasını hedefliyor.

Stable Cascade fotoğraf üretebilmenin yanı sıra, oluşturduğu görseller üzerinde varyasyonlar sunabiliyor veya mevcut bir resmin çözünürlüğünü artırabiliyor. Diğer metinden görüntüye düzenleme özellikleri arasında “inpainting” ve “outpainting” de yer alıyor. Kullanıcılar bu sayede resmin yalnızca belirli bir bölümünde düzenleme yapabiliyor. Modelin “canny edge” (kenar bulma algoritması) özelliğiyse mevcut bir resmin yalnızca iç yapısını kullanarak yepyeni bir fotoğraf oluşturabiliyor.

Stability AI, Stable Cascade ile rakiplerine meydan okuyor
Araştırmacıların GitHub üzerinden erişebildiği yeni model henüz ticari kullanıma açılmadı (Görsel kaynak)

Stable Cascade nedir?

Araştırmacıların GitHub üzerinden erişebildiği yeni model henüz ticari kullanıma açılmadı. Yine de Google ve hatta Apple gibi şirketlerin kendi görüntü oluşturma modellerini piyasaya sürmesine karşın, bu yeni teknoloji kullanıcılarına çok daha fazla seçenek sunuyor.

Stability AI’ın amiral gemisi Stable Diffusion modellerinden farklı olarak, Stable Cascade tek bir büyük dil modeli (LLM) değil, Würstchen mimarisine dayanan üç farklı modelden oluşuyor. Birinci aşama (stage C), metin isteklerini sıkıştırarak daha az bellek gerektiren latentlere (veya daha küçük kod parçalarına) dönüştürüyor. Bu latentler daha sonra, isteği çözümlemek için ikinci ve üçüncü aşamalara (stage A ve B) geçiyor.

İstekleri daha küçük parçalara bölmek, modelin daha az bellek tüketmesini (GPU’ların bulunmasının zorluğunu düşündüğümüzde, saatlerce süren eğitimlerin azaltılmasını) ve daha hızlı çalışmasını sağlıyor. Dahası, modelin performansı “hem komut uyumluluğu hem de görsel estetik kalitesi” açısından artıyor. Şu anda kullanılan SDXL modeliyle 22 saniye kadar süren görüntü oluşturma işlemi, Stable Cascade ile yaklaşık 10 saniyeye düşüyor.

Stability AI, Stable Cascade ile rakiplerine meydan okuyor
Stable Cascade, Stable Diffusion’a göre daha hızlı, daha performanslı ve daha verimli bir model (Görsel kaynak)

Stable Cascade vs Stable Diffusion

Stable Cascade, Stable Diffusion’a göre daha hızlı, daha performanslı ve daha verimli bir model. Ayrıca inpainting, outpainting ve canny edge gibi ek özellikler de sunar. Henüz ticari kullanıma sunulmasa da, Stable Cascade’in görüntü oluşturma alanında önemli bir gelişme olması ve sektörde yeni bir çığır açması bekleniyor.

Stable Diffusion ve Stable Cascade’in her ikisinin de kendine özgü avantajları ve dezavantajları var. Hangi modelin sizin için daha uygun olduğu, ihtiyaçlarınıza ve kullanım amacınıza bağlı.

ÖzellikStable DiffusionStable Cascade
MimariTek büyük dil modeliWürstchen mimarisine dayanan üç farklı model
Hız22 saniye10 saniye
PerformansDaha düşükDaha yüksek
VerimlilikDaha düşükDaha yüksek
KullanımHem araştırmacılar hem de ticari kullanıcılarSadece araştırmacılar
Ek ÖzelliklerInpainting, outpaintingInpainting, outpainting, canny edge

Stable Diffusion yöntemini popülerleştirmeye yardımcı olan Stability AI, veri setinde izin alınmadan telif hakkıyla korunan içeriğin kullanıldığı iddiasıyla birden fazla davayla karşı karşıya kaldı. İngiltere’de Getty Images tarafından Stability AI aleyhine açılan davanın, Aralık ayında görüleceği açıklandı. Aralık ayında sunulmaya başlanan ticari lisans sistemi ise araştırma fonlarını desteklemek için bir zorunluluk olarak gösteriliyor.

Bu yazımız da ilginizi çekebilir:
Bluesky ve Mastodon çatışması: Sosyal medyanın geleceği tehlikede mi?

Stability AI’ın görüntü oluşturma konusundaki atılımlarına ve yapay zeka alanındaki hızlı ilerlemeye tanıklık ediyoruz. Stable Cascade’in sağlayabileceği hız ve performans, sektörde önemli yeniliklere yol açabilir.


Öne çıkan kaynak görseli: Stability AI