Alibaba, görsel üretim modellerinde yeni bir sayfa açarak Wan2.6 serisini duyurdu. Bu yeni seri, içerik üreticilerinin yapay zeka tarafından oluşturulan videolarda kendi görüntüleri ve sesleriyle yer alabilmesine olanak tanıyarak, profesyonel kalitede video prodüksiyonunun kapılarını herkes için aralıyor.
Wan2.6 serisi, mevcut dört modelin kapsamlı güncellemelerinin yanı sıra, Çin’in ilk “referanstan videoya” (reference-to-video) üretim modelini de içeriyor. Bu yenilik, özellikle kısa video ve dijital içerik üreticilerinin hikaye anlatım süreçlerini kökten değiştirmeyi hedefliyor.
Çin’in ilk “Referanstan Videoya” modeli
Serinin en dikkat çeken üyesi şüphesiz Wan2.6-R2V. Bu model, kullanıcıların hem görünüş hem de ses içeren bir referans karakter videosu yüklemesine izin veriyor. Ardından, metin komutları kullanılarak, aynı karakterin başrolde olduğu yepyeni ve canlı sahneler oluşturulabiliyor.
Bu teknoloji sayesinde:
- Kullanıcılar, kendilerini, başka bir kişiyi, bir hayvanı veya nesneyi yapay zeka sahnelerine ekleyebilirler.
- Orijinal referansın kendine has görünümü ve sesi korunarak görsel ve işitsel tutarlılık sağlanır.
- Özellikle kısa formlu drama veya içerik üretenler için prodüksiyon süreci büyük ölçüde hızlanır ve kolaylaşır.
Sinematik kalite ve gelişmiş hikaye anlatımı
Wan2.6 serisi sadece referans videolarda değil; metinden videoya (T2V), görüntüden videoya (I2V) ve görüntü oluşturma modellerinde de önemli iyileştirmeler sunuyor.
- Çoklu Çekim Hikaye Anlatımı: Yeni modeller, görsel tutarlılığı bozmadan daha zengin ve etkileyici anlatılar oluşturmayı sağlayan akıllı çoklu çekim yeteneklerine sahip.
- 15 Saniyeye Kadar Video: Modeller, 15 saniyeye kadar video çıktısı desteğiyle içerik üreticilerine hikayelerini geliştirmeleri için daha fazla alan tanıyor.
- Ses ve Görüntü Senkronizasyonu: İyileştirilmiş ses-görüntü senkronizasyonu ve sesten video üretme yetenekleri, daha gerçekçi sahneler ve zengin ses efektleri sunuyor.
Görüntü üretiminde mantıksal akıl yürütme
Görüntü oluşturma tarafında ise Wan2.6 serisi, tutarlı bir görsel hikaye anlatımı için gelişmiş mantıksal akıl yürütme yetenekleriyle metin ve görüntüyü harmanlayabiliyor. Uzun ve karmaşık metin komutlarını (Çince ve İngilizce) anlama kapasitesi sayesinde, sanatsal niyeti ve nüansları yakalayan yüksek kaliteli görseller üretebiliyor.
Kullanıcılar, Alibaba Cloud’un yapay zeka geliştirme platformu Model Studio ve Wan’ın resmi web sitesi üzerinden bu modellere erişip kullanmaya başlayabilirler. Modeller ayrıca Alibaba’nın amiral gemisi yapay zeka uygulaması Qwen App‘e de entegre edilecek.




