Google’ın yapay zeka laboratuvarı DeepMind, video oluşturma teknolojisinde çıtayı bir adım daha yukarı taşıdı. Yeni nesil yapay zeka video oluşturma aracı Veo 2, teknolojik yenilikleriyle dikkatleri üzerine çekiyor ve OpenAI’ın yapay zeka video oluşturma aracı Sora’yı geride bırakmayı hedefliyor.
Veo 2 sınırları zorlayacak
Veo 2, 4K çözünürlüğüne kadar iki dakikalık videolar üretebiliyor. Bu çözünürlük, OpenAI’ın Sora teknolojisinin sunabildiği çözünürlüğün dört katı, video süreleri ise altı katı daha uzun. Ancak şu an için bu özellikler teorik seviyede bulunuyor. Veo 2, Google’ın deneysel video oluşturma aracı VideoFX‘te 720p çözünürlüğü ve sekiz saniyelik videolarla sınırlı olarak kullanılıyor. Buna karşın Sora, 1080p çözünürlüğünde 20 saniyelik videolar sunuyor.
VideoFX hala bekleme listesi ile sınırlı bir hizmet olarak sunulsa da, Google bu hafta daha fazla kullanıcının bu araca erişmesini sağlamaya başlayacak.
Veo 2’nin kullanım alanları
DeepMind’ın ürün başkan yardımcısı Eli Collins, Veo 2’nin Google’ın Vertex AI geliştirici platformunda da sunulmasını planladıklarını belirtti. Collins, önümüzdeki aylarda gelen geri bildirimlere göre Veo 2’yi daha da geliştireceklerini ve bu teknolojiyi Google ekosistemindeki farklı alanlara entegre etmeyi hedeflediklerini söyledi. Veo 2 ile ilgili daha fazla bilgi ise 2025 yılında paylaşılacak.
Veo 2, metin tabanlı komutlar (“Otoyolda yarışan bir araba” gibi) veya metinle birlikte referans görseller kullanılarak videolar oluşturabiliyor. Yenilenen bu sürüm, kamera kontrolü ve fizik simülasyonlarında gelişmeler sağlıyor.
Veo 2’nin avantajları
DeepMind, Veo 2’nin özellikle fiziksel hareketler, akışkan dinamikleri (bir bardağa dökülen kahve gibi) ve ışık özelliklerini (gölgeler, yansımalar) gerçekçi bir şekilde modelleyebildiğini vurguluyor. Kamera kontrollerindeki hassasiyet sayesinde videolarda farklı açılardan sahneler oluşturmak mümkün hale geliyor. Ayrıca, Veo 2 detaylı yüz ifadelerini ve sinematik efektleri daha net bir şekilde yansıtabiliyor.
DeepMind tarafından paylaşılan örnek videolar, Pixar tarzı animasyonlarıyla etkileyici bir kalite sunuyor. Ancak “unheimliche Tal” (rahatsız edici derecede yapay görünüş) etkisinden tamamen kurtulmuş değil.
Karşılaşılan zorluklar
Veo 2, hareketli sahnelerde fiziksel tutarsızlıklar ya da karışık nesneler gibi bazı sorunlar yaşatabiliyor. DeepMind da bu alanlarda geliştirme ihtiyacı olduğunu kabul ediyor.
DeepMind ayrıca yaratıcı profesyonellerle çalışarak Veo 2’yi daha etkili hale getirmeyi hedefliyor. Donald Glover ve The Weeknd gibi sanatçılarla yapılan iş birliklerinin teknolojiye önemli katkılar sağladığı ifade ediliyor.
Veri kullanımı ve güvenlik endişeleri
Veo 2, çeşitli video kaynaklarıyla eğitilerek geliştirildi. Ancak DeepMind, bu kaynakların tam olarak hangileri olduğunu belirtmiyor. Google’ın sahibi olduğu YouTube’un bu kaynaklar arasında yer alabileceği düşünülüyor.
Yapay zeka tarafından oluşturulan videolarda, deepfake risklerini azaltmak için SynthID adlı filigran teknolojisi kullanılıyor. Bu teknoloji, videolara görünmez işaretler ekliyor. Ancak filigran teknolojisinin kusursuz olmadığı da kabul ediliyor.
DeepMind, Veo 2 ile hem teknik gelişim hem de etik sorumlulukları bir arada ele alarak video oluşturma teknolojisinin geleceğine öncülük etmeyi sürdürmeyi hedefliyor.