OpenAI’nin yeni ürünü Sora AI (Artificial intelligence), yapay zeka alanında çığır açan bir gelişme. ‘Text-to-video’ (metinden videoya) özelliğine sahip bu gelişmiş model; son derece gerçekçi, dakikalar süren sahneler oluşturabiliyor. Kullanıcılar ikiye bölünmüş durumda: Bir grup, Sora AI’ın video prodüksiyonunu gereksiz kılacağından korkarken, diğer grup ise bu yeni teknolojiyi denemek için can atıyor.
Yapay zekanın video üretimindeki rolü, uzun soluklu ve tartışmalı bir sürecin sonunda belirlenecek. Hatta yasal düzenlemeleri tetikleme ihtimali de oldukça yüksek. Fakat şu anda asıl odaklanmamız gereken soru şu: Sora AI nedir ve nasıl deneyebiliriz?

Sora AI nedir?
Öncelikle belirtmekte fayda var nasıl deneyebiliriz sorusunun yanıtı şu an için maalesef olumsuz. Sora AI henüz halka açık değil. OpenAI, modelin “red-teaming” aşamasında olduğunu açıkladı. Bu terim, yapay zekanın zararlı veya uygunsuz içerik üretmediğinden emin olmak için titizlikle test edildiği dönemi ifade ediyor. Şirket ayrıca; yaratıcı profesyoneller açısından faydalı olması için bir grup görsel sanatçı, tasarımcı ve film yapımcısıyla iş birliği yapıyor. OpenAI’nin amacı, yapay zekayı bir tehdit unsuru olarak konumlandırmak yerine, kreatif iş süreçlerini destekleyen bir araç olarak sunmak. Ancak buna karar verebilmemiz için Sora’nın yaygın kullanıma açılıp, şirketler tarafından benimsenmesini beklememiz gerekecek.
Introducing Sora, our text-to-video model.
Sora can create videos of up to 60 seconds featuring highly detailed scenes, complex camera motion, and multiple characters with vibrant emotions. https://t.co/7j2JN27M3W
Prompt: “Beautiful, snowy… pic.twitter.com/ruTEWn87vf
— OpenAI (@OpenAI) February 15, 2024
Şimdilik, Sora’nın yeteneklerini görmek isteyenler OpenAI’nin resmi duyurusundaki örnek videolara göz atabilir. OpenAI CEO’su Sam Altman da X’de (Twitter), kullanıcıların isteklerini dikkate alarak hazırlanmış örnekler paylaşıyor. Şu an için daha erken erişim aşamasında bile olmayan Sora AI’ın güçlü ve zayıf yönlerini inceleyelim.
Sora AI’ın güçlü yönleri
Uzun metinleri yorumlama kabiliyeti, Sora’yı benzerlerinden ayıran en belirgin özellik (bir örnek 135 kelimeden oluşmakta). OpenAI’nin paylaştığı videolar Sora’nın, insan karakterlerden hayvanlara, sevimli yaratıklardan kent manzaralarına, peyzajlardan New York gibi bir metropolün suya gömülü halinin tasvirine kadar pek çok sahne ve karakter tasvirinin üstesinden gelebildiğini gösteriyor.
Bunda OpenAI’nin, Dall-E ve GPT gibi önceki yapay zeka modellerini geliştirme deneyiminin büyük payı var. 2023 Eylül ayında duyurulan ‘metinden resme’ dönüştürücü Dall-E 3, sektörde yankı uyandırmıştı. OpenAI’nin en yeni yapay zeka modeli GPT-4 Turbo da Kasım’da yayınlandı. OpenAI’ye göre Sora, “görsel eğitim verileri için son derece açıklayıcı başlık oluşturmada” Dall-E 3’ün yeniden başlıklandırma tekniğinden faydalanıyor.
Prompt: “A stylish woman walks down a Tokyo street filled with warm glowing neon and animated city signage. she wears a black leather jacket, a long red dress, and black boots, and carries a black purse. she wears sunglasses and red lipstick. she walks confidently and casually.… pic.twitter.com/cjIdgYFaWq
— OpenAI (@OpenAI) February 15, 2024
Yapımcılar; “Sora, kullanıcının girdiği kelimelerin anlamını kavramanın yanı sıra, onların fiziksel dünyada nasıl var olduklarını da anlayabiliyor” açıklamasını yaptı. Gerçekten de OpenAI’nin örnek videoları etkileyici bir gerçekçilik sunuyor. Yakın plan çekimlerde ya da deniz canlılarında ufak tefek kusurlar dikkat çekse de hangi videonun gerçek hangisinin yapay zeka ürünü olduğunu anlamakta zorlanabilirsiniz.
Model ayrıca durağan görüntülerden video üretebiliyor, mevcut videoları uzatabiliyor veya eksik kareleri doldurabiliyor. Yani yapay zekayla video çalışmasında önemli bir devrim söz konusu. OpenAI’nin açıklamasına göre; “Sora, gerçek dünyayı anlayabilen ve simüle edebilen bir modelin temelini oluşturuyor. Bu kabiliyetin, yapay genel zekaya ulaşmada önemli bir kilometre taşı olacağına inanıyoruz.”
‘Yapay genel zeka’, insan zekasına daha yakın gelişmiş bir yapay zeka türü. Meta ve DeepMind gibi teknoloji devleri de benzer hedeflerle çalışmalarını sürdürüyor.
Sora AI’ın zayıf yönleri
OpenAI, Sora’nın kusurlarının olduğunun da altını çiziyor. Örneğin, karmaşık sahnelerde fiziği doğru yansıtmakta ya da sebep-sonuç ilişkisini anlamakta zorlanabiliyor. Açıklamaya göre; “Videodaki bir kişi kurabiyeden ısırabilir, ancak sonrasında kurabiyede bir ısırık izi olmayabilir.” Bir de şu var: Hala hangi elinin sağ el olduğunu belirlemek için düşünenler rahatlayabilir; Sora AI da sağını ve solunu karıştırıyor.
Prompt: “A gorgeously rendered papercraft world of a coral reef, rife with colorful fish and sea creatures.” pic.twitter.com/gzEE8SwP81
— OpenAI (@OpenAI) February 15, 2024
OpenAI, Sora’nın ne zaman yaygın kullanıma açılacağı konusunda herhangi bir ipucu vermedi. Dikkat çektikleri nokta: Öncelikle şirketin mevcut güvenlik standartlarını karşılaması gerektiği. Bunlar arasında şiddet, cinsel içerik, nefret söylemi, ünlü taklitleri ve başkalarının fikri mülkiyeti bulunuyor.
Açıklamanın devamında “Kapsamlı araştırma ve testlere rağmen, bu teknolojinin istismar edilmesinin her yolunu öngöremeyiz. Bu nedenle gerçek dünya kullanımından edinilecek bilgilerin; gelişmiş ve güvenli yapay zeka sistemleri geliştirmede çok önemli bir unsur olduğuna inanıyoruz.” ifadesi kullanılıyor.
Sora AI’ın potansiyel uygulama alanları
Sora’nın kullanım alanları oldukça geniş. Video prodüksiyonu ve görsel efektler dışında, eğitimde sanal ders materyalleri oluşturmak, tıbbi araştırmalarda görselleştirmeler yapmak, mimarlıkta tasarımları canlandırmak ve oyun geliştirmede yeni dünyalar ve karakterler yaratmak için kullanılabilir.
Prompt: “Several giant wooly mammoths approach treading through a snowy meadow, their long wooly fur lightly blows in the wind as they walk, snow covered trees and dramatic snow capped mountains in the distance, mid afternoon light with wispy clouds and a sun high in the distance… pic.twitter.com/Um5CWI18nS
— OpenAI (@OpenAI) February 15, 2024
OpenAI, Sora’nın halka sunmaya yönelik çalışmalarını sürdürüyor. Henüz net bir tarih verilmese de 2024’ün sonlarında veya 2025’te beta programının başlatılması öngörülüyor. OpenAI, modelin geliştirilmesi ve yaygınlaştırılması için akademisyenler, sanatçılar ve geliştiricilerle iş birliği yapmayı planlıyor.
Sora AI gibi yapay zeka modelleri, etik açıdan bazı tartışmalara yol açıyor. Yapay zeka tarafından üretilen videoların telif hakkı kimin ait olduğu, sahte haber yayma ve manipülasyon riski gibi konular halen netlik kazanmış değil. OpenAI, bu etik tartışmalara çözüm bulmak için çalışmalar yürütmekte ve modelin sorumlu bir şekilde kullanılmasını teşvik etmekte.
Stability AI, Stable Cascade ile rakiplerine meydan okuyor
Özetle, Sora yapay zeka alanında çok önemli bir gelişme olsa da, kamuya açılması daha zaman alacak. Sizin önerilerinize uygun biçimde yazıyı gözden geçirdim. Umarım beğenirsiniz!
Öne çıkan kaynak görseli: OpenAI Sora AI




