Eğer geçtiğimiz haftalarda Twitter’da ilgi çekici çizimlere rastladıysanız ancak bunu hangi sanatçının yaptığını bulamadıysanız DALL-E mini ile tanışmış olma ihtimaliniz bir hayli yüksek. OpenAI’ın DALL-E isimli yapay zeka sisteminden ilham alarak Boris Dayma tarafından geliştirilen ve metin girdisiyle basit görseller oluşturmaya imkan veren araç, teknoloji ile derin bağları olmayan genel kullanıcıların da yapay zekayla tanışmasını sağladı. DALL-E mini buz dağının yalnızca görünen kısmı çünkü birbiri ardına gelen DALL-E, Midjourney AI ve Stable Diffusion gibi araçların yalnızca metin girdileriyle oluşturdukları hayranlık verici görseller, yapay zeka teknolojisinin hayal ettiğimizin çok ötesinde bir hızla geliştiğini gözler önüne serdi. Bu araçların ortaya çıkışının yalnızca görsel üretmek ile ilgili olmadığının da altını çizmekte fayda var.
Yıllardır son kullanıcıya tam manasıyla açıklanamayan ve bu nedenle de üzerine bir sürü komplo teorisi kurulan yapay zeka teknolojisi, bir tabu olmaktan çıkıp internete erişimi olan herkesin görsel oluşturucular ile deney yapmasına olanak verdi. Bu yönüyle bu araçların ortaya çıkışının, yapay zekanın toplum nezdinde nasıl algılandığının değişeceğini gösteren bir mihenk taşı olduğunu düşünüyoruz. Yine de bardağın boş tarafından bakmak sterseniz, bu serüvende şimdiye kadar en gerçekçi korku filmlerinde dahi göremeyeceğiniz sahnelerin bu araçlar sayesinde dakikalar içinde çizilebildiğini fark etmek oldukça tüyler ürpertici olabilir.
Sınır hayal gücünüz
Midjourney AI’ı ilk deneme fırsatımızda “song of the siren” (Yunan mitolojisinde yaşadığına inanılan sirenlerin şarkılarına verilen isim) girdisiyle aldığımız sonucunu yukarıdaki görselde inceleyebilirsiniz. Bu araçların temel çalışma prensibi aklınıza gelen bir betimlemeyi, cümleyi, şarkı sözünü veya bir kelimeyi göz alıcı görsellere çevirebilmeleri üzerine kurulu. Bu görsellerin boyutlarını, tarzlarını ve renklerini belirleyici komutlar üretebileceğinizi de belirtelim. Maalesef henüz Türkçe komut desteği sunmayan bu araçlarda nasıl girdiler oluşturulabileceğine dair aklınızda bir fikir oluşturması adına şöyle bir örnek verebiliriz: “Van Gogh tarzında beyaz tüylü bir köpek, 16:9, gerçekçi.” Olasılıklar sınırsız ve her şey sizin hayal gücünüze kalmış durumda. Bu araçlar ile sürekli görsel üretmeyi düşünüyorsanız, kullandığınız platformun hangi komutlar ile nasıl sonuç verdiğini öğrenmek için biraz vakit harcamanız gerekiyor. Şimdi gelin, gündemi kasıp kavuran bu araçları daha yakından tanıyalım.
DALL-E
İlk sürümü 5 Ocak 2021’de OpenAI tarafından piyasa sürülen DALL-E, ismini ünlü Katalan sürrealist ressam “Salvador Dalí” ve uzayda çöp toplayarak insanların kaderini belirleyecek olan robotun hikayesini anlatan 2008 yapımı 3B animasyon filmi “WALL-E”nin birleşiminden alıyor. Daha basit görseller üretebilen ilk sürüm sonrasında bir hayli yol kateden şirket, 2022 Nisan ayında DALL-E 2 ile geri döndü. Geliştirici DALL-E 2’yi “metin açıklamalarıyla orijinal, gerçekçi görüntüler ve sanat eserleri oluşturabilen; kavramları ve stilleri birleştirebilen bir araç” olarak tanımlıyor. Eylül ayının başında “Outpainting” isimli özelliğini tanıtarak kullanıcılarına mevcut resimlerin tuval sınırlarının ötesini hayal etme imkanı tanıyan platform, 28 Eylül 2022 itibariyle herkesin kullanımına açıldı. Bu özelliği kullanarak seçtiğiniz bir görselin çevresini de parça parça tasarlayabilir ve çok daha yüksek çözünürlükte çıktılar alabilirsiniz. Platform, kullanıcılarına ilk hesap açtıklarında “kredi” ismini verdiği 50 puan tanımlıyor. Bir aylık kullanım sonrasında ise her ay başında 15 kredi hediye ediyor. Eğer limitiniz dolarsa, 15 dolar ödeyerek 115 kullanım hakkı daha satın alabiliyorsunuz. Bu puanların her biri tek çıktı alınmasını sağlıyor. Outpainting özelliğinin herkesin kullanımına açık olduğunun da altını çizmekte fayda var.
OpenAI’ın içerik politikasına ve kullanım şartlarına uyduğunuz sürece, DALL-E ile oluşturduğunuz görüntüleri ticari amaçlarla kullanabileceğinizi de ekleyelim.
Midjourney AI
Aynı isimli bağımsız bir araştırma laboratuvarının projesi olan Midjourney AI, ortaya çıktığından beri adından fazlaca bahsettirmeyi başardı. Deneme sürümüne oyunseverlerin yakından tanıdığı Discord anlık mesajlaşma uygulaması üzerinden erişebileceğiniz araç, sırtını David Holz liderliğindeki 11 kişilik tam zamanlı ekibe dayıyor. The Economist Dergisi, Haziran 2022’de yayınlanan bir sayısının ön kapağını Midjourney AI ile tasarlayarak aracın ününe ün kattı. Aylık 10 dolar ödeyerek Midjourney AI’ın temel üyelik paketine abone olabilir ve ayda 200 görsel üretme, üyelere özel galeriyi görüntüleme gibi özelliklerden faydalanabilirsiniz. Aylık 30 dolar ödeyerek sahip olabileceğiniz paket ise sınırsız görsel üretme, 900 dakika boyunca daha hızlı çıktı alma gibi imkanlar sunuyor. Tıpkı DALL-E gibi, Midjourney AI ile oluşturduğunuz görselleri de ticari amaçla kullanabilirsiniz ancak geliştirici şirket bu görsellerle NFT oluşturulmasına izin vermiyor.
Stable Diffusion
StabilityAI tarafından EleutherAI ve LAION ile iş birliği içinde geliştirilen Stable Diffusion, diğerleriyle aynı mantıkla çalışan, metin girdisiyle görsel oluşturmaya yarayan araçlardan bir diğeri. Bu yazılımın kaynak kodunun GitHub’da erişime açık olduğunun altını çizelim. Modelin makine öğrenimi sürecinde 10 binden fazla beta test kullanıcısı her gün 1,7 milyon görsel oluşturdu. Eğer siz de Stable Diffusion kullanıcılarının oluşturduğu görsellere göz atmak isterseniz “lexica.art” adlı internet sitesini ziyaret edebilirsiniz. Parlak fikirlerinizi görsellere dönüştürmek istiyorsanız, beta.dreamstudio.ai adresini ziyaret ederek veya bilgisayarınıza ilgili uygulamayı kurarak Stable Diffusion’ı deneyimleyebilirsiniz. StabilityAI ekibi oluşturulan görsellerin ticari kullanımı konusunda kullanıcılar önüne herhangi bir engel koymuyor.
İnsan sanatçılar işsiz mi kalacak?
Birçok internet kullanıcısı metin girdisiyle “sanat” eseri oluşturma imkanının gerçek sanatçıları zaman içerisinde işsiz bırakacağını düşünüyor. Bu konu üzerine daha da derinleşmeden önce sizlere Darwin’in evrim kuramının en büyük savunucularından biri olan ünlü biyolog Thomas Henry Huxley’in 19. Yüzyılda ortaya attığı “sonsuz maymun teoremi”nden bahsetmek istiyoruz. Huxley, internet öncesi çağda matematiksel bir gerçekliğin altını çizmek amacıyla, sonsuz sayıda maymuna sonsuz adet daktilo verirsek, bu maymunlardan birinin eninde sonunda Shakespeare’in bir eserini baştan sona yazabileceğinden söz ediyor.
Girişimci ve yazar Andrew Keen ise 2007 tarihli “The Cult of the Amateur: How Today’s Internet Is Killing Our Culture” adlı kitabında ise “sonsuz maymun teoremi”ni örnek göstererek, internette içerik üretme imkanına sahip geniş kitleleri bu maymunlara benzetiyor. Günümüzün amatör maymunları olarak adlandırdığı internete bağlı neslin sonsuz bir “dijital sıradanlık ormanı” yarattığından yakınıyor. Kimilerimiz internetin sunmuş olduğu mkanlar sayesinde sürükleyici romanlar, etkileyici dergi yazıları yazabiliyor, göz alıcı resimler çizebiliyor veya hayranlık duyulacak şarkılar üretebiliyor olsa da göz ardı ettiğimiz çok sayıda görece kalitesiz veya kötü içeriğin internette dolaşımda olduğu da yadsınamaz bir gerçek. Yeni nesil yapay zeka araçları aracılığıyla basit cümle girdileri kullanılarak görkemli görseller üretmek mümkün. Ancak bu durum verilen komut ile alınan çıktının tutarsız olduğu, yine görece çok da etkileyici olmayan birçok sözde “sanat” eserinin internet ortamına yayılmış olduğu gerçeğini değiştirmiyor.
Yapay zeka araçları yüksek ihtimalle birkaç yıl içerisinde çok daha tutarlı görseller üretebilecek ancak yine de profesyonel olarak bu işle ilgilenecek yetenekli tasarımcılara ve küratörlere ihtiyaç var. Neden mi?
- Doğru komutları oluşturmak o kadar da kolay değil. Şu an piyasada bulunan ve elle tutulur çıktılar üretebilen neredeyse her araç İngilizce komutlar yardımıyla çalışıyor. Bu nedenle profesyonel anlamda başarılı sonuçlar elde edebilmek için iyi derecede İngilizce bilmeniz gerekiyor. Problem yalnızca dil bariyeriyle de ilgili değil. Her yapay zeka aracının kendi çalışma prensibi var ve hayal ettiğiniz çıktıyı almak için tekrar tekrar komut girmeniz gerekebiliyor. Bu konuda uzmanlaşan ve sosyal medyada kendini yapay zeka sanatçısı olarak tanıtan yüzlerce kişi var.
- En iyi çıktıyı seçmek estetik algısı güçlü kişileri gerektiriyor. Nasıl ki bir sanat galerisinde eserler arasındaki bağlamı kurgulayan uzman küratörler varsa, yapay zekayla elde edilen görsel sonuçların da aralarından en iyi veya uygununu seçmek için ihtisas sahibi kişilere ihtiyaç var.
- Görsellerin yeniden çizilmesi veya düzeltilmesi uzmanlara düşüyor. Alınan çıktıların bazıları oldukça etkileyici ancak bunların bazı kısımlarında hatalara rastlanabiliyor. Bu hataların düzeltilebilmesi için gerekli bilgi ve yetenek birikimine sahip kimselere gereksinim duyuluyor.
- İstikrarlı sonuç almak bir hayli güç. Şu sıralarda kullanıma açık olan araçlar yardımıyla hayal ettiğine yakın sonuçlar alabilen kişi sayısı bir hayli az. Bu nedenle hobiden öte bir şeyler başarmayı düşünen, projelerde çalışmayı hedefleyen veya kendi sergilerini oluşturmak isteyen yapay zeka sanatçıları istikrarlı sonuç almayı öğrendiklerinde rakiplerinden bir adım öne geçecekler.
En nihayetinde…
Yapay zeka destekli görsel üretme araçlarının zamanla ne kadar gelişeceğini ancak tahmin edebiliriz. Bugün dergi kapaklarında, reklamlarda, sergilerde, hatta gazetecilikte bile bu araçların sıklıkla kullanıldığını görüyoruz. Şüphesiz ki kullanıcıların geri dönüşleri ve uzman kadroların çalışmalarıyla çok daha etkileyici sonuçlar görmeye devam edeceğiz.
Bu araçların geliştirilme aşamasında birçok etik soru işareti olduğunun da altını çizmek gerekiyor. Telif hakkıyla korunan binlerce eser, özgün çizim tarzları, gerçek kişi fotoğrafları ve daha niceleri yapay zekanın eğitilme sürecinde kullanılabiliyor.
Yapay zeka ile ilgili şimdiye dek üzerinde konuştuğumuz her distopik fikir gibi bu teknolojinin gerçek sanatçıları bitireceği tezi bize pek de tutarlı gelmiyor. Her teknolojik yenilikte olduğu gibi, bu sürecin de yeni iş yapış biçimleri ve cazibe noktaları oluşturacağını öngörüyoruz. Yine de büyük konuşmamakta fayda var. En nihayetinde, bu yazının bir yapay zeka tarafından yazılmadığını nereden bilebilirsiniz ki?
Bu yazı Digital Report Dergisinin 15. sayısında yayınlanmıştır.