Yapay zekanın görsel üretiminde yaratıcılığının sınırlı olduğu, veri bilimi dergisi Patterns’ta yayımlanan bir araştırmayla tespit edildi. Stable Diffusion XL ile LLaVA modelleri arasında gerçekleştirilen 100 turlu “telefon oyunu”nda, görüntüler aynı 12 görsel motife dönüştü.
Sosyal medyada yapay zekanın ruhsuz reklam kampanyaları veya gizemli sanat eserleri ürettiği iddiaları yaygındı. Araştırma, bu algının tesadüf olmadığını ortaya koydu. Modeller, orijinal komuttan saparak formülleştirilmiş, Gaussian bulanıklığına sahip görüntüler oluşturdu. Yaratıcı özgünlük yerine üretkenlik için kullanılabileceği kaydedildi.
Araştırmacılar, modelleri sırayla görüntü üretmeye ve betimlemeye yöneltti. 100 tur sonunda, görüntüler pastoral manzaralar, yağmurlu gece sahneleri, sahil plajları ve gösterişli iç mekanlar gibi temalara evrildi. Bu motifler, şirket stok görsellerini andıran “görsel asansör müziği” olarak nitelendirildi.
Bir bin farklı tekrarda, yapay zekanın görsel çeşitlilik üretemediği doğrulandı. En yaygın trope’ların 12 Batı merkezli motife indirgenebilmesi, çeşitlilik sorununu alarm verici biçimde gösterdi. Araştırma, yapay zeka hakimiyetindeki içerikte insan yapımı sanatın önemini vurguladı.
Sosyal medya paylaşımlarında yapay zekanın belirgin veya tedirgin edici izleri sıkça tartışıldı. Araştırmanın bulguları, bu duyusal algının bilimsel temele dayandığını belirtti. Modellerin komut ping-pongunda orijinal temadan uzaklaşarak tekrar eden kalıplara sabitlendiği gözlendi.




