OpenAI Point-E yapay zeka sektörünü sarsacak bir sonraki yenilik olabilir. Bu hafta OpenAI tarafından geliştirilen ve kullanıma açılan Point-E, metin komutundan 3B nesne üretiyor.
Bir makaleye göre, Point-E’nin tek bir NVIDIA V100 işlemciyle bir ila iki dakika içerisinde 3B modeller oluşturabildiği iddia ediliyor.
OpenAI Point-E 3B nesneler oluşturmuyor. Bunun yerine, 3B şekilleri yansıtan uzaydaki veri noktalarının ayrık koleksiyonları olan nokta bulutları oluşturuyor.
OpenAI Point-E nedir?
Point-E, tek başına duran ağ oluşturma modelinin dışında iki modelden oluşuyor: bir metinden görüntüye model ve bir görüntüden 3D’ye model. OpenAI’nin kendi DALL-E 2 ve Stable Diffusion gibi görsel üretme araçlarına benzeyen metinden görüntüye modeli, kelimeler ve görsel kavramlar arasındaki ilişkileri anlamak için etiketli görüntüler üzerinde geliştirildi. Görüntüden 3B’ye modeli ise 3B nesnelerle eşleştirilmiş bir dizi görüntüyle besleniyor, böylece ikisi arasında etkili bir şekilde çeviri yapmayı öğrendi.
Bir metin istemi verildiğinde örneğin, “3D yazdırılabilir bir dişli, 3 inç çapında ve yarım inç kalınlığında tek bir dişli” Point-E’nin metinden görüntüye modeli, görüntüden 3D’ye modeline beslenen sentetik bir işlenmiş nesne üretiyor ve bu da bir nokta bulutu oluşturuyor.
OpenAI araştırmacılarına göre Point-E, modelleri “birkaç milyon” 3B nesne ve ilgili meta verilerden oluşan bir veri kümesi üzerinde geliştirdikten sonra, genellikle kelime istemleriyle eşleşen renkli nokta bulutları üretebildi. Kusursuz değil; zaman zaman Point-image-to-3D E’nin modeli, görüntüyü metinden görüntüye modelinden yorumlayamıyor ve metin istemine karşılık gelmeyen bir şekle yol açıyor. Buna rağmen OpenAI ekibi bu yöntemin önceki son teknolojiden çok daha hızlı olduğunu iddia ediyor.
Canva ve OpenAI’dan yeni chat robotu: Canva Magic Write
Yöntemimiz bu değerlendirmede son teknoloji tekniklerden daha kötü performans gösterse de, zamanın küçük bir kısmında örnek üretiyor.”
“Bu, belirli uygulamalar için daha pratik hale getirebilir veya daha yüksek kaliteli 3D nesnelerin keşfedilmesine olanak sağlayabilir.”
-OpenAI ekibi
OpenAI Point-E, proje tasarlamak için güçlü bir araç olabilir
Point-E tarafından oluşturulan nokta bulutları, örneğin 3D baskı yoluyla gerçek nesneler oluşturmak için kullanılabiliyor. Sistem biraz daha rafine hale getirildiğinde, örgü dönüştürme modelinin de eklenmesiyle oyun ve animasyon üretim süreçlerinde de kullanım alanı bulabiliyor.
Her ne kadar 3D nesne üretimi pazarına giren en yeni araç olsa da, OpenAI’ın daha önce de söylendiği gibi kesinlikle ilk değil. Google’ın 2021 yılında piyasaya sürdüğü üretken bir 3D teknolojisi olan Dream Fields’ın daha gelişmiş bir versiyonu bu yılın başlarında DreamFusion adıyla piyasaya sürülmüştü.
DreamFusion, Dream Fields’ın aksine, herhangi bir ön eğitime ihtiyaç duymuyor. Bu sebeple, 3B veri olmadan nesnelerin 3B modellerini oluşturabiliyor. Şu anda 2B görsel oluşturma araçları ilgi odağı olsa da, model sentezleyen yapay zeka bir sonraki büyük endüstriyel yıkıcı olma potansiyeline sahip. 3D modeller bilim, iç tasarım, mimari, film ve televizyon alanlarında sıklıkla kullanılıyor. Mühendisler modelleri yeni ekipmanlar, araçlar ve yapılar için tasarım olarak kullanırken, mimarlık firmaları bunları önerilen binaları ve peyzajları göstermek için kullanıyor.