Apple, sessizliğini bozarak yapay zeka alanındaki en son gelişmesini duyurdu: MM1. Çoklu ortam becerileri ile öne çıkan bu yeni model, görüntüye metin ekleme, görsel sorulara yanıt verme ve doğal dil çıkarımı gibi birçok alanda önemli işlevler sunuyor.
MM1’in çoklu ortam yetenekleri
MM1, 30 milyar parametreye kadar destekleyen ve “bir dizi yerleşik çoklu modül kıyaslamada, denetlenmiş ince ayar sonrasında rekabetçi performans elde eden” bir model içerisinde yer alıyor. Apple araştırmacılarının da açıkladığı gibi MLLM’ler (çoklu ortam büyük dil modelleri) geleneksel LLM’lerin ardından “temel modellerdeki bir sonraki hali” olarak ortaya çıkıyor ve “üstün yeteneklere” sahip oluyorlar.

MM1, “transformer” adı verilen bir teknolojiyi kullanıyor. Transformer, metni ve görselleri işlemede son derece başarılı bir yöntem. MM1, bu teknolojiyi kullanarak metni anlayabilir, görselleri yorumlayabilir ve kodu üretebilir. Apple araştırmacıları hem görüntü hem de metin içeren modelleri eğitmek konusunda önemli bir atılım gerçekleştirdiklerine inanıyorlar.
Son 10 yılda çok yönlü yapay zeka önemli bir değişimden geçti. İlk modeller, metin ve görsel işleme için ayrı AI modellerini bir araya getirerek çalışıyordu. Daha sonra araştırmacılar, AI’ya karma veri kümeleri sunarak bu modelleri geliştirmeye başladılar. 2019-2020 yıllarında transformer teknolojisinin kullanımı, AI’nın öğrenme kapasitesini önemli ölçüde artırdı. Günümüzde ise büyük modeller ve karma veri kümeleri, MM1 gibi son derece güçlü AI modellerini ortaya çıkardı.

Etkileyici performans iddiaları
MM1’in sunduğu bazı etkileyici performans örnekleri ise:
- Görüntüye metin ekleme: MM1, bir görüntüyü analiz ederek ve içeriğini açıklayan metin oluşturarak görsel içeriklerin daha erişilebilir hale gelmesine katkıda bulunur.
- Görsel sorulara yanıt verme: Görsellerle ilgili karmaşık sorulara bile doğru, hızlı yanıtlar sunarak bilgi edinme ve öğrenmeyi kolaylaştırır.
- Doğal dil çıkarımı: Metinlerdeki örtük anlamları ve ilişkileri analiz ederek metinlerin daha derinlemesine anlaşılmasına imkan tanır.
MM1, bu bileşenler arasında akıcı bir bilgi alışverişi sağlayarak farklı görevleri başarıyla yerine getiriyor. MM1, GLUE (dil anlama), ImageNet (görsel tanıma) ve Code Completion (kod tamamlama) gibi farklı alanlarda yapılan testlerde son derece başarılı sonuçlar elde etti. 30 milyar parametreyle çalışan MM1, 540 milyar parametreli PaLM modelinden bile daha yüksek dil anlama puanı aldı.

Apple’ın yapay zekada yeni stratejisi mi?
MM1’in duyurulması, Apple’ın yapay zeka alanındaki sessizliğini bozması ve bu alandaki iddiasını ortaya koyması açısından önemli bir gelişme olarak yorumlanıyor. Apple CEO’su Tim Cook’un da ifade ettiği gibi şirket AI ve makine öğrenmesini “temel teknolojiler” olarak görüyor. Ayrıca şirket bu alandaki yatırımlarını artırıyor.
MM1’in geliştirilmesi, Apple’ın yapay zeka alanındaki stratejisinde bir değişime işaret ediyor olabilir. Şirket, bu alanda daha aktif bir rol oynamaya ve kendi modellerini ile araçlarını geliştirmeye odaklanıyor gibi görünüyor.
MM1’in geleceği ve sektöre etkisi
MM1’in halen test aşamasında olduğunu ve ne zaman kamuya açık hale geleceği belirsizliğini koruduğunu belirtmek önemli. Ancak bu modelin, Apple’ın ürünlerinde ve hizmetlerinde yapay zekanın daha yaygın kullanılmasına öncülük etmesi ve sektöre önemli katkılar sağlaması bekleniyor.
X’in yapay zekası Grok açık kaynaklı hale geldi
MM1’in duyurulması, yapay zeka alanındaki gelişmelerin hız kazandığını ve bu alandaki rekabetin arttığını gösteriyor. Apple’ın bu alandaki yatırımları, önümüzdeki yıllarda önemli inovasyonlara ve yeni ürünlere yol açabilir.
Öne çıkan kaynak görseli: Furkan Demirkaya




