Apple, bulut sunucuları yerine doğrudan cihazlarda çalışacak şekilde tasarlanmış bir dizi açık kaynaklı büyük dil modeli (LLM) yayımladı. OpenELM (Açık Kaynaklı Verimli Dil Modelleri) adı verilen bu LLM’ler, yapay zeka kodunun paylaşıldığı bir topluluk olan Hugging Face Hub üzerinden erişime açıldı.
Apple’in yayınladığı belgelerde (PDF) belirtildiği üzere, toplamda sekiz OpenELM modeli bulunmakta ve bunlardan dört tanesi CoreNet kütüphanesi kullanılarak önceden eğitilmiş, diğer dört tanesi ise talimatla ayarlanan modeller olarak kullanıcılara sunuluyor. Apple, doğruluğu ve verimliliği artırmayı hedefleyen katman bazında bir ölçeklendirme stratejisi kullanıyor. Bu yüzden sekiz adet farklı model bulunuyor.
Apple yapay zeka konusunda açık kaynaklı strateji sergiliyor
Apple, yayınladığı LLM’lerde sadece final eğitim modelini değil, kodun eğitim günlüklerini ve birden fazla versiyonunu da paylaşmış durumda. Projenin arkasındaki araştırmacılar, bu yaklaşımın doğal dil yapay zekası alanında daha hızlı ilerlemeye ve “daha güvenilir sonuçlara” yol açacağını umuyor. Apple’ın yayınladığı belgelerde araştırmacılar yapay zekanın doğruluk payını şu şekilde açıkıyor:
“OpenELM, son teknoloji bir açık dil modeli. OpenELM, dönüştürücü modelin her katmanı içinde parametreleri verimli bir şekilde tahsis etmek için katman bazında bir ölçeklendirme stratejisi kullanıyor. Bu sayede yapay zeka daha düzgün bir şekilde geliştirilmiş doğruluk elde edebiliyor. Örneğin, yaklaşık bir milyar parametre bütçesiyle OpenELM, OLMo’ya kıyasla %2,36 oranında bir doğruluk iyileştirmesi sergilerken, 2 kat daha az önceden eğitim tokeni gerektiriyor.
Sadece model ağırlıkları ve çıkarım kodunun sağlandığı, özel veri kümelerinde ön eğitim yapıldığı önceki uygulamalardan farklı olarak, yayınımız, dil modelinin kamu erişimine açık veri kümelerinde eğitimi ve değerlendirmesinin tam çerçevesini içermekte, eğitim günlükleri, çok sayıda kontrol noktası ve önceden eğitim yapılandırmaları dahil.”

Apple, OpenELM modellerini piyasaya sürerek, en yeni dil modelleriyle açık araştırma topluluğunu “güçlendirmeyi ve zenginleştirmeyi” amaçladığını da söylüyor. Açık kaynak modellerin paylaşımı, araştırmacılara riskleri, veri ve model yanlılıklarını inceleme fırsatı sunuyor. Geliştiriciler ve şirketler, modelleri olduğu gibi kullanabilir veya değişiklikler yapabilirler.
Bilgi paylaşımının açık olması, Apple’ın en iyi mühendisleri, bilim insanlarını ve uzmanları işin içine almak için önemli bir araç haline geldi; çünkü bu, Apple’ın gizlilik politikaları altında normalde yayımlanamayacak araştırma makaleleri kullanıcılara sunularak geliştirme fırsatları sunuyor.
Threads, X’e meydan okuyor
Apple, bu tür yapay zeka yeteneklerini henüz cihazlarına getirmiş değil ancak iOS 18’in bir dizi yeni yapay zeka özelliği içermesi bekleniyor ve söylentilere göre Apple, gizlilik amaçlı büyük dil modellerini cihazda çalıştırmayı planlıyor. Bu adımlar, kullanıcı gizliliğine öncelik verirken teknolojik ilerlemeyi sürdürmenin yeni yollarını arayan teknoloji devinin stratejisinin bir parçası olarak görülüyor.
Öne çıkan kaynak görseli: Michał Kubalczyk / Unsplash




