DeepSeek
Yapay Zeka

DeepSeek, R1’in yıl dönümünde yeni yapay zeka modelinin sinyallerini verdi

Çinli yapay zeka girişimi DeepSeek, sektörde dengeleri değiştiren R1 modelinin piyasaya çıkışının birinci yıl dönümünde bir sonraki büyük adımın ipuçlarını paylaştı. 20 Ocak’ta şirketin GitHub üzerindeki FlashMLA kod tabanında yapılan güncellemeler, “MODEL1” kod adıyla geliştirilen gizemli bir projeyi açığa çıkardı. Sektör kaynakları bu sızıntının, Şubat ayı ortasında yani Ay Yeni Yılı döneminde tanıtılması beklenen gelişmiş DeepSeek V4 sürümünün habercisi olduğunu belirtiyor.

Donanım kısıtlamalarını aşan yeni teknoloji yolda

Yeni modelin varlığını hissettirmesiyle eş zamanlı olarak yayınlanan akademik makale, yaklaşmakta olan sürümün teknik altyapısına dair önemli veriler sunuyor. Şirket “Engram” adını verdiği yeni bir hafıza mimarisi geliştirerek Çin ve ABD arasındaki çip teknolojisi farkını yazılımla kapatmayı hedefliyor. Bu yöntem sayesinde yeni nesil modeller, pahalı ve sınırlı GPU bellekleri yerine standart sistem RAM’ini kullanarak çok daha verimli çalışabilecek.

Microsoft ve batılı rakipler endişeli

Microsoft Başkanı Brad Smith’in Çinli rakiplerin batı dışındaki pazarlarda öne geçtiğine dair uyarılarının hemen ardından gelen bu hamle rekabeti kızıştırıyor. Test aşamasındaki modelin “Samanlıkta İğne” olarak bilinen veri bulma testlerinde yüzde 84’ten yüzde 97 başarı oranına sıçraması, DeepSeek V4’ün özellikle kodlama ve karmaşık akıl yürütme görevlerinde endüstri standartlarını yeniden belirleyebileceğini gösteriyor.