DeepSeek R2, Huawei Ascend çip sorunlarıyla gecikti
Yapay Zeka

DeepSeek R2, Huawei Ascend çip sorunlarından gecikti

Çinli yapay zeka devi DeepSeek, Huawei’nin Ascend çipleriyle yaşadığı teknik zorluklar nedeniyle en son modeli R2’nin piyasaya sürülmesinde beklenmedik gecikmelerle karşılaştı.

Çinli yetkililer, şirketi daha olgun ve güvenilir kabul edilen Nvidia’nın H20 sistemlerine bağımlı olmak yerine yerli işlemcileri kullanmaya teşvik etmişti. Huawei mühendislerinin yerinde destek vermesine rağmen DeepSeek, Ascend çipleriyle başarılı bir eğitim çalıştırması tamamlayamadı. Bu nedenle şirket, eğitim için Nvidia donanımına, çıkarım görevleri için ise Ascend’e güvendi.

Başlangıçta Mayıs 2025’te piyasaya sürülmesi planlanan R2’nin lansmanı, bu teknik engeller ve güncellenmiş eğitim veri kümesi için beklenen süreden daha uzun süren veri etiketleme nedeniyle ertelendi. DeepSeek’in kurucusu Liang Wenfeng’in, modelin ilerlemesinden duyduğu memnuniyetsizliği dile getirdiği ve DeepSeek’in rekabet avantajını koruyacak bir model üretmek için ek geliştirme süresine ihtiyaç duyulduğunu vurguladığı bildirildi.

Bu arada, Alibaba’nın Qwen3 gibi rakipler bu gecikmeden faydalandı. Qwen3, DeepSeek’in temel eğitim algoritmalarını entegre ederken verimlilik ve esnekliği artırdı. Bu durum, tek bir startup zorlansa bile yapay zeka ekosistemlerinin ne kadar hızlı gelişebileceğini gösterdi.

Pekin’in yapay zekada kendi kendine yeterlilik konusundaki geniş kapsamlı çabası, yerli firmalar üzerinde yerel donanımı benimseme baskısı oluşturdu. Ancak pratikte bu strateji, Huawei çipleri ile Nvidia ürünleri arasında kararlılık, çipler arası bağlantı ve yazılım olgunluğunda boşluklar olduğunu ortaya koydu.

Geliştiriciler, yapay zeka ekosistemlerinin başarısını şekillendirmede kritik bir rol oynamaya devam ediyor. Nvidia, Çinli geliştiricilere erişimin stratejik olarak önemli olduğunu vurguladı ve teknoloji benimsemeyi kısıtlamanın ekonomik ve ulusal güvenlik çıkarlarına zarar verebileceği konusunda uyardı.

Çinli yapay zeka şirketleri ise büyük dil modellerini (LLM) geliştirme ve dağıtmada hükümet baskıları ile pratik gerçeklikler arasında denge kurmak zorunda kalıyor. Bu aksaklıklara rağmen DeepSeek’in R2 modeli önümüzdeki haftalarda piyasaya sürülebilir.

Modelin, daha olgun donanım üzerinde eğitilmiş rakiplerine kıyasla performansı açısından incelemeye tabi tutulması muhtemeldir. Bu durum, siyasi hırslar, teknik yetenek ve gerçek dünya yapay zeka dağıtımı arasındaki gerilimin açık bir örneğini sunmaktadır.