Çin merkezli yapay zeka şirketi DeepSeek, bu haftanın başında akıl yürütme modeli R1‘in açık kaynaklı bir sürümünü piyasaya sürdü. Bu gelişme, teknoloji sektöründe büyük yankı uyandırırken şirketin başarısı ve bunun yapay zeka alanındaki etkileri hakkında çeşitli yorumlar yapılıyor.
Girişim sermayedarı Marc Andreessen, DeepSeek’in başarısını “şimdiye kadar gördüğüm en şaşırtıcı ve etkileyici atılımlardan biri” şeklinde yorumladı.
R1, belirli yapay zeka testlerinde OpenAI’nin o1 modeline denk performans sergiliyor ya da daha iyi sonuçlar veriyor. Şirket, modellerinden birini eğitmenin yalnızca 5.6 milyon dolara mal olduğunu iddia ediyor. Bu rakam, önde gelen Amerikan şirketlerinin modellerini eğitmek için harcadığı yüz milyonlarca doların çok altında.
DeepSeek, bu başarıyı ABD’nin Çinli şirketlere ileri düzey çip satışını yasaklayan yaptırımları altında elde etmiş gibi görünüyor. MIT Technology Review, bu durumu yaptırımların “DeepSeek gibi girişimlerin verimliliği önceliklendiren, kaynak paylaşımını artıran ve iş birliğini teşvik eden yenilikçi yollar geliştirmesine yol açtığını” gösterdiğini yazdı. Ancak Wall Street Journal, DeepSeek’in yöneticilerinden Liang Wenfeng’in Çin başbakanına yaptığı açıklamada Amerikan ihracat kısıtlamalarının hâlâ bir darboğaz oluşturduğunu söylediğini aktardı.
DeepSeek, Çin’in bir devlet operasyonu mu?
Curai CEO’su Neal Khosla, daha spekülatif bir görüş ortaya koyarak, DeepSeek’in bir “Çin devlet operasyonu” olduğunu ve düşük maliyet iddialarının aslında Amerikan yapay zeka rekabetçiliğine zarar vermeyi amaçladığını savundu. Ancak Khosla’nın bu iddialarını destekleyecek bir kanıt sunmadığı, ayrıca babası Vinod’un OpenAI yatırımcısı olduğu da bir topluluk notunda belirtildi.
China’s #DeepSeek could represent the biggest threat to US equity markets as the company seems to have built a groundbreaking AI model at an extremely low price and w/o having access to cutting-edge chips, calling into question the utility of the hundreds of billions worth of… pic.twitter.com/wMVyczpRgT
— Holger Zschaepitz (@Schuldensuehner) January 24, 2025
Gazeteci Holger Zschaepitz ise DeepSeek’in başarısının “ABD hisse senedi piyasaları için en büyük tehditlerden biri” olabileceğini söyledi. Bir Çinli şirketin ileri düzey çiplere erişimi olmadan düşük maliyetle ileri bir model geliştirebilmesi, bu sektöre yatırılan yüz milyarlarca dolarlık sermaye harcamalarının verimliliğini sorgulatabilir.
Do people really believe this? If training models get cheaper faster and easier, the demand for inference (actual real world use of AI) will grow and accelerate even faster, which assures the supply of compute will be used https://t.co/Ra9EwqnMGL
— Garry Tan (@garrytan) January 25, 2025
Y Combinator CEO’su Garry Tan, DeepSeek’in başarısının Amerikan rakipleri için olumlu bir gelişme olabileceğini öne sürdü. Tan, “Eğer modellerin eğitimi daha ucuz, hızlı ve kolay hale gelirse, yapay zekanın gerçek dünyadaki kullanımı için talep daha da hızlanır. Bu da bilgi işlem kaynaklarının daha iyi değerlendirilmesini sağlar,” dedi.
Meta’nın Baş Yapay Zeka Bilimcisi Yann LeCun ise DeepSeek’in başarısına Çin ve ABD arasındaki bir rekabet açısından bakılmaması gerektiğini savundu. LeCun, asıl dersin “açık kaynak modellerin, özel modelleri geçmekte olduğudur” dedi.
LeCun, LinkedIn’de yaptığı açıklamada, “DeepSeek, açık araştırma ve açık kaynak çalışmalarından (örneğin, PyTorch ve Meta’nın Llama modeli) faydalandı. Yeni fikirler ürettiler ve bunları diğerlerinin çalışmalarının üzerine inşa ettiler. Çalışmaları açık kaynak olduğu için herkes bundan faydalanabilir,” ifadelerini kullandı.
Tüm bu tartışmalar, tüketicilerin ürünü denemesine olan ilgiyi artırıyor. Pazar öğleden sonra itibarıyla DeepSeek’in yapay zeka asistanı, Apple App Store’daki ücretsiz uygulamalar arasında ChatGPT’nin hemen önünde yer alarak zirveye oturdu.




