Çinli yapay zeka araştırma laboratuvarı DeepSeek, son dönemde büyük bir çıkış yakalayarak uluslararası sahnede dikkatleri üzerine çekti. Apple App Store’un en popüler uygulamalar listesinde zirveye oturan DeepSeek’in yapay zeka modelleri, Wall Street analistleri ve teknoloji uzmanlarını ABD’nin yapay zeka liderliğini sürdürebileceği konusunda düşündürmeye başladı. Ayrıca, yapay zeka çiplerine olan talebin geleceği konusunda da soru işaretleri yarattı.
Peki, DeepSeek nasıl bu kadar hızlı bir şekilde küresel çapta ün kazandı? İşte şirketin yükseliş hikayesi.
DeepSeek’in kökenleri: Finans ve yapay zeka buluşması
DeepSeek, Çin merkezli hedge fonu olan High-Flyer Capital Management tarafından desteklenen bir yapay zeka girişimidir. Şirketin arkasındaki isim olan Liang Wenfeng, Zhejiang Üniversitesi’nde öğrenci olduğu yıllarda finansal piyasalara ilgi duymaya başladı ve 2015 yılında High-Flyer’ı kurdu. 2019 yılında ise yapay zeka algoritmalarını kullanarak yatırım kararları alan High-Flyer Capital Management’ı bir hedge fon olarak yapılandırdı.
2023 yılında High-Flyer, finans sektöründen bağımsız olarak yapay zeka araştırmalarına odaklanmak amacıyla DeepSeek’i bir laboratuvar olarak kurdu. Bu girişim kısa süre içinde bağımsız bir şirket haline geldi. DeepSeek, ilk günden itibaren kendi veri merkezlerini kurarak yapay zeka modellerini eğitmeye başladı. Çin’deki diğer yapay zeka şirketleri gibi, DeepSeek de ABD’nin donanım ihracat kısıtlamalarından etkilendi. Şirket, güçlü H100 çiplerini kullanamaması nedeniyle yapay zeka modellerini eğitmek için Nvidia’nın daha az güçlü olan H800 çiplerini kullanmak zorunda kaldı.
DeepSeek’in teknik ekibi, genç yeteneklerden oluşuyor. Şirket, Çin’in önde gelen üniversitelerinden yapay zeka alanında doktora yapan araştırmacıları agresif bir şekilde işe alıyor. Ayrıca, bilgisayar bilimi geçmişi olmayan bireyleri de bünyesine katarak yapay zeka modellerinin farklı konuları daha iyi anlamasını sağlıyor.
DeepSeek’in güçlü yapay zeka modelleri
DeepSeek, Kasım 2023’te ilk yapay zeka modellerini tanıttı: DeepSeek Coder, DeepSeek LLM ve DeepSeek Chat. Ancak şirketin asıl dikkat çekmesi, bir sonraki nesil DeepSeek-V2 modellerini piyasaya sürmesiyle oldu.
DeepSeek-V2, hem metin hem de görsel analiz yapabilen genel amaçlı bir model olarak birçok yapay zeka kıyaslama testinde başarılı sonuçlar elde etti. Üstelik, dönemin benzer modellerine kıyasla çok daha düşük maliyetle çalıştırılabiliyordu. Bu gelişme, Çin’deki rakiplerini zor durumda bıraktı; ByteDance ve Alibaba gibi devler, kendi yapay zeka modellerinin kullanım fiyatlarını düşürmek ve bazılarını ücretsiz hale getirmek zorunda kaldı.
Aralık 2024’te piyasaya sürülen DeepSeek-V3 modeli ise şirketin itibarını daha da artırdı. İç test sonuçlarına göre, DeepSeek V3 hem Meta’nın Llama modeli gibi indirilebilir açık kaynaklı yapay zeka modellerini hem de OpenAI’nin GPT-4o gibi yalnızca API erişimiyle kullanılabilen kapalı modelleri geride bıraktı.
Buna ek olarak, Ocak 2025’te piyasaya sürülen DeepSeek R1 modeli, şirketin “mantık yürütebilen” (reasoning) yapay zekalar geliştirme konusundaki iddiasını ortaya koydu. R1 modeli, OpenAI’nin o1 modeliyle kıyaslanabilecek bir performans sergiliyor. Mantıksal çıkarım yapabilen bu model, yanılgıları minimize ederek daha güvenilir sonuçlar sunuyor. Ancak, bu tür modellerin işlem süresi geleneksel yapay zeka modellerine kıyasla biraz daha uzun sürüyor.
Çin menşeli bir yapay zeka şirketi olması nedeniyle DeepSeek’in modelleri, Çin’in internet düzenleyicileri tarafından sıkı denetimlere tabi tutuluyor. Örneğin, DeepSeek’in chatbot uygulaması, Tiananmen Meydanı olayları veya Tayvan’ın bağımsızlığı gibi konular hakkında yanıt vermiyor.
DeepSeek’in yıkıcı iş modeli
DeepSeek’in iş modeli hala tam olarak net değil. Şirket, ürün ve hizmetlerini piyasa değerinin çok altında fiyatlandırıyor ve bazılarını tamamen ücretsiz sunuyor. DeepSeek, bu agresif fiyatlandırmayı, elde ettiği verimlilik kazanımlarıyla mümkün kıldığını öne sürse de bazı uzmanlar şirketin sunduğu maliyet verilerini sorguluyor.
Şirketin yapay zeka modelleri, açık kaynak olarak tanımlanmamakla birlikte ticari kullanım için oldukça esnek lisanslarla sunuluyor. Hugging Face CEO’su Clem Delangue’nin açıklamalarına göre, platformda DeepSeek’in R1 modelinden türetilmiş 500’den fazla model bulunuyor ve bu modeller toplamda 2,5 milyon kez indirilmiş durumda.
DeepSeek’in agresif stratejisi, büyük rakipleri zor durumda bıraktı. Şirketin yükselişi, Nvidia’nın hisse değerinin %18 düşmesine neden oldu ve OpenAI CEO’su Sam Altman’ın bile konuyla ilgili açıklama yapmasını sağladı.
Ancak, DeepSeek’in geleceği hala belirsiz. Şirketin daha gelişmiş modeller üzerinde çalıştığı kesin olsa da ABD hükümeti, Çin yapımı yapay zeka modellerinin oluşturabileceği potansiyel riskler konusunda giderek daha temkinli yaklaşıyor. Bu durum, DeepSeek’in küresel pazar stratejisini doğrudan etkileyebilir.
DeepSeek’in önümüzdeki dönemde nasıl bir yol izleyeceği merak konusu. Ancak şu bir gerçek ki, şirket şu an için yapay zeka dünyasında büyük bir etki yaratmış durumda.




