Bu hafta başında Çinli yapay zeka laboratuvarı DeepSeek, yapılan testlerde birçok rakibini geride bırakan açık yapay zeka modeli olan DeepSeek V3’ü tanıtmıştı. Model, büyük ve verimli bir yapıya sahip olup kodlama ve makale yazma gibi metin tabanlı görevleri kolaylıkla yerine getirebiliyor ancak sorun şu ki bu yeni model kendisini ChatGPT olarak tanıtıyor.
DeepSeek V3 kendisini OpenAI’nin GPT-4 modeli olarak tanıtmakla kalmıyor, aynı zamanda OpenAI’nin API’si hakkında talimatlar veriyor ve GPT-4 ile aynı esprileri yapıyor. Bu durum, yeni modelin eğitim sürecinde OpenAI tarafından oluşturulan verilerin kullanmış olabileceğini düşündürüyor.
This actually reproduces as of today. In 5 out of 8 generations, DeepSeekV3 claims to be ChatGPT (v4), while claiming to be DeepSeekV3 only 3 times.
Gives you a rough idea of some of their training data distribution. https://t.co/Zk1KUppBQM pic.twitter.com/ptIByn0lcv
— Lucas Beyer (bl16) (@giffmana) December 27, 2024
Hakiki ChatGPT benim!
DeepSeek, V3 modelinin eğitim verilerinin kaynağı hakkında çok az bilgi verdi. Ancak GPT-4’ün ChatGPT aracılığıyla oluşturduğu metinleri içeren birçok açık veri seti bulunuyor. Eğer DeepSeek V3 bu tür verilerle eğitildiyse model GPT-4’ün çıktılarından bazılarını ezberlemiş olabilir. Bu tür bir eğitim aynı zamanda yasal sorunlara da yol açabilir. OpenAI’nin kullanım şartları, ChatGPT ve diğer ürünlerinden elde edilen çıktıların, OpenAI ile rekabet eden modeller geliştirmek için kullanılmasını yasaklıyor.
Hem OpenAI hem de DeepSeek, bu iddialar hakkında yorum yapmayı reddetti. Ancak OpenAI CEO’su Sam Altman, X platformunda DeepSeek ve diğer rakiplerini hedef aldığı düşünülen bir paylaşım yaptı:
“Çalıştığını bildiğiniz bir şeyi kopyalamak (nispeten) kolaydır. Çalışıp çalışmayacağını bilmediğiniz, yeni, riskli ve zor bir şeyi yapmak ise son derece zordur.”
Yapay zeka eğitiminde kirlilik sorunu
DeepSeek V3, kendisini yanlış tanıtan ilk model değil. Örneğin, Google’ın Gemini modeli de zaman zaman Baidu’nun Wenxinyiyan sohbet botu olduğunu iddia ediyor. Bunun temel nedeni, yapay zeka modellerinin eğitim verilerinin çoğunu internetten alması ve internetin giderek daha fazla yapay zeka tarafından üretilmiş içerikle dolması. Bir tahmine göre, 2026 yılına kadar web içeriğinin %90’ı yapay zeka tarafından oluşturulmuş olabilir.
Bu “kirlilik,” yapay zeka çıktılarının eğitim veri setlerinden tamamen filtrelenmesini zorlaştırıyor. DeepSeek’in doğrudan ChatGPT tarafından oluşturulan metinler üzerinde eğitim yapmış olması mümkün. Google’ın da benzer bir suçlamayla karşılaştığı biliniyor.
Daha derin sorunlar
Eğer DeepSeek V3, GPT-4 çıktılarını hiç sorgulamadan doğru kabul ediyorsa kendini ChatGPT zannetmesinden daha büyük problemlerle de karşılaşabiliriz. Örneğinyeni model, GPT-4’ün önyargılarını ve hatalarını da büyütebilir. Bu da yapay zekanın güvenilirliği ve doğruluğu konusunda yeni endişeleri gündeme getiriyor.




