Google, en gelişmiş akıl yürütme modeli Gemini 3 Deep Think güncellemesini duyurdu. Model, Humanity’s Last Exam’de %48.4, ARC-AGI-2’de %84.6 ve Codeforces’te 3455 Elo skoru elde ederek önemli başarılar kazandı.
Codeforces skoru, Gemini 3 Deep Think’in dünyanın en iyi 7 programcısından daha üstün performans gösterdiğini kanıtlıyor. Bu başarı, AI modellerinin yazılım geliştirme alanındaki yeteneklerinin ne kadar ilerlediğini gösteriyor.
Rutgers Üniversitesi’nde bir matematikçi, modelin insan peer review sürecinin kaçırdığı bir hatayı bulduğunu bildirdi. Duke Üniversitesi’nde ise yarıiletken kristal büyütme tasarımı konusunda araştırmacılara yardımcı oldu.
Gemini 3 Deep Think, Fizik ve Kimya Olimpiyatı’nda altın madalya seviyesinde performans göstererek bilimsel araştırmalarda da kullanılabilir hale geldi. Google AI Ultra abonelerine (250 dolar/ay) sunulan model, API üzerinden araştırmacılara erken erişim sağlıyor.
Google’ın akıl yürütme modelleri, OpenAI’nin o1 serisi ve Anthropic’in Claude ile rekabet ediyor. Gemini 3 Deep Think’in bilimsel araştırmalardaki başarısı, AI’nin sadece tüketici uygulamalarında değil, akademik alanda da devrim yaratabileceğini gösteriyor.




