Microsoft, üç yeni temel yapay zeka modelini tanıttı
Yapay Zeka

Microsoft, üç yeni temel yapay zeka modelini tanıttı

Microsoft, üç yeni yapay zeka modeli ile ses transkripti, ses üretimi ve görüntü oluşturma alanında rekabeti artırmayı hedefliyor.

Microsoft, Perşembe günü tamamen kendi bünyesinde geliştirdiği üç yeni temel yapay zeka modelini tanıttı. MAI-Transcribe-1 (konuşma transkripti), MAI-Voice-1 (ses üretimi) ve MAI-Image-2 (görüntü oluşturma) olarak adlandırılan bu modeller, OpenAI, Google ve diğer öncü laboratuvarlarla doğrudan rekabet etmeyi hedefliyor.

Bu modeller Microsoft Foundry ve yeni MAI Playground üzerinden hemen erişime açık durumda. Modeller, kurumsal yapay zeka için ticari olarak en değerli alanları kapsıyor: konuşmanın metne dönüştürülmesi, gerçekçi insan sesi üretilmesi ve görüntü oluşturulması. Bu lansman, Microsoft’un süper zekâ ekibinin açılış hamlesi olarak değerlendiriliyor. Bu ekip, altı ay önce Suleyman tarafından kuruldu.

MAI-Transcribe-1, 25 dilde en düşük ortalama Kelime Hata Oranı (WER) ile en iyi doğruluk oranını iddia ediyor. Model, sektör standartı çok dilli test olan FLEURS benchmark’ında ortalama %3.8 WER değerine ulaşıyor. Microsoft’un verilerine göre bu model, OpenAI’nın Whisper-large-v3 ve Google’ın Gemini 3.1 Flash modellerini geride bırakıyor.

Model ayrıca, dönüşüm için MP3, WAV ve FLAC dosyalarını 200MB’a kadar kabul ediyor. Microsoft, modelin toplu transkripsiyon hızının mevcut Microsoft Azure Fast teklifinin 2.5 katı olduğunu belirtti. Diarizasyon, bağlam yanlılığı gibi ek özellikler “yakında” gelecek. MAI-Voice-1 ise 60 saniye doğal ses üretebiliyor ve kişiselleştirilmiş ses oluşturmayı destekliyor. Bu modelin fiyatı 1 milyon karakter için 22 dolar. MAI-Image-2, Arena.ai liderlik tablosunda yer alıyor ve metin girişi için 1 milyon token başına 5 dolar, görüntü çıktısı içinse 1 milyon token başına 33 dolara fiyatlandırılıyor.

WPP, MAI-Image-2’yi ölçekli olarak kullanan ilk kurumsal ortaklardan biri oldu. Microsoft, OpenAI ile olan sözleşmesini yenileyerek bağımsız yapay genel zeka geliştirme hakkını elde etti. Yenilenen anlaşma, Microsoft’un 2032 yılına kadar OpenAI’nın yeniliklerinden lisans hakkı ile kendi modellerini geliştirmesine olanak sağladı.

Suleyman, bu modellerin küçük mühendis ekipleri ile yaratıldığını belirtti. Her bir modelin arka planındaki ekiplerin sayısı 10 kişiden az. “Biz daha az, ancak daha yetkili insanlarla çalışmalıyız” diyen Suleyman, “Sonuç olarak, örgütsel yapımız oldukça düz” ifadesini kullandı.

Suleyman, “humanist AI” kavramını ortaya atarak yapay zekanın insanlık hizmetinde olması gerektiğini vurguladı. Bu çerçevede, yapay zekanın insan kontrolünde kalmasını öncelikli olarak benimsediğini belirtti. Microsoft, agresif fiyatlandırma stratejisi ile rakipleri Amazon ve Google üzerindeki baskıyı artırmayı hedefliyor.