Yapay zeka değerlendirme platformu LMArena, Felicis ve UC Investments öncülüğünde 150 milyon dolarlık Seri A yatırımını 1,7 milyar dolar değerleme ile duyurdu. Yatırım, şirketin geçen Mayıs ayındaki 100 milyon dolarlık tohum turuna katılan Andreessen Horowitz, The House Fund, LDVP, Kleiner Perkins, Lightspeed Venture Partners ve Laude Ventures gibi fonlardan da destek aldı.
Şirket, tohum turundan yedi ay sonra değerlemesinin üç katına çıktığını açıkladı. 2023 yılında iki UC Berkeley araştırmacısı tarafından kurulan LMArena, yapay zeka modellerinin çıktı kalitesini gerçek kullanıcı geri bildirimleriyle ölçen bir bulut platformu işletiyor. Geleneksel yapay zeka kıyaslama testlerinde veri kontaminasyonu sorunu yaşandığı kaydedildi; bu durum, modellerin hazır cevapları dış kaynaklardan bulmasıyla ortaya çıkıyor.
LMArena platformu, statik soru setleri yerine sürekli yenilenen ve kalabalıktan toplanan istemleri kullanıyor. Kullanıcılar, web araması, kod üretimi gibi görevler için sohbet botu arayüzünden yararlanıyor. Her istem, iki farklı yapay zeka modeline gönderiliyor ve çıktılar yan yana gösteriliyor. Kullanıcı en iyi yanıtı seçerek model performansını belirliyor.
Toplanan verilerle düzenli güncellenen bir liderlik tablosu oluşturuluyor. Google’ın Kasım ayında piyasaya sürdüğü Gemini 3 Pro şu anda listenin zirvesinde yer alıyor. Onu Gemini 3 Flash ve xAI Corp’un Grok 4.1 modeli takip ediyor. Yapay zeka geliştiricileri, yeni modellerini geniş çapta yayınlamadan önce bu tablodan geri bildirim topluyor.
Örneğin OpenAI Group PBC, GPT-5 modelini “summit” kod adıyla LMArena’da test etti. Şirket ayrıca, model hapishane kırma taktikleri gibi araştırmalar için veri setleri sağlıyor. LMArena Kurucu Ortağı ve Üst Yöneticisi Anastasios Angelopoulos, “İnsanlara nasıl değer sunduğunu bilmeden yapay zekayı sorumlu bir şekilde devreye alamayız. Yapay zekanın gerçek faydasını ölçmek için onu gerçek kullanıcıların eline vermemiz gerekiyor” diye ifade etti.
Seri A turu, şirketin ilk ticari hizmetini piyasaya sürmesinden dört ay sonra gerçekleşti. “AI Evaluations” adlı hizmet, geliştiricilere LMArena kullanıcılarından model değerlendirmesi sunuyor ve altta yatan veri örneklerine erişim veriyor. Şirket, bu hizmetin yıllık tüketim hızının 30 milyon doları aştığını belirtti.
Yapılan yatırım, platform işletme maliyetlerini karşılamak, yapay zeka araştırma girişimlerini finanse etmek ve ek mühendisler istihdam etmek için kullanılacak. LMArena’nın Arena Intelligence Inc. olarak resmi kaydı bulunuyor. Şirketin tohum turu da aynı yatırımcı grubundan desteklenmişti ve değerleme hızla yükselmişti.
Geleneksel kıyaslamalarda geliştiriciler, örnek istemlere doğru cevaplarla model çıktılarını karşılaştırıyor. Doğru cevap oranına göre performans ölçülüyor. Ancak veri kontaminasyonu, bu yöntemin güvenilirliğini azaltıyor. LMArena, kalabalık kaynaklı istemlerle bu sorunu giderdiğini savundu.
Liderlik tablosu, geliştiricilere model iyileştirmeleri için veri sağlıyor. OpenAI örneği gibi testler, hizmetin sektördeki etkisini gösteriyor. CEO Angelopoulos’un açıklaması, gerçek kullanıcı odaklı değerlendirmenin önemini vurguladı. AI Evaluations’ın hızlı büyümesi, talebin yüksekliğini ortaya koydu.
UC Investments, California Üniversitesi sisteminin varlık yönetimi kolu olarak öne çıkıyor. Felicis’in liderliği, turun prestijini artırdı. Şirketin büyüme hızı, yapay zeka değerlendirme pazarındaki potansiyeli yansıtıyor.
