Google AI, EmbeddingGemma adlı 308 milyon parametreli yeni bir on-device (cihaz üzerinde çalışan) embedding modelini tanıttı. Bu model, özellikle mobil cihazlar ve çevrimdışı ortamlar için tasarlandı.
EmbeddingGemma’nın en önemli özelliklerinden biri, düşük inference gecikmesi sunmasıdır. EdgeTPU üzerinde 256 token için 15 ms’nin altında bir gecikmeyle çalıştığı belirtiliyor. Bu da onu gerçek zamanlı uygulamalar için uygun kılıyor.
Model, 100’den fazla dilde eğitildi ve 500 M parametrenin altındaki modeller arasında Massive Text Embedding Benchmark (MTEB) üzerinde en yüksek sıralamayı elde etti. Google’a göre EmbeddingGemma’nın performansı, özellikle çapraz dil alma ve semantik aramada, boyutunun neredeyse iki katı olan embedding modelleriyle yarışıyor veya onları aşıyor.
Modelin teknik detaylarına ve Hugging Face üzerindeki versiyonuna ilgili bağlantılardan ulaşılabilir. Google DeepMind tarafından geliştirilen bu model, yapay zeka alanında önemli bir gelişme olarak değerlendiriliyor.




