Gemini Live'a kamera ve ekran paylaşımı geldi
Teknoloji

Gemini Live’a kamera ve ekran paylaşımı geldi

Google, gecen seneki Made by Google etkinliginde tanıttıgı Gemini Live’ı daha da geliştiriyor. Yapılan son güncelleme ile Gemini Live, kamera görüntüsünü ve ekranı paylaşma yeteneklerine kavuştu. Google, Gemini Live’ın kamera paylaşım özelliklerinde önemli bir iyileştirme yaptı ve etkileşimleri daha doğal hale getirmek için yeni bir ses modeli geliştirdi.

Android Authority’nin haberine göre, Gemini Live’daki bu görsel iyileştirmeler sayesinde, kamera görüntüsündeki belirli nesneler görsel katmanlarla vurgulanabilecek. Bu özellik, kullanıcıların nesneleri daha kolay tanımlamasına ve tavsiye almasına yardımcı olacak. Vurgulanan nesneler, beyaz kenarlıklı dikdörtgenler içinde gösterilecek ve geri kalan alan biraz karartılarak nesnenin öne çıkması sağlanacak.

Bu “görsel rehberlik” özelliği sayesinde kullanıcılar, kamera görüntüsündeki öğeleri hızlıca bulup tanımlayabilecekler. Örneğin, bir makinedeki doğru dügmeyi bulmak, bir kuş sürüsündeki belirli bir kuşu işaret etmek veya bir proje için doğru aleti belirlemek mümkün olacak. Ayrıca, Gemini’den bir etkinlik için uygun ayakkabıları önermesi gibi tavsiyeler de alınabilecek.

Google ürün yöneticisi, bu özelliğin karmaşık durumlarda da işe yaradıgını belirtti. Yurt dışı seyahatinde, yabancı dildeki işaretler ve yerel kurallar nedeniyle park edip edemeyecegini anlamakta zorlandıgı bir durumda, Gemini Live’ı kullanarak park etmenin mümkün olup olmadıgını sordu. Gemini, yerel kuralları araştırıp işaretleri çevirerek, ücretsiz olarak park edebilecegi bir yeri işaretledi.

Görsel rehberlik özelliği, Google Pixel 10 serisinde varsayılan olarak sunulacak ve önümüzdeki haftadan itibaren diger Android cihazlara da gelecek. Özellik, ilerleyen haftalarda iOS cihazlarına da yaygınlaştırılacak. Bu özellik için Google AI Pro veya Ultra aboneligi gerekmeyecek.

Görsel katmanların yanı sıra, Google, Gemini Live’ı daha duyarlı ve etkileyici konuşmalar için tasarlanmış yeni bir ses modeliyle de güncelliyor. Bu yeni model, kullanıcının söylediklerine daha uygun tepkiler verecek. Örneğin, stresli bir konu hakkında konuşuluyorsa, daha sakin ve ölçülü bir ses tonuyla yanıt verecek.

Google, kullanıcıların yeni ses modelinin kendileriyle nasıl konuştuğunu kontrol edebilecegini de belirtiyor. Gemini’nin söylediklerini takip etmekte zorlanılıyorsa, daha yavaş konuşması istenebilecek. Veya aceleleri varsa, hızlanması talep edilebilecek.

Son olarak, Gemini’den tarihi bir figürün bakış açısıyla dramatik bir hikaye anlatması da istenebilecek. Google blog gönderisinde, “Gemini’den Roma imparatorlugunu Julius Caesar’ın bakış açısıyla anlatmasını isteyin ve karakter aksanlarıyla zengin, ilgi çekici bir anlatım elde edin” denildi.

Gemini Live’ın yeni görsel katmanlar özelliğinin Android XR gözlükleri için daha uygun oldugu düşünülse de, bu gözlüklere ulaşmamıza daha çok zaman oldugu için mobil cihazlarda da mevcut olması olumlu karşılanıyor.

Bu makale, 26.05.2024 tarihinde 19.50’de (ET) güncellenerek dogal ses modeliyle ilgili bölüm düzeltilmiş ve Google’ın blog gönderisinden demo görselleri eklenmiştir.