ElevenLabs Conversational AI 2
Teknoloji

ElevenLabs’in yeni ses modelini gerçekten ayırmak resmen imkansız!

Yapay zeka, özellikle konuşma ve ses teknolojileri alanında işletmeler için baş döndürücü bir hızla ilerliyor. Bu alandaki en son ve en dikkat çekici gelişmelerden biri de, eski Palantir mühendisleri tarafından kurulan ve iyi finanse edilen ses ve yapay zeka ses efektleri girişimi ElevenLabs’ten geldi. Şirket, müşteri desteği, çağrı merkezleri ve dış aramalı satış ve pazarlama gibi kurumsal kullanım senaryoları için gelişmiş sesli aracılar oluşturmaya yönelik platformu Conversational AI 2.0’ı duyurdu.

Bu lansman, ElevenLabs‘in hızlı geliştirme taahhüdünü yansıtan bir şekilde, orijinal platformun ilk çıkışından sadece dört ay sonra gerçekleşti. Ayrıca, rakip sesli yapay zeka girişimi Hume’un kendi yeni, sıra tabanlı sesli yapay zeka modeli EVI 3’ü piyasaya sürmesinden sadece bir gün sonra geldi. Bu gelişme, aynı zamanda yeni açık kaynaklı yapay zeka ses modellerinin sahneye çıkmasının ve bazı yapay zeka etkileyicilerinin ElevenLabs’in “öldüğünü” ilan etmesinin ardından geldi.

Görünüşe göre bu ilanlar, doğal olarak, erkendi.

ElevenLabs’in mühendislik ekibinden Jozef Marko’ya göre, Conversational AI 2.0, selefinden önemli ölçüde daha iyi ve ses odaklı deneyimler için yeni bir standart belirliyor.

Akıllı sıra alma modeli ile kulağa doğal gelen sohbetler

Conversational AI 2.0’ın en önemli özelliklerinden biri, son teknoloji ürünü sıra alma modeli. Bu teknoloji, geleneksel ses sistemlerinde meydana gelebilen garip duraklamaları veya kesintileri ortadan kaldırarak insan konuşmasının inceliklerini ele almak üzere tasarlandı.

Tereddütler ve dolgu kelimeleri gibi konuşma ipuçlarını gerçek zamanlı olarak analiz ederek, aracı ne zaman konuşacağını ve ne zaman dinleyeceğini anlayabiliyor.

Çok dilli destek

Conversational AI 2.0, ayrıca entegre dil algılama özelliği sunarak manuel yapılandırmaya gerek kalmadan sorunsuz çok dilli tartışmalara olanak tanıyor. Bu yetenek, aracının kullanıcı tarafından konuşulan dili tanımasını ve aynı etkileşim içinde buna göre yanıt vermesini sağlıyor.

Bu özellik, farklı müşteri tabanları için tutarlı hizmet arayan küresel işletmelere hitap ederek dil engellerini ortadan kaldırıyor ve daha kapsayıcı deneyimler sunuyor.

En güçlü eklemelerden biri de yerleşik Alım Artırılmış Üretim (RAG) sistemi. Bu özellik, yapay zekanın harici bilgi tabanlarına erişmesine ve ilgili bilgileri anında almasına olanak tanırken, minimum gecikme süresini ve güçlü gizlilik korumalarını sürdürüyor.

Örneğin, sağlık hizmetleri ortamlarında bu, bir tıbbi asistan aracısının tedavi kılavuzlarını bir kurumun veritabanından gecikmeden çekebileceği anlamına geliyor.

Müşteri desteğinde ise aracılar, kullanıcılara daha etkili yardımcı olmak için güncel ürün ayrıntılarına dahili belgelerden erişebiliyor.

Alternatif kişilikler esneklik sağlıyor

Bu temel özelliklere ek olarak, ElevenLabs’in yeni platformu çoklu modaliteyi destekliyor; yani aracılar ses, metin veya her ikisinin bir kombinasyonuyla iletişim kurabiliyor. Bu esneklik, geliştiriciler üzerindeki mühendislik yükünü azaltıyor, çünkü aracıların farklı iletişim kanallarında çalışması için yalnızca bir kez tanımlanması yeterli oluyor.

Aracı ifadesini daha da geliştiren Conversational AI 2.0, çoklu karakter moduna izin vererek tek bir aracının farklı kişilikler arasında geçiş yapmasını sağlıyor.

Büyük ölçekli dış erişimi otomatikleştirmek isteyen işletmeler için platform artık toplu aramaları destekliyor. Kuruluşlar, Conversational AI aracılarını kullanarak aynı anda birden fazla dış arama başlatabiliyor; bu yaklaşım anketler, uyarılar ve kişiselleştirilmiş mesajlar için oldukça uygun.

Kurumsal standartlar ve fiyatlandırma

İletişim ve etkileşimi geliştiren özelliklerin ötesinde, Conversational AI 2.0, güven ve uyumluluğa güçlü bir vurgu yapıyor. Platform, katı gizlilik ve veri koruması gerektiren sağlık uygulamaları için kritik bir gereklilik olan tamamen HIPAA uyumlu. Ayrıca, Avrupa’daki veri egemenliği gereksinimleriyle uyumlu olarak isteğe bağlı AB veri yerleşikliğini de destekliyor.

ElevenLabs, bu uyumluluk odaklı özellikleri kurumsal düzeyde güvenlik ve güvenilirlikle pekiştiriyor. Yüksek kullanılabilirlik ve üçüncü taraf sistemlerle entegrasyon için tasarlanan Conversational AI 2.0, hassas veya düzenlenmiş ortamlarda faaliyet gösteren işletmeler için güvenli ve güvenilir bir seçenek olarak konumlanıyor.

Fiyatlandırma konusunda ise ElevenLabs’in web sitesinde şu anda Conversational AI içeren abonelik planları şu şekilde:

  • Free: Aylık $0. 15 dakika kullanım, 4 eş zamanlı işlem sınırı. ElevenLabs’e atıfta bulunulması gerekir ve ticari lisanslama içermez.
  • Başlangıç: Aylık $5. 50 dakika kullanım, 6 eş zamanlı işlem sınırı.
  • Creator: Aylık $11 (indirimli fiyat, normal fiyatı $22). 250 dakika kullanım, 6 eş zamanlı işlem sınırı. Ek dakika başına yaklaşık $0.12.
  • Pro: Aylık $99. 1.100 dakika kullanım, 10 eş zamanlı işlem sınırı. Ek dakika başına yaklaşık $0.11.
  • Scale: Aylık $330. 3.600 dakika kullanım, 20 eş zamanlı işlem sınırı. Ek dakika başına yaklaşık $0.10.
  • Business: Aylık $1.320. 13.750 dakika kullanım, 30 eş zamanlı işlem sınırı. Ek dakika başına yaklaşık $0.096.

Conversational AI 2.0 ile ElevenLabs, işletmelerin dijital etkileşimlerin standardını yükselten, gerçekten akıllı, bağlamdan haberdar sesli aracılar oluşturmaları için araçlar ve altyapı sağlamayı amaçlıyor.

Daha fazla bilgi edinmek isteyenler için ElevenLabs, geliştiricileri ve kuruluşları belgelerini keşfetmeye, ElevenLabs geliştirici portalını ziyaret etmeye veya Conversational AI 2.0’ın müşteri deneyimlerini nasıl geliştirebileceğini görmek için satış ekibiyle iletişime geçmeye teşvik ediyor.