Toronto merkezli donanım girişimi Taalas, yapay zeka modellerini genel amaçlı işlemcilerde çalıştırmak yerine doğrudan çipin fiziksel mimarisine işleyen radikal teknolojisini duyurdu.
Meta’nın Llama 3.1 8B modelini donanım seviyesinde çalıştıran bu yeni sistem, mevcut GPU tabanlı altyapılardan 10 kat daha hızlı ve 20 kat daha ucuz bir performans sergiliyor. Bu hamleyle yapay zeka bir uygulama olmaktan çıkıp işlemcinin kendi fiziksel yapısına dönüşüyor.
ChatJimmy ile saniyede 17 bin kelime hızı aşıldı
Şirket teknolojisinin gücünü sergilemek için ChatJimmy adlı sohbet robotunu ve bir çıkarım API’sini eş zamanlı olarak yayına aldı. Geleneksel bulut sistemleri saniyede ortalama 1.800 jeton üretirken Taalas’ın donanım tabanlı çözümü saniyede 17.000 jeton hızına ulaşarak insan algı sınırlarını zorluyor.
Yapılan testlerde karmaşık sorulara 0,044 saniyede yanıt verilmesi etkileşimin anlık gerçekleşmesini sağlıyor.
Sertleştirilmiş modeller bellek duvarını ortadan kaldırıyor
Yapay zeka çiplerinin en büyük darboğazı olan işlemci ve bellek arasındaki veri transferi bu yeni mimaride fiziksel olarak yok ediliyor. Hardcore Models adı verilen bu yöntemde modelin tüm ağırlıkları çiplerin metal katmanlarına kalıcı olarak işleniyor.
TSMC 6nm süreciyle üretilen 53 milyar transistörlü HC1 çipi, yüksek maliyetli HBM belleklere veya karmaşık soğutma sistemlerine ihtiyaç duymadan devasa bir verimlilik sunuyor.
Yazılımdan metale geçiş süreci iki aya iniyor
Taalas sunduğu platform sayesinde herhangi bir yapay zeka modelini sadece iki ay içinde özel bir silikon yonga haline getirebildiğini iddia ediyor.
Model donanıma kazınmış olsa da LoRA desteği sayesinde kullanıcıların belirli sınırlar dahilinde ince ayar yapmasına imkan tanınıyor. Bu esneklik yapay zekayı elektrik kadar yaygın ve erişilebilir hale getirme vizyonunun temelini oluşturuyor.
Yapay zeka modellerini genel amaçlı bilgisayarlarda simüle etmek yerine zekayı doğrudan silikonun içine döküyoruz.
Yüksek yoğunluklu ikinci nesil platform yolda
CEO Ljubisa Bajic liderliğindeki ekip 2026 baharında akıl yürütme yeteneğine sahip yeni bir modelin lansmanını hedefliyor. Yılın sonuna doğru ise daha yüksek yoğunluk sunan ikinci nesil HC2 platformunun duyurulması planlanıyor.
Taalas’ın vizyonu dev veri merkezlerine olan bağımlılığı azaltarak otonom sistemlerin ve robotların buluta ihtiyaç duymadan çok düşük güç tüketimiyle yerinde çalışmasını sağlamak üzerine kuruluyor.




