NVIDIA, insansı robotların geliştirilmesini iyileştirmeyi hedefleyen yeni yapay zeka araçlarını duyurdu. Bu araçlar arasında yenilikçi öğrenme iş akışları, simülasyonlar ve modelleme yetenekleri bulunuyor. Duyuru, Münih, Almanya’da düzenlenen ve robotik ile makine öğrenmesinin kesişim noktasını keşfetmeye odaklanan yıllık Robotik Öğrenme Konferansı’nda (CoRL) yapıldı.
NVIDIA’nın duyurusunun önemli noktalarından biri, NVIDIA’nın Omniverse platformu üzerine inşa edilen açık kaynaklı robot öğrenme çerçevesi NVIDIA Isaac Lab’ın tanıtımı oldu. Bu platform, geliştiricilere robotları gerçekçi 3D ortamlarında simüle etme, eğitme ve test etme olanağı sunarak, AI davranışlarını fiziksel dünyada devreye almadan önce sanal olarak iyileştirmeyi mümkün kılıyor. NVIDIA, Boston Dynamics, Agility Robots ve 1X gibi şirketlerin Isaac Lab’ı robot geliştirme iş akışlarını kolaylaştırmak amacıyla zaten kullandığını belirtti.
NVIDIA’nın duyurusunda öne çıkan bir diğer özellik ise Cosmos tokenizer’ın genel kullanıma sunulması oldu. Bu araç, video girişlerini AI için işleyerek yüksek kaliteli sıkıştırma oranları sağlıyor ve mevcut tokenizer’lardan 12 kat daha hızlı çalışıyor. Cosmos, kameralardan gelen verileri optimize ederek robotların çevreleriyle etkileşime geçmesini ve nesneleri tanımasını sağlayan daha doğru AI temsil modelleri oluşturulmasına yardımcı oluyor. Bu teknoloji, olgun bir muzun nasıl kavranması gerektiğinden bir kağıdın nasıl tutulması gerektiğine kadar birçok ayrıntılı kararı doğru bir şekilde kodlama ve çözme yeteneği sunuyor.
NVIDIA’nın insansı robot geliştirme girişimi olan Project GR00T, altı yeni öğrenme iş akışıyla büyük bir destek alıyor. Bu iş akışlarını aşağıda görebilirsiniz:
GR00T-Gen: Geliştiricilerin, robotları nesne manipülasyonu veya navigasyon gibi görevlerde eğitmek için simüle edilmiş ortamlar oluşturmasına yardımcı oluyor. Eğitim ortamlarını güçlendirmek için büyük dil modelleri ve 3D üretken yapay zeka modelleri kullanarak çeşitli ve rastgeleleştirilmiş sahneler oluşturuyor.
GR00T-Mimic: İnsanların görerek öğrenme özelliğini robotlara kazandırıyor. İnsan operatörleri, robotların aynı hareketleri gerçekleştirmesini sağlamak amacıyla robotları teleoperasyonla kontrol ediyor. Örneğin, bir depoda kutuları raflardan çekip arabalara yerleştirme gibi görevleri insan gösterimleriyle öğreniyor. Bu teknik, Apple Vision Pro gibi genişletilmiş gerçeklik araçlarının kullanımıyla da uygulanabiliyor.
GR00T-Dexterity ve GR00T-Control: Hassas el hareketlerini ve geniş vücut kontrolünü geliştirmek için modeller sunuyor. GR00T-Dexterity, robotların hassas el hareketlerini iyileştirirken, GR00T-Control ise tüm vücut hareketlerine odaklanarak robotların koordinasyon ve görevleri gerçekleştirme yeteneklerini geliştiriyor.
GR00T-Mobility: İnsansı robotların karmaşık ortamlarda çeviklikle hareket etmelerine yardımcı olmak için öğrenme tabanlı bir yaklaşım sunuyor. Bu model, robotların yeni ortamlara hızla uyum sağlamasına yardımcı olmayı hedefliyor.
GR00T-Perception: ReMEmbR adlı bir bellek özelliği tanıtıyor, bu sayede robotlar uzun vadeli olay geçmişlerini hatırlayarak insan-robot etkileşimini iyileştiriyor. Bu, robotlara daha iyi bir bağlam anlayışı kazandırarak etkileşim sırasında adaptasyon yeteneğini artırıyor.
Daha fazla şirketin robotik geliştirmede yapay zekaya yöneldiği bu dönemde, NVIDIA sanal simülasyonlar ile gerçek dünya dağıtımı arasındaki boşluğu kapatma konusunda önemli adımlar atıyor. Özellikle Project GR00T iş akışları, geliştiricilerin insansı robotları inşa etme ve eğitme yaklaşımlarını devrim niteliğinde değiştirmesi beklenen yeni araçlarla bu karmaşık makineleri daha verimli ve insan ortamlarına daha uyumlu hale getiriyor.