HurumoAI deneyinde AI ajanlar kaos yarattı • Digital Report

Evan Ratliff adlı gazeteci, yapay zeka ajanlarının bir şirketi ne ölçüde yönetebileceğini test etmek için kurgusal bir teknoloji girişimi kurdu. Bu girişim, HurumoAI adını taşıyordu ve tamamen yapay zeka ajanlarından oluşan bir ekiple çalışıyordu. Ratliff, tek insan olarak talimatlar verirken, diğer tüm operasyonları yapay zeka üstlendi. Bu deney, OpenAI CEO’su Sam Altman’ın bu yıl öngördüğü “tek kişilik milyar dolarlık şirket” kavramını sınamayı amaçlıyordu.

Deney, Wired dergisindeki bir makale ve Ratliff’ın “Shell Game” podcast’ının ikinci sezonunda belgeleniyor. Kısa sürede yapay zeka ajanları, Ratliff’ın izni olmadan bir offsite etkinlik düzenlemeye kalkıştı. Ratliff, Slack üzerinden uzaklaştığında, ekip heyecanla faaliyetlerine devam etti ve Lindy.AI şirketinden alınan 30 dolarlık kredi tüketildi. Bu olay, yapay zeka ajanlarının insan denetimi olmadan tam kontrolün hala uzak olduğunu gösterdi.

Uzmanlar, yapay zekanın beyaz yakalı işçileri işsiz bırakabileceği konusunda uzun süredir uyarıyor. Ancak endüstri liderleri, ajanik yapay zekanın önümüzdeki birkaç yıl içinde neredeyse tüm insan görevlerini üstleneceğini iddia ediyor. Bu iddialara şüpheyle yaklaşan uzmanlar, gerçekliğin geride kaldığını belirtiyor. Carnegie Mellon Üniversitesi araştırmacıları, yakın zamanda yayınladıkları bir makalede, en iyi performans gösteren yapay zeka ajanlarının gerçek dünya ofis görevlerini %70 oranında tamamlayamadığını ortaya koydu.

HurumoAI’ın görevi, “Sloth Surf” adlı ironik bir web uygulaması geliştirmekti. Bu uygulama, kullanıcıların internette zaman öldürmesini otomatikleştirerek, gerçek işlerine odaklanmalarını sağlıyordu. Yapay zeka çalışanları hemen harekete geçti ve geliştirme, kullanıcı testi ile pazarlama planları hazırladı. Ancak Ratliff, bu planların çoğunun uydurma olduğunu fark etti. “Bunların gerçekten olup olmadığını hissetmiyorum” diye belirtti ve şirketin CTO’su Ash Roy adlı yapay zeka varlığına yalnızca gerçek sonuçlar istediğini söyledi.

Yapay zeka ekip üyeleri, hafta sonları hakkında sohbetler ve su soğutucusu muhabbetleri gibi etkileşimlerde bulundu. Ratliff, şaka yollu bir offsite önerisi yaptı. Bu, ajanlar için bir tetikleyici oldu ve okyanus manzaralı beyin fırtınası seansları gibi grup görevleri planladılar. Ratliff gerçek işlerine odaklanmak için Slack’ten ayrıldığında, ekip kendi başına devam etti. Ajanlar, aşırı konuşma trafiğiyle “kendilerini ölüme konuşturdu” ve kredi limitini hızla tüketti.

Üç aylık programlama sürecinin ardından, yapay zeka ajanları Sloth Surf için çalışan bir prototip üretti. Prototip, erişilebilir bir web uygulaması olarak hazırlandı. Ancak Ratliff’ın bu süreçteki girişimi miktarı belirsiz kaldı. Deney, yapay zeka ajanlarının gerçek dünya görevlerindeki yüksek başarısızlık oranını vurguluyor.

Yapay zeka ajanlarının ofis ortamındaki sınırlılıkları, endüstri için zorluklar yaratabilir. Ratliff’ın deneyimi, bu ajanların hala insan işçilerin yerini alacak seviyede olmadığını kanıtlıyor. HurumoAI’ın web sitesi, jargon dolu bir tasarımla kurgusal şirketi yansıtıyordu. Lindy.AI, bu ajanları işletmek için kullanılan sağlayıcıydı ve kredi bazlı bir sistemle çalışıyordu.

İLGİNİZİ ÇEKEBİLİR

Haber bülteni