Yapay zekada akıl yürütme karbon ayak izini artırıyor • Digital Report

Araştırmacılar ve iklim savunucuları, yapay zekanın çevresel etkileri konusunda endişelerini dile getirirken, yeni yayımlanan bir araştırma, tüm yapay zeka istemlerinin aynı çevresel etkiye sahip olmadığını ortaya koydu.

Frontiers in Communication dergisinde yayımlanan bu çalışma, 14 farklı büyük dil modelini (LLM) standartlaştırılmış 500 soruluk bir set kullanarak değerlendirdi. Araştırma, daha karmaşık “akıl yürütme modellerinin”, daha küçük ve verimli temel modellere kıyasla önemli ölçüde daha fazla CO₂ ürettiğini gösterdi. Bazı durumlarda, akıl yürütme modelleri, temel modellerin emisyonlarının 50 katına kadarını oluşturdu. Özellikle karmaşık veya açık uçlu sorular, daha büyük bir karbon çıktısı ile sonuçlanıyor.

Çalışma, her modelin eğitim verilerinin boyutuna göre değiştiğini ve her sorgu başına belirli sayıda “düşünme belirteci” ürettiğini, bu belirteçlerin CO₂ emisyonları ile ilişkili olduğunu belirtiyor. Araştırmacılar, akıl yürütme modellerinin, daha büyük eğitim setlerine sahip olmaları ve işleme ve yanıt verme sürelerinin daha uzun olması nedeniyle daha fazla CO₂ ürettiğini tespit etti. Modellerin yanı sıra, istemlerin ürettiği CO₂ miktarı konu alanına göre de değişiklik gösteriyor. Örneğin, ileri matematik veya felsefe gibi konuları içeren daha karmaşık veya açık uçlu sorular, lise tarihi soruları gibi daha basit istemlere göre daha büyük bir karbon çıktısı üretiyor.

Hochschule München Uygulamalı Bilimler Üniversitesi’nden doktora öğrencisi ve makalenin yazarı Maximilian Dauner, “Eğitilmiş LLM’leri sorgulamanın çevresel etkisi, onların akıl yürütme yaklaşımları tarafından güçlü bir şekilde belirlenir, açık akıl yürütme süreçleri enerji tüketimini ve karbon emisyonlarını önemli ölçüde artırır,” ifadelerini kullanıyor.

Muhakeme (ya da akıl yürütme) modelleri olarak adlandırılan bu büyük dil modelleri, mantık, adım adım çözümlemeler veya ayrıntılı talimatlar gerektiren daha karmaşık görevleri çözmek için optimize ediliyorlar. Bu modeller, bazı LLM araştırmacılarının düşünce zinciri olarak adlandırdığı bir işleme yöntemini kullanıyor, bu da onların hız ve netliği önceliklendiren genel modellerden daha bilinçli yanıtlar vermesini sağlıyor.

Buradaki amaç, akıl yürütme modellerinin daha insan benzeri yanıtlar üretmesi; ancak bunun en belirgin yan etkisi, akıl yürütme modellerinin yanıt üretmesinin daha uzun sürmesi. Araştırmacılar, akıl yürütme modellerinin, CO₂ emisyonları ile ilişkili token’ları, temel modellere kıyasla önemli ölçüde daha fazla ürettiğini tespit etti. Token’lar (belirteçler) LLM’nin anlayabileceği sayısal temsillerine dönüştürülen kelimeler veya kelime parçalarını ifade ediyorlar.

Testler iki aşamada gerçekleştirildi. İlk aşamada, araştırmacılar modellere aynı çoktan seçmeli soruları sordu. İkinci aşamada ise, modeller yazılı yanıtlar verdi. Ortalama olarak, akıl yürütme modelleri soru başına 543,5 token üretirken, temel modellerde bu sayı ortalama 37,7 token oldu. İncelenen muhakeme modellerinden Cogito, benzer boyutlu ve temel yanıtlar için optimize edilmiş modellere göre üç kat daha fazla CO₂ üretti. Dauner, “Kullanıcılar, yapay zeka tarafından üretilen çıktıların, örneğin kendilerini bir aksiyon figürüne dönüştürmenin tam CO₂ maliyetini bilselerdi, bu teknolojileri ne zaman ve nasıl kullanacakları konusunda daha seçici ve düşünceli olabilirlerdi,” diyor.