Apple tarafından yayımlanan yeni bir çalışma, profesyonel tasarımcıların doğal iş akışları üzerinden verdikleri geri bildirimlerin, yapay zeka modellerinin performansını devasa ölçekli genel sistemlerin ötesine taşıdığını kanıtladı.
Şirketin makine öğrenimi portalında yayımlanan veriler, Qwen2.5-Coder tabanlı özelleştirilmiş bir modelin, kullanıcı arayüzü (UI) tasarım kalitesinde OpenAI’ın GPT-5 modelini geride bıraktığını gösteriyor. Araştırma, geleneksel puanlama yöntemlerinin tasarım disiplininin gerektirdiği derin teknik bilgiyi yakalamakta yetersiz kaldığını ortaya koyuyor.
Tasarımcı iş akışları veri kalitesini dönüştürüyor
Çalışma kapsamında iki ila otuz yıl arasında deneyime sahip 21 profesyonel tasarımcı, yapay zeka çıktılarını dört farklı yöntemle değerlendirdi. Klasik ikili karşılaştırma ve metin tabanlı yorumlama gibi yöntemlerin yanı sıra, tasarımcılar arayüzler üzerinde doğrudan eskiz çizerek veya tasarım yazılımlarında revizyonlar yaparak geri bildirim sağladı.
Elde edilen 1.460 açıklama, modellerin eğitimi için tercih verisine dönüştürüldü. Bağımsız değerlendiriciler, tasarımcıların doğrudan yaptığı revizyonlara %76,1 oranında katılırken, basit sıralama yöntemlerine verilen onay %49,2’de kaldı. Bu oran, geleneksel yöntemlerin neredeyse rastgele seçim kadar verimsiz olduğunu kanıtlıyor.
“Arayüz tercihlerinde tasarımcıların doğal iş akışlarından elde edilen veri çiftleri, geleneksel sıralama yöntemlerine kıyasla çok daha düşük hata payı ve yüksek tutarlılık barındırıyor.”
Açık kaynaklı modeller devasa sistemlere meydan okuyor
Apple araştırmacıları, tasarımcılardan gelen zengin veriyi kullanarak Qwen2.5-Coder modelini ORPO adı verilen bir optimizasyon yöntemiyle eğitti. Ortaya çıkan model, aralarında mülkiyet hakları saklı olan GPT-5‘in de bulunduğu tüm temel sistemleri kullanıcı arayüzü tasarım testlerinde geride bıraktı.
Bulgular, yüksek kaliteli ve uzman odaklı verinin, model boyutundan daha kritik bir faktör haline geldiğini gösteriyor. Apple, ml-rldf adını verdiği bu eğitim metodolojisini ve ilgili modelleri GitHub üzerinden kamuya açık hale getirdi.
Geleneksel eğitim metodolojileri verimlilik sınavı veriyor
Araştırma, yapay zeka modellerinin hizalanmasında kullanılan standart “beğen/beğenme” mekanizmalarının tasarım gibi görsel alanlarda yetersiz kaldığını vurguluyor. Revizyon tabanlı geri bildirimler, not başına ortalama 3,45 dakika ile en zaman alıcı yöntem olsa da sağladığı veri hassasiyetiyle en yüksek performansı sunuyor. Eskiz tabanlı geri bildirim ise hem görsel netlik hem de operasyonel hız açısından en verimli orta yol olarak tanımlanıyor.
Apple’ın bu yaklaşımı, tasarım sistemlerinin otomatize edilmesinde insan uzmanlığının sisteme entegre edilme biçimini kökten değiştiriyor.




