Adobe SlimLM korsan kitap kullandığı gerekçesiyle dava edildi • Digital Report

Oregonlu yazar Elizabeth Lyon adına ABD’de Adobe şirketine karşı toplu dava açıldı. Dava, şirketin SlimLM yapay zeka modelini eğitmek için korsan kitaplar kullandığı iddiasını taşıyor. Bu gelişme, yapay zeka eğitim verilerindeki telif hakkı ihlalleri tartışmalarını yeniden alevlendirdi.

Adobe, son yıllarda yapay zekaya yoğun yatırımlar yaptı. Şirket, 2023 yılında Firefly adlı yapay zeka destekli medya üretim paketi dahil çeşitli hizmetleri piyasaya sürdü. SlimLM programı ise mobil cihazlarda belge yardım görevleri için optimize edilmiş küçük dil modelleri serisi olarak tanımlandı. Bu modeller, Cerebras tarafından Haziran 2023’te yayımlanan SlimPajama-627B veri kümesi üzerinde ön eğitim aldı. Söz konusu küme, yinelenmiş verilerden arındırılmış, çok kaynaklı ve açık kaynaklı bir yapıya sahip bulundu.

Davacı Elizabeth Lyon, rehber kitaplar kaleme alan bir yazar. Lyon adına açılan dava dilekçesinde, SlimPajama veri kümesinin RedPajama veri kümesinin kopyalanması ve manipüle edilmesiyle oluşturulduğu ileri sürüldü. RedPajama içinde yer alan Books3 koleksiyonu, 191 bin kitaptan oluşan dev bir arşiv olarak biliniyor. Dava, SlimPajama’nın Books3’ü içerdiği ve Lyon’un telif hakkıyla korunan eserlerinin bu kümede izinsiz kullanıldığı belirtildi. Lyon’un avukatları, Adobe’nin bu korsan verileri eğitim sürecinde kullandığına dikkat çekti.

Dava dilekçesinde şu ifadeye yer verildi: “SlimPajama veri kümesi, RedPajama veri kümesini (Books3 dahil) kopyalayarak ve manipüle ederek oluşturuldu. Dolayısıyla RedPajama’nın türevi bir kopyası olan SlimPajama, Books3 veri kümesini ve davacı ile sınıf üyelerinin telif hakkıyla korunan eserlerini içermektedir.”

Books3 koleksiyonu, yapay zeka sektöründe sıkça dava konusu olan bir kaynak haline geldi. Eylül ayında Apple’a karşı açılan davada, şirketin Apple Intelligence modelini eğitirken Books3’teki telif hakkıyla korunan materyalleri izinsiz kullandığı iddia edildi. Davacılar, eserlerin kredi veya tazminat olmaksızın kopyalandığını savundu. Ekim ayında ise Salesforce’a benzer bir dava yöneltildi. Bu davada da RedPajama veri kümesinin eğitim amaçlı kullanıldığı belirtildi.

Yapay zeka şirketleri, dev veri kümeleri üzerinde modellerini eğitiyor. Ancak bazı kümelerin korsan materyaller içerdiği yönündeki iddialar artıyor. Eylül ayında Anthropic, Claude sohbet botunu eğitmek için korsan eserler kullandığı gerekçesiyle dava edildi. Şirket, yazarlara 1,5 milyar dolar tazminat ödemeyi kabul ederek uzlaştı. Bu anlaşma, yapay zeka eğitim verilerindeki telif hakkı davalarında dönüm noktası olarak değerlendirildi.

Adobe’ye yönelik dava, Reuters tarafından ilk olarak raporlandı. Şirketten henüz resmi bir açıklama yapılmadı. Telif hakkı sahipleri, yapay zeka devlerinin veri toplama pratiklerini yargıya taşıyor. Sektörde benzer davaların sayısının artması bekleniyor.

İLGİNİZİ ÇEKEBİLİR

Haber bülteni