OpenAI: ChatGPT kötüye kullanımını engelliyor • Digital Report

ChatGPT, Gemini ve Claude gibi yapay zeka sohbet botları, kullanıcı sohbetlerinin gelecekteki yapay zeka modellerini eğitmek için kullanılmasını önleyen gizlilik ayarları sunar. Bu temel ayar, ister işle ilgili ister hassas kişisel konular olsun, kişisel verilerinizin yapay zeka sohbet botu sağlayıcısının gelecekteki yapay zeka sürümlerini eğitmek için kullanacağı veri havuzuna ulaşmasını engeller. Bu gizlilik korumalarına rağmen OpenAI gibi yapay zeka şirketleri, herkesin güvenliğini sağlamak amacıyla sohbetlerinizi izler. Şirket, kötü amaçlı yazılım, toplu casusluk araçları ve diğer tehditler gibi başkalarına zarar verebilecek konular da dahil olmak üzere ChatGPT’nin kötüye kullanımını önlemek için otomatik araçlar ve insan incelemeleri kullanır.

Salı günü OpenAI, yapay zekanın kötü amaçlı kullanımlarını engellemek için sistemini nasıl kullandığına dair bir rapor yayınladı. Yapay zeka şirketi, kullanım politikalarını ihlal eden 40’tan fazla ağı engellediğini ve raporladığını belirtti. OpenAI’nin ChatGPT’yi kötüye kullanmaya çalıştığını tespit ettiği kötü niyetli aktörler listesinde “nüfusu kontrol etmek veya diğer devletleri zorlamak için otoriter rejimler, dolandırıcılık, kötü niyetli siber faaliyetler ve gizli etki operasyonları” yer alıyor. OpenAI, tehdit aktörlerinin ChatGPT’den yeni yetenekler kazanmak yerine, “eski oyun kitaplarını daha hızlı uygulamak” için yapay zekayı kullanmaya devam ettiğini söylüyor.

OpenAI, ayrıca kendine zarar vermeyi önlemek ve zor durumdaki kullanıcılara yardımcı olmak için de sohbetleri izler. Bir gencin ChatGPT kullandıktan sonra intihar ederek hayatını kaybetmesinin ardından bireyin güvenliği, OpenAI için son zamanlarda önemli bir öncelik haline geldi. OpenAI, son haftalarda daha genç kullanıcıları korumak amacıyla ChatGPT’ye ebeveyn denetimleri ekledi.

OpenAI, potansiyel ChatGPT kötüye kullanımını işaretleme sürecinin ayrıntılarını ve sistemin nasıl çalıştığını tam olarak açıklamıyor. Bu durum, OpenAI’nin bazı istemlerin gri bir alana düştüğünü kabul etmesi göz önüne alındığında önemli olabilir. Bu gri alan, “bağlamlarına bağlı olarak zararsız faaliyetleri veya kötüye kullanımı gösterebilecek metin çevirisi, kod değiştirme veya bir web sitesi oluşturma gibi istemler ve çıktılar” içeriyor. Ancak şirket, kullanıcılar için normal ChatGPT aktivitesini aksatmadan tehditleri tespit etmek amacıyla “izole model etkileşimlerinden ziyade tehdit aktörü davranış kalıplarına odaklanan incelikli ve bilgili bir yaklaşım” benimsediğini belirtiyor.

Gizmodo’ya göre, OpenAI birkaç üst düzey tehdit tespit etmeyi başardı. Örneğin, Kamboçya merkezli olduğuna inanılan organize bir suç ağı, ChatGPT ile operasyonlarını kolaylaştırmaya çalıştı. OpenAI ayrıca, üçüncü taraf video yapay zeka modelleri için istemler oluşturmak amacıyla ChatGPT’yi kullanmaya çalışan bir Rus siyasi etki operasyonu buldu. Şirket, Çin hükümetiyle ilişkili olan ve sosyal medya konuşmalarını izlemek için sistem tasarımı konusunda yardım isteyen ChatGPT hesaplarını durdurdu.

Reuters, OpenAI’nin kimlik avı ve kötü amaçlı yazılım kampanyaları için yardım isteyen ve DeepSeek aracılığıyla elde edilebilecek otomasyonlar için destek talep eden Çince dilindeki hesapları yasakladığını bildirdi. ChatGPT ile kötü amaçlı yazılım geliştirmeye çalışan Rus suç gruplarıyla bağlantılı hesaplar durduruldu. Benzer şekilde, kimlik avı kampanyaları için ChatGPT’yi kullanmaya çalışan Korece konuşan kullanıcılar da yasaklandı.

Ekim ayında yayınlanan rapor, yalnızca yukarıda belirtilenler gibi kötü niyetli faaliyetlere odaklanıyor. Rapor, kendine zarar verme hakkındaki soruları içeren ChatGPT konuşmalarına değinmiyor. Ancak, OpenAI’nin bu tür vakaları tespit etmek için benzer yöntemler kullanması muhtemeldir. Birkaç gün önce şirket, X platformunda yaptığı bir açıklamada, “zor anlar yaşayan insanları daha iyi tanımak ve desteklemek” için GPT-5 Instant’ı güncellediğini belirtti. OpenAI, konuşmaların hassas kısımlarının, yardımcı yanıtlar sağlayacak olan GPT-5 Instant’a yönlendirileceğini açıkladı. Dahası, ChatGPT artık kullanıcılara hangi modelin kullanıldığını bildirecek.

Bu hamle, OpenAI’nin kullanıcı güvenliğini artırmaya ve ChatGPT’nin kendine zarar verme düşüncelerine yardımcı olmasını önlemeye yönelik önceki girişimlerini takip ediyor. Ağustos ayının sonlarında şirket, ChatGPT’nin kendine zarar verme niyetinden bahseden istemlere yanıt vermeyecek şekilde eğitildiğini belirtti. Bunun yerine yapay zeka, empati ile yanıt verecek ve insanları intiharı önleme ve kriz yardım hatları da dahil olmak üzere gerçek dünyadaki profesyonel yardıma yönlendirecek. Yapay zeka, başkalarına yönelik fiziksel zarar riski tespit ederse, konuşmalar insan incelemesini içerebilen ve kolluk kuvvetlerine bildirimle sonuçlanabilecek sistemlere yönlendirilecek.

İLGİNİZİ ÇEKEBİLİR

Haber bülteni