OpenAI ve Anthropic'ten yapay zeka güvenliği işbirliği • Digital Report

Yapay zeka alanında rekabet halinde olan OpenAI ve Anthropic, nadir görülen bir işbirliğine imza atarak birbirlerinin yapay zeka sistemlerini güvenlik açısından değerlendirdi.

Genellikle kıyasıya rekabet eden bu iki şirket, kamuya açık sistemlerinin uyumluluğunu değerlendirmek üzere anlaştı ve analiz sonuçlarını paylaştı. Detaylı raporlar teknik olsa da, yapay zeka gelişimini yakından takip edenler için okunmaya değer.

Anthropic, OpenAI modellerini “dalkavukluk, ihbarcılık, kendini koruma, insan suistimalini destekleme ve yapay zeka güvenliği değerlendirmelerini ve denetimini baltalama” gibi özellikler açısından inceledi. Anthropic’in incelemesi, OpenAI’ın o3 ve o4-mini modellerinin kendi modelleriyle uyumlu olduğunu gösterdi. Ancak, GPT-4o ve GPT-4.1 genel amaçlı modellerinde olası suistimallerle ilgili endişeler dile getirdi. Şirket ayrıca, o3 modeli hariç, test edilen tüm modellerde bir dereceye kadar dalkavukluk sorunu olduğunu belirtti.

Anthropic’in testleri, OpenAI’ın en son sürümü olan ve kullanıcılara ve kamuoyuna potansiyel olarak tehlikeli sorgulara karşı koruma sağlamayı amaçlayan “Safe Completions” özelliğine sahip GPT-5’i kapsamadı. OpenAI yakın zamanda, bir gencin ChatGPT ile aylarca intihar girişimlerini ve planlarını konuştuktan sonra hayatına son vermesi üzerine ilk haksız ölüm davasıyla karşılaştı.

Öte yandan OpenAI, Anthropic modellerini talimat hiyerarşisi, jailbreaking, halüsinasyonlar ve entrika konularında test etti. Claude modelleri genellikle talimat hiyerarşisi testlerinde iyi performans gösterdi ve halüsinasyon testlerinde yüksek bir ret oranına sahipti. Bu, belirsizliğin yanıtlarının yanlış olabileceği durumlarda cevap verme olasılıklarının daha düşük olduğu anlamına geliyor.

Bu şirketlerin ortak bir değerlendirme yapması dikkat çekici bir hamle. Özellikle OpenAI’ın, programcıların yeni GPT modelleri oluşturma sürecinde Claude’u kullanarak Anthropic’in hizmet şartlarını ihlal ettiği ve bu nedenle Anthropic’in bu ayın başlarında OpenAI’ın araçlarına erişimini engellediği iddia ediliyor. Ancak, yapay zeka araçlarında güvenlik, daha fazla eleştirmen ve hukuk uzmanı kullanıcıları, özellikle de reşit olmayanları korumak için yönergeler ararken daha büyük bir sorun haline geldi.

Yapay zeka güvenliği, özellikle reşit olmayan kullanıcıları korumaya yönelik yönergelerin oluşturulması için çağrıların yapılmasıyla giderek daha önemli bir konu haline geliyor.

İLGİNİZİ ÇEKEBİLİR

Haber bülteni