Cybergüvenlik yazılımı şirketi CrowdStrike ve Meta, yapay zeka modellerinin güvenlik operasyon merkezlerinde (SOC) performansını test etmek için açık kaynaklı bir benchmark paketi olan CyberSOCEval’i duyurdu. Bu araç, işletmelerin hızla artan yapay zeka destekli siber güvenlik araçları arasından ihtiyaçlarına en uygun olanı seçmelerine yardımcı olmayı amaçlıyor. Paket, büyük dil modellerini (LLM) olay yanıtı, tehdit analizi anlama ve kötü amaçlı yazılım testi gibi kritik siber güvenlik görevlerinde değerlendiriyor.
CrowdStrike, basın açıklamasında net benchmark’lar olmadan hangi sistemlerin, kullanım senaryolarının ve performans standartlarının gerçek dünya saldırılarında gerçek bir yapay zeka avantajı sağladığını belirlemenin zor olduğunu vurguladı. Araç, farklı yeteneklere ve fiyatlara sahip araçlar arasında seçim yapmayı zorlaştıran karmaşıklığı azaltmayı hedefliyor. Bu sayede siber güvenlik profesyonelleri, modellerin güçlü ve zayıf yönlerini daha net görebiliyor.
CyberSOCEval, yapay zeka geliştiricilerine de fayda sağlayacak. Bu çerçeve, kurumsal müşterilerin modellerini siber güvenlik görevlerinde nasıl kullandıklarına dair daha detaylı bir anlayış sunuyor. Sonuç olarak, daha özelleştirilmiş ve yetenekli siber güvenlik modellerinin geliştirilmesine yol açabilir. Araç, yapay zekanın hem tehdit hem de çözüm olarak yükselişiyle şekillenen dijital silahlanma yarışını ele alıyor.
Yapay zeka, kötü niyetli aktörler tarafından şifre kırma gibi yeni tehditler için kullanılıyor. Buna karşılık, savunma tarafı yapay zeka sistemlerini güvenlik araçlarına entegre ediyor. Mastercard ve Financial Times Longitude’un son anketi, finansal hizmetler sektöründeki birçok firmanın yapay zeka destekli siber güvenlik araçlarıyla yapay zeka tabanlı dolandırıcılara karşı milyonlarca dolar tasarruf ettiğini ortaya koydu.
Bu durum, vücuttaki bağışıklık sistemindeki biyolojik silahlanma yarışına benzetiliyor. Beyaz kan hücreleri, zararlı patojenleri tespit edip savaşırken, patojenler daha zor algılanabilir hale evriliyor. Benzer şekilde, yapay zeka destekli siber güvenlik, sürekli evrilen yapay zeka tabanlı tehditlerle mücadele ediyor. Bu nedenle, daha güvenilir araçlar ve gelişmiş test çerçeveleri giderek zorunlu hale geliyor.
Meta, uzun süredir açık kaynaklı yapay zeka alanında lider konumda. Şirketin modelleri, OpenAI’ın GPT-5 gibi tescilli modellere kıyasla geliştiricilere ağırlıklara veya nadir durumlarda kaynak koduna erişim imkanı sunuyor. Bu sayede geliştiriciler, modeller üzerine ücretsiz uygulamalar inşa edebiliyor.
CrowdStrike ile olan bu ortaklık, Meta’nın kuruluşlara daha fazla açık kaynaklı seçenek sunma çabasının son örneği. Temel satış argümanı, siber güvenlik profesyonellerine ücretsiz erişilebilir LLM değerlendirme çerçevelerinin sağlanması. Bu yaklaşım, değerlendirmeyi sadece yapay zeka geliştiren şirketlere sınırlamak yerine modellerin çok daha hızlı iyileşmesini sağlıyor.
Meta’nın Süper Zeka Laboratuvarları’nda Ürün Direktörü Vincent Gonguet, bir açıklamada şunları söyledi: “Bu benchmark’lar sayesinde, güvenlik ve yapay zeka topluluğunun daha fazla geliştirebileceği açık bir yapı oluşturuyoruz. Böylece sektör olarak, yapay zekanın gelişmiş saldırıları, özellikle yapay zeka tabanlı tehditleri korumak için potansiyelini daha hızlı açığa çıkarabiliriz.”
CyberSOCEval, ZDNET’in ana çıkarımlarına göre yapay zekanın hem siber güvenlik tehdidi hem de çözüm olduğunu vurguluyor. Benchmark’lar, LLM’leri gerçek dünya siber güvenlik görevleri için test edecek. Bu paket, geliştiricilerin daha iyi modeller oluşturmasına yardımcı olabilir.
Araç, işletmelerin 2025’te yapay zeka destekli siber tehditlerle başa çıkması için uzman tavsiyeleriyle uyumlu. Örneğin, Cursor adlı bir araçtaki kritik güvenlik açığı, kodları kötü amaçlı yazılımlara maruz bırakma riski taşıyor ve düzeltilmesi gerekiyor. Ayrıca, ChatGPT ile oluşturulan iş planlarının uyarıcı hikayelere dönüşebileceği belirtiliyor.
Çevrimiçi yapay zeka destekli dezenformasyon saldırılarına karşı dikkatli olmak şart. Bu bağlamda, CyberSOCEval gibi araçlar, yapay zeka modellerinin siber güvenlikteki rolünü güçlendiriyor. Paket, işletmelerin araç seçeneklerindeki karmaşayı yönetmesine yardımcı oluyor.
CyberSOCEval’i denemek isteyenler, GitHub üzerinden indirebilir. Proje web sitesinde benchmark’lar hakkında daha fazla detay bulunuyor. Bu açık kaynaklı girişim, siber güvenlik ekosistemini dönüştürme potansiyeline sahip.




