Microsoft, yapay zeka teknolojileri alanındaki en son yeniliklerinden biri olan Magentic-One platformunu duyurdu. Magentic-One, genel amaçlı bir çoklu ajan sistemi olarak, karmaşık ve çok adımlı görevleri çözmek amacıyla farklı görev ajanlarını yönlendiren modüler bir yapı sunuyor. Bu ajanlar arasında web tarayıcısı yönetimi yapan WebSurfer, dosya yönetimi için FileSurfer, kodlama görevlerini üstlenen Coder ve kodları çalıştırmak için Computer Terminal yer alıyor.
Magentic-One, özellikle yazılım mühendisliği, veri analizi ve bilimsel araştırma gibi çeşitli alanlarda kullanılabilir. Modüler yapısı sayesinde sisteme ajan eklenebilir veya çıkarılabilir; böylece esneklik sağlanırken, diğer ajanlar veya sistemin genel yapısı üzerinde değişiklik gerekmiyor.
OpenAI ve diğer üreticilerin modelleriyle çalışabiliyor
Microsoft, bu esnekliği AutoGen çerçevesi üzerinden sağlıyor ve sistemin farklı büyük dil modelleri (LLM) ve küçük dil modelleri (SLM) ile entegrasyonuna destek veriyor. Şu anda GPT-4o ve OpenAI’nin o1-preview modelleriyle test edilen Magentic-One, model-agnostik yapısıyla birçok LLM ile uyumlu çalışabiliyor.
Sistemin etkinliğini değerlendirmek amacıyla Microsoft, Magentic-One’ı çeşitli benchmark’larda test etmek için AutoGenBench adlı bir araç sundu. Bu benchmark’lar arasında GAIA, AssistantBench ve WebArena gibi çoklu adımlı planlama ve araç kullanımı içeren testler bulunuyor. Microsoft’un Ekim 2024 verilerine göre, Magentic-One bu benchmark’larda son teknoloji yöntemlere karşı rekabetçi sonuçlar elde etti.
Magentic-One’ın piyasaya sürülmesiyle birlikte, yapay zeka ajanları konusunda hareketlilik yaşandı. OpenAI, çoklu ajan sistemlerini oluşturmak ve yönetmek amacıyla Swarm adlı bir çerçeve duyururken, IBM de Bee Agent Framework’ü piyasaya sürdü. IBM’in aracı, popüler yapay zeka modelleriyle uyum sağlayacak şekilde genişletilmiş iş akışları sunuyor ve Llama 3.2 gibi modelleri destekliyor.
Magentic-One, Microsoft’un daha önceki AutoGen açık kaynak geliştirme çerçevesine dayandırılmış ve web tarama, dosya yönetimi gibi görevleri yerine getirebilen çoklu ajan sistemi olarak öne çıkıyor. Bu yeni sistem, Microsoft’un büyük rakiplerinden biri olan Salesforce’un Agentforce sistemine doğrudan bir rakip olarak tanıtıldı.
Web gezintisi, dosya izleme, kodlama işlerine odaklanıyor
Magentic-One’ın dört ana alt ajanı bulunuyor: Web gezintisi için WebSurfer, dosya ön izleme ve yönetimi için FileSurfer, kod yazımı ve programlama görevleri için Coder, ve kodları yürütmek için Computer Terminal. Orchestrator ajanı ise bu dört ajanı yönlendirerek görevlerin çözümünü sağlıyor. Microsoft’un blog gönderisine göre, Orchestrator, görevlerin planlanması, hata durumunda yeniden planlama ve görevlerin yönlendirilmesi gibi temel işlevleri yerine getiriyor.
Microsoft, Magentic-One’ın güçlü bir mantıksal çıkarım yapabilen dil modeliyle kullanıldığında en iyi performansı göstereceğini belirtiyor. Bu çoklu ajan sistemi, insan müdahalesine gerek kalmadan karmaşık görevleri yerine getirmeyi amaçlıyor. Ancak Microsoft, bu tür sistemlerin kullanımında dikkatli olunması gerektiğini, ajanların izole ortamlarda çalıştırılması ve internet erişimlerinin sınırlandırılması gerektiğini de vurguluyor. Ayrıca, ajanlara hassas verilerin veya güvenliğe duyarlı kaynakların erişimi verilmemeli ve her zaman bir insan kullanıcı tarafından denetim sağlanmalı.
Magentic-One’ın potansiyel kullanıcılarının dikkatli olmalarını isteyen Microsoft, özellikle ajanların internet erişiminin sınırlandırılması ve ajanların riskli davranışlarının tespit edilerek önlenmesi için günlüklerin yakından izlenmesi gerektiği uyarısında bulundu. Bu şekilde, Magentic-One gibi çoklu ajan sistemlerinin daha güvenli ve verimli bir şekilde kullanılması hedefleniyor.