Digital Report
  • DERGİ
  • TEKNOLOJİ
  • YAPAY ZEKA
  • PROFESYONEL
    • GİRİŞİM
    • E-TİCARET
    • FİNTEK
    • MARKA
  • GÜVENLİK
  • KRİPTO
  • OYUN
  • REHBER
No Result
View All Result
Digital Report
No Result
View All Result
Home Yapay Zeka

AI2 Bolmo 7B ve 1B’yi açtı: Bayt-seviyesi modeller

by Kerem Gülen
16/12/2025
in Yapay Zeka
AI2 Bolmo 7B ve 1B'yi açtı: Bayt-seviyesi modeller
Facebook'ta PaylaşTwitter'da PaylaşLinkedIn'de PaylaşWhatsApp'ta PaylaşTelegram'da Paylaş

Allen Institute for AI (Ai2), 14 Aralık’ta Bolmo 7B ve Bolmo 1B adlı iki açık kaynaklı dil modelini kamuoyuyla paylaştı. Geleneksel alt kelime tokenizasyonunu atlayarak ham UTF-8 baytlarını işleyen modeller, yazım hataları, nadir diller ve karakter düzeyindeki görevlerde üstün performans hedefliyor.

Ai2 yetkilileri, Bolmo’nun dünyanın ilk tamamen açık bayt-seviyesi dil modelleri olduğunu belirtti. Mevcut Olmo 3 modelleri temel alınarak geliştirilen sistem, sıfırdan eğitilmek yerine iki aşamalı bir süreçle dönüştürüldü. Birinci aşamada Olmo 3 transformeri dondurulurken, yerel kodlayıcı, sınır belirleyici ve dil modelleme başı gibi özel bileşenler 9,8 milyar token üzerinde eğitildi. İkinci aşamada ise tam model 39,3 milyar ek token ile çalıştırıldı.

Bolmo 7B, alt kelime tabanlı öncülüne matematik, mantık yürütme, kodlama ve genel bilgi testlerinde eşdeğer sonuçlar üretirken, CUTE ve EXECUTE gibi karakter odaklı ölçütlerde yaklaşık yüzde 20 puan üstünlük sağladı. Meta’nın BLT 7B dahil diğer bayt-seviyesi modellere kıyasla kod, matematik ve karakter anlayışı görevlerinde en güçlü genel performansı sergiledi.

Model mimarisi, mLSTM tabanlı yerel kodlayıcıyla bağlamsal bayt temsilleri oluşturuyor, ardından sınır belirleyici baytları değişken uzunluktaki “yama”lara gruplandırarak Olmo 3 transformerine besliyor. Çözümleme hızları saniyede yaklaşık 125 bayt olarak ölçülürken, buna karşılık gelen alt kelime modelleri 150 bayt/saniye hızına ulaşıyor.

Ai2 araştırmacıları, ince ayar sonrası yeteneklerin bayt-seviyesi modellere “görev aritmetiği” ile aktarılabileceğini gösterdi. İnce ayarlı alt kelime modellerinden ağırlık farkları eklenerek IFEval talimat takip ölçütünde Bolmo’nun performansı yüzde 31,1’den yüzde 67,4’e yükseltildi; bu oran orijinal Olmo 3 ince ayarlı noktasına yüzde 66,9 ile neredeyse eşitti.

Bayt-seviyesi modeller hala nadir kalıyor; Meta’nın Aralık 2024’te tanıttığı Byte Latent Transformer (BLT) ile ilgi artsa da, Google’ın ByT5 ve CANINE gibi erken modelleri eğitim ve çözümleme hızlarındaki yavaşlıklar nedeniyle sınırlı benimseme gördü. Ai2, Bolmo’yu Dolma 3 veri seti, açık kod depoları ve karakter düzeyinde verilerle eğitti.

Enstitü, model kontrol noktalarını, kaynak kodunu ve teknik makaleyi açık kaynak çerçevesi altında erişime açtı.

Tags: AI2featured

İLGİLİ YAZILAR

Windows JPG dosyası güvenlik açığı
Güvenlik

Windows’ta JPG dosyalarını etkileyen kritik güvenlik açığı keşfedildi

by Emre Çıtak

ESET araştırmacıları, Windows işletim sisteminde bulunan ve en yaygın resim formatlarından biri olan JPG dosyaları üzerinden sistem güvenliğini tehdit eden...

Read moreDetails
iPhone Air 2 için 2026 umudu yeniden doğdu
Teknoloji

iPhone Air 2 için 2026 umudu yeniden doğdu

by Emre Çıtak

Apple'ın "süper ince" telefon denemesi iPhone Air'in geleceği bir süredir belirsizliğini koruyordu. İlk modelin satışlarının beklentilerin altında kalması ve 2027'ye...

Read moreDetails
Teslanın Avrupa satışları çakıldı, BYD öne geçti
Marka

Tesla’nın Avrupa satışları çakıldı, BYD öne geçti

by Emre Çıtak

Avrupa Otomobil Üreticileri Birliği'nin (ACEA) Kasım ayı raporu, elektrikli araç devi Tesla için tehlike çanlarının çaldığını gösteriyor. Rapora göre, şirketin...

Read moreDetails
Lise yıllarından kalma utanç verici Gmail adresinizden yakında kurtulacaksınız
Teknoloji

Lise yıllarından kalma utanç verici Gmail adresinizden yakında kurtulacaksınız

by Emre Çıtak

Hepimizin geçmişinde, lise yıllarında aldığı ve bugün iş başvurularında kullanmaya utandığı o "çılgın_cocuk99" veya "asi_kiz" temalı bir Gmail adresi vardır....

Read moreDetails

SON YAZILAR

Xiaomi Buds 6 tanıtıldı

VEPARA’nın faaliyetleri yasa dışı bahis soruşturması kapsamında durduruldu

Windows’ta JPG dosyalarını etkileyen kritik güvenlik açığı keşfedildi

iPhone Air 2 için 2026 umudu yeniden doğdu

Tesla’nın Avrupa satışları çakıldı, BYD öne geçti

Lise yıllarından kalma utanç verici Gmail adresinizden yakında kurtulacaksınız

ChatGPT’ye reklamlar 2026’da geliyor

Google 2025’i yapay zeka fayda yılı ilan etti, OpenAI kırmızı kod ile karşılık verdi

Nvidia’nın 20 milyar dolarlık Groq satın alması yalan çıktı

X’te Artık herkes paylaştığınız fotoğrafları yapay zeka ile değiştirebiliyor

SON REHBERLER

Android telefon hafıza kartını görmüyor sorunu nasıl çözülür

Instagram’da fotoğraf paylaşma sorununu gidermenin pratik yolları

OLED ekranlarda oluşabilecek yanma sorununu önlemenin pratik yolları

Windows 10’da unmountable boot volume hatası nasıl düzeltilir

Nvidia DLAA ile oyun grafiklerinde kenar yumuşatma nasıl sağlanır

ChatGPT’yi 1 saatten kısa sürede ustaca kullanmayı öğrenin

Windows’un farklı sürümlerinde ve Mac’te şifre kaldırma

iPhone’da kilit ekranına istediğiniz metni yazma nasıl yapılır

Telegram’da engellendiğinizi pratik yöntemlerle nasıl anlarsınız

Windows’ta işletim sisteminin bit mimarisini nasıl öğrenirsiniz

BASIN BÜLTENLERİ

RTB House, Derin Öğrenme ile dijital reklamcılığın yeni işletim sistemini kuruyor

ESET, Çin bağlantılı LongNosedGoblin APT grubunu tespit etti

Simya VC’den Rudiq’e 1 milyon dolar yatırım

Huawei Cloud, İstanbul’da dijital perakende buluşması düzenledi

SteelSeries, tek kulaklıkla birden fazla platformda oyun oynama özgürlügü sunuyor

Aktif Tech, Deloitte Teknoloji Fast 50’de üçüncü oldu

Dolap, 2024 yılında 307 bin 340 ton karbon salımını önledi

Canon, Istanbul’da EOS R6 Mark III ve EOS C50 tanıttı

LG, yeni yıl için soundbar kampanyasını duyurdu

Citrix, Hibrit çoklu bulut lisans modeli sunuyor

Digital Report

© 2019 Digital Report bir Linkmedya markasıdır.

  • Dergi
  • Yazarlar
  • Basın bültenleri
  • Gizlilik
  • İletişim
  • Künye

Bizi takip edin

No Result
View All Result
  • TEKNOLOJİ
  • YAPAY ZEKA
  • PROFESYONEL
    • GİRİŞİM
    • E-TİCARET
    • FINTECH
    • MARKA
  • GÜVENLİK
  • KRİPTO
  • OYUN
  • REHBER
  • BASIN BÜLTENLERİ
  • YAZARLAR
  • DERGİ
  • KÜNYE
  • İLETİŞİM