OpenAI, gelişmiş büyük dil modeli GPT-4o’yu duyurdu. Bir yıl önce piyasaya sürülen GPT-4’ün evrimleşmiş hali olan bu model, ChatGPT aracılığıyla halka kısmen ücretsiz olarak sunulacak.
OpenAI’nin en son teknolojilerine herkesin erişebilmesi hedefleniyor. OpenAI yeni dil modeliyle beraber ücretsiz olarak üst seviye dil modellerini sınırlı şekilde kullanıma sundu. Ücretsiz kullanıcılar GPT-4o’yu günlük limitle ulaşabilecekler, limit bitince tekrar ChatGPT-3.5’a geri dönüş olacak.
Ücretsiz kullanıcıların normalde böyle bir erişimi yoktu, yeni güncelleme yapay zeka rekabetini de kızıştıracak gibi. Ayrıca OpenAI yatırım almaya da devam ediyor. OpenAI Girişim Fonu, erken aşama yapay zeka şirketlerine odaklanan bir fon olarak, son bildirimde ABD Menkul Kıymetler ve Borsa Komisyonu’na 5 milyon dolar daha topladığını duyurdu. Geçen yıl 175 milyon dolarlık taahhüt alan fon, bu yılın başında 325 milyon dolar brüt net varlık değerine ulaştı.
GPT-4o ile sohbetler, çeviriler ve daha fazlası
GPT-4o, ChatGPT‘nin işlevselliğini artırarak metin, ses ve görüntü üzerinden etkileşimlere olanak tanıyor. Kullanıcılar tarafından sağlanan ekran görüntüleri, fotoğraflar, belgeler veya grafikler gibi çeşitli görsel girdileri analiz edip tartışabiliyor. OpenAI’nin Teknoloji Direktörü Mira Murati, ChatGPT’nin artık hafıza yeteneklerine sahip olacağını, kullanıcılarla önceki etkileşimleri hatırlayabileceğini ve bunlardan öğrenebileceğini vurguladı. Model ayrıca gerçek zamanlı çeviriyi de destekliyor; bu da kullanım kolaylığını ve erişilebilirliğini daha da artırıyor.
OpenAI’ın baş teknoloji sorumlusu Mira Murati’nin bir canlı yayında belirttiğine göre GPT-4o “GPT-4 seviyesinde zekayı her şeye, ücretsiz kullanıcılar dahil, getiriyor.” Özellikler, gelecek haftalarda kullanıma sunulacak. Ücretli kullanıcılar, ücretsiz kullanıcılara göre beş kat daha fazla kapasite sınırına sahip olacak. GPT-4o, 2023 sonlarında piyasaya sürülen GPT-4 Turbo’dan iki kat daha hızlı ve %50 daha ucuz olarak geliştirildi. 50 dilde kullanılabilir olacak ve geliştiricilerin onunla çalışmaya başlaması için API’ye de eklenecek.
Yatırımların devam ettiği OpenAI’da GPT-4o’yu ara bir model olarak tanımlayabiliriz. Arayüzün değiştiği biraz daha modern ve halka açık bir yapayı kavuştuğu ChatGPT; Google’ın Gemini’sine, Meta’nın Llama’sına ve Anthropic karşı biraz daha kapalı kutu olarak kalıyordu. Özellikle yapay zeka sistemlerinin birçok aracı kendi bünyesinde bulundurması ChatGPT’yi biraz demode yapıyordu. Fakat GPT-4o ile üstünden bu yükleri kaldırmak istiyor.
GPT-4o ile gelen OpenAI yenilikleri
OpenAI, bu yılın başlarında hesap açma zorunluluğunu kaldırdıktan sonra daha fazla kullanıcıya yapay zeka araçlarını sunmayı amaçlayan masaüstü ve mobil uygulama duyurdu. Yenilenen kullanıcı arayüzü, ChatGPT ile daha doğal bir seviyede iletişim kurma imkanı sunuyor ve kullanıcıların başlangıç noktası olarak videolar paylaşmalarına olanak tanıyor. GPT-4o ile gelen bütün özellikler ise:
- Çok modlu kabiliyetler: Metin, ses ve görüş üzerinden bilgi işleyebilme yeteneği, çeşitli etkileşimler ve analizler yapabiliyor.
- Masaüstünde ses modu: Daha önce sadece mobilde bulunan ses modu artık Mac masaüstü uygulamasında da kullanılabiliyor, bu da erişilebilirliği ve kullanılabilirliği artırıyor.
- Gerçek zamanlı konuşma işleme: Sesli girdileri doğrudan işleyerek anında ve doğal iletişim sağlıyor, bu da transkripsiyona (konuşma dilinin ya da işaret dilinin yazılı hale gelmesi) ihtiyaç duymadan gerçekleşiyor.
- Gelişmiş özelliklere ücretsiz erişim: Veri, kodlama ve görsel analiz araçları gibi ileri düzey özellikler artık ChatGPT’nin ücretsiz versiyonunda da mevcut, bu da daha fazla kullanıcının bu gelişmiş AI araçlarına erişimini sağlıyor.
- Artırılmış kaynak verimliliği: GPT-4o, önceki modellerine göre daha kaynak verimli çalışıyor, bu da gelişmiş özelliklerin ek maliyet olmadan kullanıcıya sunulmasını mümkün kılıyor.
- Canlı çeviri yeteneği: AI, konuşulan dili anında çevirebiliyor, bu da çok dilli iletişimde büyük bir avantaj sağlıyor.
- Gerçek zamanlı etkileşimli yardım: Kullanıcılar, GPT-4o ile gerçek zamanlı olarak etkileşim kurarak sorularına anında yanıt alabiliyor, bu da özellikle eğitim ve profesyonel alanlarda oldukça faydalı.
- Kişiselleştirilmiş etkileşim: GPT-4o, bağlamı anlayarak kullanıcı girdilerine göre adapte olabiliyor ve kişiselleştirilmiş yanıtlar verebiliyor.
- Ücretli aboneler için artırılmış günlük istek limitleri: Ücretsiz versiyon kapsamlı özellikler sunarken, ücretli aboneler günlük beş kat daha fazla istek yapabiliyor, bu da yoğun kullanıcılar için büyük bir avantaj sağlıyor.
- Masaüstü görü işlevselliği: Masaüstü uygulama, ekranda sunulan görsel bilgileri, örneğin grafikleri veya belgeleri analiz edebilir ve gerçek zamanlı geribildirim ve içgörüler sağlar.
GPT-4o’nun etkileyici kullanım alanları
- İleri düzey gerçek zamanlı kodlama: GPT-4o’nun geliştirilmiş yetkinlikleri, özellikle gerçek zamanlı olarak kodu gözlemleme ve analiz etme konusunda yazılım geliştiriciler için paha biçilmez bir araç haline geliyor. Ekipler, GPT-4o’nun hata geri bildirimleri, optimizasyon önerileri ve güvenlik değerlendirmeleri sunarak geliştirme döngülerini hızlandırabiliyor ve kod kalitesini artırabiliyor.
- Online eğitimi dönüştürme: GPT-4o, uzaktan eğitimi devrim niteliğinde değiştirerek öğrencilerin ders sırasında gerçek zamanlı sorular sorabilmesini ve anında sesli yanıtlar alabilmesini sağlıyor. Bu özellik, sanal sınıflara entegre edildiğinde, uzaktan eğitimi geleneksel sınıf ortamları kadar dinamik ve etkileşimli hale getiriyor.
- Kişiselleştirilmiş fitness ve terapi Seansları: GPT-4o’nun ses işleme yeteneklerini kullanarak, kullanıcıların ses tonları ve stres seviyelerine dayalı olarak kişiselleştirilmiş fitness koçluğu veya terapötik rehberlik sunabiliyor. Bu, kullanıcının duygusal ve fiziksel durumuna gerçek zamanlı olarak adapte olan daha kişiselleştirilmiş sağlık tavsiyeleri, egzersiz programları veya hatta ruh sağlığı desteği sağlıyor.
- Sesle yönlendirilen veri görselleştirme geri bildirimi: GPT-4o’nun ses ve görsel işlevsellikleri, profesyonellerin karmaşık veri görselleştirmelerini analiz etmelerine sesli geri bildirim sağlayarak yardımcı oluyor. Kullanıcılar, grafik veya tabloları AI’ya sunarak anında, özlü ve sözlü içgörüler ve eleştiriler alabiliyor, bu da veri trendlerine dayalı hızlı karar verme süreçlerinde oldukça faydalı.
- AI destekli canlı etkinlik erişilebilirliği: GPT-4o’nun gerçek zamanlı konuşma metinleştirme ve çeviri özellikleri, kamu konuşmaları, konferanslar veya performanslar sırasında canlı altyazı ve çeviri sağlayarak işitme engelli katılımcılar veya farklı dillerde konuşanlar için erişilebilirliği artırıyor. Bu, etkinliklerin daha geniş bir kitleye ulaşmasını sağlıyor ve ekstra özel ekipman ihtiyacını ortadan kaldırıyor.
Sony, yeni PlayStation CEO’larını atadı
OpenAI’nin GPT-4o modeli, yapay zeka teknolojilerinde yeni bir döneme işaret ediyor ve çeşitli alanlardaki yapay zeka araçları yavaş yavaş bir araya gelmeye başlıyor. Bu da yapay genel zekanın tetiklenmesine ve yapay araçların çoğalmasıyla beraber doğal bir şekilde kendiliğinde ortaya çıkmasına sebep olacak gibi gözüküyor.
Öne çıkan kaynak görseli: OpenAI