OpenAI ücretsiz ChatGPT’nin sağlık yanıtlarını güçlendirdi
Yapay Zeka

OpenAI ücretsiz ChatGPT’nin sağlık yanıtlarını güçlendirdi

OpenAI, ücretsiz ChatGPT modeli GPT-5.5 Instant’ın sağlık sorularında şirket içi testlerde daha iyi sonuç verdiğini açıkladı.

OpenAI, ücretsiz ChatGPT kullanıcıları için varsayılan model olan GPT-5.5 Instant’ın sağlık sorularında, şirketin kendi sağlık değerlendirmelerine göre öncü Thinking modelleriyle benzer performans gösterdiğini duyurdu.

Sağlık, yapay zeka tarafından üretilen yanıtlar konusunda en fazla incelenen kategorilerden biri olarak öne çıkıyor. Guardian’ın bir araştırmasında, bazı Google AI Özeti yanıtlarının yanlış tıbbi rehberlik sağladığı bildirilmişti. Google’ın bu durumun ardından bazı tıbbi sorgular için AI Özeti’ni kaldırdığı aktarıldı. OpenAI’nin güncellemesi de aynı yüksek riskli kategoriye giriyor ancak şirket bunu bir gerileme yerine iyileşme iddiası olarak sunuyor.

Bu değişiklik, sağlık yayıncıları ve SEO uzmanları için ChatGPT üzerinde büyük bir ücretsiz kullanıcı kitlesine tıbbi yanıtlar sunulması anlamına geliyor. Kullanıcıların bu yanıtlar için doğrudan kaynak sitelere gitmesi gerekmiyor. OpenAI, HealthBench ve klinik versiyonu HealthBench Professional’da elde ettiği kazanımlara atıfta bulundu. Şirket, GPT-5.5 Instant’ın yerini aldığı GPT-5.3 Instant modelinden daha yüksek puanlar aldığını belirtti.

OpenAI, canlı trafikte gerçeklik sorunlarında azalma kaydettiğini de bildirdi. Şirket, sağlık yanıtlarının en az bir olası gerçeklik sorunu için işaretlendiği oranın 2 ay içinde %71 düştüğünü açıkladı. Bu oranın, OpenAI’nin üretim trafiğinde yürüttüğü izlemelerden elde edildiği belirtildi. Şirket, doktorlarla yapılan ayrı bir karşılaştırmaya da yer verdi.

Bu karşılaştırmada doktorlardan temsil niteliğindeki sağlık konuşmalarına yanıt yazmaları istendi. Ayrı bir doktor paneli, bu yanıtları model yanıtlarıyla karşılaştırdı. OpenAI’ye göre panel, 3.500 gözden geçirilen yanıt arasında GPT-5.5 Instant’ın yanıtlarını doğruluk, iletişim ve bütünlük gibi kriterlerde doktorların yazdığı yanıtların üzerinde puanladı.

Şirket, modelin hem eski modellerden hem de doktor yanıtlarından daha az hata modu gösterdiğini açıkladı. Daha az kırmızı bayrağın gözden kaçırıldığı ve kullanıcıdan daha fazla bağlam isteme durumlarının daha az görüldüğü ifade edildi.

HealthBench, OpenAI’nin doktor ağı ile geliştirdiği ve doktor yazılı rubrikler kullanılarak oluşturulan bir ölçüt olarak tanımlanıyor. Şirket, 60 ülkede 260’tan fazla doktorla çalıştığını ve doktorların bugüne kadar 700.000’den fazla örnek yanıtı incelediğini bildirdi.

OpenAI’nin, ocak ayında ChatGPT Health’i başlattığından beri 260 doktor sayısını sürekli olarak kullandığı belirtiliyor. Sonuçların hiçbirinin dış denetime sunulmadığı ifade ediliyor. OpenAI, ChatGPT’ye her hafta 230 milyondan fazla sağlık ve wellness sorusu sorulduğunu açıkladı. Bu kullanım, kullanıcıların chatbot’u en sık kullanma nedenlerinden biri olarak öne çıkıyor.

Sağlık, OpenAI politikalarında korumalı bir kategori olarak yer alıyor. Şirket, ChatGPT’de reklamları test etmeye başladığında sağlık, mental sağlık veya politika konularındaki sohbetlerde reklam yayımlamayacağını bildirmişti. Tıbbi sorgular, mevcut durumda yapay zeka yanıtlarına yoğun ilgi gören alanlardan biri olarak görülüyor. Yakın zamanda yapılan bir Ahrefs analizine göre, yapay zeka yanıtlarının en yüksek oranda açığa çıktığı kategori sağlık oldu.

Bu talebin ChatGPT’nin ücretsiz katmanına kayması, yayıncılara yönelik zero-click baskısını artırabilir. OpenAI’nin iyileşme iddiaları ise bağımsız bir onay olmadan daha zor değerlendirilebilecek bir uygulama alanı oluşturuyor. Testlerin şirket içinde gerçekleştirilmesi, sağlık alanındaki diğer yapay zeka yanıtlarında görülen ölçüm farklarıyla benzer bir sorunu beraberinde getiriyor. Değişikliklerin alıntılar üzerindeki etkileri net şekilde belirtilmiyor.

Daha fazla platformun sağlık yanıtlarını ücretsiz katmanlara kaydırması durumunda, yanıtların doğrulanması ve trafik kaybıyla başa çıkma sorumluluğunun sağlık uygulayıcılarının üzerine kalabileceği değerlendiriliyor.


Öne çıkan görsel kaynağı