OpenAI'ın Yeni Modeli GPT-5.4

OpenAI, akıl yürütme, kodlama ve bilgisayar kullanımını tek bir modelde birleştiren GPT-5.4'ü duyurdu. Yeni model, sektör profesyonellerinin yüzde 83'üyle yarışabildiğini kanıtladı.

OpenAI'ın Yeni Modeli GPT-5.4
GPT-5.4

OpenAI, en yetenekli ve verimli sınır modeli olarak tanımladığı GPT-5.4'ü bugün itibarıyla ChatGPT, API ve Codex üzerinde kullanıma sundu. Yeni model, akıl yürütme, kodlama ve bilgisayar kullanımını ilk kez tek bir çatı altında birleştiriyor.

GPT-5.4, önceki nesil GPT-5.2'ye kıyasla her kategoride kayda değer sıçramalar gerçekleştiriyor. 44 farklı mesleki alanda yapılan GDPval testinde model, sektör profesyonelleriyle girdiği karşılaştırmaların yüzde 83'ünde eşit ya da daha iyi sonuç üretti; GPT-5.2'nin aynı testteki oranı yüzde 70,9'da kalmıştı. Yatırım bankacılığı modellemesi gibi uzmanlık gerektiren görevlerde ise GPT-5.4, yüzde 87,3 ortalama puanla GPT-5.2'nin yüzde 68,4'lük skorunu geride bıraktı.

Yeni modelin en dikkat çekici yeniliklerinden biri, bilgisayarı doğrudan kullanabilme kapasitesi. GPT-5.4, ekran görüntüleri üzerinden tıklama ve klavye komutları vererek masaüstü ve tarayıcı ortamlarında özerk görevler tamamlayabiliyor. OSWorld-Verified karşılaştırmasında yüzde 75 başarı oranıyla hem GPT-5.2'yi (yüzde 47,3) hem de insanın ortalama performansını (yüzde 72,4) geride bıraktı. Web taraması gerektiren zorlu sorgularda ise BrowseComp testinde yüzde 82,7 başarıya ulaşırken GPT-5.4 Pro bu çıtayı yüzde 89,3'e taşıdı.

Geliştirici ekosistemi açısından öne çıkan yenilik ise araç arama (tool search) özelliği. Önceki modellerde tüm araç tanımları her sorguda bağlama eklenirken GPT-5.4, bu tanımları yalnızca ihtiyaç duyduğu anda çekiyor. OpenAI'ın yaptığı testlerde bu yaklaşım, toplam token kullanımını yüzde 47 oranında azaltırken doğruluk düzeyini sabit tuttu. Kodlama cephesinde ise model, GPT-5.3‑Codex ile eşit düzeyde SWE-Bench Pro skoru sergilerken daha düşük gecikme süresiyle çalışıyor.

Halüsinasyon ve hata oranlarında da somut ilerleme kaydedildi. OpenAI'ın kendi ölçümlerine göre GPT-5.4, kullanıcıların hatalı işaretlediği içeriklerde yanıt başına hata oranını GPT-5.2'ye göre yüzde 18 düşürüyor; bireysel iddialardaki yanlışlık payı ise yüzde 33 azalıyor.

ChatGPT'de GPT-5.4 Thinking adıyla sunulan model, uzun ve karmaşık sorgularda yanıt üretmeye başlamadan önce bir ön plan paylaşıyor; kullanıcılar yanıt tamamlanmadan bu planı yönlendirebiliyor. Plus, Team ve Pro aboneleri modele bugünden itibaren erişebilirken kurumsal kullanıcılar erken erişimi yönetici paneli üzerinden etkinleştirebilir. API'de gpt-5.4 olarak kullanıma açılan modelin giriş fiyatı 1 milyon token için 2,50 dolar olarak belirlendi.

Kaynak: OpenAI

İlginizi Çekebilir