Yapay Zeka

OpenAI'ın Yeni Modeli GPT-5.4

OpenAI, akıl yürütme, kodlama ve bilgisayar kullanımını tek bir modelde birleştiren GPT-5.4'ü duyurdu. Yeni model, sektör profesyonellerinin yüzde 83'üyle yarışabildiğini kanıtladı.

06 Mar 2026 — 2 min read

GPT-5.4

OpenAI, en yetenekli ve verimli sınır modeli olarak tanımladığı GPT-5.4'ü bugün itibarıyla ChatGPT, API ve Codex üzerinde kullanıma sundu. Yeni model, akıl yürütme, kodlama ve bilgisayar kullanımını ilk kez tek bir çatı altında birleştiriyor.

GPT-5.4, önceki nesil GPT-5.2'ye kıyasla her kategoride kayda değer sıçramalar gerçekleştiriyor. 44 farklı mesleki alanda yapılan GDPval testinde model, sektör profesyonelleriyle girdiği karşılaştırmaların yüzde 83'ünde eşit ya da daha iyi sonuç üretti; GPT-5.2'nin aynı testteki oranı yüzde 70,9'da kalmıştı. Yatırım bankacılığı modellemesi gibi uzmanlık gerektiren görevlerde ise GPT-5.4, yüzde 87,3 ortalama puanla GPT-5.2'nin yüzde 68,4'lük skorunu geride bıraktı.

Yeni modelin en dikkat çekici yeniliklerinden biri, bilgisayarı doğrudan kullanabilme kapasitesi. GPT-5.4, ekran görüntüleri üzerinden tıklama ve klavye komutları vererek masaüstü ve tarayıcı ortamlarında özerk görevler tamamlayabiliyor. OSWorld-Verified karşılaştırmasında yüzde 75 başarı oranıyla hem GPT-5.2'yi (yüzde 47,3) hem de insanın ortalama performansını (yüzde 72,4) geride bıraktı. Web taraması gerektiren zorlu sorgularda ise BrowseComp testinde yüzde 82,7 başarıya ulaşırken GPT-5.4 Pro bu çıtayı yüzde 89,3'e taşıdı.

Geliştirici ekosistemi açısından öne çıkan yenilik ise araç arama (tool search) özelliği. Önceki modellerde tüm araç tanımları her sorguda bağlama eklenirken GPT-5.4, bu tanımları yalnızca ihtiyaç duyduğu anda çekiyor. OpenAI'ın yaptığı testlerde bu yaklaşım, toplam token kullanımını yüzde 47 oranında azaltırken doğruluk düzeyini sabit tuttu. Kodlama cephesinde ise model, GPT-5.3‑Codex ile eşit düzeyde SWE-Bench Pro skoru sergilerken daha düşük gecikme süresiyle çalışıyor.

Halüsinasyon ve hata oranlarında da somut ilerleme kaydedildi. OpenAI'ın kendi ölçümlerine göre GPT-5.4, kullanıcıların hatalı işaretlediği içeriklerde yanıt başına hata oranını GPT-5.2'ye göre yüzde 18 düşürüyor; bireysel iddialardaki yanlışlık payı ise yüzde 33 azalıyor.

ChatGPT'de GPT-5.4 Thinking adıyla sunulan model, uzun ve karmaşık sorgularda yanıt üretmeye başlamadan önce bir ön plan paylaşıyor; kullanıcılar yanıt tamamlanmadan bu planı yönlendirebiliyor. Plus, Team ve Pro aboneleri modele bugünden itibaren erişebilirken kurumsal kullanıcılar erken erişimi yönetici paneli üzerinden etkinleştirebilir. API'de gpt-5.4 olarak kullanıma açılan modelin giriş fiyatı 1 milyon token için 2,50 dolar olarak belirlendi.

Kaynak: OpenAI

İlginizi Çekebilir

ABD ve AB Polisi, Çalıntı Şifre Pazarı LeakBase'i Kapattı

ABD ve Avrupa kolluk kuvvetleri, milyonlarca çalıntı hesap bilgisinin satıldığı iddia edilen LeakBase platformunu ortak operasyonla kapattı.

Laboratuvarda Yetiştirilen Mini Beyinler Artık Öğrenebiliyor

UC Santa Cruz araştırmacıları, laboratuvarda yetiştirilen beyin organoidlerinin gerçek zamanlı bilgi işleyerek hedefe yönelik öğrenebildiğini kanıtladı.

Google, Gemini'nin Ölümle Sonuçlandığı İddia Edilen Davaya Yanıt Verdi

Google'ın yapay zekâ modeli Gemini'nin bir kullanıcıyı intihar etmeye yönlendirdiği iddiasıyla açılan dava, şirketin ilk resmi açıklamasını beraberinde getirdi.

Sosyal Medyada Anonimlik Sona mı Erdi?

ETH Zurich ve Anthropic araştırmacıları, yapay zekanın sahte hesap isimlerinin arkasındaki gerçek kimlikleri yalnızca birkaç dolara tespit edebildiğini kanıtladı.

Nothing Phone (4a) Pro Tanıtıldı

Nothing, Phone (4a) Pro ile yaratıcılara odaklanan yeni bir orta segment cihaz sunuyor. Sony periskop lens, 137 mini LED'li Glyph Matrix ve yapay zekâ özellikleriyle dikkat çeken telefon 27 Mart'ta satışa çıkıyor.

Nothing Phone (4a) Tanıtıldı

Nothing, Phone (4a)'yı resmi olarak duyurdu. 50MP periskop kamera, yeni Glyph Bar tasarımı ve Essential AI özellikleriyle öne çıkan telefon 13 Mart'ta satışa çıkıyor.

TikTok, Mesajlara Uçtan Uca Şifreleme Eklemeyecek

TikTok, doğrudan mesajların uçtan uca şifrelenmeyeceğini açıkladı. Şirket bu kararı, kullanıcı güvenliğini koruma gerekçesiyle savunuyor.

Codex Windows’ta

Şubat ayında macOS için yayınlanan OpenAI Codex masaüstü uygulaması, gecikmeli de olsa Windows platformuyla buluşarak geliştirici araçlarındaki rekabeti kızıştırdı.