Gemini 3.1 Flash-Lite Duyuruldu
Gemini 3.1 Flash-Lite, büyük ölçekli iş yükleri için hem hız hem maliyet avantajı sunuyor.
Google, yapay zekâ modellerinde yeni bir çıta belirledi: Gemini 3.1 Flash-Lite, Gemini 3 serisinin en hızlı ve en ekonomik modeli olarak bugün geliştiricilerin kullanımına açıldı.
Model, şu an itibarıyla önizleme (preview) aşamasında Gemini API ve Google AI Studio üzerinden geliştiricilere, kurumsal kullanıcılara ise Vertex AI aracılığıyla sunuluyor. Giriş fiyatı 1 milyon token başına yalnızca 0,25 dolar, çıkış fiyatı ise 1 milyon token başına 1,50 dolar olarak belirlendi. Performans tarafında da dikkat çekici rakamlar var. Model, önceki nesil Gemini 2.5 Flash'a kıyasla 2,5 kat daha hızlı ilk yanıt süresi ve %45 daha yüksek çıktı hızı sunuyor. Akıl yürütme testlerinde ise GPQA Diamond karşılaştırmasında %86,9 gibi etkileyici bir skora ulaştı bu, "Lite" etiketli bir modelden beklenenin oldukça üzerinde bir başarı.
Modelin en öne çıkan yeniliklerinden biri, "Thinking Levels" adı verilen akıl yürütme derinliği kontrolü. Geliştiriciler, görevin karmaşıklığına göre Minimal, Düşük, Orta veya Yüksek düzeyler arasından seçim yaparak modelin hem gecikme süresini hem de mantıksal doğruluğunu istedikleri gibi ayarlayabiliyor. Bu esneklik, yüksek frekanslı iş yüklerini yönetmek için kritik bir avantaj sağlıyor. Büyük ölçekli belge çevirisi, metin düzenleme, kullanıcı arayüzü oluşturma ve toplu görsel analiz gibi alanlarda öne çıkan model, Latitude, Cartwheel ve Whering gibi şirketler tarafından çoktan test edilmeye başlandı.
Kaynak: Google Blog