Gemini 3.1 Flash TTS

Google, 70'ten fazla dili destekleyen ve ses tonunu doğal dil komutlarıyla yönetmeyi sağlayan yeni metinden sese modeli Gemini 3.1 Flash TTS'i duyurdu.

Gemini 3.1 Flash TTS

Google, 15 Nisan 2026'da yeni metinden sese modeli Gemini 3.1 Flash TTS'i duyurdu. Model; kontrol edilebilirliği, ifade gücü ve ses kalitesi artırılmış bir sistem olarak geliştiricilerin, kurumların ve son kullanıcıların hizmetine sunuluyor.

Google'ın resmi duyurusuna göre yeni model, şirketin bugüne kadar ürettiği en doğal sesli yapay zekâ olarak öne çıkıyor. Artificial Analysis TTS sıralamasında 1.211 Elo puanı alan Gemini 3.1 Flash TTS, aynı platform tarafından kalite ve maliyet dengesi açısından "en çekici bölge"de konumlandırıldı. Model; Gemini API ve Google AI Studio üzerinden geliştiricilere, Vertex AI üzerinden kurumlara, Google Vids aracılığıyla da Workspace kullanıcılarına önizleme olarak açıldı.

Yeni sürümün en dikkat çekici yeniliği ise ses etiketleri (audio tags). Bu sistem sayesinde metnin içine eklenen doğal dil komutlarıyla konuşmanın tonu, hızı ve aksanı yönetilebiliyor; her karaktere özel ses profili atanabiliyor ve oluşturulan performans Gemini API koduna aktarılarak farklı projelerde aynı sesle tekrar kullanılabiliyor. Google, 70'ten fazla dili destekleyen modelin ürettiği tüm seslerin SynthID filigranıyla işaretlendiğini ve bu sayede yapay zekâ üretimi içeriklerin güvenilir biçimde tespit edilebildiğini belirtti.

Kaynak: Google Blog