Microsoft Research, yapay zeka alanındaki çalışmalarına bir yenisini ekleyerek, bilgisayar arayüzlerini kullanmak üzere özel olarak tasarlanmış "Fara 7B" adlı yeni bir dil modelini duyurdu. Günümüzdeki devasa dil modellerinin aksine, sadece 7 milyar parametreye sahip olan Fara 7B, bu kompakt yapısına rağmen "ajan" (agentic) yetenekleri sayesinde karmaşık bilgisayar görevlerini yüksek doğrulukla yerine getirebiliyor. Model, ekran görüntülerini analiz ederek fare tıklamaları ve klavye girdileri gibi aksiyonları planlayıp uygulayabiliyor.
Fara 7B'nin en dikkat çeken özelliği, verimlilik ile performansı bir araya getirmesi. Genellikle bilgisayar kullanımı (computer use) gibi görsel ve işlevsel algı gerektiren görevler, GPT-4o gibi çok daha büyük ve maliyetli modellerin alanına giriyordu. Ancak Microsoft araştırmacıları, Fara 7B'yi özel veri setleriyle eğiterek, çok daha düşük işlem gücüyle benzer, hatta bazı kıyaslamalarda daha üstün performans elde etmeyi başardı. Bu durum, yerel cihazlarda çalışabilecek gelişmiş yapay zeka asistanlarının önünü açıyor.
Yapılan testlerde, özellikle OSWorld gibi bilgisayar asistanlarını değerlendiren zorlu kıyaslamalarda Fara 7B'nin başarısı öne çıkıyor. Model, kullanıcı arayüzlerindeki butonları, menüleri ve formları algılayıp, kendisine verilen "bir uçak bileti bul" veya "bu dosyayı düzenle" gibi çok adımlı talimatları, hatasız bir şekilde tamamlayabiliyor. Microsoft'un bu hamlesi, yapay zekanın sadece metin üretmekle kalmayıp, dijital dünyadaki işlerimizi fiilen devralabileceği otonom sistemlere doğru evrildiğini bir kez daha gösteriyor.









