Google’ın yeni TurboQuant algoritması, yapay zeka modellerinin bellek ihtiyacını en az 6 kat azaltarak işlem gücü maliyetlerinde devrim yaratmaya hazırlanıyor.
Yapay zeka modellerinin bellek ve işlem gücü ihtiyaçları teknoloji dünyasının en büyük darboğazlarından birini oluştururken, Google’ın yeni geliştirdiği ‘TurboQuant’ algoritması bu soruna çözüm sunuyor. Yazılım devi, yapay zeka sistemlerinin ihtiyaç duyduğu devasa bellek kapasitelerini ve işlem gücü maliyetlerini önemli ölçüde azaltmayı hedefliyor.
TechCrunch’ın haberine göre, Google Research tarafından duyurulan TurboQuant, büyük dil modellerinin (LLM) anahtar-değer önbelleği (KV cache) belleğini en az 6 kat azaltıyor. Bu sıkıştırma işlemi, yapay zekanın performansında herhangi bir doğruluk kaybı yaşanmadan gerçekleştiriliyor. Bu durum, 2014-2019 yılları arasında yayınlanan ‘Silicon Valley’ dizisindeki Pied Piper adlı şirketin geliştirdiği veri sıkıştırma teknolojisini anımsatıyor. Dizideki algoritma, dosyaları kayıpsız bir şekilde sıkıştırırken, TurboQuant da yapay zeka sistemlerinin çalışma belleğini benzer bir verimlilikle küçültüyor.
Google Research, bu teknolojinin yapay zekanın daha az yer kaplamasını ve daha fazla bilgiyi hatırlamasını sağlarken, doğruluğunu da koruduğunu belirtiyor. Araştırmacılar, bu bulguları ve sıkıştırmayı sağlayan PolarQuant ve QJL yöntemlerini ICLR 2026 konferansında sunacak. Başarılı bir şekilde uygulanması halinde TurboQuant, KV önbelleğini en az 6 kat azaltarak yapay zeka çalıştırma maliyetlerini düşürebilir.
Bazı sektör liderleri, bu gelişmeyi Google’ın ‘DeepSeek anı’ olarak nitelendirerek, düşük maliyetle rekabetçi sonuçlar elde eden DeepSeek yapay zeka modelinin yarattığı verimlilik sıçramasına atıfta bulunuyor.
Yorum Yap