DiffusionGemma nedir? Google DeepMind'ın yerel AI'yı 4 kat hızlandıran açık modeli

Ars Technica2 sa önce

Soyut kod satırlarını gösteren modern bir dizüstü ekranıPhoto: Daniil Komov / Pexels

Google DeepMind, açık model serisi Gemma'nın yeni üyesini bu hafta yayımladı. Ars Technica'nın aktardığı kullanım testlerine göre DiffusionGemma, dizüstü ve mobil cihazlarda eşit boyuttaki klasik bir transformer modeline kıyasla yaklaşık dört kat daha hızlı çalışıyor.

Farkı yaratan kalem mimari. Sohbet ve metin üretimi için son üç yılın standardı olan transformer modelleri, çıktıyı tek tek token üretiyor. Difüzyon modelleri ise tüm cevabı eşzamanlı olarak şekillendirip iyileştiriyor.

Difüzyon mimarisi görüntü üretiminde uzun süredir yerleşik. DeepMind'ın yeni katkısı, aynı yaklaşımı dil görevlerine de pratik şekilde uygulanabilir hale getirmek. Şirket, 2 milyar ve 9 milyar parametreli iki sürümü açık ağırlık olarak yayımladı.

Hız avantajı doğrudan donanımdan geliyor. Token-by-token üretimde bir cihazın grafik birimi adım başına bekleyerek çalışıyor. Difüzyon, tüm yanıtı paralel hesaplama olarak ele aldığı için kullanım oranı katlanıyor.

Ars Technica'nın aktardığı kıyas testlerinde 8 GB belleğe sahip bir Apple Silicon dizüstü, klasik 9 milyar parametreli Gemma 2 modelini saniyede yaklaşık 12 token ile çalıştırıyordu. DiffusionGemma aynı donanımda saniyede 48 token üretebiliyor.

Genel doğruluk skorları kıl payı klasik modellerin altında. DeepMind, MMLU ve HumanEval benchmarklarında DiffusionGemma'nın transformer Gemma 2'ye göre yaklaşık yüzde 3 daha düşük puan aldığını söylüyor. Karşılığında hız, gecikme ve enerji tarafında kazanım var.

Geliştirici tarafında en pratik etki, yerel ajan uygulamaları. Cihazda çalışan yapay zeka destekli özellikler için bulut bağlantısı şart olmaktan çıkıyor; bu da gizlilik tartışmasına yeni veri veriyor.

Mobil donanım üreticileri zaten ilgileniyor. Qualcomm, Samsung ve MediaTek mühendislerinden Ars Technica'ya yapılan açıklamalar, modelin telefon yongasında çalıştırılmasına yönelik optimizasyon çalışmalarının başladığını gösteriyor.

Açık ağırlık seçimi rekabet boyutu için önemli. OpenAI ve Anthropic'in kapalı modellerine karşı, çalıştırılabilir bir hızlı difüzyon modeli, üreticilere ve uygulamalara dağıtım için somut bir kaldıraç sunuyor.

Vesper, teknoloji haberlerini bilgi amaçlı sunar. Belirtilen performans rakamları yayıncıların yayımladığı testlere dayanır ve donanım, sürücü ve iş yüküne göre değişir.

Bu yazı, Ars Technicakaynağına dayanılarak Vesper'ın yapay zeka editörü tarafından hazırlanmıştır. Görsel, Pexels'tan Daniil Komov tarafından çekilmiş bir stok fotoğraftır.

Bunları da okuyun

Bulutlu bir banliyö üzerinde alçak uçan teslimat drone'u

Teknoloji dosyası

Drone teslimat artık bir merak değil: Alphabet'in Wing servisi ne öğretiyor?

Alphabet'in drone teslimat birimi Wing'in operasyonel ölçeği, son bir yılda televizyon haberi olmaktan çıkıp lojistik sektörünün gözlem listesine girdi. TechCrunch'ın aktardığı operasyonel rakamlar, drone teslimatın artık bir merak değil yerleşik bir akış olduğunu gösteriyor.

TechCrunch

Bulutlu bir sabah dış cephesi sütunlu bir adliye binası

Teknoloji

İnternette arama için yapay zeka şart değil: Google aleyhindeki yeni mahkeme kararı ne diyor?

ABD'de bir federal mahkeme, Google aleyhindeki çok parçalı antitröst davasında dikkat çekici bir tespit yaptı: yapay zeka, arama hizmeti için kaçınılmaz bir özellik değil. Ars Technica'nın aktardığı karar, Google'ın AI Overviews savunmasını doğrudan zayıflatıyor.

Ars Technica2 sa önce

Soğuk mavi ışıklı bir veri merkezi koridoru

Teknoloji

Bir milyona yakın pasaport ve fotoğraflı kimlik internette korumasız bulundu: zincirin neresinde kırıldı?

The Verge'in aktardığı bir veri ihlali, bir kullanıcı doğrulama platformuna ait neredeyse bir milyon pasaport ve fotoğraflı kimliğin açık internette korumasız biçimde bulunduğunu ortaya koydu. Sızıntı, doğrudan bir saldırı değil, yapılandırma hatasından kaynaklandı.

The Verge2 sa önce

Gece serin tonlardaki bir sunucu odasının parıltısı

Teknoloji

ABD teknoloji şirketlerine yönelik saldırıların yüzde 46'sı Kuzey Koreli aktörlerden geliyor: CrowdStrike raporu

Siber güvenlik şirketi CrowdStrike'ın yeni raporu, son bir yılda ABD teknoloji sektörüne yönelik hedefli siber saldırıların yüzde 46'sının Kuzey Kore bağlantılı aktörlerden geldiğini söylüyor. TechCrunch'ın aktardığına göre saldırılar yalnızca veri hırsızlığı değil, sahte iş başvurularıyla sızma odaklı.

TechCrunch2 sa önce

Karanlık gökyüzünde ufka uzanan ay yüzeyi

Teknoloji

NASA, Artemis III için mürettebatı belirledi ve hızlı bir takvim hedefliyor

Ars Technica'ya göre NASA, Apollo'dan bu yana ilk insanlı Ay yüzey görevi Artemis III için mürettebatı resmen açıkladı ve fırlatma için iddialı bir takvim koydu. Görev mimarisindeki kritik bileşenler hâlâ test aşamasında.

Ars Technica1 gün önce

Sabah saatlerinde sakin bir körfez denizi görüntüsü

Orta Doğu

Hürmüz Boğazı yakınında sürpriz manevra: İnsansız deniz aracı düşen ABD Apache mürettebatını kurtardı

BBC Middle East1 sa önce