Gemma (Gemma (Google Açık Ağırlıklı Model Ailesi))

Gemma, Google DeepMind tarafından geliştirilen ve Apache 2.0 lisansıyla kamuoyuyla paylaşılan açık ağırlıklı büyük dil modelleri ailesidir.

Gemma, Google DeepMind tarafından 2024 yılında duyurulan ve Apache 2.0 lisansı altında yayımlanan açık ağırlıklı büyük dil modelleri ailesidir. Gemma modelleri, Google'ın Gemini altyapısından yararlanılarak geliştirilmiş; ancak ticari Gemini modellerinin aksine ağırlıkları kamuoyuyla paylaşılmıştır. 2026 yılında yayımlanan Gemma 4 serisi (2 Nisan 2026), 1B, 4B, 12B ve 27B yoğun (dense) ile 26B MoE varyantlarını içermektedir. En büyük Gemma 4 varyantı olan 31B Dense modeli, Arena AI metin liderlik tablosunda üçüncü sıraya yükselmiş; matematik, kodlama ve akıl yürütme görevlerinde Meta'nın Llama 4'ünü geride bırakmıştır. Gemma 4, tüm varyantlarında yerel olarak çok modlu (natively multimodal) bir mimari kullanır: metin, görüntü ve videoyu tek bir model içinde işleyebilir; küçük modeller ise ses girdisini de desteklemektedir. Model ailesi, bilimsel araştırmacılar ve geliştirici topluluğu için ince ayar (fine-tuning) ve özelleştirme görevlerinde geniş çapta kullanılmaktadır. Gemma modelleri, Google Cloud Vertex AI, Hugging Face ve Kaggle üzerinden erişilebilmekte; ayrıca Google'ın AI Edge çerçevesiyle mobil ve gömülü cihazlarda da çalıştırılabilmektedir.

science Gemma Ailesi Nasıl Çalışır?

Gemma modelleri, Google'ın Gemini modelleri için geliştirilen altyapıdan türetilmiş Transformer tabanlı mimariler kullanır. Dense varyantlarda tüm parametreler her çıkarımda aktive edilirken 26B MoE varyantında Mixture-of-Experts yönlendirmesiyle yalnızca ilgili uzman katmanlar işleme alınır. Gemma 4'teki çok modlu yetenek (natively multimodal), ayrı bir görüntü kodlayıcısı yerine görüntü ve videoyu doğrudan token dizisi olarak modele besleyen birleşik bir mimariyle sağlanmaktadır. Bu yaklaşım, metin ile görsel bilginin daha derin bir şekilde kaynaştırılmasına olanak tanır. İnce ayar (fine-tuning) için Google, LoRA ve tam parametre güncellemesini destekleyen Keras ve Hugging Face Transformers entegrasyonu sunmaktadır. Model ailesi, bilimsel araştırma, tıbbi veri analizi ve eğitim gibi özelleşmiş görevlerde kaynak verimliliği açısından popüler bir seçenek haline gelmiştir.

Gemma 4 Varyantları

star Gemma 4 31B Dense

En büyük Gemma varyantı. Arena AI liderlik tablosunda 3. sıraya ulaşmış; matematik ve kodlamada Llama 4'ü geçmiştir.

device_hub Gemma 4 26B MoE

Mixture-of-Experts varyantı. Düşük çıkarım maliyetiyle yüksek kapasite sunar; toplu işleme ve API senaryoları için uygundur.

smartphone Gemma 4 4B / 1B

Mobil ve gömülü cihazlar için optimize edilmiş küçük varyantlar. Google AI Edge ile akıllı telefon ve IoT cihazlarında çalışır.

tune Fine-Tuning Desteği

LoRA ve tam parametre ince ayarını destekler. Keras, Hugging Face ve Vertex AI üzerinden özel veri setleriyle kolayca özelleştirilebilir.

quiz Sıkça Sorulan Sorular

  • check_circle Gemma ile Gemini arasındaki fark nedir?: Gemini, Google'ın kapalı kaynaklı ticari yapay zeka modeli ailesidir (Ultra, Pro, Flash gibi varyantlarıyla). Gemma ise aynı araştırma altyapısından yararlanılarak geliştirilen ancak ağırlıkları kamuoyuyla paylaşılan açık kaynaklı bir alt ailedir. Gemma modelleri Gemini'nin tüm yeteneklerine sahip değildir; ancak yerel çalıştırma ve ince ayar için erişilebilir bir alternatif sunar.
  • check_circle Gemma modelleri ticari kullanım için uygun mu?: Evet. Gemma 4 dahil tüm Gemma varyantları Apache 2.0 lisansı altında yayımlanmıştır; bu lisans ticari kullanıma izin vermektedir. Bununla birlikte Google'ın kullanım politikalarının da incelenmesi önerilir.
  • check_circle Gemma modelleri Türkçeyi destekliyor mu?: Gemma modelleri çok dilli eğitim verisiyle geliştirilmiş olsa da özellikle Türkçe için optimize edilmemiştir. Genel dil anlama görevlerinde Türkçe desteklenirken ince ayar yapılmamış modellerde tutarsızlıklar görülebilir.
  • check_circle Gemma hangi donanımda çalışır?: 1B ve 4B modeller, 4-8 GB VRAM'li tüketici GPU'larında çalışabilir. 12B ve 27B modeller için 16-24 GB VRAM önerilir. GGUF veya AWQ formatında kuantize edilmiş versiyonlar daha düşük donanım gereksinimiyle de çalıştırılabilir.