Gemma Nedir? Google'ın Açık Ağırlıklı LLM Ailesi 2026

Gemma Ailesi Nasıl Çalışır?

Gemma modelleri Transformer tabanlı bir mimari üzerine inşa edilmiştir. Gemma 4 serisinden itibaren tüm modeller yerel çok modlu (natively multimodal) yapıya geçiş yapmış; metin, görüntü ve video akışları ortak bir temsil uzayında işlenmektedir. Büyük varyantlarda Mixture-of-Experts (MoE) kullanılarak hesaplama verimliliği artırılmıştır. Küçük modeller (1B, 4B) Google'ın AI Edge çerçevesiyle akıllı telefon ve gömülü sistemlerde çalıştırılabilecek şekilde optimize edilmiştir.

Gemma 4 Varyantları

Gemma 4 27B / 31B Dense

Arena AI sıralamasında üçüncü sıra; matematik, kodlama ve akıl yürütmede Llama 4 Maverick'i geride bıraktı. 128K bağlam penceresi.

Gemma 4 26B MoE

Mixture-of-Experts mimarisi; hesaplama kaynağını verimli kullanarak büyük model kapasitesine ulaşır.

Gemma 4 4B / 12B

Orta ölçekli dense modeller; araştırma ve kurumsal ince ayar projelerinde yaygın tercih.

Gemma 4 1B

Mobil ve gömülü cihaz odaklı ultra-hafif model. Görüntü anlama ve ses desteğiyle birlikte gelir.

Gemma'nın Rakipleriyle Karşılaştırması

check_circle Llama 4 (Meta): Her ikisi de Apache 2.0 lisanslıdır; Gemma 4 31B matematik ve kodlamada Llama 4 Maverick'i geçmiştir. Llama ekosistemi daha geniş topluluk araçlarına sahip.
check_circle Qwen (Alibaba): Qwen, Türkçe dahil daha geniş dil desteğiyle öne çıkar; Gemma Google altyapısına entegrasyon ve mobil cihaz optimizasyonunda güçlüdür.
check_circle Phi-4 (Microsoft): Her ikisi de küçük ama güçlü modeller segmentinde yer alır; Gemma çok modlu yetenekte, Phi-4 metin akıl yürütmede üstündür.
check_circle Gemini (Google): Gemma kapalı kaynaklı Gemini'nin açık ağırlıklı kardeşidir; Gemini daha büyük bağlam penceresi ve kurumsal API yetenekleri sunarken Gemma yerel barındırmaya izin verir.

Özel Amaçlı Türevler: CodeGemma, ShieldGemma, PaliGemma

Google, Gemma çekirdeği üzerine farklı kullanım senaryoları için özelleştirilmiş türevler geliştirmiştir. CodeGemma, kod tamamlama ve üretme görevlerine odaklanmış; Python, JavaScript ve C++ gibi dillerde güçlü performans göstermektedir. ShieldGemma, içerik moderasyonu ve güvenlik sınıflandırması için tasarlanmış olup zararlı içerik tespitinde kullanılmaktadır. PaliGemma ise görsel-dil (vision-language) görevler için birleşik bir model sunar: görsel soru yanıtlama, resim açıklama ve görüntü tabanlı akıl yürütme gibi alanlarda kullanılabilir. Bu türevler, temel Gemma modelini ince ayar yapmadan belirli görevlerde hızla devreye almak isteyen geliştiriciler için zaman ve hesaplama tasarrufu sağlar.

İnce Ayar ve Özelleştirme

check_circle LoRA / QLoRA ile Verimli İnce Ayar: Hugging Face PEFT kütüphanesi aracılığıyla LoRA (Low-Rank Adaptation) ve QLoRA teknikleri, Gemma modellerinin 8 GB VRAM'li tüketici GPU'larında ince ayar yapılmasına imkân tanır. 4B model için tipik eğitim bellek gereksinimi 6-8 GB aralığındadır.
check_circle Veri Seti ve Eğitim Çerçeveleri: Alpaca, ShareGPT veya alan-spesifik sohbet formatlarında hazırlanmış veri setleri; Unsloth ve trl (Transformers Reinforcement Learning) kütüphaneleriyle hızla entegre edilebilir. Unsloth, eğitim hızını iki katına kadar artıran bellek optimizasyonları içerir.
check_circle Google Vertex AI Yönetilen Ayarlama: Google Cloud'un Vertex AI platformu, Gemma'yı no-code/low-code arayüz üzerinden yönetilen altyapıda ince ayarlamak için SFT (Supervised Fine-Tuning) iş akışları sunar; bu seçenek GPU yönetimini ve ortam kurulumunu tamamen ortadan kaldırır.
check_circle Quantization ile Yerel Dağıtım: İnce ayarlanmış Gemma modelleri GGUF formatına dönüştürülerek llama.cpp aracılığıyla CPU'da veya Ollama ile yerel API sunucusunda çalıştırılabilir. 4-bit kuantizasyon, 7B modeli 4 GB RAM'li bir sistemde barındırmaya olanak tanır.
check_circle Kaggle ve Google Colab Örnekleri: Google, Gemma ince ayarı için hazır Kaggle not defterleri ve Colab örnekleri yayımlamıştır. Ücretsiz GPU kotalarıyla küçük modellerin (1B, 4B) deneme ince ayarı yapılabilir; bu yöntemle kurumsal GPU kümelerine gerek kalmadan kavramsal doğrulama (PoC) projeleri yürütülebilir.

Türkiye'de Gemma Kullanım Senaryoları

Gemma'nın Türkçe dil desteği, Google'ın geniş çok dilli ön eğitim korpusundan beslenmektedir. Açık ağırlıklı yapısı ve mobil uyumluluğu, veri gizliliği gerektiren sağlık, hukuk ve eğitim sektörlerinde yerel barındırma imkânı sunar. AI Edge ile Gemma 1B modeli, çevrimdışı çalışabilen akıllı telefon uygulamalarına entegre edilebilir; bu özellikle internet bağlantısının yetersiz olduğu ortamlarda değer taşır. KOBİ'ler için Vertex AI üzerinden API kullanımı; araştırmacılar için Hugging Face fine-tuning ekosistemi tercih edilen erişim yollarıdır.

Sık Sorulan Sorular

check_circle Gemma ile Gemini arasındaki fark nedir?: Gemini, Google'ın kapalı kaynaklı ticari modelidir ve yalnızca API üzerinden erişilir. Gemma ise Apache 2.0 lisansıyla ağırlıkları kamuya açık olan modeldir; yerel barındırma ve ince ayar yapılabilir.
check_circle Gemma modelleri ticari kullanım için uygun mu?: Evet, Apache 2.0 lisansı ticari kullanıma izin verir. Ancak Google'ın kullanım koşullarını incelemek ve belirli kısıtlamalar (örneğin zararlı içerik üretimi) açısından güncel lisans metnini doğrulamak gerekir.
check_circle Gemma modelleri Türkçeyi destekliyor mu?: Evet. Gemma çok dilli ön eğitimden geçmiştir ve Türkçe metin anlama ile üretimde tatmin edici sonuçlar vermektedir. Türkçe odaklı görevler için ince ayar performansı daha da artırabilir.
check_circle Gemma hangi donanımda çalışır?: Büyük modeller (27B, 31B) için 24 GB+ VRAM önerilir. Gemma 4B orta sınıf GPU'larda (RTX 3090 gibi) çalışır. 1B model ise AI Edge çerçevesiyle modern akıllı telefonlarda dahi çalıştırılabilir.
check_circle Gemma 4'te yeni ne var?: Tüm varyantların yerel çok modlu (görüntü+video) hale gelmesi, 128K bağlam penceresi, 31B Dense'in rekabetçi kıyaslama sonuçları ve MoE varyantının eklenmesi Gemma 4'ün başlıca yenilikleridir.
check_circle LoRA ile Gemma ince ayarı kaç GPU belleği gerektirir?: Gemma 4B modeli için QLoRA + 4-bit kuantizasyon kombinasyonuyla 6-8 GB VRAM yeterlidir. Bu sayede RTX 3060 veya Apple M-serisi Mac'ler gibi tüketici donanımlarında ince ayar denemeleri yürütülebilir.