Model Weights (Model Ağırlıkları)
Model ağırlıkları (model weights), bir yapay sinir ağının eğitim süreci boyunca öğrendiği sayısal parametrelerdir. Her nöron bağlantısına atanan bu ağırlık değerleri, modelin girdi verilerini işleyip çıktı üretmesini sağlayan temel yapı taşlarıdır. Milyonlarca ya da milyarlarca ağırlık içeren büyük dil modellerinde (LLM) bu değerler, dildeki örüntüleri, bağlamı ve anlam ilişkilerini kodlar.
Model ağırlıkları, geri yayılım (backpropagation) algoritması ve gradyan inişi (gradient descent) yöntemiyle güncellenir. Eğitim tamamlandığında ağırlıklar dondurulur ve çıkarım (inference) aşamasında sabit kalır. GPT-4, Llama 3 veya Mistral gibi modeller için ağırlık dosyaları genellikle PyTorch (.pt, .bin) veya SafeTensors formatında dağıtılır.
Nicemleme (quantization) teknikleri, ağırlıkların temsil hassasiyetini azaltarak (FP32 → FP16 → INT8 → INT4) model boyutunu ve bellek kullanımını düşürür. Örneğin GGUF formatı, Llama.cpp ile yerel çalıştırma için 4-bit nicemleme uygular; bu sayede 70 milyar parametreli bir model, tüketici GPU'larında çalışabilir hale gelir.