Parameters (Parametreler)

Parametreler, bir yapay sinir ağının eğitim süreci boyunca verilerden öğrendiği, hafızasına kaydettiği ve kararlarını verirken kullandığı iç değişkenlerdir (ağırlıklar ve sapmalar).

Parametreler, bir yapay sinir ağının eğitim süreci boyunca verilerden öğrendiği, hafızasına kaydettiği ve kararlarını verirken kullandığı iç değişkenlerdir (ağırlıklar ve sapmalar). Bir modelin "büyüklüğü" genellikle parametre sayısı ile ölçülür. Örneğin GPT-3'ün 175 milyar parametresi vardır.

format_list_numbered Parametre Sayısı Neden Önemli?

Parametreleri, bir beynin içindeki sinaps (nöron bağlantıları) sayısı gibi düşünebilirsiniz. Parametre sayısı ne kadar çoksa, model o kadar ince detayı, dil yapısını, dünya bilgisini ve nüansı hafızasında (matematiksel olarak) tutabilir. Ancak parametre sayısının artması, modeli çalıştırmak için devasa RAM ve hesaplama gücü (GPU) gerektirir. 7 milyar parametreli bir model ev bilgisayarında çalışabilirken, 1 Trilyon parametreli modeller dev veri merkezlerine ihtiyaç duyar.

Hyperparameter (Hiperparametre) Farkı

memory Parametreler (Parameters)

Modelin kendi kendine eğitim verisinden öğrendiği rakamlardır. Mühendisler bunlara elle müdahale edemez. Modelin bilgisidir.

tune Hiperparametreler

Modelin eğitime başlamadan ÖNCE veri bilimciler tarafından manuel olarak ayarlanan kurallardır (Örn: Öğrenme hızı, ağın kaç katmanlı olacağı vb.).