Sıcaklık Etkisi
arrow_upward T < 1 (Keskin)
Dağılım zirveli. Model en güvendiği sınıfa yüksek olasılık atar. Metin üretimde deterministik, tekrarlı çıktı.
horizontal_rule T = 1 (Nötr)
Standart softmax. Modelin orijinal güven dağılımı. Kalibrasyon ve metin üretimde başlangıç noktası.
blur_on T > 1 (Yumuşak)
Dağılım düzleşir. Belirsizlik artar, alt sınıflar daha fazla pay alır. Damıtmada karanlık bilgi aktarımı için tercih edilir.
edit Metin Üretimde T
LLM sampling'de T yüksekse yaratıcı/çeşitli; düşükse odaklı/öngörülebilir çıktı. Genellikle 0.7-1.0 arası kullanılır.
align_horizontal_center Kalibrasyon: ECE ve Güven Hizalama
Model kalibrasyonu, tahminin olasılığının (güven) gerçek doğrulukla örtüşmesini sağlar. Kalibrasyon metriği olarak ECE (Expected Calibration Error) kullanılır. Platt scaling ve sıcaklık ölçekleme en yaygın post-hoc kalibrasyon yöntemleridir. Sıcaklık ölçekleme tek parametreli olması nedeniyle aşırı uyuma (overfitting) karşı dayanıklıdır ve genellikle daha karmaşık yöntemlere kıyasla rekabetçi kalibrasyon sağlar.
quiz Sık Sorulan Sorular
- check_circle LLM temperature ile damıtma temperature aynı şey midir?: Kavramsal olarak aynı işlemi ifade eder — softmax dağılımını yumuşatmak — ancak kullanım amacı farklıdır. LLM sampling'de çeşitlilik kontrolü; damıtmada öğretmen bilgi aktarımı için kullanılır.
- check_circle Top-p (nucleus sampling) ile sıcaklık arasındaki fark nedir?: Sıcaklık tüm dağılımı ölçekler; top-p ise kümülatif olasılığı p'ye ulaşana kadar token kümesini kırpar. İkisi kombinasyonlu kullanılabilir.