Damıtma Süreci
school Öğretmen Model
Büyük, pahalı ve yüksek doğruluklu model. Eğitim verisi üzerinde yumuşak olasılık dağılımları üretir.
label Yumuşak Etiket
Öğretmenin sınıf olasılıkları. Sıcaklık parametresiyle düzleştirilir; "karanlık bilgi"yi içerir.
person Öğrenci Model
Küçük, hızlı ve verimli hedef model. Öğretmenin yumuşak etiketlerini taklit ederek eğitilir.
calculate Damıtma Kaybı
KL sapması + çapraz entropi kombinasyonu; öğrencinin öğretmenden ne kadar sapacağını ölçer.
rocket_launch LLM Damıtmasında Kullanım Senaryoları
Büyük modelden veri üretimi: GPT-4 veya Claude büyük miktarda kaliteli eğitim verisi üretir; bu veriyle küçük model ince ayarlıdır. Yanıt damıtması: Büyük modelin çıktıları (hem yanıt hem logitler) küçük model için hedef olarak kullanılır. Hizalama damıtması: Büyük modelin güvenli ve yararlı davranışı küçük modele aktarılır. Phi-4, Gemma 2 ve Qwen serileri bu yaklaşımdan yoğun şekilde yararlanmaktadır.
quiz Sık Sorulan Sorular
- check_circle Damıtma ile fine-tuning arasındaki fark nedir?: Fine-tuning orijinal veriyle modeli güncellerken, damıtma başka bir modelin çıktılarından öğrenir. İkisi kombine edilebilir: öğretmen verisini fine-tuning ile uygulamak yaygın bir yaklaşımdır.
- check_circle Öğretmen modeline erişim şart mı?: Klasik damıtmada eğitim sırasında öğretmene erişim gerekir. Veri damıtmasında ise öğretmenin önceden ürettiği yanıtlar kullanılır; canlı erişim gerekmez.