Öğretmen Model Tipleri
smart_toy Büyük LLM
GPT-4, Claude Opus, Gemini 1.5 Pro gibi frontier modeller. Sentetik veri üretimi ve çevrimdışı damıtma için kullanılır. API'ye erişim yeterlidir.
group Ensemble Öğretmen
Birden fazla modelin çıktıları ortalaması. Tek öğretmenden daha istikrarlı ve zengin yumuşak etiketler sağlar.
autorenew Kendini Damıtma
Modelin önceki versiyonundan öğrenmesi. Born-Again Networks: aynı mimariyi tekrar tekrar damıtarak performans artışı.
tune Kapı Öğretmen
Görev-spesifik öğretmenler. Karmaşık görev için büyük genel model yerine küçük ama görevde uzmanlaşmış model öğretmen olabilir.
checklist Öğretmen Seçimi Kriterleri
İyi bir öğretmen model: (1) Öğrenciden belirgin biçimde güçlü olmalı (aksi hâlde transfer edecek bilgi yoktur), (2) Öğrencinin kapasitesini aşmayan gradyan sinyalleri üretmeli (kapasiteli bir öğrenci zayıf öğretmenden çok şey öğrenemez), (3) Hedef görev ve dağılımla uyumlu olmalı. Öğretmen-öğrenci kapasite farkı çok büyükse öğrenci bazen daha küçük bir ara öğretmenden daha iyi öğrenir.
quiz Sık Sorulan Sorular
- check_circle Öğretmen modele eğitim sırasında her zaman erişim gerekli mi?: Çevrimiçi damıtmada evet; öğretmen eğitim sırasında canlı gradyan veya çıktı sağlar. Çevrimdışı damıtmada hayır; öğretmen sadece veri üretim aşamasında gereklidir.
- check_circle Açık kaynak öğretmen modellerle damıtma yapılabilir mi?: Evet. Llama 3 70B veya Qwen2 72B gibi açık ağırlıklı modeller, daha küçük modeller için etkili öğretmenler olarak kullanılabilir.