tag PreTraining

Bu sayfada PreTraining etiketi ile işaretlenmiş tüm yapay zeka kavramlarını inceliyorsunuz.

Masked Language Modeling (Maskeli Dil Modelleme (MLM))

Masked Language Modeling (MLM), BERT ve türevlerinin ön eğitiminde kullanılan bir öğrenme görevidir. Modele verilen cümledeki token'ların rastgele bir bölümü [MASK] sembolüyle örtülür (maskelenir) ve model, bağlamı kullanarak bu gizlenen token'ları tahmin etmeye çalışır. Orijinal BERT makalesinde (Devlin ve ark., 2018) kullanılan yöntemde girdi dizisindeki token'ların %15'i seçilir. Bu seçilen token'ların %80'i [MASK] sembolüyle değiştirilirken %10'u rastgele başka bir token ile yer değiştirir, kalan %10 ise orijinal halinde bırakılır. Bu çeşitlendirme, modelin sadece [MASK] simgesini değil gerçek token dağılımını da öğrenmesini sağlar. MLM'nin en kritik özelliği modele çift yönlü (bidirectional) bağlam kavrama yeteneği kazandırmasıdır. GPT gibi öz-regresif modeller sola bakarken, BERT MLM sayesinde hem solundaki hem sağındaki token'lardan yararlanarak tahmin üretir. Bu, özellikle cümle sınıflandırma, soru cevaplama ve adlandırılmış varlık tanıma (NER) gibi anlama görevlerinde büyük avantaj sağlar. MLM, nesil yapay zeka modelleri (GPT gibi causal LM) karşısında anlama odaklı modellerin (BERT, RoBERTa, ALBERT, DistilBERT, XLM-RoBERTa) tercih ettiği ön eğitim stratejisi olmaya devam etmektedir. BERT'in genel NLP benchmark'larında devrim niteliğindeki başarısı, büyük ölçüde MLM ön eğitimine dayanmaktaydı.

arrow_forward