Overfitting (Aşırı Öğrenme / Ezberleme)

Overfitting (Aşırı Öğrenme), bir makine öğrenimi modelinin eğitim verilerine çok fazla odaklanarak o verilerdeki tüm istisnaları, gürültüleri ve hataları "ezberlemesi", bu nedenle daha önce hiç görmediği yeni (test) verileriyle karşılaştığında genelleme yapamayıp başarısız olması durumudur.

Overfitting (Aşırı Öğrenme), bir makine öğrenimi modelinin eğitim verilerine çok fazla odaklanarak o verilerdeki tüm istisnaları, gürültüleri ve hataları "ezberlemesi", bu nedenle daha önce hiç görmediği yeni (test) verileriyle karşılaştığında genelleme yapamayıp başarısız olması durumudur. Bir öğrencinin sınavdaki soruları anlamak yerine cevap şıklarını ezberleyip, farklı sorularda sıfır almasına benzer.

psychology_alt Overfitting Neden Olur?

Aşırı öğrenmenin temel sebepleri: 1) Modelin çözmesi gereken probleme göre çok karmaşık veya çok büyük (çok fazla parametreli) olması. 2) Eğitim veri setinin çok küçük olması. 3) Eğitim işleminin (Epoch) gereğinden çok uzun sürdürülerek modelin aynı veriyi tekrar tekrar görerek tamamen ezberlemesine izin verilmesidir.

Nasıl Önlenir?

add_circle Daha Fazla Veri

Eğitim setini büyütmek, modelin sadece tek tip örnekleri değil, dünyadaki genel varyasyonları görmesini sağlar.

stop_circle Erken Durdurma (Early Stopping)

Eğitim sırasında modelin test verilerindeki başarısının düştüğü (ezberlemeye başladığı) anda eğitimin otomatik olarak kesilmesidir.

tune Düzenlileştirme (Regularization)

Dropout, L1/L2 gibi matematiksel tekniklerle ağdaki bazı nöronların rastgele kapatılarak modelin veriyi ezberlemesinin zorlaştırılmasıdır.