Data Augmentation (Veri Artırma / Çoğaltma)

Veri Artırma (Data Augmentation), makine öğreniminde mevcut eğitim veri setinin boyutunu ve çeşitliliğini, elimizdeki verilere çeşitli matematiksel veya sentetik dönüşümler uygulayarak "yapay olarak" çoğaltma işlemidir.

Veri Artırma (Data Augmentation), makine öğreniminde mevcut eğitim veri setinin boyutunu ve çeşitliliğini, elimizdeki verilere çeşitli matematiksel veya sentetik dönüşümler uygulayarak "yapay olarak" çoğaltma işlemidir. Özellikle görüntü işlemede veri eksikliği ve overfitting (aşırı öğrenme) problemlerini çözmek için kullanılır.

control_camera Nasıl Çalışır?

Diyelim ki elinizde sadece 1000 adet kedi fotoğrafı var ve model eğitmek için bu yetersiz. Veri artırma ile her bir kedi fotoğrafını yatay eksende döndürür, %10 kırpar, renklerini karartır, hafif bulanıklaştırır ve %5 yakınlaştırırsınız. 1000 fotoğraf, insan gözü için hala kedi olsa da bilgisayar için pikselleri tamamen değişmiş 10.000 farklı kedi fotoğrafına dönüşür.

Metin Verisi İçin Data Augmentation

find_replace Eşanlamlı Değişimi

Cümledeki kelimeleri rastgele eşanlamlılarıyla değiştirmek (Örn: 'Güzel araba' -> 'Şık otomobil').

translate Geri Çeviri (Back Translation)

Cümleyi önce İngilizceden Fransızcaya, sonra tekrar Fransızcadan İngilizceye çevirerek farklı ama aynı anlamda yeni bir cümle elde etmek.

delete_sweep Rastgele Ekleme/Silme

Cümlenin anlamını bozmayacak şekilde aralara kelimeler serpiştirmek veya önemsiz kelimeleri çıkartmak.