Data Poisoning (Veri Zehirlenmesi)

Veri Zehirlenmesi (Data Poisoning), kötü niyetli aktörlerin bir yapay zeka modelinin eğitim verilerine (dataset) kasten hatalı, manipüle edilmiş veya yanıltıcı örnekler enjekte ederek, modelin öğrenme sürecini bozduğu ve model canlıya alındığında belirli konularda sürekli yanlış (veya saldırganın istediği) kararlar vermesini sağladığı siber saldırı türüdür.

Veri Zehirlenmesi (Data Poisoning), kötü niyetli aktörlerin bir yapay zeka modelinin eğitim verilerine (dataset) kasten hatalı, manipüle edilmiş veya yanıltıcı örnekler enjekte ederek, modelin öğrenme sürecini bozduğu ve model canlıya alındığında belirli konularda sürekli yanlış (veya saldırganın istediği) kararlar vermesini sağladığı siber saldırı türüdür.

science Nasıl Gerçekleşir?

Model eğitimi büyük ölçüde internetten (Reddit, Twitter, Wikipedia) toplanan ham verilerle yapılır. Saldırganlar, internete bilerek yanlış bilgilerle dolu on binlerce makale yükler veya bir otonom aracın görüntü eğitim setindeki 'DUR' tabelalarının üzerine küçük sarı bir çıkartma ekleyip altına 'Hızlan' yazar. Yapay zeka bu kirlenmiş veriyle eğitildiğinde, gerçek hayatta o küçük sarı çıkartmayı gördüğü her tabelada durmak yerine gaza basmayı öğrenir (Backdoor Attack).

Tehlikeleri ve Korunma

track_changes Hedefli Manipülasyon

Modelin genel olarak kusursuz çalışıp, sadece belirli bir siyasi parti veya rakip şirket sorulduğunda iftira atacak şekilde ince ayar (zehirlenme) alması.

shield Anti-Zehirlenme

Bunu önlemek için verilerin çok sıkı filtrelenmesi, güvenilmeyen kaynakların dışlanması ve modelin anormallikleri fark edecek matematiksel 'Veri Sanitizasyonu' algoritmalarıyla korunması gerekir.