Differential Privacy (Diferansiyel Gizlilik)
Diferansiyel Gizlilik (Differential Privacy), bir veri kümesi üzerinde yapılan sorguların veya istatistiksel hesaplamaların sonuçlarının, veri kümesindeki herhangi bir bireyin varlığından veya yokluğundan istatistiksel olarak ayırt edilemez hale gelmesini sağlayan matematiksel bir gizlilik çerçevesidir. 2006 yılında Cynthia Dwork tarafından formüle edilen bu yöntem, bireysel gizlilik güvencesi ile veri kullanışlılığını matematiksel olarak dengeler.
Temel fikir, bir mekanizmanın çıktısına kontrollü miktarda rastgele gürültü ekleyerek bireysel veri noktalarının sorgularda iz bırakmasını önlemektir. Epsilon (ε) parametresi gizlilik bütçesini temsil eder: ε değeri küçüldükçe gizlilik artar ancak yanıtın doğruluğu azalır; ε büyüdükçe ise yanıtın doğruluğu artar ancak gizlilik zayıflar. Bu ödünleşim, uygulamanın gereksinimlerine göre dikkatle ayarlanmak zorundadır.
İki ana varyant mevcuttur: Merkezi Diferansiyel Gizlilik (Central DP), güvenilir bir koordinatörün ham veriyi toplayıp gürültüyü merkezi olarak eklediği modeli kullanırken; Yerel Diferansiyel Gizlilik (Local DP) gürültünün her kullanıcının cihazında verisi sunucuya gönderilmeden önce eklendiği modeli benimser. Local DP, özellikle güvenilir bir merkezi tarafın bulunmadığı mobil ve IoT senaryolarında tercih edilir.
Apple ve Google, iOS klavye ve Android telemetri verilerinde yerel diferansiyel gizliliği uygulamaktadır. ABD Nüfus Sayımı Bürosu, 2020 sayımında merkezi diferansiyel gizlilik kullandı. Yapay zeka dünyasında ise diferansiyel gizlilik, özellikle derin öğrenme modellerinin eğitiminde gizlilik koruyucu bir teknik olarak yerini sağlamlaştırmıştır; bu yaklaşım DP-SGD (Differentially Private Stochastic Gradient Descent) olarak bilinmektedir.