AI Watermarking Nedir? Yapay Zeka İçerik İşaretleme (Yapay Zeka Filigranlama)

Yapay zeka tarafından üretilen içeriklere, kaynağını belirlemek için yerleştirilen görünmez veya görünür dijital işaretleme teknolojisi.

AI Watermarking (Yapay Zeka Filigranlama), yapay zeka sistemleri tarafından üretilen içeriklere —metin, görüntü, ses veya video— kaynağını izlemek ve doğrulamak amacıyla yerleştirilen dijital işaretleme yöntemleridir. Bu işaretler, kullanıcıya fark ettirmeyecek şekilde gizli (steganografik) veya açıkça görünür biçimde eklenebilir. Metin içerikleri için watermarking genellikle token olasılık dağılımlarının manipüle edilmesiyle gerçekleştirilir: modelin ürettiği her token seçiminde belirli bir gizli anahtar kullanılarak "kırmızı" ve "yeşil" token listeleri oluşturulur; yeşil listedeki tokenlar hafifçe ön plana çıkarılır. İstatistiksel analiz bu örüntüyü sonradan tespit edebilir. Görüntü için Google DeepMind'ın SynthID'si gibi sistemler piksellere insan gözünün fark edemeyeceği pertürbasyonlar ekler. Ses içerikleri için ise spektral manipülasyonlar tercih edilir. C2PA (Coalition for Content Provenance and Authenticity) standardı kapsamında kriptografik imzalar, içeriğin köken ve değişiklik geçmişini taşınabilir bir meta veri bloğu olarak kaydeder. Önde gelen standartlar ve sistemler şu şekilde sıralanabilir: C2PA, Adobe, Microsoft, Google, BBC ve Sony gibi kuruluşların bir araya gelmesiyle oluşturulan ve içeriklerin provenance (köken/atıf zinciri) bilgisini kriptografik olarak imzalayan açık standarttır. SynthID (Google DeepMind), görüntü, metin, ses ve video için ayrı ayrı tasarlanmış, insan algısına kapalı işaretleme sistemidir ve 2023 sonunda Imagen 2 ile entegre edilmiştir. OpenAI'nin DALL-E 3 ve C2PA, Meta'nın Emu ve VideoSeal, Microsoft'un Azure Content Integrity API'si bu alandaki diğer önemli uygulamalardır. AB Yapay Zeka Yasası (EU AI Act) Madde 50, yapay zeka tarafından üretilen görsel ve işitsel içeriklerin —özellikle deepfake'lerin— açıkça işaretlenmesini zorunlu kılmaktadır. Bu düzenleme; sentetik içerik yayılmasını sınırlamak, dezenformasyonla mücadele etmek ve dijital medya ekosisteminde güveni yeniden tesis etmek amacıyla hayata geçirilmiştir. Telif hakkı ihlallerinin tespitinde ve seçim dönemlerinde manipülatif içeriklerin doğrulanmasında da kritik bir işlev görmektedir. Mevcut watermarking yöntemleri bazı saldırı vektörlerine karşı kırılgandır: görüntü kırpma, JPEG yeniden sıkıştırma, metin için paraphrase atakları (anlamı koruyarak ifadeyi değiştirme) ve adversarial pertürbasyonlar watermark'ı bozabilir. Açık kaynak modellerinde zorunlu watermark uygulaması teknik ve yasal açıdan güçtür; zira ağırlıklar değiştirilebilir. Farklı sağlayıcıların sistemleri arasında birlikte çalışabilirlik henüz tam anlamıyla sağlanamamıştır.