MosaicLeaks: Derin Araştırma Ajanlarının Sır Tutma Becerisi Test Edildi
newspaper Haber schedule 19 Haziran 2026 · 02:13 timer 2 dk okuma

MosaicLeaks: Derin Araştırma Ajanlarının Sır Tutma Becerisi Test Edildi

Yapay zeka araştırma ajanları, özel belgelerle web aramalarını birleştirirken hassas bilgileri sızdırabiliyor. MosaicLeaks adlı yeni çalışma, bu gizlilik riskini ölçmek için bir kıyaslama ve çözüm olarak Gizlilik Bilincinde Derin Araştırma (PA-DR) yöntemini sunuyor. PA-DR, bilgi sızıntısını %34'ten %9,9'a düşürürken görev başarısını koruyor.

Derin Araştırma Ajanları ve Gizlilik Riski

Günümüzde derin araştırma ajanları (deep research agents), özel yerel belgelerle web aramalarını birleştirerek karmaşık soruları yanıtlıyor. Ancak bu süreçte, ajanın dış sorguları (external queries) hassas bilgileri sızdırabiliyor. HuggingFace'te yayımlanan MosaicLeaks çalışması, bu gizlilik riskini mercek altına alıyor. Araştırmacılar, ajanların özel bilgileri parça parça sızdırdığı 'mozaik etkisi' (mosaic effect) adı verilen bir kusur tespit etti. Örneğin, bir sağlık firmasındaki araç, rutin bir soruyu yanıtlarken 'MediConn', '%70' ve 'Ocak' gibi terimleri içeren web aramaları yapabilir. Tek başına masum görünen bu sorgular, birleştirildiğinde 'MediConn'un altyapısının %70'ini Ocak 2025'e kadar buluta taşıdığı' gibi özel bir bilgiyi ortaya çıkarabilir.

MosaicLeaks Kıyaslaması ve Ölçüm Yöntemleri

MosaicLeaks, 1.001 çok adımlı araştırma zincirinden oluşan kontrollü bir kıyaslama (benchmark) sunuyor. Her zincir, yerel ve web alt sorularını iç içe geçiriyor. Ajan, bir alt soruyu yanıtlamak için önce yerel belgelerden bilgi almalı, ardından bu bilgiyi web sorgusunda kullanmalı. Bu yapı, sızıntıyı tetiklemek için tasarlanmış. Sızıntı üç şekilde ölçülüyor:

  • Niyet Sızıntısı (Intent Leakage): Ajanın hangi konuyu araştırdığını tahmin etme.
  • Yanıt Sızıntısı (Answer Leakage): Gözlemlenen sorgulardan özel bir soruyu yanıtlama.
  • Tam Bilgi Sızıntısı (Full-Information Leakage): Gözlemcinin, özel belgelerdeki gerçekleri keşfedip ifade edebilmesi.

Gizlilik İçin Eğitim: PA-DR Yöntemi

Araştırmacılar, önce ajanı sadece görev başarısı için eğitmenin sızıntıyı artırdığını gördü. Strict chain success (her adımın doğru yanıtlandığı zincir oranı) %48,7'den %59,3'e yükselirken, yanıt/tam bilgi sızıntısı %34,0'tan %51,7'ye fırladı. Bunun üzerine, Gizlilik Bilincinde Derin Araştırma (Privacy-Aware Deep Research - PA-DR) yöntemi geliştirildi. PA-DR, iki ödülü birleştiriyor:

  • Durumsal Görev Ödülü (Situational Task Reward): Her model çağrısını, aynı aşama ve adımdaki diğer çağrılarla karşılaştırarak hassas kredi ataması yapıyor.
  • Öğrenilmiş Gizlilik Ödülü (Learned Privacy Reward): Bir sınıflandırıcı, web sorgularının doğrudan veya mozaik etkisiyle sızıntı yapıp yapmadığını tahmin ediyor.

Sonuçlar ve Performans

PA-DR, strict chain success oranını %48,7'den %58,7'ye çıkarırken yanıt/tam bilgi sızıntısını %34,0'tan %9,9'a düşürdü. Bu, eğitimsiz taban modelden bile daha düşük bir sızıntı seviyesi. PA-DR, daha fazla web sorgusu yapmasına rağmen, sorgulardaki özel detayları (örneğin '%15' veya '2024') kaldırarak sızıntıyı azaltıyor. Ayrıca, durumsal ödüller sayesinde eğitim verimliliği 5-6 kat arttı: PA-DR, aynı görev başarısına ulaşmak için çok daha az örnek gerektiriyor.

Neden Önemli?

MosaicLeaks, derin araştırma ajanlarının gizlilik riskini ölçülebilir hale getiriyor ve 'gizliliği eğiterek' çözülebileceğini gösteriyor. Basit bir uyarı metni eklemek sızıntıyı azaltmada yetersiz kalırken, PA-DR gibi ödül tabanlı yöntemler hem başarıyı koruyor hem de sızıntıyı 3 kattan fazla düşürüyor. Bu çalışma, gerçek dünya uygulamalarında gizlilik odaklı eğitimin önemini vurguluyor. Araştırmacılar, daha geniş görevler ve farklı ajan mimarileri için benzer çalışmaların gerektiğini belirtiyor.

tag MosaicLeaks tag derin araştırma tag gizlilik tag yapay zeka tag PA-DR tag HuggingFace