Federated Learning Nedir? Gizliliği Koruyan Dağıtık AI

list_altİçindekilerexpand_more

01Federated Learning Nedir?
02Nasıl Çalışır? Adım Adım
03Merkezi Eğitimle Fark
04Kullanım Alanları
05Mobil Klavyeler
06Sağlık ve Tıbbi Araştırma
07Finans ve Dolandırıcılık Tespiti
08Otonom Araçlar
09Avantajlar ve Zorluklar
10Avantajlar
11Zorluklar
12Federated Learning + Diferansiyel Gizlilik
13Popüler Framework’ler
14Knowledge Distillation ile İlişkisi
15Makine Öğrenmesinin Dağıtık Geleceği

Federated learning: dağıtık cihaz ağı üzerinden gizlilik korumalı AI eğitimi

Bir hastane zinciri, kanseri erken tespit eden bir model eğitmek istiyor. Elindeki hasta verileri son derece hassas. Diğer hastanelerle paylaşmak hem yasal açıdan riskli hem etik açıdan sorunlu. Peki ya her hastane verisini dışarı göndermeden ortak bir model geliştirebilseydi?

2026’da AB Yapay Zeka Yasası’nın (AI Act) tam uygulamaya girdiği bu dönemde, veri gizliliği teknik bir sorun olmaktan çıkıp yasal bir zorunluluk haline geldi. GDPR’ın birincil sağlık verilerini kapsayan kısıtlamaları, şirketleri veriyi buluta taşımadan AI geliştirme yollarını aramaya zorluyor. Federated learning tam bu noktada devreye giriyor: verinin tek bir merkeze toplanmasına gerek kalmadan, modelin verinin bulunduğu yere gitmesini sağlayan bir eğitim paradigması.

Federated Learning Nedir?

Federated learning (dağıtık öğrenme), model eğitimini verinin bulunduğu yerde gerçekleştiren bir makine öğrenmesi yaklaşımı. Geleneksel eğitimde tüm veriler merkezi bir sunucuya toplanır, model orada eğitilir. Federated learning’de ise süreç tersine çevrilir: model, verinin yanına gider.

Her istemci (bir akıllı telefon, hastane sunucusu veya fabrika sensörü olabilir) kendi yerel verisini kullanarak modeli kendi üzerinde günceller. Merkeze yalnızca bu güncellemeler, yani model ağırlıkları veya gradyanlar gönderilir. Ham veri hiçbir zaman cihazı terk etmez.

Terimi ilk kez 2016’da Google araştırmacıları McMahan ve ekibi, “Communication-Efficient Learning of Deep Networks from Decentralized Data” başlıklı makaleleriyle literatüre kazandırdı. İlk pratik kullanım alanı Google Gboard’du: klavye tahmini modeli milyonlarca Android telefonda yerel olarak eğitildi, kullanıcıların ne yazdığı hiçbir zaman Google sunucularına aktarılmadı.

Nasıl Çalışır? Adım Adım

Federated learning döngüsü beş aşamadan oluşur:

1. Global model dağıtımı: Merkezi koordinatör sunucu, mevcut global modelin ağırlıklarını seçilen istemcilere gönderir.

2. Yerel eğitim: Her istemci, indirdiği modeli kendi yerel verisiyle birkaç epoch boyunca eğitir. Bu adımda veri istemcinin kendi cihazından dışarı çıkmaz.

3. Güncelleme gönderimi: İstemciler ham veriyi değil, yerel eğitimden elde edilen delta ağırlıklarını (model güncellemelerini) merkez sunucuya iletir.

4. Toplama (Aggregation): Koordinatör, gelen güncellemeleri birleştirir. En yaygın yöntem FedAvg (Federated Averaging): istemcilerden gelen ağırlık güncellemeleri, her istemcinin veri büyüklüğüyle orantılı biçimde ortalaması alınarak global modele entegre edilir.

5. Döngünün tekrarı: Güncellenen global model yeniden dağıtılır, tüm süreç hedef performansa ulaşana kadar devam eder.

Her turda aktarılan veri miktarı, ham veriyle kıyaslandığında çok küçük kalır. Bir model güncellemesi megabaytlarla ifade edilirken, hastane görüntü veri seti gigabayt ya da terabayt düzeyinde olabilir.

Merkezi Eğitimle Fark

Hangi senaryoda hangi yaklaşımın daha uygun olduğunu anlamak için temel boyutlara bakmak gerekir:

Boyut	Merkezi Eğitim	Federated Learning
Veri lokasyonu	Bulut/merkez sunucu	İstemci cihazlar
Gizlilik	Düşük (veri toplanır)	Yüksek (ham veri paylaşılmaz)
Bant genişliği	Yüksek veri transferi	Yalnızca model güncellemeleri
Model kalitesi	Genellikle daha yüksek (homojen veri)	Non-IID veriyle zorlanır
Yasal uyum	GDPR/HIPAA riski yüksek	Daha uyumlu
Gecikme	Düşük (merkezi hesaplama)	Yüksek (yavaş istemciler etkileyebilir)

Merkezi eğitim, veriye tam erişim olduğunda ve gizlilik kısıtı bulunmadığında hâlâ tercih edilen yöntem. Federated learning ise düzenleyici kısıtların, veri hassasiyetinin veya ağ bant genişliği sınırlılığının belirleyici olduğu ortamlarda öne çıkıyor.

Kullanım Alanları

Federated learning artık yalnızca araştırma makalelerinde değil, üretim sistemlerinde de çalışıyor.

Mobil Klavyeler

Google Gboard’un akıllı metin tahmini, federated learning’in en eski ve en büyük ölçekli ürün uygulaması. Milyonlarca Android cihaz, kullanıcının yazma alışkanlıklarını yerel olarak öğreniyor. Elde edilen model güncellemeleri şifreli biçimde Google’a iletilip FedAvg ile birleştiriliyor. Kullanıcı ne yazdı, kimi aradı, hangi emoji’yi tercih etti: bunların hiçbiri Google sunucularına taşınmıyor.

Sağlık ve Tıbbi Araştırma

Federasyonlar arasında en kritik potansiyel bu alanda. Birden fazla hastanenin verisi paylaşılmadan ortak bir tümör tespit modeli geliştirilebilir. Örneğin Intel ve University of Pennsylvania liderliğinde gerçekleştirilen FeTS (Federated Tumor Segmentation) çalışması, 71 hastanenin katılımıyla beyin tümörü segmentasyonu için federated bir model eğitti. Herhangi bir hasta görüntüsü kurumlar arasında dolaşmadı; yalnızca model güncellemeleri paylaşıldı.

Finans ve Dolandırıcılık Tespiti

Bankalar kendi müşteri işlem verilerini rakip kurumlarla paylaşmak istemez. Ama dolandırıcılık örüntüleri genellikle birden fazla bankayı kapsıyor. Federated learning, bankaların ortak bir dolandırıcılık tespit modeli eğitmesini olanaklı kılıyor. Her banka kendi verisiyle yerel modeli güncelliyor; yalnızca gradyanlar merkezi koordinatöre iletiyor.

Otonom Araçlar

Araç içi sensörler büyük hacimde sürüş verisi üretiyor. Bu veriyi merkezi buluta taşımak hem bant genişliği hem gecikme açısından pahalı. Federated learning ile her araç yerel sürüş verisiyle modeli günceller; merkezi model zaman içinde tüm araçların deneyiminden beslenir. Tesla’nın “shadow mode” eğitimi bu yapıya yakın bir yaklaşım izliyor.

Avantajlar ve Zorluklar

Avantajlar

Ham veri istemciyi terk etmediği için GDPR, HIPAA ve CCPA gibi yasal çerçevelere uyum çok daha doğrudan. AI Act’in yüksek riskli AI sistemleri için belirlediği veri yönetimi yükümlülükleri, merkezi eğitimde ağır bir uyumluluk yükü yaratıyor; federated mimari bu yükü yapısal olarak azaltıyor.

Model, verinin zaten bulunduğu yerde çalışıyor. Tüm ham veriyi merkeze taşıma maliyeti ortadan kalkıyor; bu özellikle bant genişliği kısıtlı ortamlarda belirleyici.

Federated modeller bireysel istemcilere göre ince ayar yapılabilir. Global model bir temel oluşturur, istemci yerel verisine göre bunu özelleştirebilir.

Zorluklar

En bilinen sorun istatistiksel heterojenlik, Non-IID veri olarak da adlandırılır. Merkezi eğitimde verinin tüm dağılımını görürsünüz. Federated ortamda her istemcinin verisi farklı bir dağılımı temsil edebilir; bir hastanedeki hasta popülasyonu diğerinden çok farklı olabilir. Bu durum FedAvg’ın yakınsama hızını düşürür ve modeli belli istemcilere doğru çarpıtabilir.

Her federation turu ağ üzerinden güncelleme transferi gerektiriyor. Büyük modellerde bu transfer ciddi bir bant genişliği yükü oluşturabilir. Gradyan sıkıştırma, kuantizasyon ve sparsifikasyon teknikleri bu yükü azaltmak için geliştirildi.

Kötü niyetli bir istemci, kasıtlı olarak bozulmuş güncellemeler gönderebilir. Buna poisoning attack deniyor. Merkezi eğitimde tek bir güvenilir veri kaynağınız var; federated ortamda istemcileri doğrulamak daha zor. Byzantine-robust aggregation yöntemleri bu tehdide karşı geliştirilmeye devam ediyor.

Bunlara ek olarak sistem heterojenliği var. Farklı cihazların işlem kapasitesi, ağ bağlantısı ve çevrimiçi kalma süresi birbirinden farklı. Yavaş kalan istemciler (straggler) turu uzatabilir veya toplam süreyi belirsiz kılabilir.

Federated Learning + Diferansiyel Gizlilik

Federated learning tek başına güçlü bir gizlilik garantisi vermez. Model güncellemelerinin analizinden bile bazı bireysel veri özelliklerinin tersine mühendislikle çıkarılabildiği gösterildi. Bu saldırıya gradient inversion deniyor.

Daha güçlü bir güvence için federated learning, diferansiyel gizlilik (DP) ile birleştiriliyor. Temel mekanizma şu: her istemci, güncellemesini merkeze göndermeden önce Gauss gürültüsü ekliyor (DP-SGD). Bu gürültü, bireysel veri noktalarının gradyana olan etkisini matematiksel olarak sınırlıyor.

Apple, iPhone’da kullandığı federated learning sistemine diferansiyel gizlilik ekledi. Emoji tahmini, QuickType önerileri, Siri’nin kişiselleştirilmesi bu altyapı üzerinde çalışıyor. Google da federated ortamında DP-SGD kullanıyor.

Diferansiyel gizlilik bir privacy budget kavramı getiriyor: ε (epsilon) değeri küçüldükçe gizlilik koruması artar, model kalitesi düşer. Bu denge seçimi, sistemi tasarlayanların en kritik kararlarından biri.

RLHF gibi merkezi hizalama tekniklerinin aksine, federated + DP kombinasyonu gizliliği insan tercihiyle birlikte çözmeye çalışıyor. İki yaklaşımın birbirini tamamlama potansiyeli var; örneğin gizlilik korunan federated RLHF üzerine aktif araştırmalar sürüyor.

Popüler Framework’ler

Federated learning altyapısı kurmak için sıfırdan başlamak zorunda değilsiniz. Olgun açık kaynak araçlar mevcut.

TensorFlow Federated (TFF) Google’ın geliştirdiği ve TensorFlow ekosistemiyle bütünleşik çalışan framework. Hem simülasyon hem üretim ortamları için tasarlandı; FedAvg ve diferansiyel gizlilik desteği yerleşik geliyor.

Flower (flwr) framework bağımsız bir kütüphane. PyTorch, TensorFlow, JAX ve scikit-learn ile çalışıyor. API sadeliği nedeniyle araştırma prototipleri için en yaygın tercih.

PySyft OpenMined topluluğunun gizlilik odaklı kütüphanesi. Diferansiyel gizlilik ve güvenli çok taraflı hesaplamayı (Secure Multi-Party Computation) doğrudan entegre ediyor.

OpenFL Intel’in framework’ü. Sağlık sektörüne yönelik optimize edildi; FeTS çalışmasında bu araç kullanıldı.

Seçim büyük ölçüde mevcut ML altyapısına bağlı. TensorFlow ağırlıklı bir ekip için TFF mantıklı; PyTorch veya karma bir ortam için Flower daha esnek.

Knowledge Distillation ile İlişkisi

Federated learning ve knowledge distillation, farklı sorunları çözse de zaman zaman birlikte kullanılıyor. Özellikle Federated Distillation veya Ensemble Distillation olarak adlandırılan yaklaşımlarda her istemci kendi küçük modelini yerel olarak eğitir; merkez sunucu, bu yerel modellerin çıktılarını bir teacher ensemble gibi kullanarak global bir student model damıtır. Böylece ham ağırlık transferi yerine yumuşatılmış olasılık dağılımları paylaşılır. Gizlilik koruması artar, iletişim maliyeti düşer.

Makine Öğrenmesinin Dağıtık Geleceği

2016’da Google araştırmacılarının yayımladığı ilk makale, makine öğrenmesi topluluğunda küçük bir ilgi alanıydı. On yılda tablo değişti.

AB AI Act’in 2026’daki tam uygulamasıyla birlikte yüksek riskli AI sistemlerinde veri yönetimi yükümlülükleri netleşti. Sağlık, finans ve kamu güvenliği alanlarındaki şirketler, merkezi veri toplama ile uyum maliyeti arasında doğrudan bir çatışmayla karşılaşıyor. Federated mimari bu çatışmayı kısmen çözüyor.

Teknik tarafta da tablo değişti. TFF, Flower ve OpenFL gibi framework’ler üretim kullanımına hazır hale geldi. Google Gboard, Apple QuickType ve FeTS gibi projeler sistemin gerçekten ölçeklendiğini gösterdi.

Ama asıl değişen şu: veri biriktirmek ile veriden öğrenmek artık zorunlu olarak birlikte gitmiyor. Federated learning bunu mümkün kılan mekanizma.

Dağıtık öğrenme konusunu daha geniş bir çerçevede değerlendirmek isteyenler için: makine öğrenmesine giriş, model optimizasyon teknikleri ve RLHF ile insan geri bildirimi konularını ele alan yazılarımıza göz atabilirsiniz.