Canary Deployment Nasıl Çalışır?
Canary deployment sürecinde yük dengeleyici (load balancer) veya servis ağı (service mesh), gelen trafiği iki farklı model sürümüne böler: büyük çoğunluk stabil (eski) modele, küçük bir dilim ise yeni (canary) modele yönlendirilir. Tipik bir başlangıç oranı %1-5 civarındadır. Yeni model bu sınırlı yükleme altında izlenir: hata oranı, yanıt gecikmesi, model skoru ve iş metrikleri (tıklama oranı, dönüşüm, kullanıcı şikayeti) gerçek zamanlı olarak takip edilir. Metrikler referans değerlerin içinde kalıyorsa trafik payı kademeli olarak artırılır: %5 → %20 → %50 → %100. Herhangi bir anomali tespit edildiğinde trafik sıfıra çekilir ve rollback otomatik olarak tetiklenir. Bu mekanizma sayesinde ekipler, yeni modelin gerçek üretim trafiği altındaki davranışını laboratuvar ortamında ölçemeyecekleri koşullarda gözlemleyebilir.
MLOps'ta Kullanım Senaryoları
- check_circle Model güncellemeleri: Daha iyi doğruluk iddiasıyla yeniden eğitilen bir modelin üretimde gerçekten daha iyi performans gösterip göstermediğini doğrular.
- check_circle Öneri sistemleri: Yeni sıralama algoritması küçük bir kullanıcı dilimine sunularak tıklama ve dönüşüm metrikleri karşılaştırılır.
- check_circle NLP model sürüm geçişleri: Büyük dil modeli sürüm yükseltmelerinde regresyon riskini minimize eder; eski model güvenli liman olarak bekler.
- check_circle Altyapı değişiklikleri: Model servis altyapısındaki değişiklikler (yeni donanım, çerçeve güncellemesi) önce küçük trafikle test edilir.
Canary Deployment ve A/B Testi: Fark Nedir?
Canary Deployment
Birincil amaç risk yönetimidir. Yeni sürüm küçük trafikle izlenir; sorun çıkmazsa kademeli genişleme yapılır, çıkarsa hızla geri dönülür.
A/B Testi
Birincil amaç deneysel karşılaştırmadır. İki sürüm istatistiksel anlamlılık elde edilene kadar paralel çalışır; kazanan sürüm tam rollout alır.
Birlikte Kullanım
Her iki teknik de aynı anda uygulanabilir: canary deployment rollout'u güvende tutarken, A/B testi hangi sürümün daha iyi olduğunu belirler.
Sıkça Sorulan Sorular
- check_circle Canary deployment ile blue-green deployment arasındaki fark nedir?: Blue-green deployment'ta iki tam ortam paralel çalışır ve trafik bir anda yüzde yüz geçiş yapar; canary deployment'ta ise tek bir ortamda trafik kademeli olarak bölünür ve artırılır.
- check_circle Canary trafik payı ne kadar olmalı?: Genellikle %1-5 ile başlanır. Düşük trafikli uygulamalarda yeterli istatistiksel sinyal elde edilebilmesi için oran biraz daha yüksek tutulabilir; yüksek trafikli sistemlerde %1 bile binlerce istek anlamına gelir.
- check_circle Canary rollback tetikleyicileri neler olabilir?: Hata oranının eşiği aşması, P99 gecikme süresi artışı, model güven skoru düşüşü veya iş metriklerinde (tıklama oranı, dönüşüm) anlamlı düşüş otomatik rollback tetikleyicileri olarak yapılandırılabilir.
- check_circle Hangi MLOps platformları canary deployment'ı destekler?: Kubernetes Argo Rollouts, AWS SageMaker Deployment, Seldon Core, BentoML, KServe ve Kubeflow bu stratejiye yerel destek sağlayan başlıca araçlardır.