Model Registry (Model Kayıt Defteri)

Model Kayıt Defteri, eğitilmiş ML modellerini merkezi olarak sürümlendiren, staging/production aşamalarını yöneten ve denetim izini koruyan MLOps altyapı bileşenidir.

Model Kayıt Defteri (Model Registry), makine öğrenimi (ML) operasyonlarının (MLOps) temel altyapı bileşenlerinden biridir. Yazılım geliştirmede kullanılan Git sürüm kontrol sistemi veya PyPI paket yöneticisi gibi araçların ML modelleri için tasarlanmış işlevsel eşdeğeridir; eğitilmiş modellerin merkezi bir depoda saklanmasını, sürümlenmesini ve yaşam döngüsünün yönetilmesini sağlar. Bir ML modeli her yeniden eğitildiğinde, oluşturulan model dosyaları ve meta veriler kayıt defterine yüklenerek numaralı bir sürüm elde eder. Bu sürüme; kullanılan veri kümesinin sürümü, hiperparametre değerleri, doğruluk metrikleri, F1 skoru, eğitim kodu commit hash'i ve sorumlu ekip üyesi bilgisi gibi veriler otomatik olarak iliştirilebilir. Bu sayede herhangi bir modeli tek komutla yeniden oluşturmak ya da geçmiş sürümüne rollback yapmak mümkün olur. Model kayıt defterleri genellikle üç temel aşama kavramını destekler: Staging (üretim öncesi nihai test ortamı), Production (canlı trafiğe hizmet veren onaylı model) ve Archived (artık kullanılmayan ama tarihsel kayıt için saklanan model). Ekipler veya otomatik kalite kapıları, modeli bu aşamalar arasında terfi ettirme (promote) ya da geri çekme (rollback) yetkisine sahiptir. Bu yapının başlıca faydaları şöyle sıralanabilir: Yeniden üretilebilirlik — bir yıl önceki üretim modelini tam bağlamıyla geri almak mümkün olur; Denetlenebilirlik — hangi modelin ne zaman, kim tarafından devreye alındığı otomatik kayıt altına alınır; İş birliği — farklı ekiplerin aynı model üzerinde bağımsız çalışabilmesi sağlanır; Uyumluluk — GDPR ve HIPAA gibi yasal düzenlemeler için gereken denetim izi otomatik oluşturulur. Sektörde en yaygın araçlar arasında açık kaynaklı MLflow Model Registry (Databricks ekosistemi), Amazon SageMaker Model Registry, Google Vertex AI Model Registry ve Azure Machine Learning Model Registry sayılabilir. Büyük organizasyonlarda model kayıt defteri, Feature Store ve CI/CD pipeline'larıyla birlikte kurgulanan bütünleşik bir MLOps platformunun ayrılmaz parçası haline gelmiştir.

manage_history Model Kayıt Defteri Nasıl Çalışır?

Bir ML modeli her eğitildiğinde pipeline, oluşturulan model dosyaları ve meta verileri (hiperparametreler, doğruluk metrikleri, veri seti sürümü, kod commit hash'i) kayıt defterine iletir. Model otomatik olarak numaralı bir sürüm alarak 'Staging' aşamasına atanır. Entegrasyon testleri ve kalite kapıları geçildikten sonra ekip ya da otomasyon, modeli 'Production' aşamasına terfi ettirir; eski üretim modeli 'Archived' durumuna düşer. Herhangi bir anda hata veya performans düşüşü yaşandığında önceki sürüme tek komutla rollback yapmak mümkündür.

Yaşam Döngüsü Aşamaları

science Staging

Üretim adayı model; entegrasyon ve A/B testlerinin yapıldığı ön üretim ortamı. Kalite kapısını geçmeden Production'a ilerleyemez.

rocket_launch Production

Canlı trafiğe hizmet veren onaylı model sürümü. Genellikle aynı anda yalnızca bir sürüm aktif üretim durumundadır.

inventory Archived

Kullanımdan kaldırılmış ama tarihsel denetim ve yasal uyum amacıyla saklanan eski model sürümleri.

Kullanım Alanları ve Faydaları

  • check_circle Yeniden üretilebilirlik: Her model sürümü eğitim kodu, hiperparametreler ve veri seti sürümüyle birlikte saklanır; yıllar sonra bile aynı modeli tam bağlamıyla yeniden oluşturmak mümkündür.
  • check_circle Rollback yönetimi: Üretimde performans düşüşü veya anomali tespit edildiğinde önceki sürüme tek komutla geri dönmek kesinti süresini minimuma indirir.
  • check_circle Yasal uyumluluk ve denetim izi: GDPR ve HIPAA gibi düzenlemelerin gerektirdiği 'hangi model, ne zaman, kim tarafından devreye alındı' sorusunu otomatik kayıt altına alarak yanıtlar.
  • check_circle Çok ekipli iş birliği: Farklı ekipler aynı model üzerinde bağımsız çalışabilir; sürüm çakışmaları ve istem dışı üzerine yazma hataları ortadan kalkar.

Sıkça Sorulan Sorular

  • check_circle Model kayıt defteri ile experiment tracking arasındaki fark nedir?: Experiment tracking, model geliştirilirken yapılan tüm deney koşularını ve metrikleri kaydeder. Model kayıt defteri ise yalnızca üretime çıkarılmaya aday onaylı sürümleri yönetir. İkisi genellikle birlikte kullanılır: en iyi deney sonucu kayıt defterine kaydedilir.
  • check_circle Küçük ekipler için model kayıt defteri gerekli midir?: Tek bir model ve tek bir geliştirici varsa dosya sistemi yeterli olabilir. Birden fazla model veya düzenleyici uyumluluk gereklilikleri olduğunda kayıt defteri kritik hale gelir. MLflow kurulumunun düşük maliyeti nedeniyle küçük ekipler de erken benimseyebilir.
  • check_circle En popüler açık kaynak model kayıt defteri hangisidir?: MLflow Model Registry, 2019'dan bu yana en yaygın kullanılan açık kaynak çözümdür. AWS SageMaker, Azure ML ve Google Vertex AI üzerinde yönetilen servis olarak da sunulmaktadır. DVC ve Weights & Biases hafif alternatifler arasındadır.
  • check_circle Model kayıt defteri ile container registry farkı nedir?: Container registry (Docker Hub, ECR gibi) Docker imajlarını saklar. Model kayıt defteri ise ML model dosyaları (.pkl, .pt, SavedModel) ve bunlara ait MLOps meta verilerini (metrikler, parametreler, çalışma bağlamı) saklamak için özel olarak tasarlanmıştır.