NVIDIA Nemotron 3.5: Çok Dilli, Çok Modlu ve Özelleştirilebilir Yapay Zeka Güvenlik Modeli
NVIDIA, kurumsal yapay zeka sistemleri için geliştirdiği Nemotron 3.5 Content Safety modelini tanıttı. Model, metin ve görsel girdileri birlikte değerlendirerek güvenlik kararları alıyor, 12 dilde eğitimli ve yaklaşık 140 dilde sıfır atış genelleme yapabiliyor. En önemli yenilik ise kullanıcıların kendi güvenlik politikalarını tanımlayabilmesi ve modelin bu politikaları uygulayabilmesi.
Nemotron 3.5: Çok Modlu Güvenlikte Yeni Dönem
NVIDIA, kurumsal yapay zeka (AI) sistemlerinin güvenlik ihtiyaçlarını karşılamak üzere geliştirdiği Nemotron 3.5 Content Safety modelini duyurdu. Bu model, bir önceki sürüm Nemotron 3'ün görsel anlama yeteneğini derinleştirerek metin, görsel ve asistan yanıtını tek bir bağlam penceresinde (context window) değerlendiriyor ve bütünleşik bir güvenlik kararı üretiyor. Bu yaklaşım, metin ve görsel arasındaki etkileşimden doğan politika ihlallerini tek seferde yakalayarak çok modlu (multimodal) güvenlik senaryolarındaki önemli bir boşluğu kapatıyor.
Model, İngilizce, Fransızca, İspanyolca, Almanca, Çince, Japonca, Korece, Arapça, Hintçe, Rusça, Portekizce ve İtalyanca olmak üzere 12 dilde açık eğitim desteği sunuyor. Ayrıca, temel aldığı Google Gemma 3 4B modeli sayesinde yaklaşık 140 dilde sıfır atış (zero-shot) genelleme yapabiliyor. Bu sayede, eğitim verisinin az olduğu Güneydoğu Asya, İskandinav ve Afrika dilleri gibi bölgelerde ayrı bir ince ayar (fine-tuning) gerektirmeden çok dilli güvenlik denetimi mümkün hale geliyor.
Özelleştirilebilir Güvenlik Politikaları
Nemotron 3.5'in en önemli yeniliği, kullanıcıların kendi güvenlik politikalarını (custom policy) tanımlayabilmesi. Üretim ortamlarında her uygulamanın farklı risk profilleri vardır: bir sağlık platformu ile bir finans sohbet robotu (chatbot) veya bir çocuk eğitim uygulamasının güvenlik ihtiyaçları aynı değildir. Model, girdiyle birlikte özel bir politika tanımı alıyor ve kararını bu politikaya göre veriyor. Bu özellik, daha önce Nemotron Content Safety Reasoning 4B'de başlatılan çalışmanın çok modlu ve çok dilli ortama taşınmış hali.
Özelleştirme iki şekilde çalışıyor: Kategori bastırma (category suppression) ile belirli kategoriler devre dışı bırakılabiliyor; örneğin bir DevOps aracında "terminate a process" ifadesinin şiddet kategorisini tetiklemesi engellenebiliyor. Özel kategori ekleme (custom category injection) ile kuruluşun kendi düzenleyici veya ürün politikalarına özgü risk kategorileri tanımlanabiliyor.
Denetlenebilir Akıl Yürütme (THINK Modu)
Nemotron 3.5, isteğe bağlı bir THINK modu sunuyor. Bu mod etkinleştirildiğinde model, nihai güvenli/güvensiz etiketini vermeden önce adım adım akıl yürütme (reasoning trace) çıktısı üretiyor. Örneğin:
``` Kullanıcı istemi reçetesiz kontrollü madde edinme yöntemleri soruyor. Asistan yanıtı belirli adımlar ve bir çevrimiçi pazar yeri referansı içeriyor. Bu etkileşim, Suç Planlaması/İtiraflar ve Kontrollü Maddeler kategorilerini ihlal ediyor. Görsel (eczane dış cephesi) konumsal bağlam sağlıyor ancak kararı değiştirmiyor. Kullanıcı Güvenliği: güvensiz Yanıt Güvenliği: güvensiz Güvenlik Kategorileri: Suç Planlaması/İtiraflar, Kontrollü Maddeler ```
Bu akıl yürütme izleri, düzenleyici uyumluluk, insan denetimi ve politika iyileştirme için belgelenmiş gerekçeler sunuyor. Gecikme (latency) kritik olduğunda THINK modu kapatılarak Nemotron 3'teki gibi düşük gecikmeli ikili karar (binary verdict) alınabiliyor.
Veri Kümesi ve Eğitim
NVIDIA, Nemotron 3.5 ile birlikte eğitim veri kümesini de açık kaynak olarak yayınlıyor. Bu, çok modlu güvenlik modelleri için nadir görülen bir durum. Veri kümesi, çok dilli metin güvenlik verileri, insan tarafından etiketlenmiş çok modlu veriler (12 dilde çevrilmiş), güvenli çok modlu veriler (belgeler, grafikler, diyagramlar) ve akıl yürütme izlerinden oluşuyor. Özellikle eğitim görsellerinin %99'u gerçek fotoğraflardan oluşuyor; bu, yapay görsellerle oluşturulmuş diğer veri kümelerine kıyasla üretim içeriğinin karmaşıklığını daha iyi yansıtıyor.
Akıl yürütme izleri, iki aşamalı bir süreçle oluşturuluyor: Önce büyük bir öğretmen model (Qwen 397B) ile zincir düşünme (chain-of-thought) izleri üretiliyor, ardından daha küçük bir model (Qwen 80B) ile bu izler en fazla 3 cümleye indirgeniyor. Bu sayede düşük gecikmeli özel politika uygulaması mümkün oluyor.
Performans ve Karşılaştırma
Nemotron 3.5, çok dilli ve çok modlu güvenlik kıyaslamalarında (benchmark) ortalama %85 zararlı içerik sınıflandırma doğruluğu elde ediyor. Çok Dilli Aegis'te 12 dilde ortalama %96,5, RTP-LX'te ise %88,8 doğruluk sağlıyor. Bu tutarlılık, kuruluşların müşteri, çalışan ve iş ortağı iş akışlarında aynı güvenlik duruşunu uygulamasına olanak tanıyor.
Gecikme açısından Nemotron 3.5, varsayılan modda Nemotron 3 ile aynı seviyede. THINK modu, iz uzunluğuyla orantılı ek gecikme getiriyor ancak bu öngörülebilir ve eşzamansız denetim hattında yönetilebiliyor. Rakip bir çok modlu güvenlik modeline kıyasla 3 kata kadar daha düşük uçtan uca gecikme sunuyor. Ayrıca, başka bir akıl yürütme modeline göre %50 daha az token üreterek maliyet avantajı sağlıyor.
Neden Önemli?
Nemotron 3.5, kurumsal yapay zeka güvenliğinde önemli bir boşluğu dolduruyor. Mevcut güvenlik modelleri genellikle İngilizce odaklı, yalnızca metin tabanlı veya üretim hatlarında tekrar tekrar çalıştırılamayacak kadar maliyetli olabiliyor. Nemotron 3.5, çok dilli kapsama, çok modlu sınıflandırma, özel politika desteği ve düşük gecikmeli dağıtımı tek bir modelde birleştiriyor. Özellikle düzenlemeye tabi sektörlerde (finans, sağlık, eğitim) denetlenebilir karar mekanizmaları ve özelleştirilebilir politikalar büyük önem taşıyor. Modelin Hugging Face'de NVIDIA Açık Model Lisansı ile yayınlanması, araştırmacılar ve geliştiriciler için erişilebilirliği artırıyor. NVIDIA ayrıca, özel politikalar oluşturmak için Claude ve Codex uyumlu bir beceri (skill) ve modelin kullanımını gösteren yemek kitapları (cookbook) sunuyor.