Anthropic'in Güvenlik Uyarıları Ters Tepmiş Olabilir: Hükümet En Güçlü Yapay Zeka Modellerini Durdurdu
ABD hükümeti, Anthropic'in en güçlü yapay zeka modelleri Claude Fable 5 ve Claude Mythos 5'in kullanımını ulusal güvenlik gerekçesiyle durdurdu. Şirket, kararı 'dar bir potansiyel jailbreak' bulgusuna dayandırarak eleştiriyor ve sektör genelinde benzer bir standardın tüm yeni model dağıtımlarını durdurabileceğini savunuyor.
Hükümetten Sürpriz Karar
ABD hükümeti, Cuma günü Anthropic'e en güçlü iki yapay zeka modeli olan Claude Fable 5 ve Claude Mythos 5'e erişimi derhal durdurma emri verdi. Gerekçe olarak ulusal güvenlik endişeleri gösterildi. Anthropic, X platformu üzerinden yaptığı açıklamada karara uyduğunu ancak hükümetin bu konuda yanıldığını düşündüğünü belirtti. Emir, saat 17:21'de (Doğu Saati) iletildi ve şirketin her iki modeli de dünya genelindeki tüm kullanıcılar için devre dışı bırakmasını zorunlu kıldı; oysa hükümetin ihracat kontrolü düzenlemesi nominal olarak yalnızca yabancı uyruklu kişileri hedefliyordu. Anthropic'in diğer modelleri bu durumdan etkilenmedi.
Mythos ve Fable: İki Farklı Strateji
Mythos 5, Anthropic'in en yetenekli yapay zeka modeli olup Nisan başında tanıtılmış ve o zamandan beri sıkı bir şekilde kısıtlanmıştı. Şirket, Mythos'un yazılımdaki güvenlik açıklarını bulma konusunda olağanüstü bir yeteneğe sahip olduğunu ve test ettiği tüm büyük işletim sistemleri ve web tarayıcılarında kusurlar tespit ettiğini açıkladı. Bu nedenle geniş çapta piyasaya sürülmek yerine, Project Glasswing adlı kontrollü bir program başlatıldı. Program kapsamında Amazon, Apple, Google, Microsoft ve CrowdStrike gibi yaklaşık 50 onaylı kuruluşa savunma amaçlı siber güvenlik çalışmaları için erişim sağlandı.
Fable 5 ise sadece üç gün önce piyasaya sürüldü ve Mythos'un, siber güvenlik ve biyoloji gibi yüksek riskli alanlardaki yanıtları engelleyen güvenlik önlemleri (guardrails) ile donatılmış bir versiyonu olarak tanımlandı. Anthropic, bu sayede modelin genel kullanım için yeterince güvenli hale geldiğini savundu. Yapay zeka performansını izleyen Vals AI'nın kıyaslama testlerine göre Fable 5, halka açık en yetenekli yapay zeka modeli oldu.
Hükümetin Gerekçesi ve Anthropic'in Tepkisi
Hükümetin emri, ihracat kontrolü önlemi olarak çerçevelenmiş olsa da Anthropic, asıl endişenin Fable 5'e yönelik iddia edilen bir jailbreak (güvenlik önlemlerini aşma) olduğunu belirtiyor. Şirket, hükümetin şu ana kadar yalnızca sözlü olarak 'potansiyel dar, evrensel olmayan bir jailbreak' kanıtı sunduğunu söylüyor. Anthropic'e göre bu jailbreak, modeli belirli bir kod tabanını okumaya ve yazılım kusurlarını belirlemeye yönlendirmekten ibaret. Üstelik şirket, bu yetenek seviyesinin OpenAI'in GPT-5.5 dahil diğer halka açık modellerde zaten mevcut olduğunu ve siber güvenlik uzmanları tarafından rutin olarak kullanıldığını vurguluyor.
Anthropic, en güçlü güvenlik önlemlerinin modelin kendisinden bağımsız çalışan sınıflandırıcı sistemler (classifier systems) aracılığıyla uygulandığını, bu nedenle birisi Fable'ı reddetmeye devam etmeye ikna etse bile en tehlikeli çıktılara karşı korumaların yerinde kaldığını belirtiyor. Şirket ayrıca son kullanım incelemelerinde bu güvenlik önlemlerinin başarıyla aşıldığına dair bir kanıt bulunmadığını da ekliyor.
Neden Önemli?
Anthropic, karardan duyduğu hayal kırıklığını gizlemiyor. Şirket blog yazısında, 'Dar bir potansiyel jailbreak bulgusunun, yüz milyonlarca insana sunulan ticari bir modelin geri çağrılmasına gerekçe olmasına katılmıyoruz. Bu standart sektör genelinde uygulanırsa, tüm öncü model sağlayıcıları için yeni model dağıtımlarını esasen durduracaktır.' ifadelerine yer verdi.
Anthropic'in bu yıl bir ilk halka arz (IPO) gerçekleştirmesi bekleniyor ve şirket, kamuoyundaki kimliğini büyük ölçüde rakiplerine kıyasla güvenlik odaklı bir alternatif olarak konumlandırdı. Gözlemciler, Anthropic'in Mythos'u kısıtlarken sergilediği aşırı tedbirin -ki modeli kamuya açıklanamayacak kadar tehlikeli olarak tanıtmıştı- tam da işini en çok etkileyebilecek türden bir hükümet incelemesini çekmiş olmasının ironisine dikkat çekiyor.
OpenAI CEO'su Sam Altman'ın bu durumdan keyif aldığı söylenebilir. Nisan ayında podcaster Ashlee Vance'e verdiği röportajda Altman, Anthropic'in Mythos'u ele alış biçimini 'korku temelli pazarlama' olarak nitelendirmişti. Altman, 'Açıkça harika bir pazarlama: 'Bir bomba yaptık. Onu kafanıza düşürmek üzereydik. Size 100 milyon dolara bir bomba sığınağı satacağız.' demek.' ifadelerini kullanmıştı. Altman, bir hükümet kapatması öngörmemiş olsa da Anthropic'in aylar boyunca yapay zekasının eşsiz derecede tehlikeli olduğunu söylemesinin, dünyanın -ABD hükümeti dahil- buna kulak verme eğiliminde olduğunu ortaya koyduğunu belirtmişti.