device_hub Mistral MoE Mimarisi Nasıl Çalışır?
Mixtral modelleri, her Transformer katmanında sabit sayıda feedforward ağı yerine birden fazla "uzman" (expert) feedforward bloğu içerir. Her token için bir yönlendirici (router) mekanizması, hangi uzmanların kullanılacağına karar verir; genellikle top-2 veya top-k seçimi yapılır. Bu sayede model, çıkarım sırasında toplam parametre sayısının yalnızca küçük bir bölümünü hesaplasa da eğitimde tüm uzmanlar kullanılarak geniş bir kapasite kümesinden faydalanır. MoE'nin pratik avantajı, yüksek parametre sayısının sağladığı kapasiteyi, çok daha küçük bir dense modelin çıkarım maliyetiyle birleştirmesidir. Mistral Large 3'te toplam 675B parametre bulunurken her çıkarımda yalnızca yaklaşık 41B parametre aktive edilmektedir.
Mistral Model Ailesi
star Mistral Large 3
675B toplam, 41B aktif parametreli MoE amiral gemisi model. Karmaşık akıl yürütme, kod ve çok dilli görevlerde GPT-4 sınıfı performans sunar.
speed Mistral Small 4
119B MoE mimarili hafif model. Yüksek hacimli ve gecikmeye duyarlı uygulamalar için hız-performans dengesi sağlar.
record_voice_over Voxtral TTS
Mistral AI'ın Mart 2026'da duyurduğu metin-konuşma (text-to-speech) modeli. Doğal ve akıcı ses sentezi için optimizedir.
chat Le Chat
Mistral AI'ın kendi büyük dil modelleriyle beslenen sohbet asistanı platformu. Ücretsiz ve ücretli katmanlar sunmaktadır.
quiz Sıkça Sorulan Sorular
- check_circle Mistral modelleri OpenAI alternatifleri olarak kullanılabilir mi?: Evet. Mistral AI, OpenAI API ile uyumlu bir API uç noktası sunmaktadır. Mistral Large 3, GPT-4 sınıfı görevlerde rekabetçi sonuçlar verirken maliyet avantajı sunabilir. Açık kaynaklı modeller için kendi sunucunuzda barındırma seçeneği de mevcuttur.
- check_circle Mistral modelleri Türkçeyi destekliyor mu?: Mistral modelleri Türkçe dahil pek çok Avrupa ve dünya dilini destekler. Ancak şirket özellikle İngilizce, Fransızca, Almanca, İspanyolca ve İtalyanca üzerine odaklanmaktadır. Türkçe performansı kabul edilebilir düzeyde olsa da özel optimize modeller kadar tutarlı olmayabilir.
- check_circle Mistral ile Llama farkı nedir?: Her ikisi de açık ağırlıklı LLM ailesidir; ancak Mistral, MoE mimarisini daha erken benimseyerek yüksek parametre kapasitesini düşük çıkarım maliyetiyle birleştirmiştir. Meta'nın Llama ailesi ise ağırlıklı olarak dense mimari kullanır. Lisanslama açısından Mistral Apache 2.0, Llama ise Meta'nın özel lisansını kullanır.
- check_circle Mistral modellerini kendi sunucumda çalıştırabilir miyim?: Evet. Mistral 7B ve Mixtral 8x7B gibi küçük ve orta ölçekli modeller, Ollama, vLLM veya llama.cpp ile yerel ya da bulut sunucularında çalıştırılabilir. Büyük modeller için birden fazla GPU veya kuantizasyon gerekebilir.