Mistral (Mistral (Fransız LLM Ailesi))

Mistral, Fransa merkezli Mistral AI şirketi tarafından geliştirilen açık ağırlıklı büyük dil modelleri ailesidir.

Mistral, 2023 yılında Paris'te kurulan Mistral AI şirketinin geliştirdiği ve kamuoyuyla paylaştığı büyük dil modelleri ailesidir. Şirket, kuruluşunun üzerinden yalnızca birkaç ay geçmişken Mistral 7B modelini yayımlayarak kapalı model alternatifleri kadar güçlü ve açık kaynaklı bir model sunabileceğini kanıtlamış; bu sayede hızla sektörün önemli oyuncuları arasına girmiştir. Mistral modelleri, Mixture-of-Experts (MoE) mimarisini başarıyla kullanan öncü çalışmalar arasında yer alır. Mixtral 8x7B ve Mixtral 8x22B gibi modellerde her çıkarım için toplam parametrelerin yalnızca küçük bir kısmı aktive edilir; bu yaklaşım hem kapasite hem de hesaplama verimliliği sağlar. Modeller Apache 2.0 lisansıyla dağıtılarak ticari kullanıma açık tutulmaktadır. 2026 itibarıyla Mistral AI'ın portföyü Mistral Large 3 (675B toplam, 41B aktif parametre), Mistral Small 4, Mistral Medium 3.5, ses için Voxtral TTS ve akıl yürütme odaklı Ministral 3 gibi modelleri kapsamaktadır. Şirket aynı zamanda kendi sohbet asistanı Le Chat'ı da işletmektedir. Mistral modelleri, Amazon Bedrock, Google Cloud Vertex AI ve Azure AI Studio üzerinden API olarak erişilebilmektedir. Avrupa merkezli bir yapay zeka şirketi olarak Mistral AI, veri egemenliği ve AB yapay zeka düzenlemelerine uyumluluk konularında kurumsal müşterilere avantaj sunmaktadır.

device_hub Mistral MoE Mimarisi Nasıl Çalışır?

Mixtral modelleri, her Transformer katmanında sabit sayıda feedforward ağı yerine birden fazla "uzman" (expert) feedforward bloğu içerir. Her token için bir yönlendirici (router) mekanizması, hangi uzmanların kullanılacağına karar verir; genellikle top-2 veya top-k seçimi yapılır. Bu sayede model, çıkarım sırasında toplam parametre sayısının yalnızca küçük bir bölümünü hesaplasa da eğitimde tüm uzmanlar kullanılarak geniş bir kapasite kümesinden faydalanır. MoE'nin pratik avantajı, yüksek parametre sayısının sağladığı kapasiteyi, çok daha küçük bir dense modelin çıkarım maliyetiyle birleştirmesidir. Mistral Large 3'te toplam 675B parametre bulunurken her çıkarımda yalnızca yaklaşık 41B parametre aktive edilmektedir.

Mistral Model Ailesi

star Mistral Large 3

675B toplam, 41B aktif parametreli MoE amiral gemisi model. Karmaşık akıl yürütme, kod ve çok dilli görevlerde GPT-4 sınıfı performans sunar.

speed Mistral Small 4

119B MoE mimarili hafif model. Yüksek hacimli ve gecikmeye duyarlı uygulamalar için hız-performans dengesi sağlar.

record_voice_over Voxtral TTS

Mistral AI'ın Mart 2026'da duyurduğu metin-konuşma (text-to-speech) modeli. Doğal ve akıcı ses sentezi için optimizedir.

chat Le Chat

Mistral AI'ın kendi büyük dil modelleriyle beslenen sohbet asistanı platformu. Ücretsiz ve ücretli katmanlar sunmaktadır.

quiz Sıkça Sorulan Sorular

  • check_circle Mistral modelleri OpenAI alternatifleri olarak kullanılabilir mi?: Evet. Mistral AI, OpenAI API ile uyumlu bir API uç noktası sunmaktadır. Mistral Large 3, GPT-4 sınıfı görevlerde rekabetçi sonuçlar verirken maliyet avantajı sunabilir. Açık kaynaklı modeller için kendi sunucunuzda barındırma seçeneği de mevcuttur.
  • check_circle Mistral modelleri Türkçeyi destekliyor mu?: Mistral modelleri Türkçe dahil pek çok Avrupa ve dünya dilini destekler. Ancak şirket özellikle İngilizce, Fransızca, Almanca, İspanyolca ve İtalyanca üzerine odaklanmaktadır. Türkçe performansı kabul edilebilir düzeyde olsa da özel optimize modeller kadar tutarlı olmayabilir.
  • check_circle Mistral ile Llama farkı nedir?: Her ikisi de açık ağırlıklı LLM ailesidir; ancak Mistral, MoE mimarisini daha erken benimseyerek yüksek parametre kapasitesini düşük çıkarım maliyetiyle birleştirmiştir. Meta'nın Llama ailesi ise ağırlıklı olarak dense mimari kullanır. Lisanslama açısından Mistral Apache 2.0, Llama ise Meta'nın özel lisansını kullanır.
  • check_circle Mistral modellerini kendi sunucumda çalıştırabilir miyim?: Evet. Mistral 7B ve Mixtral 8x7B gibi küçük ve orta ölçekli modeller, Ollama, vLLM veya llama.cpp ile yerel ya da bulut sunucularında çalıştırılabilir. Büyük modeller için birden fazla GPU veya kuantizasyon gerekebilir.