tag MixtureOfExperts

Bu sayfada MixtureOfExperts etiketi ile işaretlenmiş 2 yapay zeka kavramını bulabilirsiniz.

Mistral, 2023 yılında Paris'te kurulan Mistral AI şirketinin geliştirdiği ve kamuoyuyla paylaştığı büyük dil modelleri ailesidir. Şirket, kuruluşunun üzerinden yalnızca birkaç ay geçmişken Mistral 7B modelini yayımlayarak kapalı model alternatifleri kadar güçlü ve açık kaynaklı bir model sunabileceğini kanıtlamış; bu sayede hızla sektörün önemli oyuncuları arasına girmiştir. Mistral modelleri, Mixture-of-Experts (MoE) mimarisini başarıyla kullanan öncü çalışmalar arasında yer alır. Mixtral 8x7B ve Mixtral 8x22B gibi modellerde her çıkarım için toplam parametrelerin yalnızca küçük bir kısmı aktive edilir; bu yaklaşım hem kapasite hem de hesaplama verimliliği sağlar. Modeller Apache 2.0 lisansıyla dağıtılarak ticari kullanıma açık tutulmaktadır. 2026 itibarıyla Mistral AI'ın portföyü Mistral Large 3 (675B toplam, 41B aktif parametre), Mistral Small 4, Mistral Medium 3.5, ses için Voxtral TTS ve akıl yürütme odaklı Ministral 3 gibi modelleri kapsamaktadır. Şirket aynı zamanda kendi sohbet asistanı Le Chat'ı da işletmektedir. Mistral modelleri, Amazon Bedrock, Google Cloud Vertex AI ve Azure AI Studio üzerinden API olarak erişilebilmektedir. Avrupa merkezli bir yapay zeka şirketi olarak Mistral AI, veri egemenliği ve AB yapay zeka düzenlemelerine uyumluluk konularında kurumsal müşterilere avantaj sunmaktadır.

wind_power

Mistral (Mistral (Fransız LLM Ailesi))

Mistral, 2023 yılında Paris'te kurulan Mistral AI şirketinin geliştirdiği ve kamuoyuyla paylaştığı büyük dil modelleri ailesidir. Şirket, kuruluşunun üzerinden yalnızca birkaç ay geçmişken Mistral 7B modelini yayımlayarak kapalı model alternatifleri kadar güçlü ve açık kaynaklı bir model sunabileceğini kanıtlamış; bu sayede hızla sektörün önemli oyuncuları arasına girmiştir. Mistral modelleri, Mixture-of-Experts (MoE) mimarisini başarıyla kullanan öncü çalışmalar arasında yer alır. Mixtral 8x7B ve Mixtral 8x22B gibi modellerde her çıkarım için toplam parametrelerin yalnızca küçük bir kısmı aktive edilir; bu yaklaşım hem kapasite hem de hesaplama verimliliği sağlar. Modeller Apache 2.0 lisansıyla dağıtılarak ticari kullanıma açık tutulmaktadır. 2026 itibarıyla Mistral AI'ın portföyü Mistral Large 3 (675B toplam, 41B aktif parametre), Mistral Small 4, Mistral Medium 3.5, ses için Voxtral TTS ve akıl yürütme odaklı Ministral 3 gibi modelleri kapsamaktadır. Şirket aynı zamanda kendi sohbet asistanı Le Chat'ı da işletmektedir. Mistral modelleri, Amazon Bedrock, Google Cloud Vertex AI ve Azure AI Studio üzerinden API olarak erişilebilmektedir. Avrupa merkezli bir yapay zeka şirketi olarak Mistral AI, veri egemenliği ve AB yapay zeka düzenlemelerine uyumluluk konularında kurumsal müşterilere avantaj sunmaktadır.

arrow_forward
psychology_alt

Qwen (Qwen (Alibaba Dil Modeli Ailesi))

Qwen (telaffuz: "Chwen"), Alibaba Group'un DAMO Academy birimi tarafından geliştirilen açık kaynaklı büyük dil modelleri ailesidir. 2023 yılında kamuoyuyla paylaşılan Qwen serisi, hem yoğun (dense) hem de Mixture-of-Experts (MoE) mimarileri kullanarak metin anlama, kod üretimi, matematiksel akıl yürütme ve çok modlu (görüntü, video, ses) işleme yetenekleri sunar. 2026 itibarıyla en güncel modeller Qwen3.7 Max ve Qwen3.7 Plus olup 1 milyon token bağlam penceresi sunmaktadır. Qwen serisi; karmaşık problemler için adım adım düşünen "düşünme modu" (thinking mode) ile hızlı yanıt gerektiren görevler için "diyalog modu" (non-thinking mode) arasında geçiş yapabilme özelliğine sahiptir. Qwen ailesi kapsamında özellikle akıl yürütme odaklı QwQ modelleri, kod yazmaya özel Qwen-Coder, görsel algılama için Qwen-VL, ses işleme için Qwen-Audio ve matematik için Qwen-Math gibi özelleşmiş varyantlar bulunmaktadır. Modeller Apache 2.0 veya Qwen lisansı altında Hugging Face'te yayımlanmaktadır. Türkçe dahil çok sayıda dili destekleyen Qwen, Hugging Face Open LLM Leaderboard başta olmak üzere birçok kıyaslamada Meta'nın Llama serisiyle rekabet edebilir puanlar almıştır.

arrow_forward