account_tree Qwen Ailesi Nasıl Çalışır?
Qwen modelleri, Transformer mimarisi temel alınarak eğitilmiştir. Büyük modellerde Mixture-of-Experts (MoE) kullanılarak toplam parametre sayısı yüksek tutulurken her çıkarım için yalnızca bir alt grup "uzman" katmanı aktive edilir; bu da hem kapasite hem verimlilik sağlar. Qwen3.7 ailesi, geleneksel LLM'lerin aksine iki ayrı modda çalışabilir: thinking mode'da model bir soruna önce iç monolog yürüterek (chain-of-thought) adım adım çözüm üretir; non-thinking mode'da ise hızlı ve doğrudan yanıt verir. Kullanıcı bu iki mod arasında sistem promptuyla ya da özel bir sistem etiketi aracılığıyla geçiş yapabilir. Çok modlu varyantlarda (Qwen-VL, Qwen-Audio) görüntü ve ses girişleri ayrı kodlayıcılarla vektöre dönüştürülüp dil modeline enjekte edilir. Bu sayede model, tek bir prompt içinde metin, görüntü ve sesi birlikte anlayıp yanıt üretebilir.
Qwen Model Varyantları
psychology QwQ
Qwen ailesinin akıl yürütme odaklı dalı. Uzun zincirli düşünce (chain-of-thought) ile matematik, mantık ve kod problemlerinde derinlemesine çözüm üretir.
code Qwen-Coder
Kod üretimi ve yazılım geliştirme için optimize edilmiş varyant. Birden fazla programlama dilinde kod yazmayı, hata ayıklamayı ve açıklamayı destekler.
image Qwen-VL
Görüntü ve metin girdisini aynı anda işleyen çok modlu varyant. Görüntü açıklama, OCR ve görsel soru-cevap görevlerinde kullanılır.
mic Qwen-Audio
Ses ve konuşma anlama için tasarlanmış varyant. Transkripsiyon, ses sınıflandırma ve konuşma tabanlı soru-cevap destekler.
quiz Sıkça Sorulan Sorular
- check_circle Qwen ile QwQ arasındaki fark nedir?: Qwen, Alibaba'nın genel amaçlı LLM ailesi için kullanılan üst şemsiye isimdir. QwQ ise bu ailenin özellikle karmaşık akıl yürütme, matematik ve kod problemleri için tasarlanmış özelleşmiş dalıdır. QwQ, uzun iç monolog (düşünme zinciri) üretme konusunda optimize edilmiştir.
- check_circle Qwen modelleri Türkçeyi destekliyor mu?: Evet, Qwen modelleri Türkçe dahil pek çok dili destekler. Ancak modeller İngilizce ve Çince verilerle ağırlıklı olarak eğitildiğinden Türkçe performansı GPT-4 veya Claude gibi büyük kapalı kaynak modellerle kıyaslandığında değişkenlik gösterebilir.
- check_circle Qwen modelleri ticari olarak kullanılabilir mi?: Qwen modellerinin büyük bölümü Apache 2.0 veya Qwen Community License altında dağıtılır. Küçük ve orta ölçekli modeller genellikle ticari kullanıma açıkken büyük modellerde (örneğin 72B+) Alibaba'nın özel lisans koşulları geçerli olabilir. Lisans dosyasını Hugging Face üzerinden kontrol etmek gerekir.
- check_circle Qwen modelleri yerelde çalıştırılabilir mi?: Evet. Hugging Face üzerinden indirilebilen Qwen modelleri, Ollama, LM Studio veya llama.cpp gibi araçlarla yerel donanımda çalıştırılabilir. 7B modeli 8 GB VRAM ile, 14B modeli ise 16 GB VRAM ile rahatlıkla çalışır. Büyük modeller (72B) için kuantizasyon (GGUF, AWQ) gerekebilir.