sort_by_alpha LLM'lerin Temel Yetenekleri
LLM'ler sadece bir dilden diğerine çeviri yapmazlar; dilin yapısına dair derin bir matematiksel harita oluştururlar. Bu sayede bir hikaye yazabilir, karmaşık bir sözleşmeyi özetleyebilir, Python'da kod yazıp hatalarını ayıklayabilir veya belirli bir role (persona) bürünerek sizinle terapi seansı yapabilirler. Tüm bu yetenekler, internetin devasa bir kopyasının okunup kelimeler arasındaki ihtimallerin hesaplanmasıyla (sıradaki kelime tahmini) ortaya çıkar.
Açık Kaynak vs Kapalı Kaynak LLM'ler
lock Kapalı (Sahipli) Modeller
OpenAI (GPT-4), Google (Gemini) ve Anthropic (Claude) tarafından geliştirilen, ağırlıkları ve kaynak kodları gizli tutulan devasa modellerdir. Sadece API üzerinden erişilir.
public Açık Kaynak (Open Source) Modeller
Meta (LLaMA), Mistral ve HuggingFace tarafından yayınlanan, bilgisayarınıza indirip kendi verilerinizle eğitebileceğiniz (fine-tune) özgür modellerdir.
quiz Sıkça Sorulan Sorular (FAQ)
- check_circle LLM'lerin kapasite sınırı nedir (Context Window)?: Bağlam Penceresi (Context Window), modelin tek bir konuşmada hatırlayabileceği maksimum metin uzunluğudur. Önceleri sadece birkaç sayfayken (4K token), günümüzde Gemini 1.5 Pro gibi modeller milyonlarca tokeni (yüzlerce kitap veya saatlerce videoyu) aynı anda hafızasında tutabilmektedir.
- check_circle Token nedir?: LLM'lerin kelimeleri parçalara ayırdığı temel birimdir. İngilizce için ortalama 1 kelime = 1.3 token iken, Türkçe gibi sondan eklemeli dillerde kelimeler parçalandığı için maliyet ve token kullanımı artar.