tag ModelEgitimi

Bu sayfada ModelEgitimi etiketi ile işaretlenmiş tüm yapay zeka kavramlarını inceliyorsunuz.

Batch Size (Yığın (Küme) Boyutu)

Batch Size, bir yapay sinir ağının eğitim sürecinde tüm verileri (Epoch) aynı anda hafızaya almak yerine, verileri kaçar adetlik küçük yığınlar (gruplar) halinde alıp işleyeceğini belirleyen kritik bir hiperparametredir.

arrow_forward all_inclusive

Continual Learning (Sürekli (Ömür Boyu) Öğrenme)

Sürekli Öğrenme (Lifelong Learning), bir yapay zeka modelinin tıpkı insanlar gibi hayatı boyunca sürekli yeni şeyler öğrenmesi, yeni beceriler kazanması ve "bunu yaparken eskiden öğrendiklerini unutmaması" hedefini taşıyan, henüz tam çözülememiş bir araştırma alanıdır.

arrow_forward trending_down

Data Drift (Veri Kayması (Bozulması))

Veri Kayması (Data Drift), bir yapay zeka modelinin canlı (prodüksiyon) ortamına alındıktan sonra tahminlerinin zamanla kötüleşmesi ve yanlış sonuçlar üretmeye başlaması durumudur. Bunun sebebi modelin kodunun bozulması değil; dünyadaki insanların, trendlerin, ekonominin veya modelin beslendiği gerçek verilerin karakteristik olarak değişmesidir (Eski eğitim verisinin bayatlaması).

arrow_forward sync

Epoch (Eğitim Döngüsü (Epok))

Epoch (Döngü/Çağ), makine öğrenimi eğitim sürecinde, tüm eğitim veri setinin (dataset) yapay sinir ağı tarafından baştan sona tam bir kez okunması (ileri ve geri yayılım ile) olayına verilen isimdir.

arrow_forward build

Fine-Tuning (İnce Ayar)

Fine-Tuning (İnce Ayar), devasa bir veri setiyle genel amaçlı olarak önceden eğitilmiş (pre-trained) bir yapay zeka modelinin (örn: LLaMA veya GPT-3), daha küçük ve spesifik bir veri seti kullanılarak belirli bir göreve veya sektöre (tıp, hukuk, kodlama vb.) uyarlanması işlemidir. Modeli sıfırdan eğitmek yerine mevcut bilgilerinin üzerine özel bir uzmanlık inşa edilmesini sağlar.

arrow_forward developer_board

GPU (Graphics Processing Unit) (Grafik İşlemci (Ekran Kartı))

GPU (Grafik İşlemci), başlangıçta bilgisayar oyunlarındaki pikselleri ve 3D grafikleri ekrana hızlıca çizmek için tasarlanmış, ancak yapısındaki binlerce küçük çekirdek sayesinde aynı anda binlerce basit matematiksel işlemi (Paralel İşlem) yapabildiği keşfedilince yapay zeka ve derin öğrenme devriminin en kritik "Motoruna" dönüşmüş donanım birimidir.

arrow_forward settings_input_component

Hyperparameter Tuning (Hiperparametre Optimizasyonu)

Hiperparametre Optimizasyonu (Tuning), makine öğrenimi modelinin eğitim süreci başlamadan ÖNCE veri bilimciler veya mühendisler tarafından manuel olarak ayarlanan kontrol düğmelerinin (Hiperparametreler), modelin en yüksek doğruluğa ulaşmasını sağlayacak en kusursuz kombinasyonunun aranması ve bulunması işlemidir.

arrow_forward layers_clear

LoRA (Low-Rank Adaptation) (Düşük Dereceli Adaptasyon)

LoRA (Low-Rank Adaptation), devasa büyük dil modellerini (LLM) veya görsel difüzyon modellerini ince ayar (Fine-Tuning) yapmak için kullanılan, parametre açısından son derece verimli bir (PEFT) tekniktir. Milyarlarca parametresi olan bir modeli baştan eğitmek yerine, modelin içine küçük matematiksel matrisler enjekte ederek eğitimin inanılmaz derecede ucuz, hızlı ve düşük hafızayla (tek bir ev GPU'sunda) yapılabilmesini sağlar.

arrow_forward auto_awesome_motion

Meta-Learning (Meta Öğrenme (Öğrenmeyi Öğrenmek))

Meta Öğrenme (Öğrenmeyi Öğrenmek), bir yapay zeka modelinin sadece spesifik bir görevi (örn: kedi tanıma) öğrenmesi değil, geçmişte farklı problemleri çözerken elde ettiği tecrübeleri kullanarak, "yeni problemleri nasıl daha hızlı ve az veriyle öğreneceğini" kendi kendine keşfetmesi (öğrenme yeteneğini geliştirmesi) alanıdır.

arrow_forward fitness_center

Quantization (Kuantizasyon (Model Küçültme))

Kuantizasyon, devasa boyutlardaki yapay zeka modellerinin (Örn: LLaMA, GPT) matematiksel doğruluğundan çok az taviz vererek, dosya boyutlarını ve kullandıkları belleği (RAM/VRAM) dramatik şekilde küçültme işlemidir. Bu teknik sayesinde 100 GB RAM isteyen bir model, evimizdeki bir telefona veya akıllı saate sığabilir hale gelir.

arrow_forward call_merge

RAFT (Retrieval-Augmented Fine-Tuning) (Geri Getirim Destekli İnce Ayar)

RAFT (Retrieval-Augmented Fine-Tuning), bir LLM'i şirket verisiyle uzmanlaştırmak için kullanılan iki dev rakip teknolojinin; yani "RAG (Veritabanından belge okuma)" ile "Fine-Tuning (Modelin beynini yeniden eğitme)" süreçlerinin en güçlü yönlerini birleştiren en güncel (2024) ve hibrit yapay zeka eğitim yöntemidir.

arrow_forward self_improvement

Self-Supervised Learning (Öz-Denetimli Öğrenme)

Öz-Denetimli Öğrenme (SSL), makine öğreniminde insanların verileri manuel etiketlemesine gerek kalmadan (Denetimsiz), modelin verinin bir kısmını saklayıp kendi kendine "Saklı olanı tahmin et" (Denetimli) oyunu oynayarak devasa miktarda bilgiyi öğrendiği, modern büyük dil modellerinin (LLM) temel eğitim yöntemidir.

arrow_forward transform

Transfer Learning (Transfer Öğrenme)

Transfer Öğrenme, bir yapay zeka modelinin belirli bir görevi (örn: araba fotoğraflarını tanıma) çözerken elde ettiği bilgi birikimini ve ağırlıkları, farklı ama ilişkili başka bir görevi (örn: kamyon fotoğraflarını tanıma) çözmek için bir başlangıç noktası olarak kullanmasıdır. Yapay zeka eğitimini inanılmaz derecede hızlandıran ve veri ihtiyacını azaltan kritik bir devrimdir.

arrow_forward trending_down

Underfitting (Eksik Öğrenme)

Underfitting (Eksik Öğrenme), Overfitting'in tam zıddıdır. Makine öğrenimi modelinin, hem eğitim verilerinde hem de yeni verilerde başarısız olması, yani arkadaki örüntüyü ve mantığı "hiç öğrenememesi" durumudur. Sınava hiç çalışmayan ve konuyu anlamayan bir öğrenciye benzer.

arrow_forward