category Derin Öğrenme
Derin öğrenme mimarileri ve yöntemleri
Activation Function (Aktivasyon Fonksiyonu)
Aktivasyon Fonksiyonu, bir yapay nörona gelen elektrik sinyalini (matematiksel toplamı) bir sonraki nörona iletip iletmeyeceğine karar veren mantıksal şalterdir (kapı). Ağın doğrusal olmayan (non-linear), yani gerçek dünyadaki gibi karmaşık problemleri çözebilmesini sağlar.
Autoencoder (Oto-Kodlayıcı)
Oto-Kodlayıcılar (Autoencoders), bir girdi verisini alıp önce çok daha küçük ve sıkıştırılmış bir boyuta kodlayan (Encoder), daha sonra bu sıkıştırılmış taslaktan verinin orijinal halini yeniden inşa etmeye çalışan (Decoder) özel bir denetimsiz yapay sinir ağı türüdür. Amacı, verinin en önemli özelliklerini (gizli uzay / latent space) keşfetmektir.
Backpropagation (Geri Yayılım Algoritması)
Backpropagation (Geriye Dönük Hata Yayılımı), bir yapay sinir ağının hatalarından ders çıkarmasını (öğrenmesini) sağlayan en önemli matematiksel kalkülüs (türev) algoritmasıdır. Derin öğrenme devriminin tam kalbinde yer alır; o olmasaydı ChatGPT veya Midjourney asla var olamazdı.
Batch Size (Yığın (Küme) Boyutu)
Batch Size, bir yapay sinir ağının eğitim sürecinde tüm verileri (Epoch) aynı anda hafızaya almak yerine, verileri kaçar adetlik küçük yığınlar (gruplar) halinde alıp işleyeceğini belirleyen kritik bir hiperparametredir.
Computer Vision (Bilgisayarlı Görü)
Bilgisayarlı Görü (Computer Vision), yapay zeka sistemlerinin dijital görüntüleri, videoları ve diğer görsel girdileri insanlar gibi "görmesini", bu içeriklerdeki nesneleri ve anlamları analiz edip uygun kararlar veya eylemler üretmesini sağlayan alt disiplindir. İnsan görüşü yıllarca süren evrimin ürünüyken, bilgisayarlı görü kameralar, pikseller, derin öğrenme (özellikle CNN algoritmaları) ve muazzam GPU işlem gücü ile bu biyolojik süreci kopyalamayı hedefler.
Convolutional Neural Network (CNN) (Evrişimli Sinir Ağı)
Evrişimli Sinir Ağı (CNN), yapay sinir ağlarının özellikle görselleri (fotoğraf, video), pikselleri ve uzamsal verileri işlemek için tasarlanmış özel bir türüdür. İnsan görme korteksinin (gözün) çalışma prensibinden ilham alır ve nesne tanıma, yüz tanıma ve medikal teşhis gibi Bilgisayarlı Görü (Computer Vision) problemlerinin şampiyonudur.
Deep Learning (Derin Öğrenme)
Derin Öğrenme (Deep Learning), insan beyninin çalışma prensibinden ilham alınarak geliştirilen yapay sinir ağlarını kullanarak çok katmanlı soyutlamalarla veriyi modelleyen makine öğrenmesi alt dalıdır. Geoffrey Hinton, Yann LeCun ve Yoshua Bengio gibi öncülerin çalışmalarıyla şekillenen bu alan, 2012 yılında ImageNet yarışmasında AlexNet'in gösterdiği çığır açan başarıyla ana akım haline gelmiştir. Günümüzde GPT, DALL-E, AlphaFold gibi devrim niteliğindeki modellerin temelini oluşturmaktadır.
Deep Reinforcement Learning (DRL) (Derin Pekiştirmeli Öğrenme)
Derin Pekiştirmeli Öğrenme (DRL), Derin Öğrenmenin (Derin Sinir Ağları) karmaşık problem çözme kapasitesi ile Pekiştirmeli Öğrenmenin (Ödül-Ceza mantığıyla kendi kendine öğrenme) birleşiminden doğan, yapay zekanın video oyunlarında, robotikte ve strateji oyunlarında (AlphaGo) insanüstü başarılar elde etmesini sağlayan süper-algoritmadır.
Epoch (Eğitim Döngüsü (Epok))
Epoch (Döngü/Çağ), makine öğrenimi eğitim sürecinde, tüm eğitim veri setinin (dataset) yapay sinir ağı tarafından baştan sona tam bir kez okunması (ileri ve geri yayılım ile) olayına verilen isimdir.
Generative Pre-trained Transformer (Üretken Ön-eğitimli Dönüştürücü)
GPT (Generative Pre-trained Transformer), OpenAI tarafından geliştirilen ve Transformer mimarisinin Decoder (Kod Çözücü) bölümünü kullanan büyük bir dil modeli serisidir. İnternetteki devasa boyuttaki metin verileri üzerinde denetimsiz olarak "ön-eğitim" (pre-training) alır. Ardından RLHF (İnsan Geri Bildirimi ile Pekiştirmeli Öğrenme) tekniğiyle ince ayar yapılarak sohbet, kod yazma, çeviri ve akıl yürütme gibi görevlerde olağanüstü performans sergileyecek hale getirilir. ChatGPT'nin arkasındaki temel teknolojidir.
Hidden Layer (Gizli Katman)
Gizli Katman (Hidden Layer), bir yapay sinir ağında Girdi Katmanı (Input) ile Çıktı Katmanı (Output) arasında yer alan, verinin özelliklerinin çıkarıldığı, matematiksel soyutlamaların ve hesaplamaların yapıldığı katmanların tümüdür. Bir ağın "Derin Öğrenme" (Deep Learning) sayılabilmesi için birden fazla gizli katmana sahip olması gerekir.
Jacobian Matrix (Jacobian Matrisi)
Çok değişkenli fonksiyonların birinci dereceden kısmi türevlerini (değişim oranlarını) içeren matematiksel bir matristir. Derin öğrenme ağlarında hataların geriye yayılması (backpropagation) sırasında, ağırlıkların güncellenme yönünü ve miktarını hesaplamak için kullanılır.
Knowledge Distillation (Bilgi Damıtma)
Knowledge Distillation, büyük ve güçlü bir öğretmen modelin bilgisini daha küçük ve verimli bir öğrenci modele aktarma sürecidir. Öğrenci model, doğrudan ham etiketlerden değil; öğretmenin yumuşak olasılık çıktılarından (soft labels) öğrenerek eğitim veri kümesindeki sinyallerin ötesine geçen genelleme yeteneği kazanır.
Loss Function (Kayıp (Maliyet) Fonksiyonu)
Kayıp Fonksiyonu (Loss veya Cost Function), makine öğrenimi modelinin yaptığı tahminin, gerçek ve doğru olan cevaptan ne kadar uzak olduğunu (ne kadar kötü bir iş çıkardığını) ölçen hata hesaplama aracıdır. Makine öğreniminin tüm amacı bu "kayıp" sayısını sıfıra yaklaştırmaktır.
LSTM (Long Short-Term Memory) (Uzun Kısa Vadeli Hafıza)
LSTM, standart RNN'lerin (Tekrarlayan Sinir Ağları) uzun metinleri veya uzun zaman serilerini hatırlayamama (unutkanlık) sorununu çözmek için 1997 yılında icat edilmiş, çok daha gelişmiş bir yapay sinir ağı hücresidir. Transformer mimarileri icat edilene kadar Google Translate ve Siri gibi teknolojilerin ana beyni olarak hizmet vermiştir.
Mixture of Experts (MoE) (Uzmanların Karışımı)
Mixture of Experts (MoE), büyük bir yapay sinir ağını tek bir devasa ve hantal beyin olarak çalıştırmak yerine, ağın içine belirli konularda uzmanlaşmış daha küçük "uzman ağlar" (experts) yerleştiren ve her soru geldiğinde sadece o konuyla ilgili 1 veya 2 uzmanı uyandırarak (aktif ederek) devasa enerji ve hız tasarrufu sağlayan model mimarisidir. GPT-4'ün arkasındaki ana mimaridir.
Neural Network (Yapay Sinir Ağı)
Yapay Sinir Ağları (ANN - Artificial Neural Networks), insan beynindeki biyolojik nöronların birbirleriyle bilgi alışverişi yapma şeklinden ilham alınarak tasarlanmış makine öğrenimi modelleridir. Veriler ağın içindeki birbirine bağlı "düğümler" (node) üzerinden geçerken matematiksel işlemlere tabi tutulur. Bu mimari, Derin Öğrenmenin (Deep Learning) yapıtaşıdır ve görüntü tanımadan ses sentezlemeye kadar modern yapay zekanın sahip olduğu neredeyse tüm yeteneklerin temelini oluşturur.
Perceptron (Algılayıcı (Yapay Nöron))
Perceptron, 1957 yılında Frank Rosenblatt tarafından icat edilen, biyolojik bir sinir hücresinden (nörondan) ilham alan, tarihteki en eski ve en basit "Tek Katmanlı" yapay sinir ağı hücresidir. Modern derin öğrenmenin atası kabul edilir.
Reasoning Model (Akıl Yürüten Model)
Reasoning model, cevap vermeden önce gizli bir düşünce zinciri ("thinking trace") üretip bunu değerlendiren büyük dil modeli ailesidir. Klasik LLM'ler bir sonraki tokeni doğrudan tahmin ederken, reasoning model bu adımları içselleştirerek problem üzerinde iteratif biçimde çalışır. OpenAI o1/o3, DeepSeek-R1 ve Claude Extended Thinking bu ailenin en bilinen örnekleridir.
RNN (Recurrent Neural Network) (Tekrarlayan Sinir Ağı)
RNN (Tekrarlayan Sinir Ağları), verilerin bir sıraya veya zamana bağlı olduğu (zaman serileri, cümleler, ses dalgaları) problemleri çözmek için tasarlanmış derin öğrenme mimarisidir. Standart sinir ağlarından farkı, bir "hafızaya" sahip olmasıdır; bir kelimeyi okurken o kelimeden önce okuduğu kelimeleri de hatırlar.
Transformer (Dönüştürücü Mimarisi)
Transformer, 2017 yılında Google araştırmacıları tarafından "Attention Is All You Need" makalesiyle tanıtılan, derin öğrenmede çığır açan bir yapay sinir ağı mimarisidir. Veriyi sıralı (sequential) olarak işleyen eski RNN ve LSTM modellerinin aksine, Transformer modeli "Self-Attention" (Öz-Dikkat) mekanizması sayesinde tüm girdileri eşzamanlı (paralel) olarak işler. Bu mimari, günümüzdeki ChatGPT, BERT ve Gemini gibi devasa Büyük Dil Modellerinin (LLM) temelini oluşturur.
Variational Autoencoder (VAE) (Varyasyonel Oto-Kodlayıcı)
Variational Autoencoder (VAE), sıradan oto-kodlayıcıların (veriyi sıkıştırıp açan sistemler) gelişmiş, üretken (Generative) bir versiyonudur. VAE, veriyi sadece sıkıştırmakla kalmaz, sıkıştırdığı o matematiksel uzay (latent space) içinde "rastgele varyasyonlar (olasılıklar)" yaratarak, dünyaya daha önce hiç var olmamış yepyeni resimler, yüzler veya moleküller üretebilir.