tag GoruntuIsleme
Bu sayfada GoruntuIsleme etiketi ile işaretlenmiş tüm yapay zeka kavramlarını inceliyorsunuz.
Autoencoder (Oto-Kodlayıcı)
Oto-Kodlayıcılar (Autoencoders), bir girdi verisini alıp önce çok daha küçük ve sıkıştırılmış bir boyuta kodlayan (Encoder), daha sonra bu sıkıştırılmış taslaktan verinin orijinal halini yeniden inşa etmeye çalışan (Decoder) özel bir denetimsiz yapay sinir ağı türüdür. Amacı, verinin en önemli özelliklerini (gizli uzay / latent space) keşfetmektir.
Computer Vision (Bilgisayarlı Görü)
Bilgisayarlı Görü (Computer Vision), yapay zeka sistemlerinin dijital görüntüleri, videoları ve diğer görsel girdileri insanlar gibi "görmesini", bu içeriklerdeki nesneleri ve anlamları analiz edip uygun kararlar veya eylemler üretmesini sağlayan alt disiplindir. İnsan görüşü yıllarca süren evrimin ürünüyken, bilgisayarlı görü kameralar, pikseller, derin öğrenme (özellikle CNN algoritmaları) ve muazzam GPU işlem gücü ile bu biyolojik süreci kopyalamayı hedefler.
Convolutional Neural Network (CNN) (Evrişimli Sinir Ağı)
Evrişimli Sinir Ağı (CNN), yapay sinir ağlarının özellikle görselleri (fotoğraf, video), pikselleri ve uzamsal verileri işlemek için tasarlanmış özel bir türüdür. İnsan görme korteksinin (gözün) çalışma prensibinden ilham alır ve nesne tanıma, yüz tanıma ve medikal teşhis gibi Bilgisayarlı Görü (Computer Vision) problemlerinin şampiyonudur.
Data Augmentation (Veri Artırma / Çoğaltma)
Veri Artırma (Data Augmentation), makine öğreniminde mevcut eğitim veri setinin boyutunu ve çeşitliliğini, elimizdeki verilere çeşitli matematiksel veya sentetik dönüşümler uygulayarak "yapay olarak" çoğaltma işlemidir. Özellikle görüntü işlemede veri eksikliği ve overfitting (aşırı öğrenme) problemlerini çözmek için kullanılır.
Facial Recognition (Yüz Tanıma Teknolojisi)
Yüz Tanıma (Facial Recognition), yapay zekanın ve biyometrik yazılımların, dijital bir fotoğraf veya video karesindeki insan yüzünü algılayıp, yüzün matematiksel haritasını çıkartarak veritabanındaki diğer yüzlerle eşleştirmesi (kimlik doğrulaması) teknolojisidir.
Multimodal AI (Çok Modlu Yapay Zeka)
Çok Modlu Yapay Zeka (Multimodal AI), yalnızca metin (text) veya yalnızca görsel (image) işleyebilen eski nesil modellerin aksine, aynı anda birden fazla veri türünü (modaliteyi) -metin, ses, görüntü, video- aynı sinir ağı içinde anlayabilen, sentezleyebilen ve üretebilen yeni nesil yapay zeka mimarisidir. GPT-4o ve Google Gemini bu teknolojinin öncüleridir.
Object Detection (Nesne Tespiti / Nesne Tanıma)
Nesne Tespiti (Object Detection), Bilgisayarlı Görünün (Computer Vision) bir alt dalıdır. Yapay zekanın dijital bir resim veya video karesi içindeki nesnelerin sadece ne olduğunu (sınıflandırma) değil, aynı zamanda resmin tam olarak neresinde durduklarını bularak etraflarına sınırlayıcı bir kutu (Bounding Box) çizmesi işlemidir.
Variational Autoencoder (VAE) (Varyasyonel Oto-Kodlayıcı)
Variational Autoencoder (VAE), sıradan oto-kodlayıcıların (veriyi sıkıştırıp açan sistemler) gelişmiş, üretken (Generative) bir versiyonudur. VAE, veriyi sadece sıkıştırmakla kalmaz, sıkıştırdığı o matematiksel uzay (latent space) içinde "rastgele varyasyonlar (olasılıklar)" yaratarak, dünyaya daha önce hiç var olmamış yepyeni resimler, yüzler veya moleküller üretebilir.