layers Semantik Bölütleme Nasıl Çalışır?
Semantik bölütleme, modelin bir görüntüyü girdi olarak alıp her piksele bir sınıf etiketi atadığı yoğun tahmin (dense prediction) görevidir. Süreç iki ana aşamadan oluşur: kodlayıcı (encoder) görüntüden soyut öznitelikler çıkarır; kod çözücü (decoder) ise bu öznitelikleri yüksek çözünürlüklü piksel sınıflandırmasına dönüştürür. 2014 yılında Long ve arkadaşlarının tanıttığı Tamamen Evrişimli Ağlar (FCN), tam bağlantılı katmanları evrişimli katmanlarla değiştirerek değişken boyutlu girdi almanın önünü açtı ve bilinear upsampling ile orijinal çözünürlükte çıktı üretti. U-Net ise simetrik kodlayıcı-kod çözücü yapısına atlama bağlantıları (skip connections) ekleyerek konumsal bilginin korunmasını sağladı; özellikle az örnekli biyomedikal veri kümelerinde yüksek başarım sundu. Google Brain'in DeepLab serisi, atrous (genişletilmiş) evrişim ile çok ölçekli bağlam yakaladı. DeepLabV3+ (2018), ayrıntılı bir kod çözücü ekleyerek sınır piksellerindeki doğruluğu belirgin biçimde iyileştirdi. Son nesil mimariler olan SegFormer ve Mask2Former, transformer dikkat mekanizmalarıyla küresel bağlamı daha iyi yakalıyor ve birden fazla bölütleme türünü tek yapıda birleştiriyor.
Benzer Görevlerle Karşılaştırma
search Nesne Tespiti
Sınırlayıcı kutularla nesneleri lokalize eder. Her nesne için dikdörtgen koordinatları ve sınıf etiketi üretir; piksel hassasiyeti yoktur.
grain Örnek Bölütleme
Aynı sınıftaki nesnelerin her birini ayrı ayrı maskeler. Semantik bölütlemenin piksel sınıflandırmasına nesne kimliği (instance ID) katmanı ekler.
palette Semantik Bölütleme
Her piksele bir sınıf atar; ancak aynı sınıftaki nesneler arasında ayrım yapmaz. En yüksek piksel hassasiyetini sunar, bireysel nesne kimliği yoktur.
Temel Mimariler
dynamic_form FCN (2014)
Long ve ark. tarafından tanıtılan ilk uçtan uca eğitilebilir piksel tahmin modeli. Tam bağlantılı katmanları evrişimli katmanlarla değiştirerek değişken boyutlu girdi alır.
biotech U-Net (2015)
Simetrik encoder-decoder + atlama bağlantıları. Az örnekli tıbbi veride yüksek başarım; histoloji ve BT/MR görüntülemede yaygın olarak kullanılır.
route DeepLab Serisi
Google Brain'in atrous evrişim tabanlı mimarisi. V3+ sürümü, sınır piksellerinde detaylı kod çözücüyle doğruluğu önemli ölçüde artırır.
hub SegFormer / Mask2Former
Transformer dikkat mekanizmasına dayalı modern mimariler. Semantik, örnek ve panoramik bölütlemeyi tek yapıda birleştirir; SOTA performans sunar.
apps Uygulama Alanları
- check_circle Özerk Araçlar: Yol, kaldırım, araç, yaya ve trafik işaretlerini piksel düzeyinde ayırarak otonom sürüş sistemlerine haritalandırmayı sağlar.
- check_circle Tıbbi Görüntüleme: BT ve MR görüntülerinde tümör, organ ve anormal dokuları piksel hassasiyetiyle sınırlayarak tanı ve cerrahi planlamayı destekler.
- check_circle Uydu ve Hava Görüntüsü: Tarım arazisi, orman örtüsü, şehir yapısı ve su kütlelerini haritalamak için uydu fotoğraflarını otomatik sınıflandırır.
- check_circle Artırılmış ve Sanal Gerçeklik: Sahnedeki nesneleri gerçek zamanlı bölüterek AR katmanları için nesne tanıma ve ortam anlama sağlar.
- check_circle Endüstriyel Kalite Denetimi: Üretim hatlarında yüzey kusurları, çatlak ve sapmaları piksel düzeyinde tespit ederek otomatik kalite kontrolü destekler.
quiz Sıkça Sorulan Sorular
- check_circle Semantik bölütleme ile nesne tespiti arasındaki temel fark nedir?: Nesne tespiti sınırlayıcı kutularla nesne konumunu yaklaşık verir; semantik bölütleme ise her pikseli sınıflandırarak piksel düzeyinde hassasiyet ve şekil bilgisi sunar.
- check_circle Örnek bölütlemeden farkı nedir?: Semantik bölütleme aynı sınıftaki tüm piksellere aynı etiketi verir; örnek bölütleme ise aynı sınıftaki birden fazla nesneyi ayrı kimliklerle maskeler.
- check_circle mIoU nedir ve neden önemlidir?: Mean Intersection over Union (Ortalama Birlik-Üzeri-Kesişim), tahmin maskesi ile gerçek maskenin örtüşme oranını her sınıf için hesaplayıp ortalar. Semantik bölütlemede evrensel başarım metriğidir.
- check_circle Hangi veri kümeleri en sık kullanılır?: PASCAL VOC (21 sınıf), Cityscapes (kentsel sürüş sahneleri, 19 sınıf), ADE20K (150+ sınıf) ve COCO-Stuff en yaygın kıyaslama veri kümeleridir.