tag FCN

Bu sayfada FCN etiketi ile işaretlenmiş tüm yapay zeka kavramlarını inceliyorsunuz.

layers

Semantic Segmentation (Semantik Bölütleme)

Semantik bölütleme (semantic segmentation), bir görüntüdeki her pikseli belirli bir anlam kategorisiyle etiketleyen bilgisayarla görme görevidir. Nesne tespitinin sınırlayıcı kutular ürettiği ve örnek bölütlemenin aynı sınıftaki nesneleri birbirinden ayırt ettiği aksine; semantik bölütleme pikselleri sınıf düzeyinde sınıflandırır. Çıktı, her piksel için atanmış bir sınıf etiketinden oluşan yoğun bir haritadır. Bu görev, 2014 yılında UC Berkeley'den Long ve arkadaşları tarafından önerilen Tamamen Evrişimli Ağlar (FCN) ile derin öğrenme ekosisteminde köklü bir dönüşüm yaşadı. FCN, kesin piksel tahminlerini üretebilen ilk uçtan uca eğitilebilir mimari olarak tarihe geçti. Ardından U-Net (2015, biyomedikal görüntüleme) ve Google Brain'in DeepLab serisi (atrous evrişim ile çok ölçekli bağlam yakalama) bu alanın temel mimarileri arasına girdi. Transformatör tabanlı modeller de semantik bölütlemeye entegre olmuştur. SegFormer ve Mask2Former gibi mimariler, dikkat mekanizmaları sayesinde hem doğruluğu artırıyor hem de semantik, örnek ve panoramik bölütleme görevlerini tek çerçevede birleştiriyor. Meta'nın SAM 2 (Segment Anything Model 2) modeli, sıfır-atışlı segmentasyon kapasitesiyle temel model paradigmasını bu alana taşıdı. Başarım değerlendirmesinde en yaygın metrik, her sınıf için Birlik-Üzeri-Kesişim (IoU) değerinin ortalamasını alan mIoU'dur. PASCAL VOC, Cityscapes ve ADE20K veri kümeleri standart kıyaslama ortamları olarak kullanılır. Uygulama alanları geniştir: özerk araçlarda yol, araç ve yaya tespiti; tıbbi görüntü analizinde tümör belirleme ve organ sınırlama; uydu görüntüsü sınıflandırması; artırılmış gerçeklik ortamlarında sahne anlama bunların başında gelmektedir. Piksel düzeyinde etiketlemenin yüksek maliyeti, temel modellerin ve transfer öğrenmenin bu alandaki önemini artırmıştır.

arrow_forward