category Veri Madenciliği
Veri analizi ve model bozulmaları
Concept Drift (Kavram Kayması)
Kavram Kayması (Concept Drift), Data Drift ile çok sık karıştırılan ancak tamamen farklı olan bir model bozulma türüdür. Burada verinin kendisi değil, verinin ifade ettiği "Anlam (Hedef Kavram)" ve kurallar değişmiştir. Yapay zekanın öğrendiği matematiksel ilişkinin gerçek dünyada artık geçerli olmaması durumudur.
Data Drift (Veri Kayması (Bozulması))
Veri Kayması (Data Drift), bir yapay zeka modelinin canlı (prodüksiyon) ortamına alındıktan sonra tahminlerinin zamanla kötüleşmesi ve yanlış sonuçlar üretmeye başlaması durumudur. Bunun sebebi modelin kodunun bozulması değil; dünyadaki insanların, trendlerin, ekonominin veya modelin beslendiği gerçek verilerin karakteristik olarak değişmesidir (Eski eğitim verisinin bayatlaması).
Data Mining (Veri Madenciliği)
Veri Madenciliği (Data Mining), istatistik, veritabanı sistemleri ve makine öğrenimi (AI) tekniklerini kullanarak, devasa büyüklükteki veri yığınlarının (Big Data) içindeki gizli kalıpları (paternler), kuralları ve ilişkileri insan müdahalesi olmadan otomatik olarak "kazıp" çıkarma işlemidir. Amaç, ham veriyi ticari veya bilimsel bilgiye dönüştürmektir.
Jaccard Index (Jaccard İndeksi / Benzerliği)
İki kümenin birbirine ne kadar benzediğini ölçen istatistiksel bir formüldür. Kesişim alanının, birleşim alanına bölünmesiyle hesaplanır. Özellikle görüntü bölütleme (segmentasyon) ve metin benzerliği hesaplamalarında sıkça kullanılır.
Web Scraping (Veri Kazıma (Web Kazıma))
Web Kazıma (Web Scraping), özel yazılımlar ve botlar kullanılarak internetteki yüz binlerce web sitesinin (haberler, forumlar, Wikipedia) sayfalarını ziyaret edip, içlerindeki yazıları, resimleri veya fiyat tablolarını saniyeler içinde otomatik olarak çekerek veritabanına kaydetme işlemidir. Yapay zeka devriminin görünmez hammaddesidir.