category Veri Madenciliği

Veri analizi ve model bozulmaları

sync_problem

Concept Drift (Kavram Kayması)

Kavram Kayması (Concept Drift), Data Drift ile çok sık karıştırılan ancak tamamen farklı olan bir model bozulma türüdür. Burada verinin kendisi değil, verinin ifade ettiği "Anlam (Hedef Kavram)" ve kurallar değişmiştir. Yapay zekanın öğrendiği matematiksel ilişkinin gerçek dünyada artık geçerli olmaması durumudur.

arrow_forward
trending_down

Data Drift (Veri Kayması (Bozulması))

Veri Kayması (Data Drift), bir yapay zeka modelinin canlı (prodüksiyon) ortamına alındıktan sonra tahminlerinin zamanla kötüleşmesi ve yanlış sonuçlar üretmeye başlaması durumudur. Bunun sebebi modelin kodunun bozulması değil; dünyadaki insanların, trendlerin, ekonominin veya modelin beslendiği gerçek verilerin karakteristik olarak değişmesidir (Eski eğitim verisinin bayatlaması).

arrow_forward
diamond

Data Mining (Veri Madenciliği)

Veri Madenciliği (Data Mining), istatistik, veritabanı sistemleri ve makine öğrenimi (AI) tekniklerini kullanarak, devasa büyüklükteki veri yığınlarının (Big Data) içindeki gizli kalıpları (paternler), kuralları ve ilişkileri insan müdahalesi olmadan otomatik olarak "kazıp" çıkarma işlemidir. Amaç, ham veriyi ticari veya bilimsel bilgiye dönüştürmektir.

arrow_forward
pie_chart

Jaccard Index (Jaccard İndeksi / Benzerliği)

İki kümenin birbirine ne kadar benzediğini ölçen istatistiksel bir formüldür. Kesişim alanının, birleşim alanına bölünmesiyle hesaplanır. Özellikle görüntü bölütleme (segmentasyon) ve metin benzerliği hesaplamalarında sıkça kullanılır.

arrow_forward
content_cut

Web Scraping (Veri Kazıma (Web Kazıma))

Web Kazıma (Web Scraping), özel yazılımlar ve botlar kullanılarak internetteki yüz binlerce web sitesinin (haberler, forumlar, Wikipedia) sayfalarını ziyaret edip, içlerindeki yazıları, resimleri veya fiyat tablolarını saniyeler içinde otomatik olarak çekerek veritabanına kaydetme işlemidir. Yapay zeka devriminin görünmez hammaddesidir.

arrow_forward