Market Basket Analysis (Pazar Sepeti Analizi)

Pazar Sepeti Analizi, işlemlerdeki ürün birliktelik örüntülerini birliktelik kurallarıyla tespit eden veri madenciliği tekniğidir.

Pazar Sepeti Analizi (Market Basket Analysis), bir veri kümesindeki işlemler içinde birlikte ortaya çıkan nesne veya öğe gruplarını keşfetmek amacıyla kullanılan temel bir veri madenciliği tekniğidir. Adını, müşterilerin alışveriş sepetlerinde hangi ürünleri birlikte satın aldığını analiz eden perakende uygulamasından alır; ancak günümüzde e-ticaret öneri sistemlerinden sağlık bilişimine kadar geniş bir kullanım alanına kavuşmuştur. Teknik, birliktelik kuralı madenciliği üzerine kurulmuştur ve üç temel metriği baz alır: destek (support), güven (confidence) ve kaldıraç (lift). Destek, bir öğe kümesinin tüm işlemler içindeki görülme sıklığını ölçer. Güven, iki öğe birlikte göründüğünde öngörülen ilişkinin doğruluğunu ifade eder. Kaldıraç ise bu birlikteliğin rastlantısal mı yoksa gerçek bir bağıntıya mı dayandığını belirler; Lift > 1 değeri, söz konusu ilişkinin bağımsız oluşumdan daha kuvvetli olduğunu gösterir. Pazar Sepeti Analizi, e-ticaret platformlarında "Bu ürünü alanlar bunu da satın aldı" türündeki öneri sistemlerinin temelini oluşturur. Streaming platformlarında içerik önerisi, sağlık sektöründe ilaç etkileşim analizi, bankacılıkta dolandırıcılık tespiti ve web analizi gibi alanlarda da etkin biçimde kullanılmaktadır. Analiz sürecinde en yaygın kullanılan algoritmalar Apriori ve FP-Growth'tur. Apriori algoritması, sık geçen öğe kümelerini adım adım iteratif biçimde bulurken; FP-Growth, veriyi daha az bellekte tutan sıkıştırılmış bir ağaç yapısı (FP-Tree) üzerinde çalışır ve büyük veri setlerinde çok daha verimlidir. Sonuç olarak Pazar Sepeti Analizi, ham işlem verilerinden eyleme dönüştürülebilir içgörüler çıkarmak isteyen veri bilimciler ve analistler için temel araçlardan biridir. Makine öğrenimi ve derin öğrenme sistemleriyle entegre edildiğinde, dinamik ve kişiselleştirilmiş öneri motorlarının bel kemiğini oluşturur.

Pazar Sepeti Analizinin Temelleri

Pazar Sepeti Analizi, bağımsız görünen veri noktaları arasındaki gizli ilişkileri ortaya çıkarır. Bir süpermarketin haftalık satış kaydına baktığınızda, bazı ürün çiftlerinin ya da gruplarının sık sık aynı sepette yer aldığını fark edebilirsiniz: ekmek ve tereyağı, bebek bezi ve ıslak mendil gibi. Bu birliktelikleri sistematik biçimde tespit etmek ve ölçmek, işletmelere mağaza düzeni, fiyatlandırma, kampanya tasarımı ve öneri sistemleri konularında kritik kararlar almada yardımcı olur. Birliktelik kuralları genellikle {A} → {B} biçiminde yazılır ve 'A satın alındığında B de satın alınır' ilişkisini ifade eder. Örneğin {ekmek} → {tereyağı} kuralı, ekmek satın alan müşterilerin tereyağı da aldığını gösterebilir. Bu kuralın güvenilirliği; destek, güven ve kaldıraç değerleriyle sayısal olarak ölçülür. Yüksek kaldıraç değeri, ilişkinin rastlantısal değil gerçek olduğuna işaret eder.

Temel Metrikler

Destek (Support)

Bir öğe kümesinin tüm işlemler içinde kaç kez göründüğünü oransal olarak ifade eder. support(A) = A'yı içeren işlem sayısı / toplam işlem sayısı

Güven (Confidence)

A alındığında B'nin de alınma olasılığı. confidence(A→B) = support(A∪B) / support(A). Yüksek güven, kuralın tutarlı olduğunu gösterir.

Kaldıraç (Lift)

İlişkinin bağımsız tesadüfi oluşuma kıyasla ne kadar güçlü olduğunu ölçer. lift(A→B) = confidence(A→B) / support(B). Lift > 1 gerçek birlikteliği ifade eder.

Destek Eşiği (min_support)

Analistlerin belirlediği minimum destek değeri; bu eşiğin altındaki itemset'ler ayıklanır ve hesaplama yükü önemli ölçüde azaltılır.

Uygulama Alanları

  • check_circle E-ticaret ve Perakende: Amazon, Trendyol gibi platformlarda 'Bunu alanlar bunu da aldı' öneri kutucuklarını besleyen temel veri madenciliği tekniğidir.
  • check_circle Streaming ve Medya: Netflix ve Spotify gibi platformlarda içerik birliktelik örüntülerini çıkararak kişiselleştirilmiş öneri listeleri oluşturmak için kullanılır.
  • check_circle Sağlık ve İlaç: Birlikte reçete edilen ilaçların olası etkileşimlerini ve sağlık risklerini sistematik biçimde tespit etmek amacıyla uygulanır.
  • check_circle Bankacılık ve Finans: Kredi kartı işlemlerinde anormal ürün-hizmet kombinasyonlarını işaretleyerek dolandırıcılık tespitine katkı sağlar.

Sıkça Sorulan Sorular

  • check_circle Pazar Sepeti Analizi ile Collaborative Filtering farkı nedir?: Pazar Sepeti Analizi kural tabanlıdır ve öğe birliktelik örüntülerine odaklanır; Collaborative Filtering ise kullanıcı davranışı benzerliğini temel alır. İkisi birbirini tamamlayan teknikler olarak öneri sistemlerinde birlikte kullanılabilir.
  • check_circle Büyük veri setlerinde hangi algoritma daha verimlidir?: Apriori O(2^n) düzeyinde karmaşıklığa sahipken, FP-Growth veriyi sıkıştırılmış bir ağaç yapısında tutar ve çok daha az bellek ile zaman kullanarak büyük veri setlerinde belirgin biçimde üstün performans gösterir.
  • check_circle Minimum destek değeri nasıl seçilir?: Veri setinin boyutuna ve iş problemine göre değişir. Çok düşük değerler anlamsız kural sayısını artırırken, çok yüksek değerler nadir ama kritik örüntüleri gözden kaçırır. Tipik başlangıç noktası %1-5 arasındadır.
  • check_circle Pazar Sepeti Analizi gerçek zamanlı çalışabilir mi?: Geleneksel yaklaşımlar toplu (batch) işlem gerektirir; ancak modern akış veri mimarileriyle (Apache Kafka, Flink) artımlı güncellemeler yapılarak gerçek zamanlı öneri sistemleri kurulabilmektedir.