Pazar Sepeti Analizinin Temelleri
Pazar Sepeti Analizi, bağımsız görünen veri noktaları arasındaki gizli ilişkileri ortaya çıkarır. Bir süpermarketin haftalık satış kaydına baktığınızda, bazı ürün çiftlerinin ya da gruplarının sık sık aynı sepette yer aldığını fark edebilirsiniz: ekmek ve tereyağı, bebek bezi ve ıslak mendil gibi. Bu birliktelikleri sistematik biçimde tespit etmek ve ölçmek, işletmelere mağaza düzeni, fiyatlandırma, kampanya tasarımı ve öneri sistemleri konularında kritik kararlar almada yardımcı olur. Birliktelik kuralları genellikle {A} → {B} biçiminde yazılır ve 'A satın alındığında B de satın alınır' ilişkisini ifade eder. Örneğin {ekmek} → {tereyağı} kuralı, ekmek satın alan müşterilerin tereyağı da aldığını gösterebilir. Bu kuralın güvenilirliği; destek, güven ve kaldıraç değerleriyle sayısal olarak ölçülür. Yüksek kaldıraç değeri, ilişkinin rastlantısal değil gerçek olduğuna işaret eder.
Temel Metrikler
Destek (Support)
Bir öğe kümesinin tüm işlemler içinde kaç kez göründüğünü oransal olarak ifade eder. support(A) = A'yı içeren işlem sayısı / toplam işlem sayısı
Güven (Confidence)
A alındığında B'nin de alınma olasılığı. confidence(A→B) = support(A∪B) / support(A). Yüksek güven, kuralın tutarlı olduğunu gösterir.
Kaldıraç (Lift)
İlişkinin bağımsız tesadüfi oluşuma kıyasla ne kadar güçlü olduğunu ölçer. lift(A→B) = confidence(A→B) / support(B). Lift > 1 gerçek birlikteliği ifade eder.
Destek Eşiği (min_support)
Analistlerin belirlediği minimum destek değeri; bu eşiğin altındaki itemset'ler ayıklanır ve hesaplama yükü önemli ölçüde azaltılır.
Uygulama Alanları
- check_circle E-ticaret ve Perakende: Amazon, Trendyol gibi platformlarda 'Bunu alanlar bunu da aldı' öneri kutucuklarını besleyen temel veri madenciliği tekniğidir.
- check_circle Streaming ve Medya: Netflix ve Spotify gibi platformlarda içerik birliktelik örüntülerini çıkararak kişiselleştirilmiş öneri listeleri oluşturmak için kullanılır.
- check_circle Sağlık ve İlaç: Birlikte reçete edilen ilaçların olası etkileşimlerini ve sağlık risklerini sistematik biçimde tespit etmek amacıyla uygulanır.
- check_circle Bankacılık ve Finans: Kredi kartı işlemlerinde anormal ürün-hizmet kombinasyonlarını işaretleyerek dolandırıcılık tespitine katkı sağlar.
Sıkça Sorulan Sorular
- check_circle Pazar Sepeti Analizi ile Collaborative Filtering farkı nedir?: Pazar Sepeti Analizi kural tabanlıdır ve öğe birliktelik örüntülerine odaklanır; Collaborative Filtering ise kullanıcı davranışı benzerliğini temel alır. İkisi birbirini tamamlayan teknikler olarak öneri sistemlerinde birlikte kullanılabilir.
- check_circle Büyük veri setlerinde hangi algoritma daha verimlidir?: Apriori O(2^n) düzeyinde karmaşıklığa sahipken, FP-Growth veriyi sıkıştırılmış bir ağaç yapısında tutar ve çok daha az bellek ile zaman kullanarak büyük veri setlerinde belirgin biçimde üstün performans gösterir.
- check_circle Minimum destek değeri nasıl seçilir?: Veri setinin boyutuna ve iş problemine göre değişir. Çok düşük değerler anlamsız kural sayısını artırırken, çok yüksek değerler nadir ama kritik örüntüleri gözden kaçırır. Tipik başlangıç noktası %1-5 arasındadır.
- check_circle Pazar Sepeti Analizi gerçek zamanlı çalışabilir mi?: Geleneksel yaklaşımlar toplu (batch) işlem gerektirir; ancak modern akış veri mimarileriyle (Apache Kafka, Flink) artımlı güncellemeler yapılarak gerçek zamanlı öneri sistemleri kurulabilmektedir.