timelapse Gelecek, Sadece Şimdiki Zamana Bağlıdır
Markov (Markov Özelliği) matematiğinin en büyük sırrı şudur: 'Bir sonraki adımın ne olacağı, geçmişin ne olduğuna değil, SADECE şu anki duruma bağlıdır.' Satranç oynayan bir yapay zeka (Ajan), oyunu kazanmak için son 40 hamlede taşların nasıl hareket ettiğini hatırlamak zorunda değildir. Tahtanın sadece o anki fotoğrafına (State) bakıp, alacağı maksimum ödülü hesaplayarak en iyi hamleyi (Action) yapabilir.
MDP'nin Temel Bileşenleri
smart_toy Ajan (Agent)
Karar veren ve öğrenen yapay zeka (Örn: Labirentteki fare).
map Durum (State)
Ajanın o anki durumu veya konumu (Örn: Farenin labirentte sağa dönme noktasında olması).
Ödül (Reward)
Ajan doğru eylemi yaptığında (peynire ulaştığında) aldığı matematiksel puan.