전체 글17 [RL] Markov Decision Process Markov Process $\mathbf{Definition.}$ Markov State State $S_t$가 다음과 같은 조건을 만족할 경우, $S_t$가 Markov property를 만족한다고 한다. 또는 $S_t$를 Markov state라고 부른다. $$ \begin{align*} P[S_{t+1} | S_t] = P[S_{t+1} | S_1, \cdots, S_t] \end{align*} $$ 즉, 어떤 마르코프 상태 $S_t = s$와 다음 상태 $S_{t+1} = s^\prime$라면, 다음과 같은 확률 값이 정의될 수 있다. $$ \begin{align*} \mathcal{P}_{ss^\prime} = P[S_{t+1} = s^\prime | S_t = s] \end{align*} $.. 2023. 6. 16. 이전 1 2 3 4 5 다음