BLOG MDP (1)
인공지능

강화학습 : MDP와 벨만 방정식

이번 포스트에서는 강화학습의 아주 기초가 되는 개념들에 대해서 알아보려고 합니다.

강화학습은 순차적으로 어떤 행동을 결정해야 하는 문제를 푸는 알고리즘 입니다. 이것을 순차적 행동 결정 문제라고 …

MDP 강화학습
Search