BLOG SARSA (1)
인공지능

강화학습: 파이썬으로 구현하는 SARSA, 살사 알고리즘

1. SARSA의 정의


살사는 시간차 제어를 사용하는 알고리즘입니다. 가치함수를 시간차 예측으로 업데이트 하면서 정책은 따로 존재하지 않고 현재 상태에서 가장 큰 가치를 가지는 행동을 하는 …

강화학습 큐함수 시간차예측 살사 SARSA
Search