BLOG

Python

파이썬 time.sleep()으로 코드 진행 지연하기

프로그래밍을 하다보면 의도적으로 코드의 진행을 지연시키고 싶을 때가 있다. 로봇을 코딩하던 중이라면 로봇이 일정시간동안 직진하게 만든다거나, 뭐 게임을 만들때 프레임률을 유지한다거나 등등 다양한 이유로 말이다. …

time
인공지능

강화학습: 파이썬으로 구현하는 큐러닝, Q Learning

1. 큐러닝(Q Learning)이란?


22.06.08 save, load 기능 업데이트 큐러닝은 오프폴리시 시간차 제어를 통한 강화학습 알고리즘입니다. 이게 뭔소리냐 싶은데 이전에 SARSA 알고리즘을 알아보았는데요 강화학습: 파이썬으로 구현하는 …

강화학습 큐함수 그리드월드 큐러닝
인공지능

강화학습: 파이썬으로 구현한 프롬프트 그리드월드

그리드월드는 강화학습 알고리즘을 적용해보기에 아주 좋은 기초적인 환경입니다. 이번 포스트에서는 제가 직접 제작한 파이썬 그리드월드에 대해서 알아보고 사용법을 소개하겠습니다. GUI를 사용하지 않고 편리하게 진행과정을 프롬프트에서 …

강화학습 그리드월드
인공지능

강화학습: 파이썬으로 구현하는 SARSA, 살사 알고리즘

1. SARSA의 정의


살사는 시간차 제어를 사용하는 알고리즘입니다. 가치함수를 시간차 예측으로 업데이트 하면서 정책은 따로 존재하지 않고 현재 상태에서 가장 큰 가치를 가지는 행동을 하는 …

강화학습 큐함수 시간차예측 살사 SARSA
인공지능

강화학습 : 몬테카를로 예측과 시간차 예측

앞에서 정책 이터레이션과 가치 이터레이션에 대해서 알아보았습니다. 최적 정책을 찾는 좋은 방법이지만 분명한 한계가 있습니다. 현실은 바둑처럼 수많은 상태들이 존재하고 매번 이 모든 상태에 대한 …

강화학습 몬테카를로예측 시간차예측
Search