BLOG A2C (2)
인공지능

강화학습: 텐서플로 케라스로 Continuous A2C 구현하고 Pendulum 학습시키기

1. Continuous A2C


얼마 전에 A2C 에이전트에 대해서 포스팅을 한 적이 있었는데요, 이번에는 Continuous A2C에 대해서 가볍게 알아보겠습니다.

.

A2C는 행동이 불연속적입니다. 그래서 장점도 있지만 …

강화학습 A2C 케라스
인공지능

강화학습 : 파이썬 케라스로 구현한 액터-크리틱, A2C

이번에는 A2C라는 강화학습 알고리즘을 가져왔습니다. 정책 이터레이션 알고리즘들의 문제점들을 보완한 알고리즘이라고 볼 수 있는데요, 자세히 알아보도록 하겠습니다.

1. A2C란?


먼저, 이전에 REINFORCE에서 사용한 정책 신경망의 …

강화학습 A2C 케라스
Search