BLOG 강화학습 (13)
인공지능

강화학습: 텐서플로 케라스로 Continuous A2C 구현하고 Pendulum 학습시키기

1. Continuous A2C


얼마 전에 A2C 에이전트에 대해서 포스팅을 한 적이 있었는데요, 이번에는 Continuous A2C에 대해서 가볍게 알아보겠습니다.

.

A2C는 행동이 불연속적입니다. 그래서 장점도 있지만 …

강화학습 A2C 케라스
인공지능

강화학습 : 파이썬 케라스로 구현한 액터-크리틱, A2C

이번에는 A2C라는 강화학습 알고리즘을 가져왔습니다. 정책 이터레이션 알고리즘들의 문제점들을 보완한 알고리즘이라고 볼 수 있는데요, 자세히 알아보도록 하겠습니다.

1. A2C란?


먼저, 이전에 REINFORCE에서 사용한 정책 신경망의 …

강화학습 A2C 케라스
인공지능

강화학습: 파이썬으로 구현한 ChopStick(젓가락 게임) 환경

이번에는 강화학습에 사용할 목적으로 어렸을때의 추억의 게임인 젓가락 게임을 만들어 보았습니다.

먼저 코드 전문을 보겠습니다.

import numpy as np
import pandas as pd
import time …

강화학습
인공지능

강화학습: Open Ai Gym 환경 불러오기

2022.10.26 수정

Open Ai에서는 Gym이라는 형태로 강화학습 알고리즘을 테스트 해볼 수 있는 다양한 환경을 제공합니다. 간단한 Text 게임에서부터 기초적인 움직임제어, 자동차나 이족보행 제어와 같은 환경이 …

강화학습 gym
인공지능

강화학습: 파이썬으로 구현한 DQN

이번에는 DQN, Deep Q-Learning에 대해서 알아보겠습니다.


1. DQN

DQN은 Q-Learning을 인공 신경망을 이용해서 구현한 오프폴리시 알고리즘입니다. 이전에 알아본 딥살사 같은 경우 온폴리시 알고리즘인데요. 즉 학습이 …

강화학습 DQN
Search