양갱로그

앎을 경계하기

actor-critic 2

차근차근 Spinning Up 톺아보기 Key Paper : A3C

이번에 볼 논문은 Asynchronous Advantage Actor-Critic (A3C)이다. A3C가 소개된 논문은 Asynchronous Methods for Deep Reinforcement Learning 이다. ICML에 Google DeepMind에서 발표하였다. 논문 전체가 A3C에 대한 이야기는 아니고 소개된 여러 비동기적 방법들 중에 RL Task에서 SOTA를 차지했었던 A3C가 포함되어 있다. A3C의 가장 큰 특징은 다음과 같다. Global Network/actor-learner Global Network : 각 Actor threads의 Gradient를 받아서 학습된 Network, Actors에게 parameter를 공유해준다. Actor threads : 주어진 Envi..

Machine Learning/Reinforcement Learning 2020.06.15

RL(7) DQN / A2C

참고 도서 : 이웅원, 양혁렬, 김건우, 이영무, 이의령 - 파이썬과 케라스로 배우는 강화학습

Machine Learning/Reinforcement Learning 2019.02.18

파이토치, 데이터분석, 파이썬, DAFIT, TensorFlow, Reinforcement Learning, 알고리즘, 머신러닝, OpenCV, 다핏, RL, 백준, 딥러닝, 강화학습, 텐서플로우, pyTorch, deeplearning, 가벼운학습지, CV, python,

Today :
Yesterday :

일	월	화	수	목	금	토
				1	2	3
4	5	6	7	8	9	10
11	12	13	14	15	16	17
18	19	20	21	22	23	24
25	26	27	28	29	30	31

actor-critic 2

티스토리툴바