양갱로그

앎을 경계하기

policy gradient 2

차근차근 Spinning Up 톺아보기 4 - Part 3: Intro to Policy Optimization

Part 3: Intro to Policy Optimization Deriving the Simplest Policy Gradient Implementing the Simplest Policy Gradient Expected Grad-Log-Prob Lemma Don’t Let the Past Distract You Implementing Reward-to-Go Policy Gradient Baselines in Policy Gradients Other Forms of the Policy Gradient Recap Simplest Policy Gradient 유도 확률적이고 파라미터화된 정책인 $$\pi_{\theta}$$ 의 경우를 다룬다. 우리의 목표$$J(\pi_{\theta})$$는 기대 누적 보..

Machine Learning/Reinforcement Learning 2019.11.07

RL(6) Policy Gradient

참고 도서 : 이웅원, 양혁렬, 김건우, 이영무, 이의령 - 파이썬과 케라스로 배우는 강화학습

Machine Learning/Reinforcement Learning 2019.02.18

TensorFlow, OpenCV, 백준, 강화학습, 파이토치, deeplearning, Reinforcement Learning, DAFIT, 머신러닝, RL, 알고리즘, pyTorch, 텐서플로우, 다핏, 데이터분석, 가벼운학습지, CV, 파이썬, python, 딥러닝,

Today :
Yesterday :

일	월	화	수	목	금	토
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30

policy gradient 2

티스토리툴바