양갱로그

앎을 경계하기

Study 2

차근차근 Spinning Up 톺아보기 1 - Part 1: Key Concepts in RL

항상 RL 관련 논문을 찾을 때 Open AI의 Spinning Up을 이용했었는데 막상 제대로 살펴본 적이 없어서 Spinning Up에 대한 정리를 해보려고 한다. 사이트는 아래 참고하기 https://spinningup.openai.com Welcome to Spinning Up in Deep RL! — Spinning Up documentation © Copyright 2018, OpenAI. Revision 2e0eff9b. spinningup.openai.com INTRODUCTION TO RL Part 1 : RL 핵심 개념 RL은 무엇을 할 수 있을까? 강화학습이 최근 들어 다양한 것들에서 좋은 결과를 내고 있다. 예를 들어, 시뮬레이션 환경에서 로봇을 컨트롤 하기 위한 학습 방법으로 RL..

Machine Learning/Reinforcement Learning 2019.10.28

(edwith) 인공지능 및 기계학습 개론 (2) MLE - 문일철 교수님

edwith에서 제공하는 인공지능 및 기계학습 개론 - 문일철 | KOOC (KAIST Open Online Course) 를 수강하며 정리한 글입니다. Thumbtack Question 동전 던지기처럼 압정을 던져 압정이 떨어진 모양을 이용한 게임이 있다. 압정이 떨어진 모양에 대한 확률을 어떻게 구할 수 있을까? 일단은 몇 번 던져볼 것이다. 총 5번을 던져서 나온 결과 3/5 to nail's up case 2/5 to nail's down case 이 trial로 "up이 더 많이 나왔으니 up일 확률이 높아요."라고 하기엔 부족함이 있다. Binomial Distribution Binomial Distribution은 Discrete probability distribution이다. 즉, 이산확..

Machine Learning 2019.05.02

텐서플로우, 강화학습, DAFIT, 파이토치, CV, 다핏, TensorFlow, 딥러닝, 데이터분석, Reinforcement Learning, RL, 알고리즘, deeplearning, 머신러닝, 파이썬, python, OpenCV, pyTorch, 백준, 가벼운학습지,

Today :
Yesterday :

일	월	화	수	목	금	토
				1	2	3
4	5	6	7	8	9	10
11	12	13	14	15	16	17
18	19	20	21	22	23	24
25	26	27	28	29	30	31

Study 2

티스토리툴바