앎을 경계하기

Study 2

차근차근 Spinning Up 톺아보기 1 - Part 1: Key Concepts in RL

항상 RL 관련 논문을 찾을 때 Open AI의 Spinning Up을 이용했었는데 막상 제대로 살펴본 적이 없어서 Spinning Up에 대한 정리를 해보려고 한다. 사이트는 아래 참고하기 https://spinningup.openai.com Welcome to Spinning Up in Deep RL! — Spinning Up documentation © Copyright 2018, OpenAI. Revision 2e0eff9b. spinningup.openai.com INTRODUCTION TO RL Part 1 : RL 핵심 개념 RL은 무엇을 할 수 있을까? 강화학습이 최근 들어 다양한 것들에서 좋은 결과를 내고 있다. 예를 들어, 시뮬레이션 환경에서 로봇을 컨트롤 하기 위한 학습 방법으로 RL..

(edwith) 인공지능 및 기계학습 개론 (2) MLE - 문일철 교수님

edwith에서 제공하는 인공지능 및 기계학습 개론 - 문일철 | KOOC (KAIST Open Online Course) 를 수강하며 정리한 글입니다. Thumbtack Question 동전 던지기처럼 압정을 던져 압정이 떨어진 모양을 이용한 게임이 있다. 압정이 떨어진 모양에 대한 확률을 어떻게 구할 수 있을까? 일단은 몇 번 던져볼 것이다. 총 5번을 던져서 나온 결과 3/5 to nail's up case 2/5 to nail's down case 이 trial로 "up이 더 많이 나왔으니 up일 확률이 높아요."라고 하기엔 부족함이 있다. Binomial Distribution Binomial Distribution은 Discrete probability distribution이다. 즉, 이산확..

Machine Learning 2019.05.02