edwith에서 제공하는 인공지능 및 기계학습 개론 - 문일철 | KOOC (KAIST Open Online Course) 를 수강하며 정리한 글입니다.
Motivation
Machine learning, AI, Datamining 등 빅데이터를 활용한 기술들이 현 시대에 굉장히 주목을 받고있다.
왜 이러한 것들을 공부해야하고 무엇을 공부할까?
Machine Learning이라 하면 굉장히 많은 키워드들이 따라 다닌다.
Data-mining, Knowledge discovery, AI ...
이렇게 많은 용어로 기계 학습에 대해 관심을 갖고 접근하는 이유는 다양한 종류의 Data들이 생산되고 있기 때문이다.
* Text Data
* Network Data
* Image Data
* ...
대량의 데이터를 기반으로 머신러닝을 적용시킨 사례
* Document Classification : 스팸 메일 필터링 등
* Stock Market Prediction : 주가 예측
* Plate Num. Recognition : 번호판 인식
* SNS Recommendation : SNS 추천친구 시스템
* Helicopter Control : 헬리콥터 조종
요즘에는 스팸 필터링 같은 경우 메일의 분류를 하면서 중요도를 판별해주기도 함.
어떠한 사건이 일어났을때 사람들의 생각 같은 것들을 SNS나 Text Data에서 데이터 마이닝을 해서 의미있는 해석을 해내기도 함.
Types of Machine Learning
1. Supervised Learning : 지도학습, 데이터와 정답을 알려주고 Classification 등 문제에 대해 prediction 해내는 학습 방법
2. Unsupervised Learning : 비지도학습, 데이터만 주고 그 데이터들을 기반으로 어떠한 summary라던지 특정 task를 해내는 학습 방법
3. Reinforcement Learning : 강화학습, 보상을 통해 학습시키고자하는 방향대로 agent가 action을 해내는 학습 방법
* 이 강의에서는 Supervised/Unsupervised 에 대해서 이야기한다.
Supervised Learning
메일 데이터를 주고 "이 메일은 스팸메일이야. 저 메일은 스팸메일은 아니야."라고 데이터와 그 데이터에 대한 정답(label)을 알려줄 수 있다.
Classification(분류) 또는 Regression(회귀)문제를 해결한다.
Classification은 관찰로부터 이산 독립 값을 추정한다.
Regression은 관찰로부터 연속적인 독립 값을 추정한다.
즉, 분류는 어떤 사진을 주고 이게 고양이인지 강아지인지 맞춰봐(분류해봐)이고
회귀는 그 동안 월 수익이 100만원인데 다음 달 수익은 얼마일지 예측해봐 식의 문제를 푸는 것이다.
Unsupervised Learning
정답 label은 없지만 데이터들만 가지고 무언가 작업을 하게 한다.
ex) 여러 사람의 사진을 모아서 얼굴의 형태 중의 합쳐진 요소들을 보여준다.
cluster, latent factors, graph structures 문제를 해결한다.
Clustering과 Filtering을 하는데
Clustering은 어떠한 기준으로 데이터들을 군집화한다.
Filtering은 노이즈가 섞인 데이터로부터 노이즈는 뺀 원래의 데이터만 추정해내는 것을 말한다.
'Machine Learning' 카테고리의 다른 글
코세라 - 00 Machine Learning (0) | 2019.08.30 |
---|---|
(edwith) 인공지능 및 기계학습 개론 (2) MLE - 문일철 교수님 (0) | 2019.05.02 |
구글 머신러닝 스터디잼 중급반 후기 + 반성(?) (0) | 2019.04.15 |
tensorflow / tensorflow-gpu 설치, GPU 사용하는 방법 (0) | 2019.04.03 |
google 텐서플로우 머신러닝잼 시작! (0) | 2019.02.13 |