앎을 경계하기

딥러닝 34

[VISION 논문 읽기] simple copy-paste is a strong data augmentation method for instance segmentation

두 장의 이미지에서 한 장을 source, 나머지 한 장을 target으로 하여 source 이미지 내 객체들의 부분 집합을 선택해 target 이미지에 붙여넣음으로써 어렵고, 새로운 이미지 데이터셋을 만들 수 있다. 코드 이식성이 좋아서 쉽게 다른 모델을 사용할 때 data augmentation 적용할 수 있으며 여러 실험을 진행해본 결과, (object detection, instance segmentation, semantic segmentation, self-supervised learning ...)성능 또한 우수함. 데이터가 적은 상황에서 데이터 효율성을 끌어올릴 수 있다. YOUTUBE : youtu.be/jPWHdj2caC8

[머신러닝 개념정리] Normalization/Standardization/Regularization

Normalization/Standardization/Regularization Data preprocessing을 위해 Normalization, Standardization과 같은 방법을 사용한다. model의 weight가 overfitting하는 것을 막기 위해 Regularization을 사용한다. Normalization original data distribution을 (0, 0)으로 shift 한 후, 분포의 범위를 [0,1]로 rescale 하는 방법 $$ \frac{X-\min(X)}{\max(X)-\min(X)} \ or \ \frac{X-\mu}{\sigma} \ \text{2번째는 standardization이기도 함.} $$ 사용하는 이유 Local minimum에 빠질 가능성을..

Machine Learning 2020.04.08

Scikit-learn Datasets 관련 정리

Scikit-learn Benchmark용 Dataset example Data preprocessing Supervised Learning Unsupervised Learning Model evaluation and selection sklearn.datasets : 예제 데이터셋 제공 load 계열 : scikit-learn 패키지에 같이 포함된 데이터 fetch 계열 : 인터넷에서 다운로드할 수 있는 대량의 데이터 make 계열 : 확률분포를 사용해 가상의 데이터 생성 load_boston : 보스턴 집값 (회귀 분석용) load_diabetes : 당뇨병 (회귀 분석용) load_linnerud : linnerud (회귀 분석용) load_iris : 붓꽃 (분류용) load_digits : 숫자..

Machine Learning 2020.02.14

텐서플로와 유니티 ML-Agent로 배우는 강화학습(1-2) ML-Agents 개요

Brain 모든 에이전트에 할당해야하는 요소. 에이전트가 환경에서 어떠한 행동을 하기 위해서는 꼭 이 브레인이 필요하다. Player Brain Heuristic Brain Learning Brain 공통 요소 Copy Brain Parameters from 다른 브레인의 파라미터를 복사할 때 사용한다. Vector Observation Space Size와 Stacked Vectors를 설정할 수 있다. space size : AddVectorObs로 추가했던 observation의 수와 동일하게 설정해줘야한다. 값이 동일하지 않으면 에러가 발생한다. stacked size : observation을 설정한 stacked size 값만큼 이어붙여서 observation vector수가 늘어나게 되며 이..