앎을 경계하기

머신러닝 27

[Pytorch Tutorials] Image and Video - DCGAN Tutorial

Introduction예제를 통해 DCGAN을 알아보는 튜토리얼을 진행한다. 실제 유명인들의 사진을 통해서 새로운 사람을 생성하는 Generative Adversarial Network(GAN)을 학습시킨다. DCGAN의 구현은 https://github.com/pytorch/examples 을 참고한다.Generative Adversarial NetworksWhat is GAN?GANs는 학습 데이터셋의 분포를 통해 새로운 데이터의 분포를 학습 데이터 분포와 똑같이 만들어내는 것이다. generator와 discriminator라는 두개의 명확한 모델을 만들어낸다.generator는 학습 이미지와 비슷한 "fake" 이미지를 만들어낸다.discriminator는 generator가 생성한 fake im..

Machine Learning 2021.03.22

DEEP LEARNING WITH PYTORCH: A 60 MINUTE BLITZ - TRAINING A CLASSIFIER

What aoubt data?일반적으로 이미지, 텍스트, 비디오, 오디오 데이터를 다룰 때 numpy array로 데이터를 읽고 torch의 tensor로 변환한다. 각 데이터마다 유용하게 사용하는 라이브러리가 존재한다.Images : Pillow, OpenCVAudio : scipy, librosaText : NLTK, SpaCy특히 vision 분야에서는 torchvision을 사용해서 유명한 데이터셋을 불러서 사용할 수 있다.torchvision.datasets, torch.utils.data.DataLoader 유명 이미지 데이터셋 중 하나인 CIFAR10을 사용해보자.CIFAR10은 RGB 컬러 32*32 사이즈 이미지의 총 10개의 카테고리로 이루어져있는 이미지 데이터셋이다. Training ..

Machine Learning 2021.03.08

DEEP LEARNING WITH PYTORCH: A 60 MINUTE BLITZ - TORCH.AUTOGRAD

torch.autogradPyTorch는 자동 미분 계산을 지원한다.이번 섹션에서는 neural network 학습을 위해 어떻게 자동미분을 적용하는지 개념적으로 이해하도록 한다.Background뉴럴넷은 어떠한 입력 데이터에 대해 실행되는 연결된 함수들(신경망)의 집합이다.이러한 함수들은 weight와 bias로 구성된 parameters에 의해 정의되고, 이것들은 Tensor 형태로 저장된다.뉴럴네트워크 학습 과정은 크게 2단계로 나눌 수 있는데, forward propagation과 backward propagation이다.Forward propagationinput data를 각 함수들에 대해 통과시켜서 가장 옳은 output을 만들어내는 과정이다.Backward propagationforward..

Machine Learning 2021.03.05

DATASET - Semantic Segmentation

Semantic Segmentation(계속 업데이트 중) 1. Cityscapes URL - https://www.cityscapes-dataset.com/ Cityscapes는 도시 길거리의 의미론적 이해를 위한 대용량 데이터셋입니다. 이 데이터셋은 semantic, instance-wise, dense pixel annotation된 라벨을 제공합니다. 라벨링은 8개 카테고리(평지, 사람, 차량, 건축물, 객체, 자연, 하늘, void)로 그룹화된 30개 클래스로 구성되어 있습니다. 5000개의 fine label 이미지들과 20000 coarse label 이미지들로 구성되어 있습니다. 이미지들은 여러 날짜, 좋은 날씨에서 50개의 도시에서 촬영되었습니다. 원래는 비디오로 녹화된 데이터였는데 각 ..

Machine Learning 2021.02.05

DATASET - Image Classification

Image Classification(계속 업데이트 중) 1. ImageNet URL - http://image-net.org/download WordNet 계층구조를 따른 14,197,122 장의 supervised learning(labeled) 데이터셋입니다. ImageNet Large Scale Visual Recognition Challenge(ILSVRC) 대회에서 Image classification과 Object Detection 성능평가 데이터셋으로 사용되었습니다. 라벨링된 Train 데이터와 라벨링되지 않은 Test 데이터셋 전부 공개된 데이터셋입니다. ILSVRC annotations는 두개의 범주 중 하나에 속합니다. (1)이미지 안에 객체 클래스가 존재하는지 아닌지에 대한 Bina..

Machine Learning 2021.02.05

파이썬 데이터 분석 실무 테크닉 100 - 3장

pd.to_datetime('20180401')] len(customer_start) Out[77]: 1361 최신 고객 집계¶ 가장 최근(2019년 3월) 고객 데이터 파악하기 In [78]: customer_join['end_date'] = pd.to_datetime(customer_join['end_date']) customer_newer = customer_join.loc[(customer_join["end_date"]>=pd.to_datetime('20190331'))|(customer_join['end_date'].isna())] len(customer_newer) Out[78]: 2953 In [79]: customer_newer['end_date'].unique() #검산 Out[79]: ..