앎을 경계하기

Machine Learning

DATASET - Image Classification

양갱맨 2021. 2. 5. 14:28

Image Classification(계속 업데이트 중)

1. ImageNet

URL - http://image-net.org/download

WordNet 계층구조를 따른 14,197,122 장의 supervised learning(labeled) 데이터셋입니다. ImageNet Large Scale Visual Recognition Challenge(ILSVRC) 대회에서 Image classification과 Object Detection 성능평가 데이터셋으로 사용되었습니다. 라벨링된 Train 데이터와 라벨링되지 않은 Test 데이터셋 전부 공개된 데이터셋입니다. ILSVRC annotations는 두개의 범주 중 하나에 속합니다. (1)이미지 안에 객체 클래스가 존재하는지 아닌지에 대한 Binary labeling, (2)이미지 안에 객체 인스턴스 주변을 Bounding box와 label로 표현. ImageNet 프로젝트 내 이미지들은 저작권을 소유하지 않으므로 이미지의 썸네일과 URL만 제공합니다.

  • 비어있지 않은 WordNet 동의어 집합 전체 수 : 21841
  • 전체 이미지 수 : 14,197,122
  • Bounding Box 라벨링한 이미지 수 : 1,034,908
  • SIFT features가 있는 동의어 집합 수 : 1000
  • SIFT features가 있는 이미지 수 : 1,200,000

2. CIFAR-10/100

URL - https://www.cs.toronto.edu/~kriz/cifar.html

CIFAR-10 또는 CIFAR-100은 60000장의 32*32 RGB 이미지로 구성된 데이터셋입니다. CIFAR-10은 카테고리 수가 10개, 100은 20개의 상위 클래스로 그룹화된 총 카테고리 수가 100개인 데이터셋입니다. CIFAR-10은 카테고리수가 적은 대신, 각 클래스 마다 6000장의 이미지가 있습니다. 5000장은 Train set, 1000장은 Test set입니다. CIFAR-100은 클래스 당 600장의 이미지로 구성되어 있고 500장의 Train set, 100장의 Test set이 있습니다. 각 이미지들마다 “fine”label과 “coarse”label을 얻을 수 있습니다.

  • “이 이미지가 무엇인가?”와 같은 질문에 대한 객체 이름이 카테고리의 이름이다.
  • 현실 이미지로 구성되어 있고 따로 이미지에 어노테이션이 되어있지 않다.
  • 이미지에는 한 눈에 띄는 하나의 객체 인스턴스만 있다.

3. MNIST

URL - http://yann.lecun.com/exdb/mnist/

MNIST는 대용량 숫자 필기체 이미지 데이터셋입니다. 6만장의 Train set, 1만장의 Test set이 있습니다. 필기체 숫자의 grayscale 이미지로 구성되어 있고, 이미지는 중심 배치하여 28*28 pixel에 맞게 정규화 했습니다.

4. Fashion-MNIST

URL - https://github.com/zalandoresearch/fashion-mnist

Fashion-MNIST는 6만장의 Train set, 1만장의 Test set이 있습니다. 의 grayscale 이미지로 구성되어 있고, 이미지는 중심 배치하여 28*28 pixel에 맞게 정규화 했습니다. 이것은 숫자 필기체 데이터셋인 MNIST와 같습니다. 그러나 이 데이터셋은 10개의 의류 카테고리로 이루어져 있고, 각 클래스마다 7천장의 이미지가 있습니다.

5. Cityscapes

URL - https://www.cityscapes-dataset.com/

Cityscapes는 도시 길거리의 의미론적 이해를 위한 대용량 데이터셋입니다. 이 데이터셋은 semantic, instance-wise, dense pixel annotation된 라벨을 제공합니다. 라벨링은 8개 카테고리(평지, 사람, 차량, 건축물, 객체, 자연, 하늘, void)로 그룹화된 30개 클래스로 구성되어 있습니다. 5000개의 fine label 이미지들과 20000 coarse label 이미지들로 구성되어 있습니다. 이미지들은 여러 날짜, 좋은 날씨에서 50개의 도시에서 촬영되었습니다. 원래는 비디오로 녹화된 데이터였는데 각 프레임들을 다음 조건에 맞춰 선별한 데이터셋입니다.

조건 - 많은 수의 움직이는 객체들이 있고, 다양한 장면들과 다양한 배경이 있는 프레임.

6. CelebA

URL - http://mmlab.ie.cuhk.edu.hk/projects/CelebA.html

CelebA는 CelebFaces Attributes Dataset으로 이름에서도 알 수 있듯이, 사람 얼굴에 대한 이미지 데이터셋입니다. 178*178 사이즈의 202,599장 이미지입니다. 데이터셋을 구성하고 있는 사람들은 10,177명의 유명인들이며 머리카락 색, 성별, 나이와 같은 얼굴 사진에서 나타나는 특징들을 40개의 binary label로 라벨링하였습니다.

7. SVHN

URL - http://ufldl.stanford.edu/housenumbers/

SVHN은 Street view로 촬영된 집 주소 데이터셋입니다. 숫자 분류 성능평가를 위한 데이터셋으로 0부터 9로 이루어진 집주소 이미지입니다. 이 데이터셋은 숫자를 중심으로 잘라낸 32*32 RGB 이미지 60만장으로 구성되어있습니다.

 

Papers with Code - The latest in Machine Learning

Papers With Code highlights trending Machine Learning research and the code to implement it.

www.paperswithcode.com