Semantic Segmentation(계속 업데이트 중)
1. Cityscapes
URL - https://www.cityscapes-dataset.com/
Cityscapes는 도시 길거리의 의미론적 이해를 위한 대용량 데이터셋입니다. 이 데이터셋은 semantic, instance-wise, dense pixel annotation된 라벨을 제공합니다. 라벨링은 8개 카테고리(평지, 사람, 차량, 건축물, 객체, 자연, 하늘, void)로 그룹화된 30개 클래스로 구성되어 있습니다. 5000개의 fine label 이미지들과 20000 coarse label 이미지들로 구성되어 있습니다. 이미지들은 여러 날짜, 좋은 날씨에서 50개의 도시에서 촬영되었습니다. 원래는 비디오로 녹화된 데이터였는데 각 프레임들을 다음 조건에 맞춰 선별한 데이터셋입니다.
조건 - 많은 수의 움직이는 객체들이 있고, 다양한 장면들과 다양한 배경이 있는 프레임.
2. KITTI
URL - http://www.cvlibs.net/datasets/kitti/
KITTI 데이터는 mobile robotics와 자율주행에서 사용되는 가장 유명한 데이터셋입니다. 고해상도 RGB, grayscale 스테레오 카메라와 3D 레이저 스캐너와 같이 다양한 센서 신호와 함께 녹화된 교통 시나리오로 구성되어 있습니다. 이 데이터셋은 semantic segmentation에 대한 ground truth를 제공하지 않지만 연구자들이 자신들의 연구 목적에 맞게 부분적으로 라벨링하였습니다.
< 예시 >
- •3개의 클래스에 대한 road detection을 위해 생성한 ground truth images - http://yann.lecun.com/exdb/publis/pdf/alvarez-eccv-12.pdf
- •10개 카테고리 tracking task을 위한 252개 라벨링된 이미지(Train 140/Test 112) - http://www-video.eecs.berkeley.edu/papers/rzhang/zhang-icra-submission.pdf
- •시각적 주행거리 측정 task를 위한 11개 카테고리 대상 Train 170, Test 46개 라벨링된 이미지 - http://refbase.cvc.uab.es/files/rrg2015.pdf
3. SYNTHIA
URL - https://synthia-dataset.net
SYNTHIA 데이터셋은 가상 도시를 현실적 느낌으로 렌더링한 9400개의 multi-viewpoint 이미지 데이터셋입니다. 이 데이터셋은 13개의 카테고리를 semantic segmentation에 적용 가능하도록 라벨링되어 있습니다. 각 프레임 별 해상도는 1280*960입니다.
4. ScanNet
URL : http://www.scan-net.org/
ScanNet은 실내 RGB-D 이미지로 각 객체들을 인스턴스화하여 라벨링 한 데이터셋입니다. 그리고 2D, 3D 데이터 모두 포함하고 있으며, points 또는 objects가 아닌 voxel로 라벨링 되어 있습니다. 최신 버전인 ScanNet v2는 약 90%의 표면을 덮는 1513개 라벨링 된 스캔데이터로 구성됩니다. Semantic segmentation 문제에서 이 데이터셋은 3차원 복셀화된 객체의 20개 클래스로 표시됩니다.
Uploaded by Notion2Tistory v1.1.0