앎을 경계하기

instance segmentation 2

[Pytorch Tutorials] Image and Video - Torchvision object detection finetuning tutorial

Torchvision object detection finetuning tutorial 이 튜토리얼에선 pre-trained된 Mask R-CNN을 finetuning한다. 데이터셋은 보행자 detection, segmentation을 위한 Penn-Fudan database를 사용한다. 345개 보행자 인스턴스가 있는 170개 이미지로 구성되어있다. 데이터셋 만들기 데이터셋은 torch.utils.data.Dataset클래스를 상속해서 __len__과 __getitem__을 구현해야한다. __getitem__은 다음을 반환한다. image : height, width 사이즈의 PIL Image (width, height가 아님을 주의해야한다.) target : dictionary boxes : N개의 ..

Machine Learning 2021.03.11

[VISION 논문 읽기] simple copy-paste is a strong data augmentation method for instance segmentation

두 장의 이미지에서 한 장을 source, 나머지 한 장을 target으로 하여 source 이미지 내 객체들의 부분 집합을 선택해 target 이미지에 붙여넣음으로써 어렵고, 새로운 이미지 데이터셋을 만들 수 있다. 코드 이식성이 좋아서 쉽게 다른 모델을 사용할 때 data augmentation 적용할 수 있으며 여러 실험을 진행해본 결과, (object detection, instance segmentation, semantic segmentation, self-supervised learning ...)성능 또한 우수함. 데이터가 적은 상황에서 데이터 효율성을 끌어올릴 수 있다. YOUTUBE : youtu.be/jPWHdj2caC8