728x90

DeepLearning/Computer Vision 24

[Object Detection] Image Annotation Formats

Image Annotation Formats Object Detection 시 pascal voc, coco 등 annotation format이 있다. 모델에 넣을 인풋을 세팅할 때 이런 포맷을 지정해줘야함. COCO COCO 포맷은 object detection, keypoint detection, stuff segmentation, panoptic segmentation, image captioning의 5개의 annotation 타입이 있다. Annotation은 JSON 파일 형식으로 저장되어 있다. 아래는 object detection의 경우 COCO 포맷 JSON파일의 예시이다. annotation{ "id" : int, "image_id": int, "category_id": int, "s..

[Object Detection] object detection 성능평가지표

Object Detection 성능의 평가 모델이 얼마나 객체 탐지를 성공적으로 수행했는가는 두 가지 측면에서 살펴볼 수 있다. 1) 얼마나 잘 탐지하는가? 2) 얼마나 빠르게 탐지하는가? 얼마나 잘 탐지하는가는 Accuracy의 측면으로, mAP로 흔히 평가한다. 얼마나 빠르게 탐지하는가는 inference time을 얼마나 단축시키는가의 측면으로, 모델의 효율성 등과 연관되며 이는 FPS로 흔히 평가한다. 얼마나 잘 탐지하는가 Precision and Recall Recall = TP / (TP+FN) = TP / # of ground truths Precision = TP / (TP + FP) = TP / # of predictions 간단히 말하면 Recall은 actual == True인 경우 ..

[Object Detection] Faster R-CNN 논문 리뷰

Faster R-CNN : Towards Real-Time Object Detection with Region Proposal Networks Idea Fast R-CNN은 selective search 수행으로 인한 region proposals(object가 있는 곳을 파악하는 과정)에서의 시간 소요 (bottleneck)가 단점으로 작용함 Faster R-CNN에서는 Region Proposals를 CNN으로 수행함으로써 속도 개선 (“Region Proposal Networks; RPNs” ) → end-to-end object detection model 구성 → 5 fps 까지의 속도 향상, Pascal VOC 기준 mAP 78.8%의 성능 개선 RPNs Region proposals 부분에서..

728x90