728x90

DeepLearning/Computer Vision 25

[DL/CV] NN interpolation의 backward propagation

Nearest Neighbor Upsampling FPN(Feature Pyramids Network)에서는 top-down path를 통과할 때 high level feature와 low level feature를 섞기 위해서 upsampling 연산을 하는데, upsampling 방법으로는 Nearest Neighbor Upsampling을 사용한다. Nearest Neighbor Upsampling은 다음과 같은 연산이다. (나중에 Upsampling을 한 번에 정리할 필요가 있다고 느낌) 간단하게 생각하면 upsampling 시, 채워야 하는 부분을 가까운 값의 copy로 채우는 연산이다. NN(Nearest Neighbor) Upsampling의 Backward path NN Upsampling..

[Object Detection] Image Annotation Formats

Image Annotation Formats Object Detection 시 pascal voc, coco 등 annotation format이 있다. 모델에 넣을 인풋을 세팅할 때 이런 포맷을 지정해줘야함. COCO COCO 포맷은 object detection, keypoint detection, stuff segmentation, panoptic segmentation, image captioning의 5개의 annotation 타입이 있다. Annotation은 JSON 파일 형식으로 저장되어 있다. 아래는 object detection의 경우 COCO 포맷 JSON파일의 예시이다. annotation{ "id" : int, "image_id": int, "category_id": int, "s..

[Object Detection] object detection 성능평가지표

Object Detection 성능의 평가 모델이 얼마나 객체 탐지를 성공적으로 수행했는가는 두 가지 측면에서 살펴볼 수 있다. 1) 얼마나 잘 탐지하는가? 2) 얼마나 빠르게 탐지하는가? 얼마나 잘 탐지하는가는 Accuracy의 측면으로, mAP로 흔히 평가한다. 얼마나 빠르게 탐지하는가는 inference time을 얼마나 단축시키는가의 측면으로, 모델의 효율성 등과 연관되며 이는 FPS로 흔히 평가한다. 얼마나 잘 탐지하는가 Precision and Recall Recall = TP / (TP+FN) = TP / # of ground truths Precision = TP / (TP + FP) = TP / # of predictions 간단히 말하면 Recall은 actual == True인 경우 ..

[Object Detection] Faster R-CNN 논문 리뷰

Faster R-CNN : Towards Real-Time Object Detection with Region Proposal Networks Idea Fast R-CNN은 selective search 수행으로 인한 region proposals(object가 있는 곳을 파악하는 과정)에서의 시간 소요 (bottleneck)가 단점으로 작용함 Faster R-CNN에서는 Region Proposals를 CNN으로 수행함으로써 속도 개선 (“Region Proposal Networks; RPNs” ) → end-to-end object detection model 구성 → 5 fps 까지의 속도 향상, Pascal VOC 기준 mAP 78.8%의 성능 개선 RPNs Region proposals 부분에서..

728x90