300x250
Computer Vision에서 recognition task 시에 겪을 수 있는 challenges (출처: cs231n notes)
1. Viewpoint variation: 카메라 앵글에 따라 다르게 잡히는 객체 (얼굴의 정면, 측면 등)
2. Scale variation: 같은 객체여도 다른 사이즈로 이미지에 등장할 수 있음.
3. Deformation: 같은 객체여도 다른 모양으로 이미지 내에 표현될 수 있음. (서있어도, 앉아있어도, 누워있어도, 요가 자세를 취해도 사람은 사람이다)
4. Occlusion: 물체가 어느 부분 가려져도 같은 물체임을 판단할 수 있어야 함. (얼굴이 반 잘렸다거나, 갈대밭에 숨어있는 사람이어도 사람이라고 판단할 수 있어야 함)
5. Illumination conditions: 조명에 따라 같은 객체여도 이미지 픽셀은 크게 달라짐.
6. Background clutter: 물체와 배경이 색상 등이 비슷해서 물체를 배경으로부터 구분해내기 어려운 경우
7. Intra-class variation: 같은 클래스의 객체라고 하더라도 그 클래스 내에서 여러 가지로 나뉠 수 있음. 의자의 경우에는 등받이가 있는 의자, 등받이가 없는 의자 모두 같은 의자임을 판별할 수 있어야 함.
좋은 모델이라면 위의 어려운 점들을 모두 극복해낼 수 있어야 함.
300x250
'Computer Science > computer vision' 카테고리의 다른 글
[opencv/c++] 메모리공간에 배열 데이터 할당하는 방법 (using Mat) (0) | 2021.02.22 |
---|