반응형
Classification, 분류 :
인풋에 대해서 하나의 레이블을 예측하는 작업.
ex) AlexNet, ResNet, Xception 등의 모델
Localization / Detection, 발견 :
물체의 레이블을 예측하면서 그 물체가 어디에 있는지 정보를 제공.
물체가 있는 곳에 네모를 그리는 등..
ex) YOLO, R-CNN 등의 모델
Segmentation, 분할 :
모든 픽셀의 레이블을 예측
ex) FCN, SegNet, DeepLab 등의 모델
Semantic Image Segmentation(직역 : 의미론적인 이미지 분할)의 목적은 사진에 있는 모든 픽셀을 해당하는 class로 분류하는 것임. (이 class는 미리 지정되어있음.) 이미지에 있는 모든 픽셀에 대한 예측을 하는 것이기 때문에 dense prediction(조밀한 예측)이라고도 불림.
여기서 주의해야할 점은, semantic image segmentation은 같은 class의 instance를 구별하지 않는다는 것.
쉽게 말해서 밑에 가족사진처럼 같은 class에 속하는 object(사람이 4명)가 있을 때
사람을 따로 분류하지 않고, 그 픽셀 자체가 어떤 class에 속하는지에만 관심이 있음(아래 오른쪽 사진).
아래 왼쪽 사진처럼 instance를 구별하는 모델은 따로 instance segmentation이라고 지칭함.
Semantic Segmentation Task를 더 자세하게 이해하고 싶다면,
반응형