안녕하세요. 달토깽이 입니다. 데이터라벨링이라는 것이 참 생소하고 그렇죠. 저도 처음 접할때는 생경했지요. 디지털노가다 인형에 눈알붙이기 등등 라벨링은 별명도 많습니다. 아무리 어떤 작업인지 설명을 들어도 와 닿지가 않습니다. 직접 해보시면 이게 바운딩이구나 폴리곤이구나 할텐데 말이죠. 물론 실질적으로 실습을 했어도 용어를 잘 모르는 경우도 있습니다. 그렇지만 데이터라벨링 하면서 용어를 알고 가면 좋을 것 같아 정리해봤습니다.
데이터 라벨링(Data labeling)이란?
사람이 만든 사진, 문서 등의 데이터를 인공지능(AI)이 학습 할수 있는 형태로 가공하는 작업을 말합니다.
객체검출(object detection) 방법
① 바운딩 박스 (Bounding Box)
바운딩 박스는 객체검출(object detection)에서 가장 흔히 쓰이는 방법. 검출하려는 객체에 타이트 하게 박스표기를 하고 해당 객체의 class를 구분해주는 방식. 대각선의 포인트를 잡아주면 되기 때문에 가장 쉽지만 데이터의 디테일이 그만큼 떨어짐
② 폴리곤 (Polygon)
폴리곤은 의미 그대로 다각형. 검출하려는 객체를 다각형으로 표기. 레이블링(=어노테이션)에서 자세하고 디테일할수록 그만큼 좋은 데이터가 될 수 있지만, 그만큼 노동력이 많이 들어가게 된다.
③ 포인트(Point)
포인트는 이미지에서 찾으려는 객체에 대해 점을 찍어 표기하는 방식으로 점만 찍으면 됨으로 매우 쉽다. 하지만 그만큼 특징을 뽑아내는데 한정적이기 때문에, 정확하게 해당하는 데이터를 찍어주는 것이 중요하다. 찾으려고 하는 객체의 특성이 뚜렷한 경우에 효과가 좋고 이미지 안에서 객체의 수를 셀 때 유용하다.
④키포인트(Keypoint)
키포인트는 탐지하려는 객체의 모양을 알고싶을 때 데이터의 외곽선을 따줌으로써 폴리곤과 포인트 정보를 만들어 특징을 갖게 만드는 것이다. 추가적으로 포인트의 순서와 개수도 매타 데이터에 포함되기 때문에 동일 객체에 대해서는 같은 포인트를 갖는 것이 좋다.
⑤폴리라인(Polyline)
폴리라인은 많은 점으로 선을 그어 표기한다. 도로선 같이 시작과 끝이 없는 선을 구분할 때 사용하기 좋은 라벨링으로써 그 모양 자체로 특성을 가질 때 해당 데이터를 주로 사용한다. 예시와 같이 주로 차량 ADAS에서 자율주행을 위해 사용된다.