시간과 비용을 절약하는 셀렉트스타의 반자동 레이블링 기술

반자동 레이블링은 AI 기술을 통해 세그멘테이션(segmentation)을 보다 원활하게 만들어주는 기술입니다.
Apr 11, 2022
시간과 비용을 절약하는 셀렉트스타의 반자동 레이블링 기술

더 빠르고 정확한 레이블링

🔑
5분 안에 이런 걸 얻을 수 있어요.
  • 셀렉트스타에서 해결하는 데이터 레이블링 문제
  • 반자동 레이블링 기술을 사용한 효율적인 데이터 생산 방식

Q. 아래 이미지에서 고양이를 레이블링 해주세요.

notion image
“레이블링을 하고자 하는 객체 위에 다른 물체가 겹쳐있는 경우 이 객체를 어떻게 레이블링할 수 있을까요?”
인간은 나무에 가려져 두 개의 덩어리로 나뉜 고양이를 하나의 동일한 객체로 인식하는 것이 가능합니다. 하지만 보통의 고양이 이미지를 학습한 모델을 통해 Auto-Labeling을 진행하는 경우 한 덩어리로 이어진 고양이의 기본적인 형태만을 고양이로 인식하기 때문에 고양이를 가리고 있는 나무까지 고양이로 인식하게 됩니다.
하지만 실제의 고양이는 나무 뒤에 가려졌을 뿐 한 덩어리로 존재하기 때문에 객체가 나눠져있더라도 동일한 객체로 인식해야 한다는 문제가 발생합니다. 반대로 사람이 일일이 세그멘테이션 하는 경우에는 그 정확도가 높아지는 만큼 컨트롤 포인트가 증가할수록 많은 시간과 비용이 발생하게 됩니다. 셀렉트스타에서는 이러한 어려움을 해결하고자 비용과 시간을 절약하며 정확도를 높이는 방식인 ‘반자동 레이블링’을 고안하게 되었습니다.

반자동 레이블링

반자동 레이블링은 AI 기술을 통해 세그멘테이션(segmentation)을 보다 원활하게 만들어주는 기술입니다.
notion image
작업자는 AI가 선 작업한 결과를 간단한 수정만 해서 쉽게 레이블링을 마무리할 수 있습니다.

✔️ 레이블링 소요 시간을 수작업 대비 50%가량 절약

✔️ 최소 400개의 수작업 만으로 도메인에 무관하게 반자동화 가능

mIoU:87.9%

단일 400 소(cow)데이터셋

mIoU:82.8%

조합 총합 400 도심데이터셋
Video preview
유저가 세그멘테이션 작업을 진행할 때 AI가 먼저 추론을 진행하고 그 뒤에 유저가 수정 작업을 하는 방식으로 레이블링 시간을 수작업 대비 40%~50%가량 절약할 수 있습니다. 특히, 셀렉트스타의 반자동 레이블링 기술은 최소 400개의 레이블링 데이터만 있다면 어떤 도메인의 데이터라도 반자동 레이블링에 활용할 수 있을 만큼 범용적입니다.

자동차와 보행자 반자동 레이블링 시연 화면

자체 데이터 증강 기술을 통해 최소 400개 수량의 수작업만으로 도메인에 무관하게 반자동화가능

내부 테스트가 완료된 상태이며, 22년 2분기 내 프로덕션화 예정입니다.

동물 반자동 레이블링 시연 화면

적은 데이터로 높은 정확도 기록, 직관적인 사용으로 쉬운 조작법

Bbox 그린 후 점을 가운데에 정확히 찍지 않아도 일관성을 갖추는 것이 가능한 레이블링
notion image
셀렉트스타는 어떻게 하면 ‘데이터 수집 및 가공 작업을 가장 효율적으로 할 수 있을지’를 집중적으로 연구하는 집단입니다.
여러분은 귀찮은 일에 신경 쓰지 않으셔도 됩니다. 셀렉트스타가 여러분을 위한 데이터를 빠르게 높은 품질의 데이터를 준비해 드리겠습니다.
시간을 아끼고, 비용도 아껴서, 저희가 드리는 다양하고 높은 품질의 데이터를 바탕으로, 여러분의 본업인 세상을 바꾸는 일에만 집중하시면 됩니다.
반자동 레이블링을 이용한 데이터 가공 기술 혁신, 데이터는 셀렉트스타가 책임져 드리겠습니다.
Share article

셀렉트스타(주) 블로그