Underdog을 위한 AI 기술 2편: wesee
Underdog을 위한 인공지능의 발전 두번째 이야기, 소외된 90%를 위한 기술 WeSee의 교차로 정보 데이터셋입니다.
May 25, 2022
10분 안에 이런 걸 얻을 수 있어요.
- 셀렉트스타만의 데이터셋 구축 솔루션
- 사회적 약자를 위한 데이터셋이 실질적으로 필요한 분야
- 오픈데이터셋 다운로드
** 오픈데이터셋은 AI 업계의 건강한 발전을 위해 셀렉트스타에서 자체 진행하는 무료 데이터셋 지원 사업입니다.
AI기술은 사회적 약자를 위해 어떻게 발전하고 있을까?
Underdog을 위한 인공지능의 발전 두번째 이야기, 소외된 90%를 위한 기술 WeSee의 교차로 정보 데이터셋입니다.
데이터셋 스펙
데이터셋 구축 목적
저시력자 혹은 시각장애인에게 지폐 및 동전의 단위/금액을 구분할 수 있는 서비스 개발
수량
총량 : 55,752건 (이미지 27,876건, JSON 27,876건)
지폐 8종 x 카테고리 12개 x 카테고리별 수량 125 → 145 수집 및 최종검수
14,009장
동전 8종 x 카테고리 8개 x 카테고리별 수량 200 → 220 수집 및 최종검수
13,867장
최종데이터 생산 진행률: 27,876건 / 24,800건 (112.4%)
데이터 수집 방법
동전의 세부 각도를 8개 방향으로 각각 촬영
지폐 금액 : 1000 / 5000 / 10000 / 50000
앞면/뒷면 : F(ront) / B(ack)
손/책상/물체 : HAND / DESK / STUFF
각도 : 0 / 90 / 180 / 270
데이터 형식
PNG/JPG, JSON
화폐 데이터셋은 셀렉스트타의 4가지 데이터 구축 철학[ ACCURACY / CONSISTENCY / BALANCE / COVERAGE ]에 입각하여, 한국에서 사용되는 모든 화폐의 다양한 각도의 사진을 수집/가공하였습니다. 덕분에 본 데이터셋을 활용하여 한국의 모든 화폐를 어떠한 각도에서도, 어떠한 상황에서도 완벽하게 인식, 판별할 수 있는 AI를 개발할 수 있는 발판이 마련되었습니다.
어떤 약자를 위한 인공지능 데이터셋일까?
셀렉트스타는 WeSee와 함께 저시력자, 시각장애인을 위한 ‘화폐 정보 데이터셋’을 구축했습니다.
알고 계셨나요?
저시력자나 시각장애인(이동 시 휠체어나 보조기구가 필요한 이)들이 이동 시 많은 어려움을 겪고 있음에도 불구하고 국내외, 장애인의 주요 이동 통로인 ‘인도’에 대한 대규모 데이터가 구축된 사례를 찾아볼 수 없었습니다.
무심코 사용해왔던 ‘돈’ 역시 누군가에게는 불편함을 동반한다는 현실, 시각장애인들은 현금을 사용하는데 생각보다 더 많은 제약을 받습니다. 물건을 살 때 알맞은 금액을 지불한 것인지 알기 어렵고, 정확한 거스름돈을 받았는지도 알기 쉽지 않습니다. 심지어는 이를 악용하여 부당한 이득을 취하는 비도덕적인 경우도 비일비재하게 발생한다고 합니다.
현금의 사용량이 많이 줄어든 요즘이긴 하지만, 여전히 사용하는 경우가 더러 있습니다. 그렇기에 WeSee는 이러한 일들을 방지하고자, 저시력자나 시각장애인들도 수월하게 현금을 사용할 수 있기를 바라며, 화폐를 정확히 인식하고 사용자에게 정보를 전달해줄 수 있는 화폐 정보 데이터셋을 셀렉트스타를 통해 구축하였습니다.
데이터셋은 어떻게 구축했을까?
화폐에 박스 그리기 미션
‘캐시미션(앱)’에서 박스 대상의 경계선이 두 박스선 사이에 들어오도록 박스를 그리는 화면
‘캐시미션(앱)’에서 동전의 동그란 경계선 끝이 두 박스 안에 들어오도록 박스를 그려서 수집
데이터는 셀렉트스타의 크라우드소싱 플랫폼 캐시미션을 통해 수집 & 가공되었습니다.
다양한 각도로 촬영된 지폐와 동전 데이터를 수집하고, 이를 각각 레이블링하였습니다. 정확한 정보를 통해 인지도를 높이기 위해 총 55,752건이라는 방대한 양의 데이터를 모아 구축한 데이터셋입니다.
양질의 데이터를 확보할 수 있었던 좋은 기회
인공지능의 품질을 높이는 다량의 고퀄리티 데이터
WeSee 공동 창업자 오선택 대표
인공지능의 품질은 데이터셋의 양과 질에 의해 좌우되는 폭이 큰데, 많은 양질의 데이터셋을 이번 프로젝트를 통해 확보할 수 있게 되어 기쁩니다. 무엇보다 시각장애인들의 삶에 작은 진보를 이뤄낼 가능성이 더 커졌다는 점이 과한 업무에 지친 팀원들에게 하나의 보상이 된 듯 싶습니다. 많은 도움을 준 셀렉트스타에게 감사의 인사를 전합니다.
이 데이터셋은 실제로 어떻게 사용될까?
WeSee는 시각장애인들 위한 AI 모델에 활용되기를 꿈꾸고 있다고 합니다.
웨어러블 디바이스나, 스마트폰 앱을 통해 음성 서비스와 같은 직관적인 방식으로 사용하는 현금의 정보를 시각장애인들이 쉽고 빠르게 인지할 수 있도록 돕는 것입니다.
기술의 발전이 모두에게 평등할 수는 없습니다. 하지만 이와 같은 underdog을 위한 AI 기술의 발전이 소외된 이들에게 희망을 줄 수 있기를 바랍니다.
인터뷰
Open Datasets for Data-Centric AI
위 데이터셋은 셀렉트스타 ‘OPEN DATASETS’를 통해 무료로 다운받으실 수 있습니다.
AI 산업의 발전을 위해 셀렉트스타가 무료로 데이터셋을 제공합니다.
Share article