소음수집 미션 후기
캐시미션을 통해 많은 요원들이 주택가, 음식점 등 장소에 따른 소음과 자동차 경적 소리, 발걸음 소리 등 여러 소음을 녹음해서 제출하는 미션에 참여했습니다. 고객사 코클리어닷에서는 요원들이 만들어준 음성 데이터로 열심히 AI를 개발하고 학습시켰죠.
Mar 17, 2022
우리는 이미 소리로부터 많은 정보들을 얻으며 생활하고 있습니다. 발소리만 듣고도 어떤 신발 종류인지도 알 수 있고, 밖에 비가 오는지, 아기가 우는지, 강아지가 짖는지 등을 알 수 있는 것처럼요.
그런데 이런 정보들을 컴퓨터가 사람처럼 인지할 수 있다면?!
컴퓨터가 비언어적인 정보를 감지하게 되면 보안 카메라가 비명소리나 총소리를 감지해서 위급상황을 알려줄 수도 있게 되고, 기침 소리가 나면 사용자가 감기에 걸렸는지 알려줄 수 있습니다. 여기서 비언어적인 정보란 박수 소리, 휘파람 소리, 경고음 소리 등 언어가 포함되지 않은 소리 정보를 말합니다. 그리고 음성과 소리를 통해서 정보 검색이 가능해지기도 합니다.
실제로 이런 차원에서 캐시미션을 찾아준 고객사가 있었으니, 바로 코클리어닷(cochl.)!
본부(a.k.a 셀렉트스타)는 코클리어닷과 함께 여러 소음을 수집하는 미션을 오픈했습니다.
캐시미션을 통해 많은 요원들이 주택가, 음식점 등 장소에 따른 소음과 자동차 경적 소리, 발걸음 소리 등 여러 소음을 녹음해서 제출하는 미션에 참여했습니다. 고객사 코클리어닷에서는 요원들이 만들어준 음성 데이터로 열심히 AI를 개발하고 학습시켰죠.
그 결과 AI가 유리창 깨지는 소리, 비명 소리, 화재 경보 소리 등을 학습해서 위험을 알리는 소리가 들렸을 때 보안 시스템이 작동해 청각 장애인에게 알리는 솔루션을 개발할 수 있었습니다. 또한 사람들이 보다 편리하고 안전한 일상생활을 누릴 수 있도록 휘파람, 박수, 손가락 소리, 노크와 같은 비언어적 명령으로 IoT 장치를 제어하는 솔루션을 만들기도 했습니다.
캐시미션에서 여러 장소와 조건 아래 다양한 소리를 녹음한 이유는 소리가 매우 다양한 환경을 포함하고 있어야 하기 때문인데요. 소리와 소음은 종류와 범위가 아주 다양하고 많기 때문에 수많은 음성 데이터를 수집하고 분석해야만 정확하고 넓은 범위를 인지하는 AI 기술을 만들 수 있습니다.
특히 음성 데이터를 넓은 범위에서 사용하기 위해서는 생활 속에서 발생하는 여러 소리들을 확보하는 것이 매우 중요한데요. 그렇기에 녹음 공간의 크기, 벽의 재질과 주변 사람들 대화 소리, 빗소리나 비행기 소리처럼 갑작스러운 외부 소음에 대한 수집이 필요했습니다.
소음의 종류가 다양하고 소음을 녹음하는 환경들이 천차만별이라, 기준이 무척 까다로웠는데도 이 모든 걸 이해하고 작업해서 멋진 결과물을 내준 우리 캐시미션 요원들에게 다시 한번 감사의 인사를 전하고 싶군요. (????) 요원들이 만들어준 데이터 덕분에 인공지능을 위한 고품질 학습 데이터를 제공하는데 아주 큰 도움이 됐습니다.
이렇게 요원들이 제공해 준 데이터들 중 ‘장소 소음’ 데이터는 현재 오픈데이터셋 페이지에서 무료로 다운로드 받으실 수 있습니다.
소음 데이터셋과 함께 총 9개의 오픈데이터셋을 무료로 다운받으실 수 있으니 많은 관심 부탁드립니다!
Open Datasets for Data-Centric AI
위 데이터셋은 셀렉트스타 ‘OPEN DATASETS’를 통해 무료로 다운받으실 수 있습니다.
AI 산업의 발전을 위해 셀렉트스타가 무료로 데이터셋을 제공합니다.
Share article