프로젝트명 | 예술의전당 좌석 그룹핑 & 가격 수립 프로젝트
(빅콘테스트2023 어드밴스드 리그 참여) |
기간 | 2023.08.23 ~ 2023.09.27 (5주) |
참여 인원 | 팀 프로젝트 (4인) |
나의 기여도 | ◼︎◼︎◼︎◼︎◻︎◻︎◻︎◻︎◻︎◻︎ (35%) |
나의 역할 | 1. 기존의 좌석 그룹핑/가격 모델 추정 (군집분석)
2. 좌석의 환경 관련 데이터 수집 (데이터 라벨링, 전처리, 파생변수 생성)
3. 다양한 변수를 포함한 좌석 그룹핑 모델링 (군집분석) |
활용 데이터 (출처) | - 예술의전당 공연예매데이터 (빅콘테스트 2023 제공)
- 음악당 좌석배치도 (예술의전당 홈페이지 ‘공간소개’)
- 음악당 평면도 (나라장터 ‘음악당 콘서트홀 음향시설 개선공사’)
- 코로나 거리두기 정보 (질병관리청, 보건복지부)
- 검색어 트렌드 (키워드사운드) |
분석 방법 | - 군집분석 : KNN, K-Means, Silhouette
- 차원축소 : PCA
- 딥러닝 : DNN |
1. 프로젝트 배경 · 목표
프로젝트 배경
- 예술의전당 공연예술 : 예술의전당은 문화체육관광부 산하 공공기관으로, 다양한 장르별 전용관이 존재하는 대표 복합문화 예술 공간이다. 2020년부터 코로나로 인해 공연예술 산업이 타격을 받았으나, 최근에는 사회적 거리 두기가 완화되면서 공연예술에 대한 수요가 증가하고 있다.
예술의전당 공연예술
- 예술의전당은 문화체육관광부 산하 공공기관으로, 다양한 장르별 전용관이 존재하는 대표 복합문화 예술 공간이다. 2020년부터 코로나로 인해 공연예술 산업이 타격을 받았으나, 최근에는 사회적 거리 두기가 완화되면서 공연예술에 대한 수요가 증가하고 있다.
- 예술의전당에서는 관객과 공연관계자의 입장을 모두 고려한 클래식 문화 활성화 방안을 모색하고 있다. 이를 위해 이번 대회에서는 빅데이터를 활용하여 수익성, 공공성을 고려한 투명하고 합리적인 좌석 그룹핑 및 가격산정을 목표로 한다.
프로젝트 목표
- 좌석 그룹핑 제시
- 관람객 재방문 유도, 만족도 향상을 위해 고객 선호도를 반영하여 투명하고 합리적인 가격 근거(ex. 시야, 위치, 편의시설)를 제시한다.
- 고객의 입장에서 좌석별 특성과 가격 산정 이유를 이해하기 쉽게 하고, 다양한 선택이 가능하게 하는 좌석 그룹핑을 제시한다.
- 가격 모델 제시
- 수익 및 공공성(공연 관계자 간 협력관계 등)을 고려하여 공연별 객단가를 선정해 수익을 최대화하는 방법을 제시한다.
- 공연 관계자의 입장에서 예상 공연 수요에 따라 유연하게 대응할 수 있는 옵션을 제시한다.
2. 진행 과정
기간 | 진행 단계 | * 소제목을 클릭하면 내용 페이지로 연결됩니다. |
ㅤ | - 배경 조사 : 예술의전당, 공연예술, 클래식공연
- 방법론 조사 : 가격 최적화(optimal pricing)
- 분석계획서 | |
ㅤ | - 공연-좌석별 원가격 추정 (KNN)
- 공연-좌석별 원등급 추정 (K-means) | |
ㅤ | - 공간정보를 바탕으로 좌표값 추출
- 좌석별 환경, 선호도 관련 파생변수 생성
- 파생변수의 차원축소로 주성분 추출 (PCA)
- 새로운 기준으로 좌석별 등급 부여 (K-means) | |
ㅤ | - 좌석별 공연객단가-좌석가격 에 따른 예매여부 예측 모델 생성
- 좌석별 최대 이익 발생 가격 맵핑 | |
ㅤ | - 모델 평가
- 한계점 : 모델 성능 저하의 원인 분석 |
3. 결과물 요약
4. 회고 · 피드백
부족한 점
- 구매패턴(좌석별 가격에 따른 예매율) 일반화 성능 부족 : 특정 객단가의 공연에서 좌석에 부여되는 가격에 따라 예매율을 구하고, 이를 기준으로 을 좌석별로 추정하기로 했다. 이 추정된 예상수익이 최대가 되는 가격을 해당 좌석의 가격으로 제시하는 것이 가격수립 모델의 최종 목표였다. 그러나 이 구매패턴 학습에 사용할 수 있는 데이터의 양이 절대적으로 적었고(모든 좌석이 0원으로 맵핑된 공연을 제외할 경우 학습에 사용할 수 있는 데이터는 151개 공연 뿐임), 구매패턴을 충분히 학습하지 못해서 결과적으로 예상수익 추정 및 가격 제시를 실패했다.
- 익명화된 데이터의 한계 : 해당 분석 프로젝트 수행을 위해 참고한 많은 공연예술 관련 연구에서 공연의 제작자, 출연진 등이 흥행력에 매우 큰 영향을 미친다고 설명한다. 그러나 제공된 데이터프레임에서는 모든 공연이 익명화되어 있어서 흥행력(예매율, 수익)에 가장 큰 영향을 미치는 이러한 특성을 특정하지 못한다. 마찬가지로 관객의 정보 또한 익명화되어 있어서 개인의 취향을 반영할 수 없다. 구매패턴 문제가 해결되더라도 가장 중요한 변수를 제외한 모델링이 된다는 한계가 있다.
좋은 점
- 공연 환경 관련 변수 : 예술의전당 측에서는 공연예매데이터 만이 제공되고 좌석별 공연환경에 대한 정보는 없었다. 공간정보를 통해 물리적 환경에 대한 변수를 생성했고, 군집모델에서 사용자(예술의전당 및 공연기획자)가 추가적인 정보(ex. 좌석별 음향 점수)를 입력하여 반영할 수 있게 했다는 점에서는 부족한 데이터 종류의 한계를 논리적으로 보완했다고 생각한다.
Share article