프로젝트 | 프로젝트명 | |
전체 기간 | 2023.08.23 ~ 2023.09.27 (5주) |
진행단계 | 단계명 | (1) 현황파악 및 계획수립 |
ㅤ | 수행 기간 | 2023.00.00 ~ 2023.00.00 (00일) |
ㅤ | 활용 데이터 (출처) | - 예술의전당 측의 문제 출제 배경 및 목표 (빅콘테스트2023 설명회)
- 예술의전당 운영보고서/공시자료 (예술의전당 홈페이지)
- 공연예술/예술의전당 관련 기사 (구글, 네이버)
- 공연예술/가격최적화 관련 논문 및 사례 (DBpia, Youtube, 야놀자, 에어비앤비) |
ㅤ | 분석 방법 | - 문헌 조사 |
1. 현황 파악
공연예술 분야 현황
- 코로나 유행 기간 : 공연예술 분야는 코로나19 유행 기간 동안 인원제한, 띄어앉기 등의 정책 시행으로 큰 타격을 입었다. 공연의 수요 자체도 감소하여 2020~2021년 ‘장르별 관람객 수’가 2019년 대비 60~90%까지 감소했다.
- 코로나 유행 이후 : 2022년에는 거리두기 정책이 완화되면서 공연수요가 빠르게 회복되었고, 일부 장르는 코로나 이전인 2019년 관람객 수를 넘어서기도 했다.
관련 자료 (펼쳐보기)
ㅤ | 2019년 | 2020년 | 2021년 | 2022년 |
전체 | 274만 | 91만 | 176만 | 375만 |
클래식 | 41만 | 10만 | 34만 | 63만 |
예술의전당 현황
- 예술의전당 : 예술의전당은 문화체육관광부 산하 공공기관으로, 다양한 장르별 전용관이 존재하는 대표 복합문화 예술 공간이다. 공연예술은 음악당, 오페라하우스, 토월극장, 리사이틀홀, IBK챔버홀에서 이루어진다. 이 프로젝트에서는 음악당(콘서트홀)에서 이루어지는 공연만을 다루기로 했다.
- 예술의전당의 공연예술 : 코로나 유행 기간동안 거리두기, 무료 대관 지원사업 등으로 관객과 수익이 감소했으며, 이후 2022년에는 다시 공연예술 수요가 회복되었다. 주어진 예매데이터에는 코로나기간에 해당되는 데이터가 포함되어 있다.
- 공공성과 수익성 : 조사 결과 예술의전당은 크게 두 가지 문제로 지적받고 있다.
- 1) 대관공연 의존성 : 예술의전당 공연은 기획공연과 대관공연으로 나뉘는데, 대관공연의 비중이 전체 (2006~2022년 공연수 기준) 90% 에 달한다. 대관공연은 수익성이 어느정도 보장되지만 공공성이 떨어진다는 지적이 계속되어왔다.
- 2) 수익성 부진 : 공연예술 분야 적자
관련 자료 (펼쳐보기)
- Insight : 공공성과 수익성을 동시에 확보하기 위해서는 기획공연의 수익성 개선이 필요하다. 예술의전당 측에서 기획공연의 가격정책 변화와 실험을 위해 데이터 분석을 활용하려는 것이라고 추측하며 프로젝트를 진행했다.
주어진 데이터셋
- 데이터셋 간단 EDA
place
genre
membership_type
,discount_type
,price
,open_date
,trans_date
, …
- 데이터셋의 불완전한 부분 (가격)
- 한 공연에서 판매된 좌석의 데이터만 포함되어 있다. 판매되지 않은 좌석은 데이터가 없다. (모든 공연이 2505개 좌석에 대한 2505개 행을 갖는 것이 아니다.)
- 판매된 좌석이더라도, 가격(
price
)가 0원으로 나와있는 경우가 많았다. 할인종류(discount_type
)에 ‘초대권’, ‘기획사판매’로 명시된 경우가 대부분이었다. - 총 162개의 콘서트홀-클래식 공연 중 11개 공연은 모든 좌석이 0원으로 되어 있었다. 이 경우 예매까지 걸린 시간과 회원여부 외에는 얻을 수 있는 정보가 없다.
2. 관련 연구 및 사례 조사
공연예술의 가격/예매율 결정 요인
- 공연의 예매율 :
- 공연을 기획하는 입장에서 공연의 가격할인보다 좌석미확보의 위험성이 더 치명적이다.
- 공연 가격의 책정 :
- 다양한 공연요소 중 ‘출연진’이 유의미한 영향을 준다.
- 공연 기획자는 제작비를 기준으로 손익분기점을 계산한다. 이 때 일반적으로 공연 예매율을 40~60%로 예상하고 객단가를 설정하게 된다.
- 좌석의 선호도 :
- 무대 시야, 시각적 편안함이 좌석의 선호도와 높은 상관관계를 보인다. 무대와의 거리가 가까울 수록, 측면 각도가 작을 수록, 수직 각도가 적당한 각도를 가질 수록 좌석의 선호도가 올라간다.
관련 자료 (펼쳐보기)
가격 최적화 모델
- 가격 최적화(Price Optimization) 모델
- 에어빈앤비, 그루폰, 야놀자 등의 기업들이 실제로 가격최적화를 통해 매출을 상승시킨 사례를 참고했다.
- 에어비앤비의 논문을 통해 과거의 가격과 예매율 데이터를 학습한 회귀모델에서 이익 (예매율*가격)이 최대가 되는 가격을 설정하는 과정을 참고했다.
- 동적 가격(Dynamic Pricing) 모델
- 동적가격모델은 시간, 상황에 따라 가격을 다르게 적용하는 모델이다. 처음 티켓 오픈 시점부터 공연 시작이 가까워질 수록 할인율을 높이는 방식을 고려해볼 수 있다.
- 예술의전당 측에서 요구한 결과물은 ‘좌석 그룹핑’과 ‘(초기)가격 설정’이다. 동적 가격을 적용하더라도 기준이 되는 초기 가격이 있어야 하는데, 여기서는 그 초기가격이 설정되지 않은 상황이라고 봤다. 팀원들과 논의 결과, 이번 프로젝트에서는 ‘동적가격’보다 ‘가격최적화’ 부분에 초점을 맞추기로 했다.
관련 자료 (펼쳐보기)
3. 분석계획 수립
분석을 위해 필요한 (추가적인) 데이터
- ‘좌석 별 환경’ 관련 데이터 :
- 2. 관련 연구 및 사례 조사 를 통해 음향, 시야 등 ‘좌석의 환경’이 관객의 선호도와 예매율에 결정적인 영향을 미친다는 것을 확인했다.
- ⇒ 나라장터에서 찾은 ‘예술의전당 음악당 콘서트홀 실내공사’ 도면을 활용해서 좌표와 환경 변수를 생성하기로 했다.
- ‘코로나19 유행 기간 거리두기’ 데이터 :
- 코로나19 유행 기간에는 거리두기를 목적으로 일부 좌석을 ‘예매불가 좌석’으로 지정해놓기도 했다. 하지만 해당 기간이 언제인지, 좌석 거리두기가 어떤 규칙으로 적용되었는지 공지되어 있지 않았다. ‘예매불가 좌석’인 경우를 고려하지 않으면 좌석별 평균 예매율을 계산하는 과정에서 문제가 발생할 것으로 예상했다.
- ⇒ 보건복지부 데이터를 바탕으로 코로나 거리두기 시행 기간을 특정하기로 했다. 해당 기간 시행된 공연별로 2505개의 좌석을 시각화하고, ‘예매된 좌석’과 인접한 ‘예매되지 않은 좌석’은 ‘예매불가 좌석’으로 특정하는 방식으로 라벨링을 진행했다.
- ‘공연예술 수요’ 관련 데이터 :
- 동일 가격의 동일 공연도 시계열 및 공연예술 수요에 따라 예매율이 달라질 것으로 예상했다.
- ⇒ ‘키워드 검색량’ 통해 대략적인 공연예술 관련 대중의 관심도를 측정하여 반영하기로 했다. 공연이 모두 익명화되어 있기 때문에
서울 예술의전당 공연
,서울 예술의전당 콘서트홀
등의 키워드로 한정하여 데이터를 수집하기로 했다.
분석 방법 및 계획
1) 현황 파악
- 가격 결정에 중요한 영향을 미칠 것으로 예상되는 변수를 파악
- 주어진 데이터와 추가로 필요한 데이터 파악
2) 기존의 좌석 그룹핑 및 가격 분석
- 주어진 공연예매데이터에서 가격정보 보완
- 좌석별 (할인전) 가격 추정
- 좌석별 부여 등급 추정
3) 좌석별 공간 환경 관련 데이터 생성
- 공간정보를 바탕으로 도면 생성
- 좌석별 좌표(x, y, z) 추출
- 좌석별 시야, 편의시설 등의 공간 환경 관련 파생변수 생성
4) 새로운 좌석 그룹핑 모델
- 파생변수의 차원축소로 주성분 추출 (PCA)
- 새로운 기준(주성분)으로 좌석별 군집화 모델링
5) 가격 수집 모델
- 특정 공연객단가에서 좌석 가격에 따른 예매여부 구매패턴 모델 생성
- 좌석별 최대 이익 발생 가격으로 맵핑
예상 결과물
- 사용자 input에 따른 중요도를 반영하는 좌석 그룹핑 : 공연에 따라 특정 요인의 중요도가 바뀔 수 있을 것으로 예상된다 (ex. A공연에서는 시각적인 요소가, B공연에서는 음향적인 요소가 중요할 수 있음). 여러 변수를 시야, 음향, 편의시설, 고객선호도 등의 몇 가지 카테고리로 분류하고, 공연기획자가 각각에 중요도(weight)를 부여할 수 있게 한다. 공연객단가와 중요도를 입력하면 그에 부합하는 최적의 그룹핑과 등급별 가격을 제시할 수 있다.
- 좌석별 정보 시각화 및 필터링 기능 : 관객 입장에서 기존의 예매 화면에서는 좌석배치도에 좌석의 대략적인 위치 정보와 등급, 가격 만이 표현된다. 사용자(관객)가 특정 좌석에 마우스를 호버하면 좌석별 가격 결정 요소를 점수로 시각화하여 표현하여 해당 좌석의 장단점과 그에 따른 가격 책정 과정을 이해할 수 있다 (ex. 음향 좋음, 시야 보통, 편의시설 좋음, 고객선호도 높음). plotly나 tableau를 활용한 대시보드로 간단한 활용 예시 화면을 제시할 수 있을 것으로 예상된다.
예상 한계점
- 개별 공연/회원의 특성 특정 불가: 공연별로 예매율은 이전의 예매율을 참고하거나, 제작진 및 출연진을 파악하거나, 홍보비를 측정하는 등으로 수요를 보다 정확히 예측할 수 있다. 하지만 해당 데이터셋은 모든 공연과 관객(회원)이 익명화되어 있어서 이러한 부분의 반영이 어렵다. 키워드 검색량 또한 포괄적인 검색어를 선택해야 했다.
- 제한된 종류의 데이터 : 시각적인 정보와 편의시설 정보는 좌표를 생성하면 측정할 수 있을 것으로 예상되었다. 하지만 클래식 공연에서 중요한 요소인 음향 관련 정보는 문헌조사로 찾을 수 없었다. ⇒ 후에 모델에서 input 데이터를 추가/수정 할 수 있도록 만들기로 했다.
- 모델의 학습 부족 : 콘서트홀 클래식 공연은 총 162개, 그 중 모든 좌석의 가격이 0원으로 표시된 공연은 11개이다. 남은 151개 공연만으로 모델이 ‘객단가-가격’에 따른 좌석의 예매율을 충분히 학습하기 어려울 것으로 예상된다.
Share article