[GA] 스터디 Kick-off

서쿼드 1기 get started!
Jun 17, 2023
[GA] 스터디 Kick-off

스터디 begins

  • 기존 부트캠프 친구들과 진행했던 서쿼드를 외부 커뮤니티를 통해 홍보해서 스터디 멤버를 더 충원했다.
  • 현직자, 구직자, 취준생등 총 7명의 멤버로 시작~!
notion image
 

해보고 싶었던 분석 프로젝트는..

  • 대부분의 멤버 분들이 이커머스 데이터셋을 들고 왔다.

1. G사 브랜드 매출 데이터셋

Background 설명 :
  • Sideproject로 식물영양제 브랜드를 판매하시는 1인기업을 도와주는 일을 했었는데용,,
  • 해당 브랜드의 스마트스토어 매출 데이터셋을 활용해볼 수 있을 것 같습니다.
  • 제가 도움을 드렸던 부분
    • 자사몰 구축 https://flowerbloomingtime.com/ (아임웹으로 제작)
    • 자사몰 GA4 연동
    • 자사몰 유입 마케팅 (광고 운영 등)
    • 자사몰 소구점 테스트 (google optimize personalization 사용)
    • 인플루언서 시딩 프로세스 구축 및 시딩 진행
해볼 수 있는 프로젝트 예시 :
  • 구매 패턴 분석 : 구매 이력 데이터를 분석하여 고객들의 구매 패턴을 파악 → 판매 추이, 잠재적 크로스셀링 기회 등을 파악
  • GCP Bigquery 연동 : 자사몰 GA4, GTM은 연결되어있는 상황. 자사몰 유입 마케팅 안하고 있어서.. 사실상 현재 트레픽은 없습니다만.. 이벤트 설계하고, GTM 으로 이벤트 수집하고, Bigquery에 DB구축하는건 해볼 수 있을 것 같아용.
  • 리뷰 분석 : 리뷰 데이터 바탕으로 평점, 키워드 분석
제약 사항 :
  • 브랜드의 상품 갯수가 매우 적음 (주력 상품 2종) → 장바구니 분석과 같은 건 불가
  • 스마트스토어에서 발생하는 다른 데이터와 JOIN할 수 없음 (스마트스토어를 비롯한 대부분의 유통 플랫폼은 raw데이터를 제공하지 않음. 자사의 자산이기 때문.)
  • 해당 브랜드의 다른 유통채널 데이터와 함께 비교 어려움 (현재 쿠팡에서 판매되는 매출이 80% 가까움) 현재 해당 스스의 한달 매출은 200만원 선으로 볼륨이 적음. (온전하지 않은 데이터)
  • 해볼 수 있는 건, 구매확정된 고객의 주문정보, 고객정보 파일을 활용해서 분석 진행해야함.
  • 데이터 전처리 필요 (고객정보, 상품정보 비식별화 진행) - 포폴 첨부시 G사 브랜드로 표기 필요.
 
+) GPT 활용 아이디어
ChatGPT 커뮤니티를 보다가 완전 신기한거 발견
sql 강의에서 주는 데이터베이스 예제에 너무 익숙해져서
다른 데이터 베이스를 가지고 연습해보고 싶었음.
GPT를 활용해 데이터베이스를 구축하면 어떨까 하는 마음에 GPT에게 만들어달라고 요청.
  • 처음엔 3.5를 사용해 제작요청
몇가지 질문을 더해 그럴듯한 데이터를 만들어 줌
GPT3.5
….
카테고리까지 완전 랜덤하게 설정해서 데이터를 만든 모습
  • 일단 3.5인데도 불구하고 계속 continue generating을 눌러줘야 데이터를 만들어주고 속도가 느림.
  • 숫자가 들어가는 카테고리는 최대한 피해서 요청하는 나음
  • 랜덤 데이터라 하더라도 데이터끼리의 연관성은 있었음(ex. 좋아하는 음식 - 국가, 인종 - 국가)
  • 민감한 주제에 조심성이 있다고 느낌(ex- 흑인)
  • 느리지만 GPT 4.0을 활용해서 예시 데이터 제작을 요청
  • 아무리 시도해도 중간에 …을 넣어서 모든 데이터를 보여주지 않음
  • 아마 비효율적인 요청이 너무 많아서 시스템적으로 막는 것이라고 느껴졌음
  • GPT 4.0보다 GPT3.5가 더 나았던 흔치 않은 경험
    • 결론
  • 그냥 강의에서 주는 예시데이터 받아서 쓰자… 배우기엔 그게 제일 효과적이다.
  • 소재가 떠오르지 않을 때 참고자료로 활용하기 좋아보인다.
각자 하고 싶은 분석에 맞게 ERD 설계해서 가상의 데이터셋을 만들어보면 어떨까
 

2. 와디즈 트렌드 분석

데이터 링크 :
  • 셀레니움으로 크롤링함. 동적 사이트라 request,bs4론 어려움. API는 못찾겠음.
  • 상세페이지도 크롤링해야하는데 예정/진행 중/달성완료 마다 element가 달라서 아직 완료 못함. (난이도 하)
Background 설명 :
  • 꽃피우는시간 제품을 활용해서 와디즈 펀딩 계획 중 (7월 초~중순) 원래 와디즈는 시제품 판매하는건 정책상 안됬는데, 이번에 개정되었다고 함. 그래서 현재 쿠팡, 스마트스토어에서 잘 판매되고 있는 제품을 가격, 구성만 달리해서 판매해볼 예정.
  • 목표 매출액은 N천만원.
  • 와디즈 플랫폼 유저 대상으로 마케팅을 해야하는데, 와디즈 내 트렌드, 유저에 대한 리서치가 필요함. 와디즈에서 제공하는 마케팅 광고상품도 검토 필요. 광고예산 할당해서 사용가능. https://ad.wadiz.kr/login
해볼 수 있는 프로젝트 예시 :
  • 와디즈 내 식물 카테고리 상품 분석 : 펀딩상품군, 상품 구성, 가격대, 달성률, 참가자 분석
  • 펀딩 진행 성과 예측 : 기존 펀딩 히스토리 바탕으로 목표 매출을 설정하고, 벤치마킹할 수 있는 프로젝트 발굴
GPT 추천 > 펀딩 성공에 영향을 미치는 요인 식별: 펀딩 사이트에서 수집한 데이터를 기반으로, 펀딩 성공과 관련된 요인들을 분석하여 어떤 요소들이 성공적인 펀딩에 영향을 미치는지 확인. 예를 들어, 펀딩 기간, 목표 금액, 카테고리, 프로젝트 설명 등과 펀딩 성공 여부 간의 관계를 분석하여 효과적인 펀딩 전략을 도출할 수 있습니다.
  1. 데이터 전처리: 수집한 펀딩 사이트 데이터셋을 정리하고 필요한 변수들을 추출합니다. 이 단계에서 결측치 처리, 이상치 탐지, 변수 변환 등의 작업을 수행합니다.
  1. 변수 선택: 펀딩 성공 여부와 관련이 있을 것으로 예상되는 요인들을 선택합니다. 예를 들어, 펀딩 기간, 목표 금액, 카테고리, 프로젝트 설명의 길이 등이 가능한 요인입니다.
  1. 인과관계 가정: 인과추론을 수행하기 위해서는 인과관계를 가정해야 합니다. 예를 들어, 펀딩 기간이 길면 성공 확률이 높아진다고 가정할 수 있습니다. 이러한 가정은 통계적 기법을 통해 검증할 수 있습니다.
  1. 인과추론 방법 선택: 인과추론을 수행하기 위해 다양한 방법을 사용할 수 있습니다. 여기서는 "처치(도구)"와 "비처치(비도구)" 중 어떤 방법을 사용할지 결정해야 합니다.
  • 처치(도구) 방법: 특정 요인을 조작하여 그 요인이 펀딩 성공에 미치는 영향을 확인하는 방법입니다. 예를 들어, 펀딩 기간을 조작하여 기간이 길어질 때와 짧아질 때의 펀딩 성공률을 비교합니다.
  • 비처치(비도구) 방법: 특정 요인을 조작하지 않고, 기존 데이터를 분석하여 인과관계를 추론하는 방법입니다. 예를 들어, 펀딩 기간과 펀딩 성공 여부 간의 상관관계를 분석하여 펀딩 기간이 길수록 펀딩 성공률이 높아지는지를 확인합니다.
  1. 통계적 분석: 선택한 인과추론 방법에 따라 통계적 분석을 수행합니다. 예를 들어, 처치 방법을 사용하는 경우 펀딩 기간을 조작한 실험 집단과 조작하지 않은 대조 집단 간의 차이를 t-test나 회귀분석을 통해 비교합니다. 비처치 방법을 사용하는 경우 상관관계 분석이나 로짓 회귀분석을 통해 요인들과 펀딩 성공 여부 간의 관계를 파악합니다.
  1. 결과 해석: 분석 결과를 토대로 펀딩 성공에 영향을 미치는 요인들을 식별하고 해석합니다. 통계적으로 유의한 결과가 나왔다면, 해당 요인이 펀딩 성공에 중요한 역할을 한다고 해석할 수 있습니다.
  1. 효과적인 펀딩 전략 도출: 인과추론 결과를 토대로 펀딩 전략을 개발합니다. 예를 들어, 펀딩 기간이 펀딩 성공에 유의미한 영향을 미친다면, 적절한 펀딩 기간을 설정하는 등의 전략을 도출할 수 있습니다.
위의 절차를 따라 인과추론을 수행하면, 펀딩 사이트에서 수집한 데이터를 통해 효과적인 펀딩 전략을 도출할 수 있습니다.
 

결과적으로는,

  • GA, Bigquery등에서 제공하고 있는 Google Merchandise Store 데이터셋을 사용해보기로 했다.
  • 선정 이유
    • 실시간 대용량 데이터
    • 빅쿼리 환경에 익숙해지기
    • 로그 데이터가 포함되어있어서 진행해볼 수 있는 프로젝트가 다양함
  • TIL
    • 와디즈 사이트를 크롤링하면서, 해당 사이트의 크롤링이 법적 이슈가 없는지 한번도 생각해보지 못했는데, sr님이 robot.txt를 확인해보자고 말씀해주셔서 놀라웠음. 윤리적/법적 이슈 고려하기!
    • 구글밋도 무료미팅은 1시간 제약이 있더라… 줌으로 이동
Share article

hollyisyoon