
Overview:
01. 번개장터의 상품,셀러 정보를 크롤링하여 데이터를 만들기
|
주제: 번개장터 상품 / 셀러 분석 마케팅 기획
팀원: 4명
작업기간: 2021.09.30 - 2021.10.13 (2주)
데이터: 번개장터 상품 41만건 크롤링데이터
진행과정:
01.주제 분석 및 탐색
02.목표 설정
03.데이터 전처리
04.데이터 분석
05.가설 설정
06.데이터 모델링
07.마케팅 전략
08.최종 발표
01.주제 분석 및 탐색
01-01. 분석
- 번개장터 API 크롤링 상품, 셀러 JSON 데이터 분석
02.목표 및 가설설정
02-01. 목표
- 번개장터 분석 목표 설정 (seller activation 높이기, product 분석)
- 분석 목표
- Seller Segmentation > 회귀분석
- bizseller : 번개장터에서 어떤 기준으로 bizseller를 어떻게 주는지 확인해야 함
- follower 수 (최고와 최저 수 확인 후 5등분)
- Number of items posted
- 별점 : 10점 만점 (10,9/ 8,7/ 6,5/ 4,3/2,1)
- Idenfication완료된 얘들은 높은 Seller로 분류
- num_faved 높은 아이템의 키워드 (word cloud)
- product posted price 분포 (카테고리별) + 카테고리별 가격 평균 조사 > 제안
- 마케팅 제안 ( 예를들어, 니트는 25,000원이 평균가이고 **님이 올리신 가격은 살짝 높습니다. 가격을 10% 낮추시면 판매율이 40%가 향상됩니다. )
- 요일 별 / 시간 별 어떤 옷이 가장 많이 등록되는지
- 만약 판매완료된 정보를 crawling 할 수 있다면, 판매완료된 아이템의 ad_product과의 상관관계일주일 내에 판매/예약 된거 : 잘팔림Status : 예약완료 1, 판매완료 3, 안팔린거 0
- 일주일 내에 판매 안된거 : 잘 팔려서 ad를 적극 권장
- (AD를 진행하면 아이템 판매가 더 팔리 된다)
- 요일 별 잘 팔리는 옷 종류 분석필요 데이터: num_faved / price / time / status / ad_product /
- 예) 수, 목요일 : 주말에 입을 옷을 찾고 있나요? 원피스 리스트 보기 / 주말: 출근룩을 찾고 있나요? 셔츠 보기상품 분석
- Seller Segmentation > 회귀분석
- 계절과 여성의류의 상관관계
-
- 절기를 기준으로 해서 여성의류 품목 거래량 상관관계
- 기상청 데이터 가져와서 기온 기준으로 품목(21개) 거래량 상관관계
- 카테고리 - 여성의류코트 : 310100 | 후드티,후드집업: 310230 | 블라우스 : 310040 | 바지: 310150 | 반바지: 310160 | 원피스 : 310120 | 니트,스웨터: 310060 | 정장: 310180 | 조끼,베스트: 310080 | 언더웨어,홈웨어: 310200
03.데이터 전처리
- 번개장터 프러덕트, 셀러 데이터셋 만들기
- 클린작업
04.데이터 분석
04-01. 아디이어 제시
○ 번개장터 특징
- *MZ대상으로(휴대폰,신발,키덜트)번개페이는 판매자가 아닌 구매자에게 안전결제 비용으로 수수료를 받는다.
- 번개장터 기획전. 새상품 위주 제품 판매
- 준셀러. 아마존으로 지향
○ 분석데이터
- 처음 여성의류(15개 정도 카테고리), 일주일데이터
- 절기데이터 참고 (추계 상품)
- 카테고리 선정: 여성의류.브랜드별.
○ 아이디어 제시
- 판매완료수를 기반으로 많은 우수 셀러에게는 수수료(광고, 번개페이) 할인해 주어서 판매를 활성화 시켜준다.(기준점 제시)셀러에 대한 분석 제안
- 시즌별 제안하는 상품 제안
- 광고를 달거나, 번개페이, 안팔리는 제품 판매(기획전)
used_code: 1, 13 - 중고 2-새상품 , 11-거의 새상품
status: 0-판매 중, 1-예약, 3-판매완료
04-02. 분석 방법 제시
○ 우수 셀러(별점 10점 만점, 팔로우수, 판매완료 개수, 상품 업로드 주기가 많은)
- 수수료 할인 혜택을 주어 전보다는 상품 판매완료 개수가 늘어날 것이다. > 가능하다면, seller 세분화를 통한 관리 ←물어볼 것,크게 비즈셀러와 개인셀러로 나눠야함
- 구분기준. 셀러들의 분포 포션. 별점,팔로우수,판매완료,상품업로드주기 정규분포 기준. 95%. 점수대. 02. 낮은 것은 버림. 03.박스플롯. T검정 / 2개이상 아노바(두 집단의 평균 비교).
- 인플루언서 셀러 - 판매자 를 발견해서 프로모션
- 월별 기준
- 회귀분석으로 우수셀러 분류
- 기준은 팔로워수와 리뷰수& 리뷰평점으로 나누는것이 좋을거 같음
- 데이터를 확인하니 9,10점 별점 셀러가 너무 많음. 별점으로 셀러를 분석하는것은 의미가 없어보임. 상품업로드 주기가 많은 부분도 의미가 없어 보임. 왜냐하면, 번장의 경우 중고 직거래 개인이 아니라 전문적 셀러인 경우가 다수로 파악됨. 아래 데이터 블링바비의 경우 아이템의 수는 많지 않으나 리뷰가 많은것으로 확인되는바 전문적 셀러일 가능성이 많음.
○ AD(광고) 상품
- AD(광고) 상품을 분석하여 판매완료가 잘되는 카테고리, 키워드 분석하여 제안
○ 상품 업데이트 주기
- 번개장터 접속 기간에 따라, 접속이 뜸한 셀러에게 광고 상품으로 제안하여 상품 업데이트량을 늘리게 유도한다. > 이거는 그런데 최근 데이터 수집해서 한거라 의미가 있을지 모르겠음
- 업데이트주기기준으로 판매완료된 상품은. 2일전-5일전, 1주일전-4주전, 한달전 (update_time, pid)
- 1주일, 1달 단위로 판매완료된 제품 특징이 다르게 나타난다. ( 선호도, 인기도가 높은 상품군은 판매가 빨리 되고, 고객들의 관심도가 없는 상품은 판매가 늦게 된다. )
- 기간 특성에 따른 인기상품별로 판별하여 상품 업데이트 시점을 갱신 요청해 준다.
- 예시) 축구화 - 1일 전 5% 2일전 20% 3일전 40% 4일전 10% ... → 축구화를 3일마다 갱신 해주세요.
○ 셀러 분석
- 셀러들이 번개페이를 사용하지 않는 이유? 권장할 수 있는 근거데이터를 찾아야 함.
- 셀러들 번개페이에 대해 부정적으로 생각하는 것 같음
- 번개페이를 상위노출 했을 때 셀러들이 다른 플랫폼으로 갈 가능성
○ 절기
-
- 절기 별 상품 추이 분석 > 절기 기준(기온 기준) 로 많이 업데이트되는 의류 카테고리 파악 후 관심도가 높은(VIEW수와 Liked) 많이 나오는 하위 카테고리로 분류해 본다. 상품의 키워드를 나타난다 (워드 클라우드)
- 절기별(24절기), 기온(날짜별로 평균기온)로 pid의 update_time(날짜, 시간) 을 비교하여 나눈다.
- 기온의 평균값이 절기별로 차이가 난다.(확인용)
- 인기있는 순( view 수, liked 수)
- 상품의 키워드 (하위카테고리) / 키워드 별 분석 / 안된다면 키워드 카운트
- 키워드 빈도 또는 트렌디(브랜드, 색상, 사이즈를 미리 정함) 를 반영한 텍스트 정형 제안, 토픽모델링 . 텍스트에 대한 인사이트는 어려움.
- 리서치 데이터. 오픈마켓. 중고마켓 베스트 프랙티스.
- 시계열분해(캐글 예시 데이터). 트렌드, 시즌단위 분석.
- value count 상위 몇개에 대한 데이터
- 절기 별 상품 추이 분석 > 절기 기준(기온 기준) 로 많이 업데이트되는 의류 카테고리 파악 후 관심도가 높은(VIEW수와 Liked) 많이 나오는 하위 카테고리로 분류해 본다. 상품의 키워드를 나타난다 (워드 클라우드)
○ 상품 별 가격 제안
- 제품 하위 세부 카테고리(평균치 가격)
- '상품네임', '키워드' (네임은 ' ' 공백으로 나누기, 키워드는 ',' 로 구분) 단어별(빈도수) 상품 분류 후 각각의 평균 가격 계산 후 알맞은 금액을 제안
- 상품별 안 팔리는 제품 분석
- status ( 0: 안팔림 1: 예약중 3: 판매완료) 로 파악해서> 해결 방법: 기획전, 이벤트 기획
○ 시간대별
-
- 요일별 / 주중,주말 / 시간 별 올리는 상품 분석 (단순시 최신 상품 나열이 아닌, 유사상품별 분석을 통한 검색 추천 제안)
- 예시) 주말에 입을 원피스 > 주말이 다가오는 '목', '금' 에 많이 업데이트 됨 (update_time, pid)
- 아침, 점심, 저녁 때 별로 상품 업데이트 추이가 다르다. ( 아침에는 일반 잡기류, 점심, 저녁에는 가전, 의류가 많이 업데이트 됨)
○ 지역별
-
- 지역별 판매동향 > 태블로 시각화
- 지역별 필터 제안 > 지역기준 검색 ("부산", "부산시")
- str. contains. or 해서 주요 키워드만 가져오는 걸로.토픽 모델링분석방법
04-03. 분석 모델링 예시
05.가설 설정
- 가설01: 제품군 트렌드 분석
- A. 번개장터 (뷰수, 찜수) 분석을 통해 가을 트렌드 유행을 따르는지, 안따른지 유무를 판단한다. (리서치, 21년도 F/W 대표 의류 카테고리, 키워드, 브랜드) . 의류(중고, 새상품), 디바이스(중고) 사용하지 않는 제품을 내놓으므로 트렌디와는 다를수 있다
- 만약, 최신 유행을 따르는 카테고리가 있다며고 하면 셀러에게 기획전을 제공해 줄수 있다.
- B. (카테고리>브랜드(타이틀)>상품 키워드)공급과 수요 차이 : 소비자가 원하는 상품별 (뷰수, 찜수가) / 판매자가 내놓는 상품 공급 (단순 제품 갯수)높은 상관 관계를 가지고 있다. (워드 클라우드)
- 카테고리별로 구분했을 때 가을 트렌드 유행을 따르는지, 안따른지 유무를 확인해 본다.
- A. 번개장터 (뷰수, 찜수) 분석을 통해 가을 트렌드 유행을 따르는지, 안따른지 유무를 판단한다. (리서치, 21년도 F/W 대표 의류 카테고리, 키워드, 브랜드) . 의류(중고, 새상품), 디바이스(중고) 사용하지 않는 제품을 내놓으므로 트렌디와는 다를수 있다
- 가설02: 셀러 인풀루언서 지수
- 판매완료 * ( 팔로워수 , 리뷰수, 아이템 수) > 각각을 상관분석 해서 인풀루언서 지수.
- 상관계수 기준 = 판매완료 / 상관계수 = 가중치인플루언서지수 상위 10% 를 우수판매자별점기준. 우수셀러. (8이상-10), 평범한 셀러.계산값 기준이 궁금. 비슷하게 맞추는 로그화 작업. 정규화 작업.단순 건수. 매출 건수는 크니까 낮추는 작업. min max
- 가설03: 가격 제시
- 카테고리별>하위카테고리(1-5만원 최상위 타이틀, 6만원-10만원, 11만원-20만원, 21만원 이상) 평균값 가격을 제안해 본다. (평균시세 소비자, 판매자에게 적정한 소비자 가를 제시하여 허위 가격에 대해 예방 조치할 수 있다)→ 카테고리별 가격 박스플롯으로 비교피드백:-이동평균계산 링크 (나중에 검토) > 태블로
- 최근 시세 반영.(1주기간, 2주기간) 윈도우 슬라이싱. X 축 일별/주간/달 . 점 롤링.(최근 2-3주, 최근 3주 금요일 평균)
- 하위카테고리 박스플롯 간격차, 넓은 가격에 대한 범주 제안→ 로그를 씌운다음에가격 분석 예시 링크
- (X- x_min) / (x_max - x_min) 먼저 상관 계수 간의 관계 확인후 변인 설정.→ 정규화 작업
- 지수이동평균계산 예시 링크
- 카테고리별>하위카테고리(1-5만원 최상위 타이틀, 6만원-10만원, 11만원-20만원, 21만원 이상) 평균값 가격을 제안해 본다. (평균시세 소비자, 판매자에게 적정한 소비자 가를 제시하여 허위 가격에 대해 예방 조치할 수 있다)→ 카테고리별 가격 박스플롯으로 비교피드백:-이동평균계산 링크 (나중에 검토) > 태블로
- 가설04: 지역 기반 상품 동향 추이 분석
- 카테고리>브랜드>키워드 상위 판매(데이터 적고), 관심도(데이터 많아서 근거치가 많고) 를 나타탄다. ⇒ 판매자에게는 지역 제품 추천(카테고리>브랜드>키워드) , 지역별 특산품
06.데이터 모델링
목표 : 더 많은 셀러들이 번개장터를 사용하게 하는것
06-01. 번개장터 파이선 데이터 분석, 모델링 만들기
01. 카테고리/브랜드 트렌드 분석
02. 셀러 인플루언서 집단 구분
03. 카테고리이동평균값 가격 제시
04. 지역별 판매 추이 분석
06-02. 가설 모델링 검증
01. 카테고리/브랜드 트렌드 분석
- 카테고리 분석 정리 > 중위 > 하위(카운팅) 대표 카테고리 선정.
- 선형회귀분석 > 라벨링.(상품 키워드 기준) > 형태소 분석데이터 분석 작업
02. 셀러 인플루언서 집단 구분
- 회귀계수로 인플루언서 점수 구하기
03. 카테고리이동평균값 가격 제시
- 데이터 필터링: 값이 0 인, 999999 데이터. 잘못 된 가격대 이상치 처리 : 121212, 43333
- 이동평균계산 (박스플롯)
04. 지역별 판매 추이 분석
- 번개장터 지도분석 (태블로)
- 20만건 데이터. 부산>경기도>서울 ( 지하철역 오류 수정 라벨링 )
07.마케팅 전략




08.최종발표






'데이터분석과정' 카테고리의 다른 글
| 패스트캠퍼스 데이터분석(BDA) Day055-Day60. 파이널프로젝트02- 패스트캠퍼스 강의 구매 마케팅 데이터 분석 (0) | 2021.11.10 |
|---|---|
| 패스트캠퍼스 데이터분석(BDA) Day046. 서비스기획 - UXUI 특강 (0) | 2021.11.10 |
| 패스트캠퍼스 데이터분석(BDA) Day045. 서비스기획 - 프로젝트 학습 (0) | 2021.11.10 |
| 패스트캠퍼스 데이터분석(BDA) Day044. 서비스기획 - 특강 (0) | 2021.11.10 |
| 패스트캠퍼스 데이터분석(BDA) Day042-Day043. 서비스기획 - 학습 (0) | 2021.11.10 |