1. 데이터 수집
해당 데이타는 Kaggle사이트이용
2. 데이터 전처리
날짜 컬럼이 정렬이 되지 않아 꽤 애먹었음.
한시간동안이나 열심히 찾아보았으나 결국 수작업으로 날짜를 수정.
3개월치 매출 자료 였으나 그냥 한달치만 사용.
요일 컬럼이 없었는데 나름 반 수작업으로 요일 추가.
3. 시각화 및 분석
* 요일별, 상품별 매출 피벗테이블
한달에 포함된 요일갯수가 다르므로 SUM보다 AVERAGE를 사용.
새로막대 그래프를 활용
차트를 보면 월요일에 Food and Beverage 매출이 높고,
수요일, 목요일에 Home and lifestyle 매출이 높은편이다.
* 멤버쉽, 일반고객별 매출 피벗테이블
이전에 만든 피벗테이블을 복사하여 다시 사용하지는 않았고,
새로 피벗테이블을 만들었고 SUM 총 매출로 설정.
가로막대 그래프 사용
정보를 알 수 없는 경우도 있고,
일반, 멤버 고객 방문에 크게 차이가 없는것을 볼 수 있다.
(이외였는데… 왠지 한국 편의점은 왠지 다를 것 같다.)
* 성별 매출 피벗테이블
역시 남성, 여성 비율에 큰차이가 없다.
* 시간대별 매출 피벗테이블
정보를 알 수 없는 경우를 제외하고 오후 1시 매출이 가장 높다.
4. 피드백
- 월요일 : 푸드 패키지 제품량을 다른 요일보다 늘리기 (예: 바로 요리 할 수 있는 밀키트)
유통기한 임박 푸드관련 제품 할인하여 판매 (버릴상품를 최소화하기 위해 또한 할인 마케팅)
눈에 잘 띄는 위치에 추가 배열
- 수요일 및 목요일 : Home and lifestyle 제품 눈에 잘띄는 위치에 추가 배열.
정리할 상품 할인하여 판매
- 오후 1시 : 점심시간이므로 식사 상품 적극 판매 (예: 도시락) 및 디저트 판매 (예: 커피)
Resources
- Kaggle _ CSV 파일
- https://www.kaggle.com/
오른쪽 상단 [Register] 에서 회원가입 후
왼쪽 상단 [Datasets] 에서 데이터 검색
‘sale’ 단어만 입력해서 검색했음
- 매출 데이터 분석_슈퍼마켓
- 표준편차, 왜도, 첨도,이상치 분석_연봉 데이터
- 상관관계 분석, Countifs, Date_베이커리 매출
- 상관관계, 선형회귀선, 기울기_기준금리와 주택 매매 거래량
- 가설 검정 독립표본 T 검정, F 검정 대학생 남녀 생활비 분석
- 가설검정 대응표본 T 검정 탈모약 복용 전후 분석
- 모수적 피어슨 상관관계 소비자 물가 지수 심리지수 분석
- 스피어만 상관계수 지역별 신용 카드 사용금액 순위 분석
- 한국 1인가구 소득 소비 패턴