8. 스피어만 상관계수 신용 카드 사용 순위



1. 데이터 수집

2022년 8월 지역별 소비유형별 (백화점, 여행/교통) 신용카드 사용금액 순위

2. 데이터 전처리 

정리가 잘 되어있는 데이터라 사용 할 컬럼 선택과 약간의 데이터 이동만 있었음. 

백화점, 여행/교통 순위 설정하기 _ 엑셀 Rank 함수

E2 =RANK.AVG(C3,$C$3:$C$18,0)
F2 =RANK.AVG(D3,$D$3:$D$18,0)
G2 =(E2-F2)^2

3. 데이터 시각화 및 분석

n : 표본 갯수
=COUNT(D2:D17)p : 각 변수 순위간의 피어슨 상관계수
=CORREL(E2:E17,F2:F17)

가설설정

​귀무가설(Ho) : 두 변수의 순위는 상관관계가 없다. (ρ=0)
대립가설(H1) : 두 변수의 순위는 상관관계가 있다. (ρ≠0)

​p 0.4764 > 0 보다 크므로 양의 상관관계를 갖는다.
두 변수는 상관관계가 있으며 백화점 사용이 커지면 여행/교통 사용도 커진다.

z값 구하기 : 스피어만 상관계수의 검정통계량

=J5*SQRT(16-1)

P(|Z|>1.85) = 엑셀수식 =”P(|Z|>”&ABS(ROUND(J6,2))&”)”

p는 양측검정이므로 엑셀의 표준정규 누적분포함수를 이용

=2*(1-NORMDIST(ABS(J6),0,1,TRUE))

결론

유의확률(0.064)이 유의수준(0.05) 보다 크므로 귀무가설을 채택한다.
즉, 두 변수의 순위는 상관관계가 없다.
백화점과 여행/교통은 5% 유의수준에서는 상관관계 없다.

10% 유의수준에서는 기각할 수 있으므로 상관관계가 있다.
(백화점과 여행/교통 간에 상관관계가 신뢰구간 90%에서 통계적으로 유의함을 의미한다.)

* 피어슨 상관관계에서는 양의 관계로 상관관계가 있음을 보여주지만
스피어만 상관계수에서는 5% 유의수준에서는 상관관계가 없다.

 

* 스피어만 상관계수

데이터가 서열 척도인 경우
즉 자료의 값 대신 순위를 이용하여 분석하는 경우


Resources 

데이터 수집 : 지역별 소비유형별 (백화점, 여행/교통) 지역별 신용카드 사용금액

엑셀 순위 스피어만 상관계수

 

  1. 매출 데이터 분석_슈퍼마켓
  2. 표준편차, 왜도, 첨도,이상치 분석_연봉 데이터
  3. 상관관계 분석, Countifs, Date_베이커리 매출
  4. 상관관계, 선형회귀선, 기울기_기준금리와 주택 매매 거래량
  5. 가설 검정 독립표본 T 검정, F 검정 대학생 남녀 생활비 분석
  6. 가설검정 대응표본 T 검정 탈모약 복용 전후 분석
  7. 모수적 피어슨 상관관계 소비자 물가 지수 심리지수 분석
  8. 스피어만 상관계수 지역별 신용 카드 사용금액 순위 분석 
  9. 한국 1인가구 소득 소비 패턴