7. 모수적 피어슨 상관관계 소비자 물가 지수 심리지수



1. 데이터 수집

2011년 ~ 2022년 : 총 11년

소비자 물가지수

소비자가 구입하는 상품과 서비스의 가격변동을 측정하기 위한 지표

소비자 심리지수 (CCSI)

주요 개별지수(현재생활형편 등 6개)를 표준하여 합성한 지수로, 경제상황에 대한 종합적인 소비자심리지표

2. 데이터 전처리 및 가공

데이터를 월별로 제공해서 년도 별로 평균을 계산하고 정리
각 11개의 컬럼으로 만듬

3. 데이터 시각화 및 분석

두 자료 모두 정규분포를 따른다고 가정하에 모수적 방법인 피어슨 상관분석과 회귀분석 시도.

목적과 관계가 있는지를 보는 것이 상관분석(r)이고(두변수간의 상관의 정도, 두 변수의 변화의 관계강도),

원인의 변화가 얼마나 결과에 영향을 미치는지 보는 것이 회귀분석이다.

두변수의 상관관계(r) 분석

상관관계(r) -0.3827은 음(-)의 결과로 반비례 방향을 나타냄

소비자 물가 지수가 올라갈수록 소비자의 심리는 줄어드는 것을 의미
물가가 1이 올라가면 소비자의 심리는 0.38가 줄어든다.

산점도 추세선 (선형회귀선) _ 선형관계 시각화

선형회귀선은 역시 음(-)의 방향을 보여준다
회귀계수(y) = -0.3993x + 139.63

결정계수 R^2(14.6% _ 0.1465)은 원인에 의해 결과에 미치는 정도로 낮은편.
(가설검정이 유의할지라도) 이 분석은 오직 14.6%의 설명력을 갖는다.

* 상관계수(r)

r의 값은 -1 < r < 1 사이에 있음.
r의 절대값이 클수록 선형관계가 크다는 것을 의미

r < 1 비례(같은) 방향
r=0 관계가없다
r < 1 반비례방향

* 상관분석의 정규성에 따라 (정규분포를 따르는지 아닌지) 모수적방법과 비모수적 방법으로 나눈다.

모수적방법 : 정규분포를 따르는 경우 (T 검정, 분산분석(ANOVA), Pearson의 상관분석)

비모수적방법 : 정규분포를 따르지 않거나 정규분포라고 가정 할 수 없는 경우 ( Spearman의 순위상관분석, Mann-Whitney test, Wilcoxon signed rank test, Kruskal-Wallis test)

* 결정계수 r^2

r^2의 값은 0 < r <= 1 사이에 있음.
값이 1에 가까울수록 설명력이 높다고 판단.
1이면 문제의 변수(y)를 예측하는 모델이 데이터를 모두 설명한다는 말.

회귀분석 설명력을 알아볼때 사용하며 독립변수와 종속변수의 인과성은 해석자가 판단.

결정계수가 크다고 자동적으로 인과성(원인이 있으면 결과가 있다)이 크다고 말할수는 없으나 회귀모형이 잘 추정되었다고 판단할 수 있다.


Resources

소비자 물가 지수, 소비자 심리 지수

엑셀 피어슨 상관관계 상관분석 사용법

모수적, 비모수적 차이 설명

피어슨 상관분석(피어슨, 스피어만), 회귀분석설명

상관계수와 결정계수의 차이