1. 데이터 수집
주택 매매 거래량 3년 (data.dbland.kr)
한국은행 기준 금리 (bok.or.kr)
2. 데이터 전처리
3년간의 주택 매매 거래량과 금리를 정리
3. 데이터 시각화 및 분석
기준금리와 전국, 수도권, 지방데이터의 상관관계 분석
모든 결과는 음(-)의 관계로 반비례 방향.
금리가 올라갈수록 주택매매거래량은 줄어드는것을 의미.
수도권과 지방 수치가 비슷 한 것으로 보아
수도권이라해서 금리에 대해 더 영향을 받는 것은 아니라 판단.
기준금리와 전국 주택 매매 거래량의 선형 회귀선 (Regression line)
선형회귀선은 역시 음(-)의 방향을 보여준다
선형회귀 기울기의 값 : -37767x =SLOPE(C2:C34,B2:B34)
y절편 값 : 117382 =INTERCEPT(C2:C34,B2:B34)
선형회귀 기울기와 y절편 값은 엑셀 함수를 사용해도 동일한 결과가 나옴.
결정계수 R^2은 0.5922로 회귀분석의 설명률이 59.2% 높은편은 아님.
한국은행 기준금리 추이
2020년부터 금리가 가파르게 상승하고 있으며 현재 10년전의 금리와 비슷한 수치를 보여주고 있다.
상관분석과 회귀분석의 목적은 다르다.
* 상관관계 분석
두 변수의 연관성, 유의성 검증(의미가 있는지..)
* 상관관계 분석 절차
1단계 : 유의성 검증
2단계 : 상관계수(r)의 크기를 비교 (어떤 변수와의 관계가 더 큰지..)
* 상관계수(r)
r의 값은 -1 < r < 1 사이에 있음.
r의 절대값이 클수록 선형관계가 크다는 것을 의미
r < 1 비례(같은) 방향
r=0 관계가없다
r < 1 반비례방향
* 결정계수 R^2
회귀분석의 설명력을 알아볼때 사용. 값이 1에 가까울수록 설명력이 높다고 판단.
독립변수와 종속변수의 인과성은 해석자가 판단.
결정계수가 크다고 자동적으로 인과성이 크다고 말할수는 없으나 회귀모형이 잘 추정되었다고 판단할 수 있다.
Resources
한국은행 금리 추이(한국은행 사이트)
주택매매 거래량 (KB 부동산)
엑셀 선형회귀 기울기
- https://statools.tistory.com/102
- https://m.blog.naver.com/jinjin_0725/222942741815
통계 회귀분석으로 살펴본 서울 집값과 금리의 관계 뉴스
상관계수와 결정계수의 차이
- 매출 데이터 분석_슈퍼마켓
- 표준편차, 왜도, 첨도,이상치 분석_연봉 데이터
- 상관관계 분석, Countifs, Date_베이커리 매출
- 상관관계, 선형회귀선, 기울기_기준금리와 주택 매매 거래량
- 가설 검정 독립표본 T 검정, F 검정 대학생 남녀 생활비 분석
- 가설검정 대응표본 T 검정 탈모약 복용 전후 분석
- 모수적 피어슨 상관관계 소비자 물가 지수 심리지수 분석
- 스피어만 상관계수 지역별 신용 카드 사용금액 순위 분석
- 한국 1인가구 소득 소비 패턴