5. 가설 검정 독립표본 T 검정, F 검정 대학생 남녀 생활비



1. 데이터 수집

대학생 남녀 생활비 (Kaggle.com)

2. 데이터 전처리

필요한 성별과 한달 생활비용 컬럼만 사용.
빈셀(Null)이 있어 먼저 제거 작업을 해줌.

남, 녀 정렬을 해주고 COUNTIF 함수를 이용하여 갯수를 확인
Male =COUNTIF(A2:A100,A2)
Female =COUNTIF(A2:A100,A50)

3. 데이터 시각화 및 분석

F 검정, T 검정을 실시 하기 위해 귀무가설을 세운다.
귀무가설 : 대학생 남녀의 한달 생활비는 차이가 없다. (두 집단의 분산은 동일하다.)
대립가설 : 대학생 남녀의 한달 생활비는 차이가 있다. (두 집단의 분산은 동일하지 않다.)

* F 검정
먼저 두 집단의 분산을 구함

남자의 집단이 여성의 집단보다 분산의 크기가 큼.
즉 남자들의 생활비가 남자 평균생활비로 부터 양쪽으로 흩어짐이 여자보다 넓다고 해석
Male 분산이 크므로 변수1(Variable1)로 설정
(4단계에서 검정통계랑(F비=F)를 사용하지 않고 P-value만 활용한다면, 표본 집단의 분산크기는 고려하지 않아도 됨)

​유의수준(Alpha) : 95% 신뢰수준으로 검정 (0.05)

P-value 0.44617 > 유의수준(Alpha) 0.05 보다 높기때문에 귀무가설은 기각 실패 (귀무가설 채택)
검정통계랑(F=F비) 1.038957534 < 기각치(F Critical on-tail) 1.6083 보다 작으므로 귀무가설 기각 실패 (귀무가설 채택)

결론 : 두 그룹의 집단의 분산은 동일하다. (= 귀무가설)
즉 두 그룹은 등분산을 가졌으므로 “t-검정:등분산 가정 두집단” 실행해서 t-검정을 진행

* T 검정

평균의 크기 비교가 아니기 때문에 양측검정의 P값 사용
P(T=t) tw-tail 0.7611 > 유의수준(Alpha) 0.05보다 크므로 귀무가설 기각 실패 (귀무가설 채택)

​결론 : 대학생 남녀 월 생활비의 평균은 차이가 없다.
두 그룹의 집단의 분산은 동일하다. (귀무가설 채택)

 

* T 검정
두 집단의 평균차이가 있는지 없는지 여부를 판단

독립표본 t 검정 : 서로 다른 두 집단의 평균 비교 (남녀 발 사이즈)
대응표본 t 검정 : 동일한 집단의 사전 사후 평균 비교 (탈모 치료제 복용 전후 머리숱 – 대상이 같음)

​독립표본 t 검정

등분산 가정 두집단 : 등분산 가정을 할 수 있는경우 (귀무가설)
이분산 가정 두집단 : 등분산 가정을 할 수 없는경우 (대립가설)

​T 검정을 하기전 F 검정 P값으로 등분산인지 이분산인지 파악

P값 > 유의수준 0.05 보다 크면 등분산 (귀무가설)
P값 < 유의수준 0.05 보다 작으면 이분산 (대립가설)


Resources 

University Students Monthly Expenses 대학생 남녀 월 생활비

엑셀 빈셀(Null) 값 없애기

분산개념 및 엑셀 사용 방법

가설검정, F검정 개념 및 엑셀 사용 방법

독립표본 T검정, F검정 개념 및 엑셀 사용 방법

 

  1. 매출 데이터 분석_슈퍼마켓
  2. 표준편차, 왜도, 첨도,이상치 분석_연봉 데이터
  3. 상관관계 분석, Countifs, Date_베이커리 매출
  4. 상관관계, 선형회귀선, 기울기_기준금리와 주택 매매 거래량
  5. 가설 검정 독립표본 T 검정, F 검정 대학생 남녀 생활비 분석
  6. 가설검정 대응표본 T 검정 탈모약 복용 전후 분석
  7. 모수적 피어슨 상관관계 소비자 물가 지수 심리지수 분석
  8. 스피어만 상관계수 지역별 신용 카드 사용금액 순위 분석 
  9. 한국 1인가구 소득 소비 패턴