/*
-- Title : [Stats] 통계 용어 - 귀무가설, 대립가설, 유의확률, 유의수준, 검정통계량
-- Reference : blog.naver.com/birdiechan, pubdata.tistory.com,
-- Key word : 통계 가설 검증 귀무가설 대립가설 유의수준 임계치 유의확률 p-value p value 검정통계량
*/
가설 vs. 검증
* 가설 : 아직 검증되지 않은 추측적 예비이론
* 검증 : 표본 데이터를 통해 모집안이 통계적으로(귀무가설이 맞는지, 대립가설이 맞는지) 검증
귀무가설 vs. 대립가설
* 귀무가설(H0) : 차이가 없다, 효과가 없다는 가설(기존가설)
기본적으로 NULL Hypo....의 개념으로 본다면 없다!로 설정됨.
* 대립가설(H1) : 차이가 있다, 효과가 있다는 가설(신규가설)
* ex) 월평균 자동차 판매량이 14대인데 보너스를 주면 판매량이 증가할까?
귀무가설 : u <= 14, 대립가설 : u > 14
유의수준 vs. 임계치
* 상관관계가 '있다', '없다'의 기준
* 유의수준(a) : 오류를 허용할 범위
(유의수준 0.1은 90%의 신뢰수준, 0.05는 95%의 신뢰수준 의미)
* 임계치 : 귀무가설의 채택과 기각에 결정을 하는 기준점(신뢰수준 95%는 유의수준 0.05)
유의확률(p-value)
* 대립가설이 틀릴 확률(귀무가설이 맞을 확률)
* "유의확률 < 유의수준"이면 귀무가설 기각(=대립가설 채택)
* ex) 'A 나라의 평균 수명은 70세이다'를 유의수준 5%에서 검정하시오.
- 귀무가설 : 평균 수명이70세이다.
- 대립가설 : 평균 수명이70세가 아니다.
- 채택근거 : t-test결과 p-value = 0.04
- 결과 : 유의확률(0.04) < 유의수준(0.05) 이므로 대립가설을 채택
제1종 오류 vs. 제2종 오류
* 제1종 오류 : 귀무가설이 모집단의 특성을 제대로 반영하는데도 기각하는 오류
* 제2종 오류 : 귀무가설이 모집단이 특성을 제대로 반영을 못함에도 인용하는 오류
검정통계량
* 가설 증명에 사용되는 통계량
* 이를 이용해서 구한 값을 분포에 적용해서 p-value 구함
* 통계량 사용 이유 : 전수 조사를 행할 수 없기 사용되는
* 분포 : 정규분포, t분포, F분포
* 검정 : 분포를 가지고 하다보니 95% 검정을 많이 수행