반응형

/*
-- Title : [Stats] 
통계 용어 - 귀무가설, 대립가설, 유의확률, 유의수준, 검정통계량
-- Reference : blog.naver.com/birdiechan, pubdata.tistory.com, 
-- Key word : 통계 가설 검증 귀무가설 대립가설 유의수준 임계치 유의확률 p-value p value 검정통계량
*/

가설 vs. 검증
    * 가설 : 아직 검증되지 않은 추측적 예비이론
    * 검증 : 표본 데이터를 통해 모집안이 통계적으로(귀무가설이 맞는지, 대립가설이 맞는지) 검증

귀무가설 vs. 대립가설
    * 귀무가설(H0) : 차이가 없다, 효과가 없다는 가설(기존가설)
                                    기본적으로 NULL Hypo....의 개념으로 본다면 없다!로 설정됨.
    * 대립가설(H1) : 차이가 있다, 효과가 있다는 가설(신규가설)
    * ex) 월평균 자동차 판매량이 14대인데 보너스를 주면 판매량이 증가할까?
  귀무가설 : u <= 14, 대립가설 : u > 14
 
유의수준 vs. 임계치
    * 상관관계가 '있다', '없다'의 기준
    * 유의수준(a) : 오류를 허용할 범위
               (유의수준 0.1은 90%의 신뢰수준, 0.05는 95%의 신뢰수준 의미)
    * 임계치 : 귀무가설의 채택과 기각에 결정을 하는 기준점(신뢰수준 95%는 유의수준 0.05)

유의확률(p-value)
    * 대립가설이 틀릴 확률(귀무가설이 맞을 확률)
    * "유의확률 < 유의수준"이면 귀무가설 기각(=대립가설 채택)
    * ex) 'A 나라의 평균 수명은 70세이다'를 유의수준 5%에서 검정하시오.
       - 귀무가설 : 평균 수명이70세이다.
       - 대립가설 : 평균 수명이70세가 아니다.
       - 채택근거 : t-test결과 p-value = 0.04
               - 결과 : 유의확률(0.04) < 유의수준(0.05) 이므로 대립가설을 채택

제1종 오류 vs. 제2종 오류
    * 제1종 오류 : 귀무가설이 모집단의 특성을 제대로 반영하는데도 기각하는 오류
    * 제2종 오류 : 귀무가설이 모집단이 특성을 제대로 반영을 못함에도 인용하는 오류

검정통계량
   * 가설 증명에 사용되는 통계량
   * 이를 이용해서 구한 값을 분포에 적용해서 p-value 구함
   * 통계량 사용 이유 : 전수 조사를 행할 수 없기 사용되는
   * 분포 : 정규분포, t분포, F분포
   * 검정 : 분포를 가지고 하다보니 95% 검정을 많이 수행


반응형

+ Recent posts