반응형

/*******************************************************************************************************************
-- Title : [Stats] 회귀분석 lm()함수의 결과 해석 사례
-- Reference : http://blog.naver.com/gksshdk8003/220820705546
-- Key word : 회귀분석 회귀 분석 lm linear model r-square p-value 결정계수 유의확률 결정 계수 유의 확률
                  선형 회귀식 잔차 residual intercept f-statistics f-검정통계량 linear regression
*******************************************************************************************************************/

galton에서 남자 아이들의 키가 아버지키에 영향을 미치는지 검증
참고 :  http://dbrang.tistory.com/1118


해석

  • Coefficients에서 y-절편(Intercept)에 대한 P-value가 2e-16 *** < 0.05으로 유의미함.
  • Father에 대한 회귀계수(Slope)의 P-value(2e-16 ***) < 0.05라 유의미함.
  • R-squared값이 0.1608로 전체 변동량의 약 16%정도를 이 모형을 통해 설명 가능. 
  • R-squared값이 비교적 낮게 나타난 이유는 자녀키가 아버지키 외에 영향을 받는 요인이 있을 수 있음을 설명.
  • F-통계량 P-value(2.2e-16) < 0.05로 모형전반이 유의미성을 나타남.
  • 단순 선형회귀모형은 회귀계수가 곧 모형의 유의미성을 나타냄.
  • Father의 T-value(9.399)를 제곱하면 F-통계량 값인 88.34와 동일.
    이 역시 단순 선형회귀모형의 성질 중 하나임.


챠트 확인
>>> par(mfrow=c(2,2))
>>> plot(model)


  • Residual vs Fitted에서 매우 랜덤하게 잔차들이 분호해 있응 것을 확인.
  • Scale-Location 역시 산포를 보이는 것을 보임.
  • Normal Q-Q Plot의 경우도 기준선에 대부분 점들이 놓여 정규성을 만족하는 것으로 판단.
  • Residuals vs Leverage Plot의 경우 대다수 값들이 한쪽으로 몰려있는 형태를 보이고 있기에
    역시 모형이 잘 적합함을 나타냄.
  • 정규성의 경우 그래프로 주관적 판단도 가능하지만 shapiro.test()함수를 이용한 
    Shapiro-Wilk normality test역시 가능.





반응형

+ Recent posts