Regression(회귀분석)은 가장 기본적인 분석 방법중의 하나이다. 가장 빈번히 사용되는 방법으로 그중 OLS (Ordinary Least Square)는 가장 기본적인 방식이다.
Stata에서 OLS는 regress 명령어로 실행할 수 있다.
[data: auto.dta (http://www.stata-press.com/data/r12/auto) | Stata 12.1 version]
여기에서는 다음과 같은 모델을 추정하려고 한다.
위의 출력문은 regress 명령문에 대한 결과를 보여준다.
우선, OLS 추정결과는 모델에 74개의 관측치가 사용되었고, 결정계수(R-squared)는 0.6913, adj. R-squared는 0.6781이라는 것을 보여준다. 또한, 사용된 3개의 변수는 모두 5% 수준에서 모든 통계적으로 유의미하다는 것으로 보여주고 있다.
여기에서 고려해야 할 한가지 사항은 회귀분석에서 추정된 계수(coefficient)에 대해 변수간의 비교가 불가능하다는 것이다. 이는 변수간의 단위가 다르다는 것에서 비롯된 것이다. 따라서, 추정된 계수를 정규화(Normalization)하면, 비교가 가능하다.[정규화된 계수를 흔히 beta 계수라고 한다.]
추정된 계수를 정규화하기 위해서는 beta 옵션을 사용하면 된다.
beta 옵션을 사용하여, 우리는 각 변수의 정규화된(Normalized) 계수(coefficient)를 얻을 수 있다. 이 추정된 모델에서 weight 변수의 정규화된 계수값이 가장 크다는 것을 알 수 있다.
다시, 앞에서 추정한 식으로 돌아가보자. 일반적으로, 모델 추정치로 표시되는 결과치 외에도, 다른 부가적인 결과치를 출력하는 명령어가 있다.
Stata에서 모든 명령어 앞에 quietly를 붙이게 되면, Stata에서 명령문을 실행한 후에, 어떠한 결과치도 출력하지 않는다. 그리고, ereturn list를 실행하면, 모든 결과치를 출력하게 된다. 아래의 리스트는 regress 명령어의 의해 출력되는 통계 값들을 보여준다.
Regression을 실행한 후에는 Stata에서 몇가지의 가설 검정을 할 수 있다. test 명령어를 사용하면, 추정된 계수 값과 VCE를 이용하는 Wald test를 실행할 수 있다.
Wald test 를 실행하기 위해 새로운 regression을 실행해보자.
여기에서 length = 0이라는 가설을 검정해보자.
출력문은 'length = 0'이라는 가설이 5% 레벨에서 가설이 reject되지 않는다. (p-value: 0.0966)
만약 'length=1'이라는 가설을 검정해보자.
출력문은 'length = 1'이라는 가설은 reject된다는 것을 보여준다. (p-value: 0.0000)
또한, 2개의 변수의 계수(coefficient)를 비교하는 검정도 가능하다.
출력문은 'length = turn'이라는 가설이 reject되지 않는다. (p-value: 0.8932)
또한 joint test도 가능하다.
댓글 없음:
댓글 쓰기