2014년 2월 23일 일요일

How to use Stata 2. 변수의 분포를 시각적으로 살펴보자 [histogram 명령어]

이제는 시각적으로 변수의 분포를 살펴보자. Stata에서 histogram 명령어를 사용하면 쉽게 살펴볼 수 있다.

히스토그램(Histogram)은 확률 분포 함수를 시각적으로 보여주는 하나의 방법이다.

[여기에서 사용되는 데이터(data)는 auto.dta (http://www.stata-press.com/data/r12/auto)이다]

우선 마일리지(mileage) 변수에 대한 히스토그램을 그려보자.




히스토그램에서 모든 바(bar)의 면적으로 합하게 되면 1이 된다.
histogram 명령문 내의 다른 옵션(default: density)을 사용하면 다른 단위로 표시가능하다 - 단위: density(default); fraction; frequency; percent

또한 히스토그램과 정규분포(Normal density) 곡선과 커널 분포(Kernel density) 곡선을 겹쳐 그릴 수 있다.

  • 정규분포 곡선: histogram 명령문 뒤에, normal 옵션을 사용한다.




















  • 커널 분포 곡선: histogram 명령문 뒤에, kdensity 옵션을 사용한다. 




















댓글 없음:

댓글 쓰기