본문 바로가기
기타 학문

[확률과 통계] The sign test

by 지식id 2012. 12. 8.
반응형

쉽게 말해, 어떠한 값보다 크고 작음만 따져 계산하는 테스트이다. 예를 보면 이해하기 쉽다.

 

미국 남성의 평균 키가 최근 몇십년간 증가 했을 것이라는 가정을 가지고 테스트를 해 보자. 1970년대 18세 이상 24세 이하 남성의 평균 키는 69.5inch 였다. 이 가정을 검사하기 위해 올해에 무작위로 선별된 20명의 키를 측정 하였다.

 

69.5  72.4  74.0  74.5  72.0  68.0  68.8  70.0  69.5  70.5

74.0  72.0  71.0  71.0  72.0  69.0  69.8  69.0  71.8  73.0 (단위 inch)

 

이 가정에 sign test를 적용 해 보자.

 

H0 : 미국 남성의 평균 키는 69.5inch이다. (변하지 않았을 것이다.)

Ha : 미국 남성의 평균 키는 더 커졌을 것이다. (Med>69.5)

 

먼저 데이터에 sign을 한다. 69.5보다 클 경우엔 (+), 작을 경우엔 (-), 같은 경우엔 (0)

 

69.5(0) 72.4(+) 74.0(+) 74.5(+) 72.0(+) 68.0(-) 68.8(-) 70.0(+) 69.5(0) 70.5(+)

74.0(+) 72.0(+) 71.0(+) 71.0(+) 72.0(+) 69.0(-) 69.8(+) 69.0(-) 71.8(+) 73.0(+) (단위 inch)

 

(0)으로 assign된 데이터는 지운다. 크고 작음만 고려하기 때문에 무의미한 데이터이다. 그럼 우리의 모집단은 n = 18이다. k(+) = 14, k(-) = 4

 

귀무가설(null hypothesis)에 따르면 모집단의 값이 69.5inch보다 클 확률은 π = 0.5이다. 좀 더 명확하게 하기 위해서 위에서 했던 가정을 재정의한다.

 

H0 : π = 0.5

Ha : π > 0.5

 

귀무가설 대로라면 모집단에서 키가 69.5보다 큰 사람은 9명이 되어야 한다. 하지만 9명과 다소 차이가 있는 14명이란 것은 대립가설에 대한 증거가 되는 것이다. 이 값을 Test statistic 이라고 한다.

 

Test statistic ks = 14

 

이제 P-value를 구한다. P-value(유의확률)은 귀무가설의 기각 여부를 판단하는 근거가 되는 값으로, 이 값이 작으면 작을 수록 귀무가설을 기각 했을 경우 오류를 범할 확률이 작다는 것이다.

 

P-value = Pr(K ≥ ks) = Pr(K ≥ 14) = 1- Pr(K ≥ 13) = 1 - Fk(13) = 1 - 0.9846 = 0.0154 (이항분포표에 의한 값)

 

보통 P-value < 0.05 일 경우 일반적으로 귀무가설을 기각 할 만한 근거가 있다고 판단한다.

책에 따르면

P-value < 0.05, it is commoly said the "The evidence is significant" And is te P-value < 0.01, is it commonly said that the evidence is highly significant.

 

여기서 0.05, 0.01과 같은 판단 수치를 α라고 하며 α가 작을수록 귀무가설을 쉽게 기각하진 않겠다는 의미이다.

 

수치가 아닌, 단순히 (+) (-)라는 sign들 만으로 무언가를 검증 한다는게 신뢰가 가지 않을수도 있다. 그렇다면 아래 예를 보자

 

1717년, 스코틀랜드 과학자 John Arbuthnot는 여자의 출생보다 남아의 출생이 더 많다고 생각하였다. 그는 82년간의 런던 출생 기록을 살펴 보았다. 각 년도별로 만약 남아 출생이 많은 해엔 (+), 여아의 출생이 많은 해엔 (-) 표시를 하였다. 생물학적으로 남자가 태어날 확률이나 여자가 태어날 확률은 같으므로 똑같거나 비슷한 (+), (-)를 예상 했지만, (-) 0개, (0) 0개, (+) 82개 라는 결과가 나왔다.

 

총 머릿수를 계산한 수치를 가지고 "남아가 몇명 태어날때 여아는 몇명 태어났다" 라고 하는것 보단 "지난 82년간, 매년 여아보다 남아가 더 많이 출생되었다" 라고 하는데 계산 하기도 쉽고 좀더 명확해 보이는 대립가설의 증거가 될 수도 있는 것이다.

반응형

댓글