지난 글에서는 가설검정 중에서 1표본 Z검정에 대해서 정리하였다.
즉, 하나의 모집단과 표본에 대한 가설검정만 다루었다.
이번에는 두 모집단과 표본에 대해서 가설검정 하는 내용을 다루려고 한다(2표본 Z검정).
이 글은 훌륭한 유튜브 강의 영상인 손으로만 푸는 통계 내용을 많이 참조하였음을 밝힌다.
이번에는 어떤 두 모집단 A, B가 있다고 하자. 이때 각 모집단의 모분산 σ2A와 σ2B는 알려져있다고 가정한다.

그런데 누군가가 모집단 A의 평균 μA와 모집단 B의 평균 μB가 같다고 하는 의심스러운 주장을 하고 있다. 이런 의심스러운 주장(가설)을 통계적으로 검정해보려고 한다. 다르게 말하면 우리는 μA=μB임을 주장하고 싶다. 그럼 여기서 귀무가설과 대립가설은 어떻게 될까? 아래와 같이 된다.
귀무가설 H0: μA=μB
대립가설 H1: μB≠μB
가설 검정의 기본적인 원리는 1표본 Z검정 때와 같다. 모집단 전체를 조사하기 어려우니까 각각 표본을 뽑아 조사하도록 하고, 아래와 같이 표본을 뽑는다. 이번에도 모집단 A와 B의 모분산이 알려져 있고, 표본의 크기 nA와 nB는 30보다 크다고 가정한다.

표본의 크기가 30보다 크므로, 중심극한 정리에 의해, 다음이 성립한다.
¯XA∼N(μA,σ2AnA), ¯XB∼N(μB,σ2BnB)
이전에 1표본 Z검정에서는 모집단의 평균이 특정 값인지 아닌지를 따지는 것이어서 E(ˉX)를 특정 값 μ′인 정규분포로 놓고 표준정규분포를 이용해 p-value를 구하고 유의수준 α와 비교했다. 근데 여기서는 귀무가설 자체가 어떤 특정 값과 비교하는 것이 아니고, 값을 모르는 두 모집단의 평균이 같다라는 것이기 때문에 이전과 같이 할 수가 없다. 그래서 약간의 기술을 사용하는데, 다음과 같이 변수를 새로 정의한다. Y=ˉXA−ˉXB
이렇게 해주는 이유는 어차피 μA와 μB를 알 수 없으니, 둘의 차이를 새로운 관점으로 해서 접근해보겠다는 것이다.
그러면 귀무가설은 μA=μB ⇔E(Y)=μA−μB=0
이 된다. 그런데 ˉXA와 ˉXB가 각각 정규분포를 따르므로, Y는 다음과 같은 정규분포를 따른다. Y가 아래와 같은 정규분포를 따른다는 것은 수학적 증명이 필요한데, 자세한 증명은 손으로만 푸는 통계 채널을 참고하도록 하고 여기서는 생략한다. Y∼N(0,σ2AnA+σ2BnB)

모집단 A, B에서 각각 뽑은 표본의 평균을 ¯XA,1,¯XB,1이라고 하면 Y1=ˉXA,1−ˉXB,1이다. 즉, 모집단 A, B에서 표본을 하나씩 뽑으면 위 정규분포에서도 Y에 대한 표본을 하나 뽑은 것과 같다. 유의수준 α를 0.05로 정했다고 하고, 어쨌든 이 상태에서 Y의 분포에 대한 평균과 분산을 알고 있으니 표준정규분포를 이용해서 Y1에 대한 p-value를 구할 수가 있다. 만약 구한 p-value가 α보다 작으면, 즉 표본이 기각역 안에 있으면 귀무가설을 기각하고 대립가설을 채택할 수가 있게 된다.
다시 말해서, 두 모집단 A, B의 평균의 차이가 0이다 라는 귀무가설이 참이라고 했을 때, 표본을 추출해봤더니 뽑힐 확률이 5%미만인 표본이 나왔다면, 귀무가설이 잘못되었다고 볼 수 있는 것이다.
'Study > 통계' 카테고리의 다른 글
불편추정량(Unbiased Estimate) - 표본분산은 왜 n-1로 나누나? (3) | 2020.03.19 |
---|---|
카이제곱분포(Chi-squared distribution) (0) | 2020.03.19 |
통계적 추론 - 가설검정(Hypothesis Test) - 1 (0) | 2020.03.10 |
통계적 추론 - 통계적 추정(Statistical Estimation) (0) | 2020.03.05 |
중심극한정리(Central Limit Theorem) (0) | 2020.03.04 |