상관검정 통계량 유도

귀무가설 ( $H_0:\beta_1=0$ ) 에 대한 t-검정 통계량은
[
t = \frac{\hat\beta_1 - 0}{\operatorname{SE}(\hat\beta_1)}
= \frac{\hat\beta_1}{s/\sqrt{S_{xx}}}
= \frac{\hat\beta_1\sqrt{S_{xx}}}{s}
]

여기에 (\hat\beta_1 = S_{xy}/S_{xx}) 를 대입하면
[
t = \frac{S_{xy}}{S_{xx}} \cdot \frac{\sqrt{S_{xx}}}{s}
= \frac{S_{xy}}{\sqrt{S_{xx}},s}
]

이제 (s^2)와 (S_{xy})를 앞에서 구한 식으로 치환합니다.

(s^2 = \dfrac{S_{yy}(1-r^2)}{n-2}) → (s=\sqrt{\dfrac{S_{yy}(1-r^2)}{n-2}})
(S_{xy} = r\sqrt{S_{xx}S_{yy}})

따라서
[
t
= \frac{r\sqrt{S_{xx}S_{yy}}}{\sqrt{S_{xx}}\sqrt{\dfrac{S_{yy}(1-r^2)}{n-2}}}
= \frac{r\sqrt{S_{xx}S_{yy}}}{\sqrt{S_{xx}}\sqrt{S_{yy}}\sqrt{\dfrac{1-r^2}{n-2}}}
]

분자·분모에서 (\sqrt{S_{xx}}), (\sqrt{S_{yy}}) 가 약분되어
[
t
= \frac{r}{\sqrt{\dfrac{1-r^2}{n-2}}}
= \frac{r\sqrt{n-2}}{\sqrt{1-r^2}}
]
을 얻습니다. 이것이 상관검정에서 사용하는 t-검정통계량입니다.

4. 분포: 왜 t 분포를 따르나?¶

이제 “왜 t 분포인가?” 부분은 회귀이론으로 설명합니다.

이변량 정규분포 가정 + (H_0:\rho=0) 아래에서
(\hat\beta_1)은 정규분포를 따르고,
((n-2)s^2/\sigma2 = \text{SSE}/\sigma^2)는 자유도 (n-2)인 (\chi^2) 분포를 따르며,
(\hat\beta_1)과 (s^2)는 서로 독립입니다.

그래서
[
t = \frac{\hat\beta_1/\operatorname{SD}(\hat\beta_1)}{\sqrt{s^2/\sigma2}}
]
꼴이 되어, 전형적인
[
\frac{Z}{\sqrt{V/(n-2)}} \quad (Z\sim N(0,1), V\sim \chi^2_{n-2}, Z\perp V)
]
형태가 되고, 따라서
[
t \sim t_{n-2}
]
가 됩니다.

정리하면,

상관검정 (H_0:\rho=0)을 단순회귀에서 기울기 검정으로 바꿔 생각하고,
회귀계수 (\hat\beta_1)의 t-통계량을 (r)로 다시 표현한 결과가
[
t = \dfrac{r\sqrt{n-2}}{\sqrt{1-r^2}}
]
로 나온다 — 라는 흐름입니다.

필요하면, (\rho \neq 0)인 일반 (H_0:\rho=\rho_0) 에 대한 검정통계량(변형된 t 혹은 Fisher z 변환)도 유도 과정까지 같이 풀어줄게요.