▶ 자연과학/▷ 조합론·통계학

【통계학】 14-9강. Kolmogorov-Smirnov 검정

초록E 2025. 3. 24. 07:44

14-9강. Kolmogorov-Smirnov 검정

 

추천글 : 【통계학】 14강. 통계적 검정 


1. 일반적인 Kolmogorov-Smirnov 검정 [본문]

2. 모수적 Kolmogorov-Smirnov 검정 [본문]

3. Cramér–von Mises 검정 [본문]

4. Kolmogorov-Smirnov 두 표본 검정 [본문]


 

1. 일반적인 Kolmogorov-Smirnov 검정 [목차]

⑴ 표본 (즉, empirical) 분포함수를 다음과 같이 정의함 : 계단함수 형태

 

 

⑵ two-sided Kolmogorov-Smirnov test는 다음 값이 클 경우 귀무가설을 기각함

 

 

출처: 이미지 클릭

Figure. 1. Kolmogorov-Smirnov 검정 통계량

 

⑶ 귀무가설

D의 귀무분포는 F0 (연속적이라고 가정함)에 의존하지 않으며, 이는 다양한 표본 크기 n에 대해 표로 정리됨 

② 즉, 귀무가설은 F hat과 F0, 두 확률분포가 동일하다는 것 

이론 : 귀무가설 하에서, √n D는 점근적으로 (n → ) Brownian bridge의 절댓값의 최댓값의 분포를 따름 

시뮬레이션 : Monte Carlo 시뮬레이션을 통해 p-value를 계산할 수 있음

① 실제로 귀무분포에서의 D의 분포는 F0에 의존하지 않기 때문에, 이는 각 표본 크기에 대해 한 번만 수행하면 됨

② 예를 들어, F0 = Unif(0, 1)로 둘 수 있음 

 

 

2. 모수적 Kolmogorov-Smirnov 검정 [목차]

⑴ 통계량은 다음과 같이 정의됨 

 

 

⑵ p-value는 일반적으로 parametric boostrap을 통해 추정됨 : 여기서 F hat과 θ hat은 각 부트스트랩 샘플에 대해 다시 계산

⑶ 𝒢가 정규 분포 계열인 경우 : 즉, 주어진 분포가 정규분포를 따르는지 검정하는 경우 (정규성 검정)

 

 

① 이 검정은 종종 Lilliefors normality test라고 불림

② 위의 통계량은 계열 내의 모든 분포에서 보정될 수 있으며, 이는 몬테카를로 시뮬레이션을 통해 수행

③ 따라서 이 통계량의 귀무분포는 표로 정리되어 있음 

④ R 코드 : ks.test(dat, "pnorm", mean=mu, sd=sigma) 

⑷ 동일한 논리가 다른 location-scale family의 분포에도 적용됨 

 

 

① 여기서 G0는 실수 집합 ℝ에서 정의된 주어진 분포

② location : 평균, 중앙값, 분위수 등

③ scale : 표준편차, MAD(median absolute deviation) 등

 

 

3. Cramér–von Mises 검정 [목차]

⑴ Kolmogorov-Smirnov 검정의 변형 

⑵ Cramér–von Mises 검정은 다음 값이 클 경우 귀무가설을 기각

 

 

① f0(x) = dF0(x) /dx는 귀무가설 하의 확률밀도함수(PDF)

② MSE(mean-squared error)와 유사하게 식을 구성 

⑶ 이는 적분 계산이 필요 없는 간단한 폐쇄형(closed form) 표현을 가짐

 

 

여기서 X(1) ≤ ⋯ ≤ X(n)은 순서 통계량(order statistics)으로 정렬된 샘플 

② D의 귀무 분포(null distribution)는 F0에 의존하지 않으며 표로 작성되어 있음

③ 점근적 귀무 분포(asympotic null distribution)도 알려져 있지만 복잡함 

④ 따라서 p-value를 계산하기 위해 Monte Carlo 시뮬레이션을 사용할 수 있음 

 

 

4. Kolmogorov-Smirnov 두 표본 검정 [목차]

⑴ (단측) Kolmogorov-Smirnov 검정은 아래 값이 클 때 귀무가설을 기각함 

 

 

이론 

Dm,n+의 분포는 몇 가지 재귀 공식들을 사용하여 정확하고 효율적으로 계산할 수 있음

② 큰 표본의 경우, 다음과 같은 극한 분포를 가짐

 

 

③ 위 분포는 표본 크기를 ⎣ mn / (m+n) ⎦로 한 단일 표본 검정에서의 극한 분포와 동일함 

 

입력: 2025.03.23 18:32