본문 바로가기

▶ 자연과학/▷ 조합론·통계학

【통계학】 20강. 회귀분석의 분산분석 20강. 회귀분석의 분산분석 추천글 : 【통계학】 통계학 목차 1. 단순선형회귀분석의 분산분석 [본문]2. 공변량 분석 [본문] 1. 단순선형회귀분석의 분산분석 [목차]⑴ 문제 상황 나이 (년)진드기의 수356139161214151818232120243227293028Table. 1. 단순선형회귀분석의 분산분석 예제] ⑵ t 통계표 요인계수표준오차tsignificance절편5.7332.2652.5310.035나이0.8530.1227.0060.001Table. 2. t 통계표  ⑶ F 통계표 요인제곱합df평균제곱Fsignificanceregression539.6481539.64849.086residual87.952810.994  총합627.6009   Table. 3. F 통계표 ① 귀무가설 H0 : 회귀..
【통계학】 통계학 요점 정리 통계학 요점 정리 추천글 : 【통계학】 통계학 목차 1. 데이터, 정보, 지식 ⑴ 데이터 : 주어진 자료 ⑵ 정보 : 데이터의 이름 ⑶ 지식 : 정보와 정보의 관계 2. 비율척도, 구간척도, 순서척도, 명목척도 ⑴ 비율척도 : 절대영점 존재. 비율 개념 존재. 절대영도 등 ⑵ 구간척도 : 절대영점 부존재. 비율 개념 부존재. 섭씨온도 등 ⑶ 순서척도 : 순서 개념 ⑷ 명목척도 : 성별 등 3. 가설연역법과 데이터 과학의 차이점 ⑴ 가설연역법은 선 가설설정 후 실험 ⑵ 데이터 과학은 선 실험 후 가설설정 4. 정확도와 정밀도 ⑴ 정확도는 표본평균이 모평균에 얼마나 가까운지에 대한 개념 ⑵ 정밀도는 표본의 분산이 얼마나 작은지에 대한 개념 5. 교락효과 ⑴ 제3의 요인이 조작변인과 종속변인에 모두 영향을 미..
【통계학】 19강. 고급 회귀분석 19강. 고급 회귀분석 추천글 : 【통계학】 통계학 목차 1. 타당도 [본문]2. 패널 데이터 [본문]3. 도구 변수 [본문]4. 랜덤 통제 실험 [본문]5. 유사실험 [본문]6. heterogeneous population [본문] 1. 타당도(validity) [목차]⑴ 내부적 타당도(internal validity)① 정의 : 회귀분석 결과 얻은 각 계수가 타당하게 계산된 것인지에 대한 정성적 평가 ② 위협 요인 1. omitted variable bias○ 정의 : 다음 두 가지 조건을 만족하는 변수가 존재하는 경우 잔차의 기댓값이 0이 아니게 되는 것○ 조건 1. 하나 또는 몇 개의 기존 변수들과 상관관계가 있을 것 ○ 조건 2. 생략된 변수가 Y의 결정자(determinator)일 것 ○ 잔차..
【통계학】 16강. 선형 회귀분석 16강. 선형 회귀분석(linear regression analysis) 추천글 : 【통계학】 통계학 목차 1. 회귀분석 [본문]2. 단순선형회귀모델 [본문]3. 다중선형회귀모델 [본문]a. R로 하는 회귀분석 1. 회귀분석 [목차]⑴ 회귀분석(regression analysis) : 특정 변수를 하나 또는 복수의 다른 변수의 의존관계로 나타내는 것① 더 정확하게는, y ~ X (단, y ∈ ℝ) ○ supervised algorithm에 속함 ○ (참고) classification : y ~ X  (단, | { y } | < ∞ ) ② 특정 변수 : 종속변수(dependent variable)라는 명칭이 대표적이나 여러 명칭이 있음○ 응답변수(반응변수, response variable) ○ 결과변수(o..
【통계학】 1-1강. 분위수 대 분위수 플롯(Q-Q plot) 1-1강. 분위수 대 분위수 플롯(Q-Q plot) 추천글 : 【통계학】 1강. 통계의 기초 1. 개요 [본문] 1. 개요 [목차] Figure. 1. 분위수 대 분위수 플롯(Q-Q plot, quantile-quantile plot)] ⑴ (참고) 분위수(quantile) ① 분위수 함수 : 누적분포함수 Φ의 역함수 ○ 정의역 :{x | 0 ≤ x ≤ 1} ○ 치역 : 관심 있는 집단의 통계량 ② 구간의 개수에 따라 100분위수(percent), 4분위수(quartile) 등이 존재 ⑵ 정의 : 다음과 같은 점 (x, y)들의 집합 ①{(x, y) | Φ = P(X < x) = P(Y < y)} ② x는 표준정규분포의 통계량이고 y는 표본집단의 통계량임을 유의 ⑶ 사례 분석 ① 정규분포를 따르는 경우 ..
【통계학】 14-7강. 카이제곱검정 테스트 (3종류) 14-7강. 카이제곱검정 테스트 (3종류) 추천글 : 【통계학】 14강. 통계적 검정 1. 카이제곱 단순적합도 검정 [본문] 2. 카이제곱 독립성 검정 [본문] 3. 카이제곱 동질성 검정 [본문] a. R로 하는 카이제곱 검정 Figure. 1. 카이제곱분포표] 1. 카이제곱 단순적합도 검정(chi-square goodness-of-fit test) [목차] ⑴ 문제상황(contingency table) : 유전 실험이라면 Oi와 Ej는 비율이 아니라 개체수를 의미함 Figure. 2. 카이제곱 단순적합도 검정 문제상황 ⑵ 가설 설정 H0 : 표본 Xi들의 분포가 주어진 확률분포를 따름 H1 : 표본 Xi들의 분포가 주어진 확률분포를 따르지 않음 ⑶ 검정통계량 계산 ⑷ 기각역 : 유의수준 α. 샘플이 커..
【통계학】 14-6강. Fisher Exact Test (hypergeometric test) 14-6강. Fisher Exact Test (Fisher 정확 검정, hypergeometric test) 추천글 : 【통계학】 14강. 통계적 검정 1. 예제 [본문] 2. 설명 [본문] 3. 응용 [본문] 1. 예제 [목차] Figure. 1. 예제] ⑴ 위와 같은 표를 contingency table이라고 함 2. 설명 [목차] ⑴ 전제 : marginal total이 알려져 있음 ① marginal total : a + b, c + d, a + c, b + d를 지칭 ② a + b + c + d = n이란 것도 알려져 있음 ⑵ 귀무가설 H0 : 남성 집단과 여성 집단이 동일한 집단 ⑶ 귀무가설 변형 : 남성 집단은 n 명 중 a + c 명을 무작위로 추출한 집단에 불과함 ⑷ 통계량 1. 확률 (..
【통계학】 14-3강. Kruskal-Wallis H test 14-3강. Kruskal-Wallis H test(크루스칼 왈리스 검정) 추천글 : 【통계학】 14강. 통계적 검정 1. 개요 [본문] 2. 방법 [본문] 1. 개요 [목차] ⑴ 정의 ① 세 집단 이상의 분포를 비교하는 검정 방법 ② 모수적 방법에서의 one-way ANOVA와 같은 목적으로 쓰임 ③ 그룹별 평균이 아닌 중위수와 같은지를 검정 ④ 각 그룹의 표본수는 다를 수도 있음 ⑵ (참고) 검정 방법의 선택 ① 단일 표본 ○ 모수 검정 : 단일 표본 T-검정 ○ 비모수 검정 : 부호 검정(sign test), 윌콕슨 부호 순위 검정(Wilcoxon signed rank test) ② 두 표본 (대응 표본) : 사실상 단일 표본과 동일함 ○ 모수 검정 : 대응 표본 T-검정 ○ 비모수 검정 : 부호 ..