본문 바로가기

▶ 자연과학/▷ 통계학

【통계학】 Gromov-Wasserstein distance 이해하기 Gromov-Wasserstein distance(Kantorovich–Rubinstein metric, Earth Mover's Distance, EMD) 추천글 : 【통계학】 5-2강. 거리함수와 유사도 1. 개요 [본문] 2. 코드 [본문] 1. 개요 [목차] ⑴ 결합확률분포(결합확률질량함수, joint probability distribution; 커플링, coupling) ① 이산확률변수 : X ={x1, ···, xm}, Y ={y1, ···, yn}에 대해, π(xi, yj) = π(X = xi, Y = yj)인 함수 π(x, y) ② 연속확률변수 : ∂2F(x, y) / ∂x ∂y = π(x, y)인 함수 π(x, y) ③ 성질 1. π(x, y) ≥ 0 ④ 성질 2. ∑∑ π(x, y) ..
【통계학】 5-2강. 거리함수와 유사도 5-2강. 거리함수와 유사도 추천글 : 【통계학】 5강. 통계량 1. 개요 [본문] 2. 거리 개념 종류 [본문] 3. 유사도 개념 종류 [본문] a. Gromov-Wasserstein distance 1. 개요 [목차] ⑴ 거리함수와 유사도 개념은 많이 혼용되어 쓰임 ① 공통점 : 두 data point가 가깝다(거리가 짧다)는 말은 유사하다는 뜻과 동일함. 즉, 거리 ∝ 1 / 유사도 ② 공통점 : 머신러닝에서의 손실함수, 에러함수, 비용함수라는 말도 참값과 예측값의 차이(∝ 1 / 유사도)를 지칭함 ③ 차이점 : 거리함수는 선형대수학에서 다음과 같이 엄밀하게 정의되지만, 손실함수, 유사도 등이 그 정의를 만족해야 하는 것은 아님 ⑵ 다음 거리 개념 및 유사도 개념 구분은 엄밀하지 않음을 유의 ⑶ 여..
【통계학】 14-5강. 런 검정(run test) 14-5강. 런 검정(run test) 추천글 : 【통계학】 14강. 통계적 검정 1. 개요 [본문] 2. 가정 [본문] 3. 절차 [본문] 1. 개요 [목차] ⑴ 두 개의 값을 가지는 연속적인 측정값들이 어떤 패턴이나 경향이 없이 임의적으로 나타난 것인지를 검정하는 방법 ⑵ 런(run)은 동일한 측정값들이 시작하여 끝날 때까지의 덩어리를 지칭 ① 예 : 1, 0, 0, 1, 0, 1, 1, 1, 0, 1과 같은 수열의 경우 1/00/1/0/111/0/1로 런은 총 7개 2. 가정 [목차] ⑴ 이분화된 자료가 아닌 경우는 이분화된 자료로 변환시켜야 함 ⑵ 평균, 중위수, 최빈수 또는 사용자가 정의한 숫자 등의 기준값을 이용하여 이분화 3. 절차 [목차] ⑴ 단계 1. 가설 검정 ① 귀무가설 H0 : 연속..
【통계학】 통계학 목차 통계학 목차 추천글 : 【수학】 수학 목차 최근 수정 내역 경제학과 정보이론의 지니계수의 차이 (24.04.05) 상관계수 보충 (23.11.19) Optimal Transport Theorem (23.11.07) 전하는 말 Ⅰ. 조합론 1강. 통계의 기초 1-1강. 분위수 대 분위수 플롯 2강. 경우의 수 Ⅱ. 모집단 3강. 확률공간 3-1강. 포함배제의 원리 3-2강. 몬티홀 문제 3-3강. 고난이도 확률문제 4강. 확률변수와 분포 5강. 통계량 6강. 이산확률분포 7강. 연속확률분포 8강. 확률변수변환 9강. 통계학 주요 정리 1부 10강. 통계학 주요 정리 2부 Ⅲ. 표본집단 11강. 표본집단과 표본분포 12강. 오차해석 13강. 통계적 추정 14강. 통계적 검정 14-1강. 통계적 검정 예시 총..
【통계학】 20강. 정보이론 20강. 정보이론(information theory) 추천글 : 【통계학】 통계학 목차 1. 정보이론 [본문] 2. 현대 정보이론 [본문] 1. 정보이론 [목차] ⑴ 개요 ① low probability event : high information (surprising) ② high probability event : low information (unsurprising) ⑵ entropy ① 문제 상황 : X는 Raining / Not Raining. Y는 Cloudy / Not Cloudy Figure. 1. 엔트로피 예제 ② 통계학 기본 개념 ③ 정보(information) : 결과를 알게 되었을 때 얻게 되는 모든 것 ④ uncertainty(surprisal, unexpectedness, ran..
【통계학】 17강. 비선형 회귀분석 17강. 비선형 회귀분석(non-linear regression model) 추천글 : 【통계학】 통계학 목차 1. 이차회귀모델 [본문] 2. 다항회귀모델 [본문] 3. 로그회귀모델 [본문] 4. 확률모델 [본문] 5. 상호작용 [본문] a. R로 하는 회귀분석 1. 이차회귀모델(quadratic regression model) [목차] ⑴ 수식화 ⑵ 계수 결정 ① 다중선형회귀모델 이용 : Xi와 Xi2를 서로 다른 변수로 간주하고 해석 ② Xi와 Xi2는 완전 다중공선성(perfect multi-collinearity)이 없으므로 가능 ⑶ 선형성 테스트(linearity test) ⑷ 변화량의 신뢰구간 ① 효과(effect) : X의 단위변화에 따른 Y의 효과는 다음과 같음 ② marginal effe..
【통계학】 14-4강. 윌콕슨 순위 검정(Wilcoxon Rank Test) 14-4강. 윌콕슨 순위 검정 (Wilcoxon rank test) 추천글 : 【통계학】 14강. 통계적 검정 1. 개요 [본문] 2. 윌콕슨 순위합 검정 [본문] 3. 윌콕슨 부호순위검정 [본문] 1. 개요 [목차] ⑴ 단일 표본 ① 모수 검정 : 단일 표본 T-검정 ② 비모수 검정 : 부호 검정(sign test), 윌콕슨 부호 순위 검정(Wilcoxon signed rank test) ⑵ 두 표본 (대응 표본) : 사실상 단일 표본과 동일함 ① 모수 검정 : 대응 표본 T-검정 ② 비모수 검정 : 부호 검정(sign test), 윌콕슨 부호 순위 검정(Wilcoxon signed rank test) ⑶ 두 표본 (독립 표본) ① 모수 검정 : 독립 표본 T-검정 ② 비모수 검정 : 윌콕슨 순위 합 ..
【통계학】 14-2강. 단순 검정 14-2강. 단순 검정 추천글 : 【통계학】 14강. 통계적 검정 1. 부호 검정 [본문] 2. ROC 분석 [본문] 1. 부호 검정(sign test) [목차] ⑴ 개요 ① 차이의 크기는 무시하고 차이의 부호만을 이용한, 중위수의 위치에 대한 검정 방법 ② 자료를 중위수와 차이의 부호인 +와 -의 부호로 전환한 다음 부호들의 수를 근거로 검정 ③ 자료의 분포가 연속적이고 독립적인 분포에서 나온 것이라는 가정만 필요함 ⑵ 절차 ① 단계 1. 표본 추출 ○ 모집단에서 연속인 표본을 추출 ○ 가정된 중위수 θ0와 같은 표본을 제외 후 남은 표본의 수가 n개일 때, 남은 표본을 X1, X2, ∙∙∙, Xn이라고 정의 ② 단계 2. 검정 통계량 ③ 단계 3. 유의수준 α에 대한 기각역 ○ 귀무가설 : θ = θ..