본문 바로가기

▶ 자연과학/▷ 통계학

【통계학】 5-1강. 이미지 유사성 비교 : SSIM 5-1강. 이미지 유사성 비교 : SSIM 추천글 : 【통계학】 5강. 통계량 1. 개요 [본문] 2. 이론 [본문] 3. 코드 [본문] 4. 출처 [본문] 1. 개요 [목차] ⑴ SSIM(structural similarity index measure) ⑵ 최초 소개 : Image Quality Assessment: From Error Visibility to Structural Similarity (2004, IEEE) ⑶ 기존 방법으로는 mean squared error를 조사하는 수준에 그쳤음 2. 이론 [목차] ⑴ 두 개의 이미지(image) 또는 윈도우(window) x와 y를 비교하는 상황에 대하여, ⑵ 이미지의 구성 ① 휘도(luminance) : 빛의 밝기를 나타내는 양 ② 대조(cont..
【통계학】 전하는 말 들어가기에 앞서 추천글 : 【통계학】 통계학 목차 ♣︎ 전하는 말 ♣︎ 2016년 역사적인 바둑 매치를 통해 알파고가 이 세상에 등장하였습니다. 알파고의 존재가 함축하는 바는 첫째 블랙박스로도 세상을 이해할 수 있다는 점이고, 둘째 우리 주변의 방대한 정보를 딥러닝 알고리즘으로 "축약"할 수 있다는 점입니다. 첫 번째 함축과 관련하여:알파고 이전의 과학은 칼 포퍼의 반증주의에 기반하여 가설 기반의 접근을 취하였습니다. 하지만 알파고 이후에 데이터를 통해 가설을 생성할 수 있고, 데이터를 통해 생성된 가설을 검증할 수 있으며, 데이터를 통해 가설조차 필요하지 않게 되었습니다. 단적인 예로 기존에는 생물학을 인간 중심의 목적론적인 학문으로 인식하였으나 생물정보학의 출현에 힘입어 생물학을 데이터 자체로 해석하..
【통계학】 19강. 회귀분석의 분산분석 19강. 회귀분석의 분산분석 추천글 : 【통계학】 통계학 목차 1. 단순선형회귀분석의 분산분석 [본문] 2. 공변량 분석 [본문] 1. 단순선형회귀분석의 분산분석 [목차] ⑴ 문제 상황 나이 (년) 진드기의 수 3 5 6 13 9 16 12 14 15 18 18 23 21 20 24 32 27 29 30 28 Table. 1. 단순선형회귀분석의 분산분석 예제] ⑵ t 통계표 요인 계수 표준오차 t significance 절편 5.733 2.265 2.531 0.035 나이 0.853 0.122 7.006 0.001 Table. 2. t 통계표 ⑶ F 통계표 요인 제곱합 df 평균제곱 F significance regression 539.648 1 539.648 49.086 < 0.001 residual ..
【통계학】 통계학 요점 정리 통계학 요점 정리 추천글 : 【통계학】 통계학 목차 1. 데이터, 정보, 지식 ⑴ 데이터 : 주어진 자료 ⑵ 정보 : 데이터의 이름 ⑶ 지식 : 정보와 정보의 관계 2. 비율척도, 구간척도, 순서척도, 명목척도 ⑴ 비율척도 : 절대영점 존재. 비율 개념 존재. 절대영도 등 ⑵ 구간척도 : 절대영점 부존재. 비율 개념 부존재. 섭씨온도 등 ⑶ 순서척도 : 순서 개념 ⑷ 명목척도 : 성별 등 3. 가설연역법과 데이터 과학의 차이점 ⑴ 가설연역법은 선 가설설정 후 실험 ⑵ 데이터 과학은 선 실험 후 가설설정 4. 정확도와 정밀도 ⑴ 정확도는 표본평균이 모평균에 얼마나 가까운지에 대한 개념 ⑵ 정밀도는 표본의 분산이 얼마나 작은지에 대한 개념 5. 교락효과 ⑴ 제3의 요인이 조작변인과 종속변인에 모두 영향을 미..
【통계학】 18강. 고급 회귀분석 18강. 고급 회귀분석 추천글 : 【통계학】 통계학 목차 1. 타당도 [본문] 2. 패널 데이터 [본문] 3. 도구 변수 [본문] 4. 랜덤 통제 실험 [본문] 5. 유사실험 [본문] 6. heterogeneous population [본문] 1. 타당도(validity) [목차] ⑴ 내부적 타당도(internal validity) ① 정의 : 회귀분석 결과 얻은 각 계수가 타당하게 계산된 것인지에 대한 정성적 평가 ② 위협 요인 1. omitted variable bias ○ 정의 : 다음 두 가지 조건을 만족하는 변수가 존재하는 경우 잔차의 기댓값이 0이 아니게 되는 것 ○ 조건 1. 하나 또는 몇 개의 기존 변수들과 상관관계가 있을 것 ○ 조건 2. 생략된 변수가 Y의 결정자(determinator..
【통계학】 16강. 선형 회귀분석 16강. 선형 회귀분석(linear regression analysis) 추천글 : 【통계학】 통계학 목차 1. 회귀분석 [본문] 2. 단순선형회귀모델 [본문] 3. 다중선형회귀모델 [본문] a. R로 하는 회귀분석 1. 회귀분석 [목차] ⑴ 회귀분석(regression analysis) : 특정 변수를 하나 또는 복수의 다른 변수의 의존관계로 나타내는 것 ① 더 정확하게는, y ~ X (단, y ∈ ℝ) ○ supervised algorithm에 속함 ○ (참고) classification : y ~ X (단, | { y } | < ∞ ) ② 특정 변수 : 종속변수(dependent variable)라는 명칭이 대표적이나 여러 명칭이 있음 ○ 응답변수(반응변수, response variable) ○ 결..
【통계학】 1-1강. 분위수 대 분위수 플롯(Q-Q plot) 1-1강. 분위수 대 분위수 플롯(Q-Q plot) 추천글 : 【통계학】 1강. 통계의 기초 1. 개요 [본문] 1. 개요 [목차] Figure. 1. 분위수 대 분위수 플롯(Q-Q plot, quantile-quantile plot)] ⑴ (참고) 분위수(quantile) ① 분위수 함수 : 누적분포함수 Φ의 역함수 ○ 정의역 :{x | 0 ≤ x ≤ 1} ○ 치역 : 관심 있는 집단의 통계량 ② 구간의 개수에 따라 100분위수(percent), 4분위수(quartile) 등이 존재 ⑵ 정의 : 다음과 같은 점 (x, y)들의 집합 ①{(x, y) | Φ = P(X < x) = P(Y < y)} ② x는 표준정규분포의 통계량이고 y는 표본집단의 통계량임을 유의 ⑶ 사례 분석 ① 정규분포를 따르는 경우 ..
【통계학】 14-7강. 카이제곱검정 테스트 (3종류) 14-7강. 카이제곱검정 테스트 (3종류) 추천글 : 【통계학】 14강. 통계적 검정 1. 카이제곱 단순적합도 검정 [본문] 2. 카이제곱 독립성 검정 [본문] 3. 카이제곱 동질성 검정 [본문] a. R로 하는 카이제곱 검정 Figure. 1. 카이제곱분포표] 1. 카이제곱 단순적합도 검정(chi-square goodness-of-fit test) [목차] ⑴ 문제상황(contingency table) : 유전 실험이라면 Oi와 Ej는 비율이 아니라 개체수를 의미함 Figure. 2. 카이제곱 단순적합도 검정 문제상황 ⑵ 가설 설정 H0 : 표본 Xi들의 분포가 주어진 확률분포를 따름 H1 : 표본 Xi들의 분포가 주어진 확률분포를 따르지 않음 ⑶ 검정통계량 계산 ⑷ 기각역 : 유의수준 α. 샘플이 커..