본문 바로가기

Contact 日本語 English

【통계학】 4강. 확률변수와 분포

 

4강. 확률변수와 분포(random variable and distribution)

 

추천글 : 【통계학】 통계학 목차


1. 확률변수 [본문]

2. 분포함수 [본문]

3. 밀도함수 [본문]

4. 적률생성함수 [본문]

5. 차원의 확장 [본문]


 

1. 확률변수(random variable) [목차]

⑴ 정의 : 표본공간 내 각 사건과 대응시키는 함수 또는 대응된 실수값

① (참고) X : Ω →

② (참고) F → B() = A, B() : Borel field

③ (참고) A ⊂ , X-1(A) = {ω | X(ω) ∈ A}

④ (참고) A ⊂ , PX(A) = P(X-1(A)) : PX는 편의상 P로 표시

⑵ 이산확률변수(discrete random variable)

정의 1. 확률변수 X의 치역이 유한집합(finite set) 또는 셀 수 있는 무한집합(countable infinite set)인 경우

정의 2. 누적분포함수 F가 이산적인 경우

⑶ 연속확률변수(continuous random variable)

정의 1. 확률변수 X의 치역이 셀 수 없는 무한집합(uncountable infinite set)과 관련

정의 2. 누적분포함수 F가 연속적인 경우

⑷ 확률분포(probability distribution) : 특정 사건의 확률을 나타내는 함수관계 PX

종류 1. 분포함수(distribution function) : 누적분포함수(CDF, cumulative distribution function)라고도 함

종류 2. 밀도(density) : 확률질량함수와 확률밀도함수로 구분

종류 3. 적률 생성 함수(moment generating function)

확률질량함수 : 이산확률변수의 확률분포

⑤ 확률밀도함수 : 연속확률변수의 확률분포

⑥ 분포함수를 미분하면 밀도가 됨 ↔ 밀도를 적분하면 분포함수가 됨

 

 

2. 분포함수 [목차]

⑴ 정의

① 정의 : F(xi) = P(- < X ≤ xi)인 함수 F를 지칭

② 이산확률변수의 누적분포함수

 

 

③ 연속확률변수의 누적분포함수

 

 

⑵ 성질 

F(-) = 0, F() = 1

x1 < x2에 대하여, F(x1) ≤ F(x2)

밀도가 이산확률변수, 연속확률변수인지 상관없이 우극한은 함수값과 일치

P(a < X ≤ b) = F(b) - F(a)

 

 

3. 밀도함수 [목차]

⑴ (참고) 인디케이션 함수(indication function)

① 표기 : I{·

② 정의 : · 를 만족할 때만 1이고 나머지는 0인 함수

⑵ 확률질량함수(PMF, probability mass function)

① 정의 : X = {x1, x2, ···, xn}에 대해, p(xi) = P(X = xi)인 함수 p(x)를 지칭

② 예시

 

 

⑶ 확률밀도함수(PDF, probability density function)

정의 : 누적분포함수 F에 대해, F'(x) = p(x)인 함수 p(x)를 지칭

② 예시

 

 

⑷ 공통점

① p(x) ≥ 0

② ∫ p(x) dx = 1

⑸ 차이점

① 점 확률(point probability) : 확률질량함수는 점 확률이 0이 아닐 수 있지만, 확률밀도함수는 점 확률이 항상 0임

② 점 확률이 0인 것과 서포트 함수의 정의는 차이가 있음을 유의

③ 서포트 함수(support function) SX ={x | p(x) > 0}

○ 독립인 경우 서포트 함수가 임의의 변수에 대해서도 일정해야 함

 

 

4. 적률 생성 함수 [목차]

⑴ (참고) 기댓값

 

 

⑵ 적률(moment)

① 원점에 대한 n차 적률

 

 

② 원점에 대한 1차 적률(1st moment) : 기댓값

③ 원점에 대한 2차 적률(2nd moment) : 관성모멘트

④ 평균에 대한 1차 적률(central 1st moment) : 0

⑤ 평균에 대한 2차 적률(central 2nd moment) : 분산

⑥ 편포도(왜도, skewness) : 기울어 있는 정도

 

출처 : 이미지 클릭

Figure. 1. 편포도의 의미]

 

○ skew > 0 : 우측으로 긴 꼬리가 있는 경우로, 이에 대응하여 많은 데이터가 왼쪽으로 쏠리게 됨

○ skew < 0 : 좌측으로 긴 꼬리가 있는 경우

⑦ 첨도(kurtosis) : 뾰족한 정도

 

출처 : 이미지 클릭

Figure. 2. 첨도의 의미

 

○ 첨도가 3에 가까우면 정규분포와 유사

○ 첨도 ↑ : outlayer가 crazy value가 되려는 경향 ↑, 즉 tailedness가 커짐

○ 첨도 ↑ : 더 뾰족해짐

⑶ 적률생성함수(moment generating function)

① 정의

 

 

② 적률과의 관계

 

 

③ 라플라스 변환과 유사 : 적률생성함수와 확률분포는 일대일대응

성질 1. ψaX+b(t) = ebt ψX(at)

 

 

성질 2. X1, ···, Xn이 독립이면, Y = X1 + ··· + Xn에 대해

 

 

 

5. 차원의 확장 [목차]

⑴ 확률변수가 두 개가 되도록 (X, Y)를 정의 : Ω → 2

결합확률분포(결합확률질량함수, joint probability distribution; 커플링, coupling)

① 이산확률변수 : X = {x1, ···, xm}, Y = {y1, ···, yn}에 대해, p(xi, yj) = P(X = xi, Y = yj)인 함수 p(x, y)

② 연속확률변수 : 2F(x, y) / ∂x ∂y = p(x, y)인 함수 p(x, y)

성질 1. p(x, y) ≥ 0

성질 2. ∑∑ p(x, y) = 1

주변확률분포(marginal probability distribution)

① 정의 : 결합확률분포를 확률변수 X 또는 Y만의 분포로 바꾼 것

② 이산확률변수의 주변확률분포

 

 

연속확률변수의 주변확률분포

 

 

⑷ 예시

 

결합확률분포와 주변확률분포의 예

 

Table. 1. 결합확률분포와 주변확률분포의 예

 

① 결합확률분포를 알면 주변확률분포를 알 수 있음

② 주변확률분포를 안다고 결합확률분포를 항상 알 수 있는 것은 아님

심슨의 역설(Simpson's paradox) : 직관적으로 계산하지 말 것

 

심슨의 역설

 

Table. 2. 심슨의 역설

 

⑸ 결합적률생성함수(joint moment generating function)

① 정의

 

 

② 성질

 

 

조건부 분포(조건부 밀도함수, conditional distribution)

① Y의 조건부 분포 : p (y | x) = p(x, y)/pX(x)

② X의 조건부 분포 : p (x | y) = p(x, y)/pY(y)

응용 1.

 

 

응용 2. Y = g(X), P(X = x) = p(x)에 대해,

 

 

⑤ 조건부 독립

 

 

⑺ 상호독립(mutual independence)

① 정의

 

 

② 상호독립 정의의 완결성

○ 부분에 대해서도 독립이 성립

 

 

○ 결합 확률 분포와 주변 확률 분포는 상대적인 개념임을 주의

성질 1. 상호독립과 결합분포함수

 

 

입력: 2019.06.17 13:52