Math/확률과 통계

[확통] 공분산과 상관계수

Buang 2023. 4. 21. 20:08
반응형

<목차>

 

1. 공분산

2. 상관계수

3. 확률변수독립

 


공분산

 

 

기대값을 구하는 건데 변수를 2개 구하는 거라

x-평균, y-평균 한 다음에 제곱해주면 된다.

 

 

이전에 배운 분산 식과 유사하다.

공분산은 변수가 두 개라다란 차이점 뿐이다.

 

 

 

- 상수 a, b, c, d가 있을 때

상수들을 더해 주는 것(b와 d)는 영향을 미치지 못한다.

 

 

상관계수

 

 

 

- 공분산의 값을 정규화 시킨 게 상관계수다.

- 공분산 X와 Y를 x의 표준편차와 y의 표준편차로 나눈다.

 

- 연관된 데이터들 간에 어떤 관계가 있는지 살펴본다.

예) x가 상승하면 y도 상승하나?

 

 

(a) 해석

- x가 증가함에 따라서 y도 증가하는 것

예) 학생의 키가 커짐에 따라서 몸무게도 증가하는 것

 

(c) 해석

예) 수학 잘 보는 학생들이 영어를 못 볼 경우 음의 상관관계를 지닌다.

 

 

상관계수 성질

 

 

 

(1) 해석

- X랑 Y 순서 바뀐다고 결과가 바뀌지 않는다.

 

(2) 해석

상관계수가 -1과 1 사이에서 값을 가진다.

 

(3) 해석

- 자기자신과 상관계수를 가질 경우 1이다.

- 자기자신의 확률변수에 마이너스를 붙이면 X가 증가하면 완전히 반대로 하락함

 

(4) 해석

- a랑 c랑 부호가 서로 같다면 양수다(양, 양 / 음, 음)

- a랑 c랑 부호가 다르면 음수다.

 

 

예제 3-23

 

(a) E(X)와 Var(X)를 각각 구하라

 

(b) E(Y)와 Var(Y)를 각각 구하라

 

 

 

(c) E(XY)를 구하라

 

 

(d) Cov(X, Y)를 구하라

(e) Corr(X, Y)를 구하라

 

 

 

 

확률변수의 독립

 

 

 

 

 

예제 3-24

 

 

 

(a) 두 확률변수 X와 Y의 결합확률분포표를 작성하라

 

 (b) E(X)와 E(Y)를 각각 구하라

 

 

(c) Var(X)와 Var(Y)를 구하라

 

(d) Cov(X, Y)를 구하라

 

 

아래는 왜 E(XY)가 1/3인지 설명한 것이다.

 

 

x나 y가 둘 중에 하나라도 0이면 결국 0이 나오기 때문에

현재 x와 y를 고려했을 때 (x=1, y=1), (x=2, y=1)일 때가 0이 아니다.

 

 

(e) Corr(X, Y)를 구하라

 

Corr 구하는 식이 위와같았다.

Cov가 0이었으니까 Corr도 0이 나올 수 밖에 없다.

 

 

(f) 두 확률변수 X와 Y가 서로 독립인지의 여부를 확인하라

 

 

확률변수가 독립인지는 위의 식을 통해 확인 가능하다.

 

 

독립이 아니다.

반응형