핵심 개념
확률변수의 분산은 기댓값(평균) 주위로 값들이 얼마나 퍼져 있는지를 측정한다.
정의
기댓값이 μ=E(X)인 확률변수 X에 대해:
Var(X)=E[(X−μ)2]=E(X2)−(E(X))2
표기법
- Var(X) 또는 V(X) - X의 분산
- σ2 (시그마 제곱) - 분산의 일반적인 기호
- D(X) - 대체 표기법 (중국 교과서에서 사용)
두 가지 공식
공식 1: 정의식
Var(X)=E[(X−μ)2]=∑i=1n(xi−μ)2⋅pi
공식 2: 계산식 (더 실용적)
Var(X)=E(X2)−(E(X))2
암기 요령: "제곱의 평균 빼기 평균의 제곱"
분산의 성질
1. 비음수성
Var(X)≥0
등호는 X가 상수일 때만 성립한다.
2. 상수 인수
Var(aX)=a2⋅Var(X)
주의: 인수는 제곱된다.
3. 상수 더하기
Var(X+b)=Var(X)
상수를 더해도 산포도는 변하지 않는다.
4. 결합 선형 변환
Var(aX+b)=a2⋅Var(X)
5. 독립 변수의 합
X와 Y가 독립이면:
Var(X+Y)=Var(X)+Var(Y)
경고: 종속 변수에는 성립하지 않는다!
6. 상수의 분산
Var(c)=0
주요 분포
| 분포 | 분산 |
|---|
| 베르누이(p) | p(1−p) |
| 이항(n,p) | np(1−p) |
| 이산 균등({1,...,n}) | 12n2−1 |
CSCA 연습 문제
💡 참고: 다음 연습 문제는 CSCA 시험 요강을 기반으로 설계되었습니다.
예제 1: 기초 (난이도 ★★☆☆☆)
확률변수 X의 분포가 다음과 같다:
Var(X)를 구하라.
풀이:
먼저 E(X)를 구한다:
E(X)=0(0.3)+1(0.5)+2(0.2)=0+0.5+0.4=0.9
E(X2)를 구한다:
E(X2)=02(0.3)+12(0.5)+22(0.2)=0+0.5+0.8=1.3
공식 적용:
Var(X)=E(X2)−(E(X))2=1.3−0.81=0.49
답: Var(X)=0.49
예제 2: 중급 (난이도 ★★★☆☆)
Var(X)=4일 때, Var(3X+2)를 구하라.
풀이:
성질 Var(aX+b)=a2⋅Var(X)를 이용하면:
Var(3X+2)=32⋅Var(X)=9×4=36
답: 36
예제 3: 고급 (난이도 ★★★★☆)
E(X)=2이고 E(X2)=8일 때, Var(2X−3)을 구하라.
풀이:
먼저 Var(X)를 구한다:
Var(X)=E(X2)−(E(X))2=8−4=4
그러면:
Var(2X−3)=22⋅Var(X)=4×4=16
답: 16
표준편차
표준편차는 분산의 제곱근이다:
σ=Var(X)
표준편차는 X와 동일한 단위를 가지므로 해석이 더 용이하다.
분산 vs. 기댓값
| 성질 | 기댓값 E(X) | 분산 Var(X) |
|---|
| 측정 | 중심 (위치) | 산포 (분산도) |
| 선형 변환 | E(aX+b)=aE(X)+b | Var(aX+b)=a2Var(X) |
| 합 | 항상 가법적 | 독립일 때만 가법적 |
흔한 실수
❌ 실수 1: 계수를 제곱하는 것을 잊음
틀림: Var(3X)=3⋅Var(X) ✗
맞음: Var(3X)=9⋅Var(X) ✓
❌ 실수 2: 종속 변수의 분산을 더함
틀림: X와 Y가 종속일 때, Var(X+Y)=Var(X)+Var(Y) ✗
맞음: 독립 변수에 대해서만 성립한다 ✓
❌ 실수 3: 분산과 표준편차를 혼동
틀림: 이항분포(n,p)의 표준편차가 np(1−p)이다 ✗
맞음: 분산이 np(1−p)이고, 표준편차는 np(1−p)이다 ✓
학습 팁
- ✅ 계산 공식 사용: E(X2)−(E(X))2가 대개 더 간편하다
- ✅ 계수는 제곱: Var(aX)=a2Var(X)
- ✅ 독립성 확인: 분산의 합은 독립 변수에 대해서만 성립한다
- ✅ 이항분포 분산 암기: np(1−p)는 자주 출제된다
💡 시험 팁: 분산을 계산할 때 항상 E(X)와 E(X2)를 먼저 따로 구하라. 계산 공식이 정의식보다 오류가 적다!