Skip to main content
返回术语表
statistics难度:基础statisticsprobabilityvariance
Share

方差fāngchā

분산
4 分钟阅读
更新于 2025-01-24
已完成

핵심 개념

확률변수의 분산은 기댓값(평균) 주위로 값들이 얼마나 퍼져 있는지를 측정한다.

정의

기댓값이 μ=E(X)\mu = E(X)인 확률변수 XX에 대해:

Var(X)=E[(Xμ)2]=E(X2)(E(X))2\text{Var}(X) = E\left[(X - \mu)^2\right] = E(X^2) - (E(X))^2

표기법

  • Var(X)\text{Var}(X) 또는 V(X)V(X) - XX의 분산
  • σ2\sigma^2 (시그마 제곱) - 분산의 일반적인 기호
  • D(X)D(X) - 대체 표기법 (중국 교과서에서 사용)

두 가지 공식

공식 1: 정의식

Var(X)=E[(Xμ)2]=i=1n(xiμ)2pi\text{Var}(X) = E\left[(X - \mu)^2\right] = \sum_{i=1}^{n} (x_i - \mu)^2 \cdot p_i

공식 2: 계산식 (더 실용적)

Var(X)=E(X2)(E(X))2\text{Var}(X) = E(X^2) - (E(X))^2

암기 요령: "제곱의 평균 빼기 평균의 제곱"

분산의 성질

1. 비음수성

Var(X)0\text{Var}(X) \geq 0

등호는 XX가 상수일 때만 성립한다.

2. 상수 인수

Var(aX)=a2Var(X)\text{Var}(aX) = a^2 \cdot \text{Var}(X)

주의: 인수는 제곱된다.

3. 상수 더하기

Var(X+b)=Var(X)\text{Var}(X + b) = \text{Var}(X)

상수를 더해도 산포도는 변하지 않는다.

4. 결합 선형 변환

Var(aX+b)=a2Var(X)\text{Var}(aX + b) = a^2 \cdot \text{Var}(X)

5. 독립 변수의 합

XXYY독립이면: Var(X+Y)=Var(X)+Var(Y)\text{Var}(X + Y) = \text{Var}(X) + \text{Var}(Y)

경고: 종속 변수에는 성립하지 않는다!

6. 상수의 분산

Var(c)=0\text{Var}(c) = 0

주요 분포

분포분산
베르누이(pp)p(1p)p(1-p)
이항(n,pn, p)np(1p)np(1-p)
이산 균등({1,...,n}\{1,...,n\})n2112\dfrac{n^2-1}{12}

CSCA 연습 문제

💡 참고: 다음 연습 문제는 CSCA 시험 요강을 기반으로 설계되었습니다.

예제 1: 기초 (난이도 ★★☆☆☆)

확률변수 XX의 분포가 다음과 같다:

XX012
PP0.30.50.2

Var(X)\text{Var}(X)를 구하라.

풀이:

먼저 E(X)E(X)를 구한다: E(X)=0(0.3)+1(0.5)+2(0.2)=0+0.5+0.4=0.9E(X) = 0(0.3) + 1(0.5) + 2(0.2) = 0 + 0.5 + 0.4 = 0.9

E(X2)E(X^2)를 구한다: E(X2)=02(0.3)+12(0.5)+22(0.2)=0+0.5+0.8=1.3E(X^2) = 0^2(0.3) + 1^2(0.5) + 2^2(0.2) = 0 + 0.5 + 0.8 = 1.3

공식 적용: Var(X)=E(X2)(E(X))2=1.30.81=0.49\text{Var}(X) = E(X^2) - (E(X))^2 = 1.3 - 0.81 = 0.49

답: Var(X)=0.49\text{Var}(X) = 0.49


예제 2: 중급 (난이도 ★★★☆☆)

Var(X)=4\text{Var}(X) = 4일 때, Var(3X+2)\text{Var}(3X + 2)를 구하라.

풀이:

성질 Var(aX+b)=a2Var(X)\text{Var}(aX + b) = a^2 \cdot \text{Var}(X)를 이용하면: Var(3X+2)=32Var(X)=9×4=36\text{Var}(3X + 2) = 3^2 \cdot \text{Var}(X) = 9 \times 4 = 36

답: 3636


예제 3: 고급 (난이도 ★★★★☆)

E(X)=2E(X) = 2이고 E(X2)=8E(X^2) = 8일 때, Var(2X3)\text{Var}(2X - 3)을 구하라.

풀이:

먼저 Var(X)\text{Var}(X)를 구한다: Var(X)=E(X2)(E(X))2=84=4\text{Var}(X) = E(X^2) - (E(X))^2 = 8 - 4 = 4

그러면: Var(2X3)=22Var(X)=4×4=16\text{Var}(2X - 3) = 2^2 \cdot \text{Var}(X) = 4 \times 4 = 16

답: 1616

표준편차

표준편차는 분산의 제곱근이다: σ=Var(X)\sigma = \sqrt{\text{Var}(X)}

표준편차는 XX와 동일한 단위를 가지므로 해석이 더 용이하다.

분산 vs. 기댓값

성질기댓값 E(X)E(X)분산 Var(X)\text{Var}(X)
측정중심 (위치)산포 (분산도)
선형 변환E(aX+b)=aE(X)+bE(aX+b) = aE(X)+bVar(aX+b)=a2Var(X)\text{Var}(aX+b) = a^2\text{Var}(X)
항상 가법적독립일 때만 가법적

흔한 실수

❌ 실수 1: 계수를 제곱하는 것을 잊음

틀림: Var(3X)=3Var(X)\text{Var}(3X) = 3 \cdot \text{Var}(X)

맞음: Var(3X)=9Var(X)\text{Var}(3X) = 9 \cdot \text{Var}(X)

❌ 실수 2: 종속 변수의 분산을 더함

틀림: XXYY가 종속일 때, Var(X+Y)=Var(X)+Var(Y)\text{Var}(X+Y) = \text{Var}(X) + \text{Var}(Y)

맞음: 독립 변수에 대해서만 성립한다 ✓

❌ 실수 3: 분산과 표준편차를 혼동

틀림: 이항분포(n,pn,p)의 표준편차가 np(1p)np(1-p)이다 ✗

맞음: 분산이 np(1p)np(1-p)이고, 표준편차는 np(1p)\sqrt{np(1-p)}이다 ✓

학습 팁

  1. 계산 공식 사용: E(X2)(E(X))2E(X^2) - (E(X))^2가 대개 더 간편하다
  2. 계수는 제곱: Var(aX)=a2Var(X)\text{Var}(aX) = a^2\text{Var}(X)
  3. 독립성 확인: 분산의 합은 독립 변수에 대해서만 성립한다
  4. 이항분포 분산 암기: np(1p)np(1-p)는 자주 출제된다

💡 시험 팁: 분산을 계산할 때 항상 E(X)E(X)E(X2)E(X^2)를 먼저 따로 구하라. 계산 공식이 정의식보다 오류가 적다!