方差(英语:Variance),应用数学里的专有名词。在概率论和统计学中,一个随机变量的方差描述的是它的离散程度,也就是该变量离其期望值的距离。一个实随机变量的方差也称为它的二阶矩或二阶中心动差,恰巧也是它的二阶累积量。这里把复杂说白了,就是将各个误差将之平方(而非取绝对值,使之肯定为正数),相加之后再除以总数,透过这样的方式来算出各个数据分布、零散(相对中心点)的程度。继续延伸的话,方差的正平方根称为该随机变量的标准差(此为相对各个数据点间)。
方差定义
设X为服从分布F的随机变量, 如果E[X]是随机变数X的期望值(平均数μ=E[X])
随机变量X或者分布F的方差为:
Var(X)=E[(X–μ)2]
这个定义涵盖了连续、离散、或两者都有的随机变量。方差亦可当作是随机变量与自己本身的协方差:
Var(X)=Cov(X,X)
方差典型的标记有Var(X),σX2, 或是σ2,其表示式可展开成为:
Var(X)=E[X2–2XE[X]+(E[X])2]=E[X2]–2E[X]E[X]+(E[X])2=E[X2]–(E[X])2
上述的表示式可记为”平方的期望减掉期望的平方”。
离散随机变量
如果随机变量X是具有概率质量函数的离散概率分布x1↦p1,…,xn↦pn,则:
Var(X)=i=1∑npi⋅(xi–μ)2=i=1∑n(pi⋅xi2)–μ2
此处μ 是其期望值, i.e.
mu=i=1∑npi⋅xi.
当X为有N个相等概率值的平均分布:
Var(X)=σ2=N1i=1∑N(xi–μ)2=N1(i=1∑Nxi2–Nμ2)
N个相等概率值的方差亦可以点对点间的方变量表示为:
Var(X)=N21i=1∑Nj=1∑N21(xi–xj)2
连续型随机变量
如果随机变量X是连续分布,并对应至概率密度函数f(x),则其方差为:
Var(X)=σ2=∫(x−μ)2f(x)dx=∫x2f(x)dx−μ2
此处μ 是一期望值,
μ=∫xf(x)dx,
且此处的积分为以X为范围的x定积分(definite integral)
如果一个连续分布不存在期望值,如柯西分布(Cauchy distribution),也就不会有方差(不予定义)。
方差特性
方差不会是负的,因为次方计算为正的或为零:
Var(X)≥0
一个常数随机变量的方差为零,且当一个资料集的方差为零时,其内所有项目皆为相同数值:
P(X=a)=1⇔Var(X)=0
方差不变于定位参数的变动。也就是说,如果一个常数被加至一个数列中的所有变量值,此数列的方差不会改变:
Var(X+a)=Var(X).
如果所有数值被放大一个常数倍,方差会放大此常数的平方倍:
Var(aX)=a2Var(X)
两个随机变量合的方差为:
Var(aX+bY)=a2Var(X)+b2Var(Y)+2abCov(X,Y),
Var(X−Y)=Var(X)+Var(Y)−2Cov(X,Y),
此数Cov(., .)代表协方差。
对于N个随机变量X1,…,XN的总和:
Var(i=1∑NXi)=i,j=1∑NCov(Xi,Xj)=i=1∑NVar(Xi)+i=j∑Cov(Xi,Xj)
在样本空间Ω上存在有限期望和方差的随机变量构成一个希尔伯特空间: L2(Ω,dP),不过这里的内积和长度跟协方差,标准差还是不大一样。 所以,我们得把这个空间“除”常变量构成的子空间,也就是说把相差一个常数的 所有原来那个空间的随机变量做成一个等价类。这还是一个新的无穷维线性空间, 并且有一个从旧空间内积诱导出来的新内积,而这个内积就是协方差。
一般化
如果X是一个向量其取值范围在实数空间Rn,并且其每个元素都是一个一维随机变量,我们就把X称为随机向量。随机向量的方差是一维随机变量方差的自然推广,其定义为E[(X − μ)(X − μ)T],其中μ = E(X),XT是X的转置。这个方差是一个非负定的方阵,通常称为协方差矩阵。
如果X是一个复数随机变量的向量(向量中每个元素均为复数的随机变量),那么其方差定义则为E[(X − μ)(X − μ)],其中X是X的共轭转置向量或称为埃尔米特向量。根据这个定义,方差为实数。