嘘~ 正在从服务器偷取页面 . . .

方差


方差

在概率论和统计学中,方差(英语:variance)描述的是一个随机变量的离散程度

即一组数字与其平均值之间的距离的度量,是随机变量与其总体均值或样本均值的离差的平方的期望值。

方差是标准差的平方、分布的二阶矩,以及随机变量与其自身的协方差。

其常用的符号表示有 \(\sigma^2, s^2 、 \operatorname{Var}(X), V(X)\) 以及 \(\mathbb{V}(X)\)


定义

\(X\) 为服从分布 \(F\) 的随机变量,如果 \(\mathrm{E}[X]\) 是随机变量 \(X\) 的期望值

则随机变量 \(X\) 或分布 \(F\) 的方差为「 \(X\) 的离差平方的期望值」,即 \[ \operatorname{Var}(X)=\mathrm{E}\left[(X-\mu)^2\right] \] 方差的表达式可展开如下 \[ \begin{aligned} \operatorname{Var}(X) &=\mathrm{E}\left[(X-\mathrm{E}[X])^2\right] \\ &=\mathrm{E}\left[X^2-2 X \mathrm{E}[X]+\mathrm{E}[X]^2\right] \\ &=\mathrm{E}\left[X^2\right]-2 \mathrm{E}[X]^2+\mathrm{E}[X]^2 \\ &=\mathrm{E}\left[X^2\right]-\mathrm{E}[X]^2 \end{aligned} \] 也就是说,\(X\) 的方差等于「 \(X\) 平方的期望减去 \(X\) 期望的平方」。

该等式不应该用于浮点运算,因为如果等式的两个成分大小相似,将会造成灾难性抵消


方差的性质

方差不会是负的,因为平方运算结果为非负数: \[ \operatorname{Var}(X) \geq 0 \] 一个常数随机变量的方差为零。反之,若有限个数组成的资料集方差为零,则其内所有数皆相等。

对于一般随机变量,也有类似结论,即方差为零推出该变量几乎总是取同一个值: \[ P(X=a)=1 \Leftrightarrow \operatorname{Var}(X)=0 \] 方差不变于定位参数的变动。

也就是说,如果一个常数被加至一个数列中的所有变量值,此数列的方差不会改变: \[ \operatorname{Var}(X+a)=\operatorname{Var}(X) \] 如果所有数值被放大一个常数倍,方差会放大此常数的平方倍: \[ \operatorname{Var}(a X)=a^2 \operatorname{Var}(X) \] 两个随机变量合的方差为: \[ \begin{aligned} &\operatorname{Var}(a X+b Y)=a^2 \operatorname{Var}(X)+b^2 \operatorname{Var}(Y)+2 a b \operatorname{Cov}(X, Y), \\ &\operatorname{Var}(X-Y)=\operatorname{Var}(X)+\operatorname{Var}(Y)-2 \operatorname{Cov}(X, Y) \end{aligned} \] 此处的 \(\mathrm{Cov}(X,Y)\) 代表协方差。(然而我还不会,QAQ

对于 \(N\) 个随机变量 \(\left\{X_1, \ldots, X_N\right\}\) 的总和: \[ \operatorname{Var}\left(\sum_{i=1}^N X_i\right)=\sum_{i, j=1}^N \operatorname{Cov}\left(X_i, X_j\right)=\sum_{i=1}^N \operatorname{Var}\left(X_i\right)+\sum_{i \neq j} \operatorname{Cov}\left(X_i, X_j\right) \]


总体方差和样本方差

总体方差

一般而言,一个有限的容量为 \(N\) 、元素的值为 \(x_i\) 的总体的总体方差为: \[ \begin{aligned} \sigma^2 &=\frac{1}{N} \sum_{i=1}^N\left(x_i-\mu\right)^2 \\[8pt]&=\frac{1}{N} \sum_{i=1}^N\left(x_i^2-2 \mu x_i+\mu^2\right) \\[8pt]&=\left(\frac{1}{N} \sum_{i=1}^N x_i^2\right)-2 \mu\left(\frac{1}{N} \sum_{i=1}^N x_i\right)+\mu^2 \\[8pt]&=\left(\frac{1}{N} \sum_{i=1}^N x_i^2\right)-\mu^2 \end{aligned} \] 其中总体均值为: \[ \mu=\frac{1}{N} \sum_{i=1}^N x_i . \] 总体方差也可用下式计算: \[ \sigma^2=\frac{1}{N^2} \sum_{i<j}\left(x_i-x_j\right)^2=\frac{1}{2 N^2} \sum_{i=1}^{N}\sum_{j=1}^N\left(x_i-x_j\right)^2 . \]

该式成立,是因为: \[ \begin{aligned} & \frac{1}{2 N^2} \sum_{i, j=1}^N\left(x_i-x_j\right)^2 \\[8pt]=& \frac{1}{2 N^2} \sum_{i, j=1}^N\left(x_i^2-2 x_i x_j+x_j^2\right) \\[8pt]=& \frac{1}{2 N} \sum_{j=1}^N\left(\frac{1}{N} \sum_{i=1}^N x_i^2\right)-\left(\frac{1}{N} \sum_{i=1}^N x_i\right)\left(\frac{1}{N} \sum_{j=1}^N x_j\right)+\frac{1}{2 N} \sum_{i=1}^N\left(\frac{1}{N} \sum_{j=1}^N x_j^2\right) \\[8pt]=& \frac{1}{2}\left(\sigma^2+\mu^2\right)-\mu^2+\frac{1}{2}\left(\sigma^2+\mu^2\right) \\[8pt]=& \sigma^2 \end{aligned} \]

总体方差与生成该总体的概率分布的方差相匹配。因此, “总体”的概念可推广到具有无限总体的连续随机变量。

样本方差

咕咕咕,这里暂时还没写


参考文献

[1] 方差 - 维基百科,自由的百科全书


文章作者: q779
版权声明: 本博客所有文章除特别声明外,均采用 CC BY-NC-ND 4.0 许可协议。转载请注明来源 q779 !
评论
  目录