方差
在概率论和统计学中,方差(英语:variance)描述的是一个随机变量的离散程度
即一组数字与其平均值之间的距离的度量,是随机变量与其总体均值或样本均值的离差的平方的期望值。
方差是标准差的平方、分布的二阶矩,以及随机变量与其自身的协方差。
其常用的符号表示有 $\sigma^2, s^2 、 \operatorname{Var}(X), V(X)$ 以及 $\mathbb{V}(X)$ 。
定义
设 $X$ 为服从分布 $F$ 的随机变量,如果 $\mathrm{E}[X]$ 是随机变量 $X$ 的期望值
则随机变量 $X$ 或分布 $F$ 的方差为「 $X$ 的离差平方的期望值」,即
方差的表达式可展开如下
也就是说,$X$ 的方差等于「 $X$ 平方的期望减去 $X$ 期望的平方」。
该等式不应该用于浮点运算,因为如果等式的两个成分大小相似,将会造成灾难性抵消。
方差的性质
方差不会是负的,因为平方运算结果为非负数:
一个常数随机变量的方差为零。反之,若有限个数组成的资料集方差为零,则其内所有数皆相等。
对于一般随机变量,也有类似结论,即方差为零推出该变量几乎总是取同一个值:
方差不变于定位参数的变动。
也就是说,如果一个常数被加至一个数列中的所有变量值,此数列的方差不会改变:
如果所有数值被放大一个常数倍,方差会放大此常数的平方倍:
两个随机变量合的方差为:
此处的 $\mathrm{Cov}(X,Y)$ 代表协方差。(然而我还不会,QAQ)
对于 $N$ 个随机变量 $\left\{X_1, \ldots, X_N\right\}$ 的总和:
总体方差和样本方差
总体方差
一般而言,一个有限的容量为 $N$ 、元素的值为 $x_i$ 的总体的总体方差为:
其中总体均值为:
总体方差也可用下式计算:
该式成立,是因为:
总体方差与生成该总体的概率分布的方差相匹配。因此, “总体”的概念可推广到具有无限总体的连续随机变量。
样本方差
咕咕咕,这里暂时还没写
参考文献: