两点分布(伯努利分布)
两点分布的应用非常广泛,如抽取的彩票是否中奖,买回的一件产品是否为正品,新生婴儿的性别,投篮是否命中等,都可以用两点分布来研究。
基本概念
伯努利分布,又名 两点分布 或者 0-1分布 ,是一个离散型概率分布,为纪念瑞士科学家雅各布·伯努利而命名。
- 若伯努利试验成功,则伯努利随机变量取值为 \(1\)
- 若伯努利试验失败,则伯努利随机变量取值为 \(0\) 。
记其成功概率为 \(p(0\le p\le 1)\) ,失败概率为 \(q = 1 - p\) ,则
其概率质量函数为 \[ f_X(x) = p^x(1-p)^{1-x} = \begin{cases}p & \text { if } x=1 \\ q & \text { if } x=0\end{cases} \]
其期望值为 \[ \operatorname{E}[X] = \sum_{i=0}^{1} x_i f_X(x) = 0 + p = p \]
其方差为 \[ \begin{aligned} \operatorname{Var}[X] &=\sum_{i=0}^1\left(x_i-\operatorname{E}[X]\right)^2 f_X(x) \\[6pt]&=(0-p)^2(1-p)+(1-p)^2 p \\[6pt]&=p(1-p) \\[6pt]&=p q \end{aligned} \]
高中一般称伯努利分布为两点分布。
基本的应用也就算出 \(X=0\) 的概率,然后用 \(1- \mathrm{P}(X=0)\) 算出 \(\mathrm{P}(X=1)\) 的概率。
高中一般直接写 \(\mathrm{P}(X = k)\) 即可,更一般的写法为 \(\mathrm{Pr}(X = k)\) 。(probability的缩写)
常见误区
随机试验的结果不是只能用 \(0,1\) 表示,也可以设为 \(1\) 和 \(2\) 。
因为随机变量只是把随机试验可能发生的结果数量化。
我们甚至可以设为 \(98\) 和 \(100\) ,只不过我们为了方便起见,用 \(0\) 和 \(1\) 。
服从两点分布的随机变量,可能发生的结果不是 \(1\) 就是 \(0\) ,但是它们发生的概率不一定是 \(\frac{1}{2}\)。
例如,有 \(10\) 颗豆子,\(9\) 颗红的,\(1\) 颗绿的。
从中随机取出 \(1\) 颗豆子的颜色虽然也服从两点分布,
但取出 \(1\) 颗豆子是红豆的概率为 \(\frac{9}{10}\) ,是绿豆的概率为 \(\frac{1}{10}\) ,二者不相等。
究其原因,还是因为样本空间中这两者对应的样本点的数量不相等。
例题
例:袋中有 \(5\) 个白球, \(6\) 个红球,从中摸出两球,记 \(X = \begin{cases}0,&\texttt{两球均为红色}\\1,&\texttt{两球不全为红色}\end{cases}\) ,求随机变量 \(X\) 的分布列。
解:先求出 \(\mathrm{P}(X=0)\) ,再用 \(1-\mathrm{P}(X=0)\) 来算 \(\mathrm{P}(x=1)\) 。
答:由题意知, \(X\) 服从两点分布, 则 \[ \mathrm{P}(X = 0) = \frac{\binom{6}{2}}{\binom{11}{2}} = \frac{3}{11} \] 所以 \[ \mathrm{P}(X = 1) = 1 - \frac{3}{11} = \frac{8}{11} \] 所以随机变量 \(X\) 的分布列为
\(X\) | \(0\) | \(1\) |
---|---|---|
\(\mathrm{P}(X)\) | \(\frac{3}{11}\) | \(\frac{8}{11}\) |
参考文献:
[1] https://zh.wikipedia.org/wiki/%E4%BC%AF%E5%8A%AA%E5%88%A9%E5%88%86%E5%B8%83