条件概率:三硬币问题
坑边闲话:以前我的社长,每次跟我讨论概率问题时,都特别强调,“我们所有的概率观测,实际上都是条件概率”。之前我不太懂这句话是什么,但是今天推导“三硬币问题”的时候,我发现用条件概率模型更加简单。
三硬币模型:假设有 3 个硬币,标号为
再次提醒:你只能看到连续多次实验的结果,对于
、 、 一无所知。现在要求你根据观测结果,恢复 、 、 .
现在猜测一下,如果结果中频繁出现正面,那么说明硬币
1. 解题思路·
为了方便建立公式,我们令
另设随机变量
另外,中间的硬币
再次强调,随机变量
那么根据全概率公式,我们有:
$$ \mathbb{P}{\theta}(y) = \sum_z{\mathbb{P}{\theta}(y,\ z)} $$
提醒:这种形式可能在国内教科书上不常见,但是更加合理,不要再用 “
” 来划分观测变量和已知情况了。
现在我们的目标是把上式中的
对于条件概率下的联合概率,只需要把它们看作一个整体就可以,所以再次根据条件下的联合概率公式,就有
$$ \begin{aligned} \mathbb{P}{\theta}(y) &= \sum_z{\mathbb{P}{\theta}(y,\ z)} \ &= \sum_z{\mathbb{P}{\theta}(z)\cdot \mathbb{P}{\theta,\ z}(y)} \end{aligned} $$
上述概率其实非常简单,根据样本空间理论,可以画个 Venn 图:
通过图 1,我们可推导一下:
通过
$$ \begin{aligned} \mathbb{P}{\theta}(y) &= \sum_z{\mathbb{P}{\theta}(y,\ z)} \ &= \sum_z{\mathbb{P}{\theta}(z)\cdot \mathbb{P}{\theta,\ z}(y)}\ &= \pi py(1-p){1-y} + (1-\pi)qy(1-q){1-y} \end{aligned} $$
公式解释:
有两种结果:当 朝上,$\mathbb{P}{\theta}(z) \pi A y B \mathbb{P}{\theta,\ z}(y) p y C \mathbb{P}_{\theta,\ z}(y) q y$ 只是为了方便描述两种情形而已。
自此我们就成功地将观测结果与
考虑重复这个实验很多次,得到了一列观测结果
$$ \mathbb{P}{\theta}(Y) = \sum{Z}\mathbb{P}{\theta}(Z)\mathbb{P}{\theta,\ Z}(Y) $$
坑边闲话:其实写成上述矩阵、向量的形式没什么意义,只是看着好看而已。
写成一般形式,就是:
$$ \mathbb{P}{\theta}(Y) = \prod{j=1}^{n}\pi p{y_j}(1-p){1-y_j} + (1-\pi)q{y_j}(1-q){1-y_j} $$
一串独立同分布的随机变量,出现一串值,自然是每个单独取值概率的乘积。
这时候调用 EM 算法,求模型参数
总结·
三硬币模型是一个很有趣的问题,描述背后的原理不难,用极大似然估计求出参数才是有技术含量的。接下来我将利用最大期望方法求解该问题。
Cover 劳动节第三篇文章