大误 · 我是预言家,这不是一个平安夜

知乎日报 大象 382℃ 评论

大误 · 我是预言家,这不是一个平安夜

图片:编辑瞎说的

两个预言家,一个准确率 90%,一个准确率 30%,他们都预言了末日降临,那么末日降临的概率是多少呢?

大象

这个题目给出的信息不完全,因此无法计算世界末日的概率。

首先要正确理解准确率的概念。

准确率 accuracy 是 P(预测末日,末日)+P(预测非末日,非末日),即在末日时候猜对末日,和非末日的时候猜对非末日两个部分。而大多数答案却理解成了阳性预测值:P(末日|预测末日)或者灵敏度 P(预测末日|末日)。

图中 a+d/a+b+c+d 是每一个预言家预测的准确率,可见,如果我们只有准确率,那么 a 和 d 有无穷多种组合的可能,其具体的比例是无法得到了。

本题中要计算的概率为,当两个预言家预测都为末日时,末日发生的条件概率,即P(末日|预测末日 1,预测末日 2).

从逻辑上来看

预言家的预测是基于末日的原因,是比较复合逻辑的,可以看到,两个预言家的预测是条件独立于末日原因,但边际不独立。如果末日的原因决定了末日是否发生,那么预言家的预测也会条件独立于末日。

假设末日为 E,预测分别为 P1 和 P2。

其中分子和分母的部分可以继续利用上面的条件独立假设分解。

因此,我们要么需要

五个独立的参数,或者知道 P1 和 P2 联合分布才能计算。从题干中,我们只有两个方程,解不出五个参数。

注意:这里的 P(P1|E) 不等于 1 - P(P1|Not E), @Bayes

举个极端的例子,如果末日从未发生过,a+c=0,那么即使预言家都预测会发生末日,末日发生的条件概率 P(末日|预测末日 1,预测末日 2)依然为 0,因为预言家的准确率都来自对非末日的预测 b+d(一共预测 100 次,其中预言家 1 预测了 10 次末日,预言家 2 预测了 70 次末日)。

又比如生活中的例子:如果垃圾邮件的比例是 0.00001。现在有两个“垃圾”分类器,分别完全地随机地把 10%和 70%的邮件标记为垃圾邮件,那么这两个分类器的准确率分别是 90%和 30%。然而这两个分类器本身就是随机标记,它们达成共识并不能提供任何邮件是否属于垃圾邮件的信息。

转载请注明:微图摘 » 大误 · 我是预言家,这不是一个平安夜

喜欢 (0)or分享 (0)
发表我的评论