Title Text:P((B|A)|(A|B)) represents the probability that you’ll mix up the order of the terms when using Bayesian notation.
Origin:https://xkcd.com/2545/
https://www.explainxkcd.com/wiki/index.php/2545:_Bayes%27_Theorem
贝叶斯定理
http://xkcd.in/comic?lg=cn&id=2545
给定与事件相关的条件的知识,贝叶斯定理描述了事件的概率。它通常用于在给定结果的情况下更新起始条件发生的概率。当所涉及的概率非常小时,这可能会揭示不直观的结果。例如,当对大量人进行罕见疾病检测时,即使是相当准确的检测也会产生比实际患有该疾病的人数更多的假阳性,因此阳性结果更可能是假的而不是真的。
检测呈阳性 | 测试为阴性 | 全部的 | |
做作的 | 0.1% | 0.0% | 0.1% |
不受影响 | 0.9% | 99% | 99.9% |
全部的 | 1% | 99% | 100% |
例如,如果一项测试的灵敏度为 100%(第一行,所有受影响的人都收到阳性结果)和 99% 的特异性(第二行,1% 的未受影响者也收到阳性结果),则阳性测试的解释取决于该疾病在人群中的流行程度。在示例案例中,流行率为 0.1%(第三列),因此当测试结果为阳性(1% 的测试,左列)时,受试者实际上十有八九不受影响。尽管这将是一个非常高效的测试,但考虑到所涉及的相对流行率,它将在所有阳性结果中产生压倒性的假阳性。(但是,在这个例子中,所有被告知他们没有危险的人——几乎是检测呈阳性的人数的一百倍——都得到了正确的通知。)
对于同一个例子,贝叶斯公式给出:
-
- P(受影响 | 阳性)= P(阳性 | 受影响)* P(受影响)/ P(阳性)= 100% * 0.1% / 1% = 10%
- 和 P( 未受影响 | 阳性 ) = P( 阳性 | 未受影响 ) * P( 未受影响 ) / P( 阳性 ) = 0.9009% * 99.9% / 1% = 90%
在这部漫画中,一位老师提出了一个问题,学生们应该使用贝叶斯定理来解决这个问题。然而,课外学生知道他们正在研究贝叶斯定理,因此他们使用先验知识来猜测此类问题的通常答案。妙语是标题 – 学生不需要进行计算,因为他们熟悉涉及贝叶斯定理的问题以及他们如何经常呈现违反直觉的结果来说明普遍性对计算的重要性。
这里可能还有一种自我参照的情况,即学生已经多次更新他们的先验概率,以确定对涉及贝叶斯定理的问题的答案是否为“是”。如果他们对每个此类问题回答“是”的方法在此之前通过贝叶斯定理每次都成功,那么他们将有很多理由继续这样做,直到他们开始弄错为止。要求回答“否”的贝叶斯定理问题的普遍性可能足够小,以至于这种情况不会发生在任何少数情况下,因此在那个时间点之前,他们对误报率一无所知。这可以解释为对贝叶斯统计的批评,贝叶斯统计可能会将判断视为合理的(例如
标题文字参考了贝叶斯定理的数学定义:P(A | B) = P(B|A) * P(A) / P(B)。在这里,P(A|B) 表示某个事件 A 发生的概率,前提是 B 已经发生。这通常被称为“A 给定 B 的概率”。可能很难记住 P(A|B) 是指给定 B 的概率,还是给定 A 的 B,尤其是在谈论给定较晚原因的较早原因的概率时。兰德尔的笑话就是基于这个困难。这里 P((B|A)|(A|B)) 意味着你写出(B|A)的概率,给定正确的表达式是 (A|B),这使得它成为你写出(B|A) 的概率把符号的顺序搞混了。