Title Text:We’ve tested it on 30 different days and it hasn’t gotten one wrong yet.
Origin:https://xkcd.com/2236/
https://www.explainxkcd.com/wiki/index.php/2236:_Is_it_Christmas%3F
我們在三十個不同的日子做過測試,都沒有出錯。
https://xkcd.tw/2236
兰德尔在这里制作了漫画,几乎总是可以正确地判断是圣诞节。圣诞节是每年12月25日在西方世界庆祝的一个假期。这也适用于仅持续一天的任何年度活动。
兰德尔列出的舍入率为99.73%。如果不进行without年计算,则364/365表示99.726027397%的精度。用leap年计算得出364.2425 / 365.2425:约99.726209299%。或仅在a年运行计算即可得出365/366(99.7267759562%)。由于所有三个数字均取整为99.73%,因此列出的百分比在所有三个方面都是正确的。
尽管兰德尔(Randall)对准确性的主张是正确的,但仅靠准确性并不能使预测装置有用。在这种情况下,页面未命中率或错误否定率,即漫画预测的不是圣诞节的正向条件天(圣诞节)的百分比为100%。换句话说,它错过了圣诞节的所有实际事件。
在为稀有事件建立模型时,一个常见的错误是忽略了内置于二进制事件的标准预测准确性有效性统计中的隐式成本函数。预测准确性(正确的预测数/总的猜测数)假设误报和误报同样不好。给定此性能统计信息的隐含成本函数,性能最佳的模型通常是持久性预测模型-即,无论模型输入是什么,最优预测模型都会返回最常见的值。使用性能统计信息优化模型可能是一个更好的选择,该性能统计信息依赖于代价函数,对损失的罕见事件的正确预测的惩罚要比对损失的常见事件的正确预测的惩罚要大。
实际上,在大多数情况下,单个结果比任何其他结果都普遍得多,总是预测最常见的结果将产生非常高的准确性,而没有任何用处。找到比Randall更为准确的示例并不难:
- 如果对艾滋病患者进行无用的检测,结果总是阴性,那么将其用于随机人群的准确率约为99.95%,如果在艾滋病流行率较低的国家使用,则准确性更高。
- 在网上说“您不是漫画家Randall Munroe”对99.9999999857%的人来说是正确的。
https://isitchristmas.com/是一个网站,类似于相声,用NO印刷如果不是圣诞节,和YES如果它是圣诞节。该网站会检查计算机的当前日期,如果确实是圣诞节,则会进行相应更新。兰德尔的漫画并没有做任何事情,但是如上所述,在大多数情况下还是正确的。另外,isitchristmas.com用您所在地区的语言给出答案(即,来自加拿大的访客将用英语和法语给出答案,以说明加拿大的双语性);试纸只给出英语的固定答案。
标题文本是其服务有效的“证明”。他声称已在30个不同的天对此进行了测试,并确认“否”是正确的结果。除圣诞节外的任何日期都将得出正确的结果。
这可能是对短语“时钟坏了,每天两次正确”的引用