Title Text:We reject the null hypothesis based on the ‘hot damn, check out this chart’ test.
Origin:https://xkcd.com/2400/
https://www.explainxkcd.com/wiki/index.php/2400:_Statistics
统计
http://xkcd.in/comic?lg=cn&id=2400
此漫画处于另一漫画系列漫画相关的2020流感大流行的的冠状 SARS-CoV的-2 ,这将导致COVID-19。
图形[编辑]
漫画的主要焦点是一张图表,显示了两组COVID-19的病例与时间的关系:一组接受了疫苗接种,另一组没有进行疫苗接种。图形是使数据可视化的方法,对于实际数据则表示特定的值。该图似乎是基于Moderna疫苗的结果但有些虚构。较高的线(“安慰剂组”)以陡峭的曲线上升。较低的线(“疫苗组”)跟随第一条线,但随后趋于平缓,爬升速度慢得多。正式地,对任何事物的有效性进行科学评估需要严格的统计分析。在医学研究中尤其如此,因为生物学的影响可能非常复杂并且受许多因素的影响,这意味着必须仔细检查数据以确认干预是有效的。这个漫画的笑话是,这里提出的干预是如此明显即使对于不懂数学的外行也很明显。接种疫苗后的几天,接种组的病例基本呈扁平状,而安慰剂组的病例以明显的比率继续上升。数据是如此“好”,这意味着治疗组和对照组的数字差异很大,以至于实际分析几乎是一种形式:一看图表就会使大多数人相信这种治疗是有效的。
这本漫画发布一天后,FDA的12月17日简报文件为Moderna的COVID-19疫苗被释放。该文件包括以下图表。图表绘制的是发病率数据的积分,而不是数据本身(“累积”而不是“比率”):这会导致图表左侧的疾病发生率变化,并添加到右侧的数据中,扩大他们的差异。强调数据的这项技术是有效的:如果效果持续发生,则线之间的差异只会继续增加,因此右侧的总差异与疫苗的总体效果成正比。图表未显示有关其他可能变量的任何信息。兰德尔以前在他的网络漫画中曾描述过如何制作非常清晰的图表来隐藏误导性数据。链接的图不会忽略数字,
这里的建议可以看作是2311年的“科学技巧”的倒数:置信区间,其中的数据是如此糟糕,其误差线落在图形之外,因此没有显示。此外,还有与1725相关联的一些东西:线性回归,其中数据不是很好,您不需要执行线性分析。
零假设[编辑]
标题文本中提到的零假设是统计分析中的假设,该假设指示未发生分析研究的效应,即零效应中的“零”。例如,该研究的无效假设可能是“疫苗对受试者是否感染COVID没有影响”。零假设以前是892:零假设的主题。当原假设为真时,如果像观察到的数据之类的概率非常低,则原假设被拒绝。
举一个简化的例子,假设接种疫苗的人群有1万,在原假设下,每个人都有5%的机会感染COVID。我们预计有500人会感染COVID。如果只有490个捕获COVID,则零假设仍然成立,但如果只有10个,则赔率是(Python中;请参见二项分布)sum([math.comb(10000, i) * 0.05**i * 0.95**(10000-i) for i in range(0,10)])
= 1.5×10 -204。换句话说,无效的疫苗将产生如此优异的结果是极不可能的。因此,我们得出结论,该疫苗不是无效的,并且已经拒绝了原假设。
但是,大多数人看到原始结果后会得出结论,该疫苗起作用了,统计数字只是一种形式。就像标题文字所说的那样,他们将“拒绝基于“该死的,检查这张图”检验的零假设。”