[1574] Trouble for Science

Title Text:Careful mathematical analysis demonstrates small-scale irregularities in Gaussian distribution<

Origin:https://xkcd.com/1574/

https://www.explainxkcd.com/wiki/index.php/1574:_Trouble_for_Science

该漫画突出了这样一个事实,即最近发表了一些广为人知的科学批评,这些批评引发了对一些普遍接受的科学方法的质疑。对于科学家来说,这些批评可以提醒任何方法过度自信的危险,希望能够引导那些天真接受结果的人记住任何科学结论本质上是暂时性的,并受到方法论可靠性的限制。然而,这些论文的大众新闻报道可能会引起普通公众对科学素养的适度印象,即科学可能会遇到麻烦,正如标题所暗示的那样。这些方法论问题和缺点中的一些在科学界是众所周知的,但是“无论好坏”是最好的工具包科学今天可以使用的。然而,最后(虚构的)标题极大地夸大了这一点,这表明本生燃烧器实际上具有冷却效果,这当然是绝对荒谬的,但仍会大大改变一个更基本的科学信念。此外,每个标题都包含讽刺或双重含义的滑稽效果。

显示了五篇科学文章的标题:

许多基于商业抗体的免疫测定是不可靠的

这句话是真的。参见Kebaneilwe Lebani,用于开发血清分型登革热病毒NS1捕获试验的抗体发现,2014年。在这篇博士论文中,给出了11篇参考文献。

将p值作为重要指标的问题

在实证研究中,人们通常对人口中的影响/结果/关系感兴趣。然而,由于实际原因,研究人员只能获得较小的人口子集。这些被称为样本。通常使用样品测试感兴趣的效果。假设检验的目的是确定样本中观察到的效应(或缺乏效应)是否是我们特定样本的随机假象,或者它是否也很有可能存在于群体中。

通常,零假设表明在群体中没有影响,而备选假设表明存在影响。

P值用于假设检验。 p值是在样本数据中观察效果/结果/关系的概率,因为群体中不存在这样的效果/结果/关系。它基于样本数据和特定统计量(例如样本平均值,t或F)。统计量是基于样本的计算结果。可以针对每个感兴趣的统计值计算p值。形式上,假设零假设为真,则p值是观察测试统计量等于或大于基于​​样本数据的统计量的概率。

p值截止值的阈值α是预先指定的(通常为5%或1%,这是更保守的)。当p值低于或等于α时,拒绝零假设以支持备选假设。当它高于α时,保留原假设。

用于α的值由Fisher提出并且是任意的。

使用p值作为统计显着性的度量经常被批评,例如在Hubbard和Lindsay中。兰德尔过去在882年证明了这个问题:很重要。

实验室啮齿动物的过度喂养会影响动物模型

Keenan等。提出这个案子。此外,单词模型有两个含义。从某种意义上说,模型可以指的是一种理解现象的科学描述;在另一种意义上,模特可以指的是一个人,他的工作是展示时尚,通常是时髦的服装。时装模特因超薄而臭名昭着,因此过度喂食会影响他们作为模特的工作。

复制研究无法重现许多已发表的结果

复制研究是一项研究,旨在通过对不同的受试者和实验者使用相同的方法来复制先前研究的结果。它旨在重建结果,以获得对先前研究结果的信心,并确保先前研究的结果可转移到其他类似的研究领域。

兰德尔可能指的是最近在自然界中描述的这项研究:超过一半的心理学研究未通过重复性测试。它也可能是对这里提到的至少3项研究的参考:http://www.jove.com/blog/2012/05/03/studies-show-only-10-of-published-science-articles-are-可重复的 – 什么 – 是 – 发生。在标题的措辞中也有讽刺意味,因为生物复制是一种复制形式。

对这一标题的另一种可能的解释是,复制研究可能成功地复制了其设计的特定研究的结果,但未能复制许多其他无关研究的公布结果。关于在本研究中考虑了哪些结果,标题非常模糊。对照试验显示本生燃烧器使事情变得更冷

这部漫画的主题是普遍接受的科学方法可能是不可靠的,这里的笑话是,新发现的本生灯是一种用来加热东西的装置,而不是总是冷却东西,这是荒谬的。

理论上,是的,将本生燃烧器置于一个已经非常热的物体下方,慢慢地使火焰和物体之间的温度均衡,从而导致冷却。鉴于本生燃烧器在1000 K和2000 K之间燃烧,如果测试材料已经比火焰(超过2000 Kelvin)更热,则可能存在一些方法错误。如果“对照试验”涉及本生燃烧器没有点燃但是打开以允许气体流动,那么它也可能具有冷却效果,因为气体从管线压力膨胀到大气压力。另一种替代理论是冷物质,例如冷水或寒冷空气,通过燃烧器进入较温暖的物体。

或者,可以设置试验以一方面对本生灯进行测试,另一方面对更热的火焰进行测试。与较热的火焰相比,本生灯不会对被测材料加热太多,导致某些东西比替代品更“冷”。

与之前的标题一样,理解这个笑话的关键是检查标题的模糊性,因为没有给出关于如何控制试验的线索。

仔细的数学分析证明了高斯分布中的小规模不规则性

这是一个明显不真实的前提的另一个笑话。高斯分布是一种数学结构,通常称为钟形曲线或正态分布。由于它是理想的数学结构,根据定义,它不会有任何不规则性 – 类似于方程式y = 2x + 1不能有小规模的不规则性。这个笑话可能暗示了这样一个事实,即许多类型的观察通常最初被建模为高斯分布,尽管仔细观察结果的实际分布通常会偏离纯高斯分布。

此外,测试高斯分布的实验将具有有限的样本大小,从而给出非精确的高斯分布。提交的一份可能的论文将得出结论,这一结果是“大致正常分布”,“小规模的违规行为”。一个不了解统计数据的新闻记者可能很容易误解这篇论文决定性地总结了数学定义中的错误(而不是来自实验中固有的随机误差)。

You May Also Like

More From Author

Leave a Reply

Your email address will not be published. Required fields are marked *