Title Text:Baseballs do present a challenge to this theory, but I’m convinced we just haven’t found the right seasoning.
Origin:https://xkcd.com/2893/
https://www.explainxkcd.com/wiki/index.php/2893:_Sphere_Tastiness
球状美食
https://xkcd.in/comic?lg=cn&id=2893
这幅漫画描绘了四种大致呈球形物体的美味程度与大小的关系:甜瓜、葡萄、地球和月球。基于甜瓜和葡萄在这个上下文中对于大多数人来说相对较小且美味,以及行星规模的物体相对较大且主要由一般认为一点也不美味的岩石和金属组成的事实,兰德尔推测存在一个中间体,直径约为800米,”味道还不错”。
这是连续第二区漫画以水果、图表和预测为主题(在2892:香蕉价格之后),并延续了使用对数轴标度以便于绘制线性回归的主题。在这里,线条是在已知数据之间内插的,而不是向外推算。这样的内插在科学分析中相当常见,通常很有用,但这个例子显然得出了荒谬的结论。利用这样的荒谬分析来展示有缺陷和/或草率的方法论的危险是xkcd中的一个常见主题。
这种分析存在多种缺陷,因此结论是站不住脚的:
仅有四个数据点,这不足以进行内插。
这些数据簇代表完全不同的球形物体子类(水果与天体),而其他子类根本没有被代表(标题文字提到这一缺陷)。
作为来源相似的数据的紧密聚集,它实际上将数据有效地减少到两个有用的数据点。这也使得选择对数中位数内插缺乏正当性。
“美味程度”尺度没有表明它记录的评估(主观或客观)是什么。也没有刻度,使得我们不知道图表是线性对数还是对数对数(或其他),改变了选择直线内插所暗示的含义。
根据宇航员约翰·杨的说法,他在阿波罗16号任务期间造访了月球表面,”月球尘土味道不算差”。(尽管其他阿波罗宇航员将其气味和味道比作烧焦的火药,所以你可以自己理解。)
标题文字指出,棒球似乎反驳了这个理论,因为它们通常不被认为是美味的,但它们的大小介于葡萄和甜瓜之间,这将它们放在图表的左下角,远离拟合线。棒球通常由橡胶或软木中心包裹纱线制成,并覆盖以马皮、牛皮或合成皮革。事实上,有许多常见的圆形物体完全不符合这个图表,而兰德尔并没有承认这种分析存在致命缺陷,而是采用特殊请求来证明其剔除图表的合理性,暗示问题在于我们缺乏”适当的调味品”。虽然调味品可以改善食品的味道,但不可能把棒球的不可食用成分用任何可想象的调味品组合变成”美味”。即使真的可以,没有证据表明这样会使其具备符合图表的适当’美味程度’。这个论点讽刺了”挑选樱桃”和动机推理的使用,研究者仅选择符合他们假设的数据点,并编造理由排除不符合的点。这显然是非常糟糕的科学,但在科学研究中略微夸大的版本却是非常常见的。
这幅漫画将这个图表称为研究。这是夸张的,因为两个成对点的簇通常不被认为足够用于研究目的。但在对数图上绘制足够数量的数据点,然后通过它们绘制一条线,是更易理解地可视化实际指数关系的常见方法。一个例子是古腾堡-里克特法则,在特定区域内地震的震级(一个内在的对数尺度)与发生频率一起绘制,通常结果是统计上显著的直线。
之前在388:该死的葡萄柚中提到过其他水果的意见,但尚不清楚如果兰德尔包括葡萄柚,这条线会是什么样的。
其他线性回归的荒谬用法在605:外推和1204:细节中有所表现。