Title Text:Squinting at a graph is fine for getting a rough idea of the answer, but if you want to pretend to know it exactly, you need statistics.
Origin:https://xkcd.com/2701/
https://www.explainxkcd.com/wiki/index.php/2701:_Change_in_Slope
漫画是检测数据散点图斜率变化的技巧。这是探索性统计中比较一系列趋势的常见要求——找到斜率变化的截止点可能会揭示有关数据的有价值信息。
漫画比较了两种方法。首先,一个新手方法——通过“做一堆统计”——即应用各种统计工具来分析数据并计算出斜率的数量变化。这会产生两个等式,用于表示高于和低于给定值的趋势线、箱形图、直方图和折线图。目前尚不清楚新手究竟使用了什么方法来计算数据中斜率的变化。可能性包括计算导数(这可能不适用于如图所示的噪声数据)或梯度,或使用Savitzky-Golay 过滤器或分段线性平滑样条拟合。兰德尔的浅灰色数字可能暗示了这种方法。
另一种是所谓的“专家”方法,它涉及倾斜打印图形的页面以更好地查看斜率变化。对于潜在趋势的微小变化,类似于漫画中明显显示的变化,直接目视检查不能总能识别甚至揭示效果。然而,漫画显示,通过将页面以正确的方式旋转,透视缩短可以使某些细节更加明显,让“专家”一眼就能看出坡度有变化。具有讽刺意味的是,倾斜漫画使原图大致类似于漫画中显示的“倾斜”版本图的透视图,表明右侧面板为了视觉效果而略微夸大了。透视法的运用几个世纪以来,艺术家一直在使用使信息突然出现在观众视野中的方法。
然而,将这种方法应用于数据图可能会出错——主要的错误是倾斜视角的视差,导致观察者不一定能识别或清楚地找到斜率变化的点。它也没有透露任何关于斜率变化的定量值的数据,只是证明了一个的存在。此外,噪声数据可能会显示明显的斜率变化,这并不代表基础数据的实际变化,因此更高级的统计数据测试明显的斜率变化是否真实的假设可能是个好主意。
标题文本继续说,虽然这种技巧对于识别斜率有一些变化很有用,但为了假装确切地知道它,必须恢复统计(“新手方法”)以获得某种形式的信息,打败了漫画的一些前提。这至少产生了统计上的严谨性,尽管一旦答案显而易见,就可以解释数据以得出您现在期望的答案,而不是揭示更具统计意义的东西。