Title Text:Cauchy-Lorentz: “Something alarmingly mathematical is happening, and you should probably pause to Google my name and check what field I originally worked in.”<
Origin:https://xkcd.com/2048/
https://www.explainxkcd.com/wiki/index.php/2048:_Curve-Fitting
曲線擬合
举例说明相同数据的几个图表,曲线与点相符,并与您可能得出的关于制作它们的人的结论相对应。当在X /Y图上绘制时,这些数据似乎具有总体上升趋势,但数据太嘈杂,数据点太少,无法清楚地表明任何特定的增长模式。在这种情况下,许多不同的数学和统计模型可以表示为粗略拟合数据,但它们都不足以恰当地表示数据。
当统计地对这样的问题进行建模时,数据科学家或统计学家的大部分工作是知道哪种拟合方法最适合于所讨论的数据。在这里,我们看到各种假设的科学家或统计学家各自对完全相同的数据应用他们自己的解释,并且漫画嘲笑他们每个人的各种个人偏见或其他各种各样的借口。通常,研究人员将指定要绘制的线的等式的形式,并且算法将产生实际的线。
尽管如此,科学家们通过给出希腊字母sigma或拉丁字母s所代表的标准差的值作为衡量数据点与最佳拟合的变异量的量度,对其假设的可靠性更加认真地工作。 。如果蟽值不够好,科学界就不会接受基于特定拟合的解释。
由于Randall没有提供关于所使用数据集的性质的暗示 – 每个图中都相同 – 所呈现的任何拟合都没有任何意义。这些图表可以代表星图,最新当选总统的投票,或者您最近的耗电发票。这部漫画只是夸大了解释数据的各种方法,但在背景中没有任何知识,没有任何意义。