[2311] Confidence Interval
Title Text:The worst part is that’s the millisigma interval. Origin:https://xkcd.com/2311/ https://www.explainxkcd.com/wiki/index.php/2311:_Confidence_Interval 置信区间 最糟的是这还是一个千分之一西格玛区间。 脚注: 置信区间:在统计学中,一个概率样本的置信区间(Confidence interval)是对这个样本的某个总体参数的区间估计。 西格玛区间:置信区间一般采用(t-c*σ,t+c*σ)的形式,t为样本数据的某一具体数值,c为常数,σ为样本数据标准差。 千分之一西格玛:可能指c=0.001的时候? http://xkcd.in/comic?lg=cn&id=2311 这是Randall的另一个技巧,这次是科学技巧。 连续函数预测值的图形通常显示置信区间,即一个区域(阴影或用虚线标记,此处使用虚线表示),该区域指示任何点处的预测误差范围。这个漫画中的一个笑话是,估计值具有很大的不确定性,因此置信区间超出了图表的顶部和底部,这在真实报告中通常会阻止其打印,并且需要重新缩放图表才能显示出来。这可能是一个提示,好像它在可打印区域之外,任何阅读它的人都不会看到,因此他们不会意识到您的模型有多糟糕,尽管这更多是关于如何欺骗人们的提示错误地认为您在工作中取得了良好的结果,而不是在进行实际合法有用的科学结果时提供的提示。 在标题文本中,毫西格码将是标准偏差的+/- 1 / 1000th的误差。统计误差和不确定性通常通过标准偏差来衡量,该标准偏差在公式中用希腊字母sigma书写,通常也用“ sigma”一词来表示。样本均值(最常见的实验确定变量之一)的测量将趋于遵循正态分布,这样人口中68%的成员将落在平均值的1个sigma(正负)之内,两个平均值在95%的平均值之内,三个平均值在99.7%的平均值之内。这些间隔中的任何一个都可以有用地报告为置信区间,只要读者可以清楚知道即可,但是对于大多数应用而言,两个或三个西格马就足够了。但是,此图显示的数据质量很差(或y轴选择范围太差),甚至“毫西格玛”置信区间(+/- 1/1000 sigma或人口的0.08%)也很少见。用于科学,但偶尔在分子分析工具中发现)不适用于图表。与误差线相比,曲线上的变化较小,通常无法与误差区分开。因此,曲线的形状以及本示例中的整个图形没有意义。