Title Text:It’s important to make sure your analysis destroys as much information as it produces.
Origin:https://xkcd.com/2582/
https://www.explainxkcd.com/wiki/index.php/2582:_Data_Trap
数据陷阱
http://xkcd.in/comic?lg=cn&id=2582
Cueball想要分析他拥有的“一堆”数据,这些数据可能来自调查或研究。梅根警告他不要进行分析,因为分析会产生更多数据——特别是关于数据的数据。这暗示着是一件坏事,例如,拥有“太多”数据是不可取的——也许他会被期望分析元数据,然后分析由元数据创建的元数据,等等。但是,分析生成的数据可能会提供有关原始数据集的有用见解,例如发现趋势或相关性数据点之间。避免分析或删除其数据可能会剥夺分析器的有用信息。而且,在分析有缺陷或不可能的情况下,处理任何生成的报告几乎没有危险。[需要引用]
标题文本提出了另一种解决方案:破坏性分析。重要的是,选择分析数据的方法会破坏与其创建的信息一样多的信息,从而保持数据总量不变。这扩展了没有多余数据的概念,表明任何分析都应该破坏它产生的尽可能多的数据。这将使数据在数量上保持不变或处于平衡状态;当然,数据实际上并没有这个限制,[需要引用],用户可以根据需要或期望创建尽可能多的数据。
在量子世界中,信息既不能被破坏,也不能被创造;例如,参见无隐藏定理。破坏性分析是考古学中使用的一个术语。顾名思义,你研究的东西被分析破坏了。然而,破坏性分析很少或从不用于研究数据。[需要引用]