Title Text:Our work has produced great answers. Now someone just needs to figure out which questions they go with.
Origin:https://xkcd.com/2652/
https://www.explainxkcd.com/wiki/index.php/2652:_Proxy_Variable
代理变量
http://xkcd.in/comic?lg=cn&id=2652
在这部漫画中,Hairy正在与Cueball讨论代理变量的使用。在统计学中,代理变量被用作一个或多个难以测量的其他变量的替代。为了如此有用,代理变量必须与它们要表示的内容相关联。例如,一种药物可能旨在减少因缓慢作用疾病而导致的死亡。但测试它是否减少死亡可能需要很多年,因此研究人员可能会测试替代结果,例如该药物是否会减少骨密度损失或细胞损伤。医生将血压作为心血管健康的众多指标之一。
Hairy 驳斥了他们是否正在研究正确变量的问题,因为太昂贵而无法回答。这是非常具有讽刺意味的,因此也是讽刺的,因为良好的实验设计需要对实验所有相关部分的稳健性给予足够的关注,即使费用可能会令人望而却步。这部漫画可能指的是最近发现的近 20年涉嫌欺诈的阿尔茨海默病研究支持了一个错误的代理假设。
选择错误的代理变量可能会使研究产生误导、无关紧要,或者如标题文本所示,回答错误的问题。在解释代理变量结果时,必须将相关性与因果性分开,以确保他们回答的问题是已知的。仅仅相关而不是真实的因果关系会产生较弱的结果。探索性因果分析可以帮助找到有用的代理变量,但对于外行来说很难解释并且可能会产生误导,因为即使执行正确,可能的代理变量的组合爆炸也会使传统的统计显着性分析失败,需要F 分数或类似措施。药物研究的历史在很大程度上是失败的代理假设的坟墓。这也是实验注册规定的原因之一。
标题文本在不知道实际问题的情况下获得答案的概念也可能是对经典喜剧科幻小说《银河系漫游指南》的参考,其中在一个场景中,地球原来是一台超级计算机,用于计算回答“42”的问题。
值得注意的代理变量示例
- 骨密度损失或细胞毒性损伤
- 心血管健康的血压
- 阿尔茨海默病的淀粉样蛋白标志物