Title Text:If you think THAT’S unethical, you should see the stuff we approved via our Placebo IRB.
Origin:https://xkcd.com/2726/
https://www.explainxkcd.com/wiki/index.php/2726:_Methodology_Trial
方法学试验
http://xkcd.in/comic?lg=cn&id=2726
测试潜在医疗治疗方法的功效时,研究人员将接受治疗的被试对象与接受安慰剂的被试对象进行比较。通常每个被试对象都不知道自己接受了治疗还是安慰剂,且从试验开始直到结束,研究人员也不知道。这样可以将治疗的真实效应与仅仅参与研究本身产生的效应区分开来。接受安慰剂(或无效治疗)的人往往会相信他们的治疗有效,原因可以是更加关注自己的健康或者期望感觉更好等等。将效应归因于非治疗的情况被称为“安慰剂效应”。
在这个漫画中,一组研究人员似乎对某种医疗治疗方法进行了研究,使用了安慰剂对照试验。他们呈现了自己的发现,其中一组特定的参与者(至少有四个不同的组)显示出明显的结果。图表显示,其中三个分组的结果的误差棒表明,它们可能有零(或中性)真实效应,或者可能有负面效应。但是,即使在接受的不确定性的最低程度下,第四个组也显示出某种程度的积极效应(根据这个特定图表绘制的效应类型)。然而,揭示出来的是,他们接受的“治疗”实际上也是安慰剂。他们自己的研究是对他们方法的安慰剂对照试验。他们是安慰剂组,而另一个团队据推测使用完全相同的方法研究了真正的治疗方法。因此,这个团队的所有发现都是由安慰剂效应引起的,否则试验规模和范围将允许纯粹的统计“波动”发生,而不是存在任何真实的“治疗”价值。这表明他们的方法不应该用于任何实际世界应用。这可能是对最近的阿尔茨海默病药物试验争议(aducanumab)的一个微妙批评,在该试验中,对某个患者子组进行事后再分析揭示出一个惊人的结果,而整体试验却失败了。
该方法论的特定缺陷似乎是将太少的被试对象分为太多的子组,导致偶然的异常结果聚集过分影响了明显结果。研究人员在一个子组中发现了显著性,尽管实际上没有信号,只有噪音,因为所有都是安慰剂组。这提及了与882: Significant一样的P值操纵问题。只不过在这种情况下,研究人员本身是真正试验的对象。
如果非安慰剂研究具有完全相同的规模和设计(在这样的荟萃研究中应该如此),这可能会对在伦敦发现的任何类似结果的显著性产生怀疑。特别是如果他们还发现同样的子组再次展示了唯一显著效应,这可能揭示了过程中固有的缺陷。另一方面,这也可能进一步显示出任何特定分组出现结果的可能性有多大;如果所有分组都表现出 apparent-benefit,那么大部分可能是正确的,不论是否需要2268: Further Research is Needed。
治疗方法在特定人群的亚群体上可能效果更好;例如,抗癌药物可能只对导致癌症的特定突变产生作用。但任何这样的结果都需要具有适当的统计显著性,并且需要对来自该亚群体的新受试者进行测试以确保结果的重复性。
标题文字指出该实验几乎肯定违反了某些伦理标准,因为一名研究人员向大量参与者提供他认为是真正治疗的药物,但第三方(背景声音的人)却用安慰剂替换了所有药物,最终欺骗了患者。标题文字暗示这是经过一个真正的伦理审查委员会(IRB)批准的,IRB是决定是否可以进行某项拟议实验的团体。然而他们也有一个“安慰剂IRB”,大概是由那些没有资格做出这种判断的人组成的,或者甚至可能根本不是由人组成,而只是生成随机决策的机制。
然而,使用所有安慰剂进行的这种方法论试验未必是不道德的。除了使用安慰剂外,大多数研究都是“双盲”的,意思是既患者也是医生/护士治疗他们的人不知道谁得到了安慰剂谁没有;只有进行研究的研究人员知道。这样做是为了防止医生/护士无意中让患者知道谁正在服用真正的药物(在他们知道没有得到治疗的患者面前表现出懊悔,或者在他们知道得到治疗的患者面前表现得更加愉快)。在医生相信给病人的是药物而实际上不是(安慰剂)的情况下,这被认为是完全合乎道德的。这是因为如果没有双盲程序,可能无法将真正的药物与无效的药物区分开来,而阻止数百万人使用真正的药物的影响要比对实验中接受安慰剂的少数患者进行欺骗更大。因此,扩展而言,研究人员进行安慰剂试验而不知道这一点可能是合乎伦理的。例如,如果伦敦团队和漫画中的团队在其他研究人员发现没有效果的新药中找到了有益效果(或者发现其他药物没有效果,而其他研究人员有证据证明它们有效),那么调查他们的共享方法论是否有本文所示的缺陷可能是值得的。这样,监管机构在决定批准哪些药物时可以排除他们有缺陷的数据,而这两个团队可以转向更好的方法论,并继续为医学科学做出贡献。