Title Text:If you think THAT’S unethical, you should see the stuff we approved via our Placebo IRB.
Origin:https://xkcd.com/2726/
https://www.explainxkcd.com/wiki/index.php/2726:_Methodology_Trial
方法学试验
http://xkcd.in/comic?lg=cn&id=2726
在测试潜在医疗治疗的功效时,研究人员会将接受治疗的受试者与接受安慰剂的受试者进行比较。通常,每个受试者都不知道自己接受的是治疗还是安慰剂,从而使得研究人员也无法得知,直到试验结束时。这样可以区分治疗本身的实际效果和仅仅参与研究所带来的效果。接受安慰剂(或无效治疗)的人往往会认为他们的治疗有效,这可能是因为更加关注自己的健康或期望感觉更好等原因。将效果错误归因于非治疗的现象被称为“安慰剂效应”。
在这个漫画中,一组研究人员似乎对某种医疗治疗进行了研究,使用了安慰剂对照测试。他们呈现了研究结果,其中一个特定的子集参与者(至少四个不同组中的一个)显示出明显的结果。图表显示,三个分组的结果误差条表明它们可能是零(或中性)真实效果,甚至可能是负面的。但是,即使在接受的不确定性最低程度上,第四个分组也表现出一定程度的正面效果(无论这个图表所描绘的是何种类型的效果)。
然而,揭示出他们所接受的“治疗”其实也是安慰剂。他们自己的研究是对他们的方法进行了安慰剂对照测试。他们是安慰剂组,而另一个团队则可能使用完全相同的方法研究真正的治疗方法。因此,这个团队的所有发现都归因于安慰剂效应,或者试验的规模和范围使纯粹的统计“噪音”发生,而不是因为“治疗”有任何真正的价值。这表明他们的方法不应用于任何现实世界的应用。这可能是对最近的阿尔茨海默病aducanumab药物试验争议的一个微妙讽刺,当整体试验失败时,对一个患者群体的事后重新分析揭示出令人惊讶的结果。
这种方法论上的缺陷似乎是将过少的受试者分成过多的子组,从而导致偶然异常结果的几率过高地影响了明显结果。研究人员在一个子组中找到了显著性,尽管事实上没有任何信号,只有噪音,因为所有子组都是安慰剂组。这引用了与882: Significant相同的p值问题。唯一不同之处在于,在这种情况下,研究人员本身是真实试验的对象。
如果非安慰剂研究具有完全相同的规模和设计(如元研究中应该有的),那么伦敦的任何类似结果都会对是否具有重要意义产生怀疑。特别是如果他们还发现,同一子组再次展示了唯一的显著效果,这可能揭示了程序内在缺陷。另一方面,这也可能进一步显示任何特定分组显示结果的可能性有多大;如果所有组都明显受益,那么大部分都是正确的,无论是否需要2268: Further Research is Needed。
治疗对特定人群的亚群可能更有效;例如,抗癌药物可能只对导致癌症的特定基因突变起作用。但是,任何这样的结果都需要具有适当的统计显著性,并且应该对来自该亚群的新受试者进行测试以确保结果的重复性。
标题文本指出了实验几乎肯定违反了某些道德标准,因为一位研究人员向大量参与者提供真正的治疗,然后第三方(不可见说话者)用安慰剂替换了所有的药物,最终欺骗了患者。标题文本暗示这已经得到了真正的伦理审查委员会(IRB)的批准,该组织决定是否可以进行拟议实验。然而,他们也有一个“安慰剂IRB”,可能由没有资格做出此类判断的人组成,或者也可能根本不是由人组成,而只是一个生成随机决策的机制。
然而,使用所有安慰剂进行的这种方法论试验不一定是不道德的。除了使用安慰剂外,大多数研究都是“双盲”的,意味着患者和医生/护士对待他们的患者是否得到了安慰剂都不知道,只有进行研究的研究人员知道。这样可以防止医生/护士不经意地让患者知道谁得到了真正的药物(通过在知道没有得到治疗的患者周围表现出懊悔,或在知道得到治疗的患者周围表现得更欢快)。医生给予患者他们认为是药物但实际上不是的安慰剂是被认为是完全道德的。这是因为如果没有双盲程序,可能无法区分真正的药物和无效的药物,而阻止真正的药物被数百万人使用的影响比实验中少数接受安慰剂的患者受骗更大。因此,扩展来说,让研究人员在不知情的情况下进行两个安慰剂的试验也可能是道德的。例如,如果伦敦团队和漫画中的团队在其他研究人员发现没有效果的新药中发现了益处(或发现其他药物在其他人有证据表明有效时没有起作用),那么研究他们共享的方法是否具有文章中展示的缺陷可能值得研究。那样,监管机构在决定批准哪些药物时可以排除他们有缺陷的数据,而两个团队则可以转向更好的方法,并继续为医学科学做出贡献。