安慰剂,placebo,在拉丁语中意为「我会好转」,作为术语,在临床试验中,理论上是指一种无效的干预方式。然而,在双盲设计的临床随机对照研究中(RCTs),服用安慰剂的患者,因受到被试验药物干预的心理暗示,往往对患者症状和身体机能产生间接的影响,从而造成对照组患者也出现一定的阳性缓解率,有专家学者称之为「安慰剂反应率」。
安慰剂反应率过高,很可能导致有效率在试验组、对照组间分布无统计学差异,继而宣告临床药物试验的失败。不幸的是,在抗抑郁药物的 RCT 中,安慰剂似乎扮演着「新药杀手」的角色,其反应率过高的问题,逐渐引起了国内外广泛的关注。
为科学的评价在抗抑郁药物试验中,安慰剂反应率的影响因素及时间效应变化(即这一反应率是否随时间年份的增加,逐年增大),来自日本京都大学医学院的 Toshi A Furukawa 博士团队利用循证医学的方法,在 2016 年 10 月的 Lancet psychiatry 杂志上发表了一篇系统综述,指出安慰剂反应率其实一直保持在稳定的水平,既往研究均存在一定统计学上的偏误。
由来已久的争议:安慰剂反应率居高不下?
国际上目前有观点认为,在抗抑郁药物试验中安慰剂的反应率在过去的 30 年中,逐年增高。既往有限的循证医学证据指出,临床实验的发表年份与安慰剂的反应率密切相关,也就是说,安慰剂反应率已经随着时间的变化而增加。在基于儿科学抗抑郁药物的 RCT 系统综述研究中,也可以得出相似的结论。
近年来,抗抑郁药物临床试验的失败案列屡有报道,有学者指出安慰剂反应率过高是其中重要的罪魁祸首之一。因而寻找安慰剂反应率的影响因素,成为了学界的热点之一。
利用 logistic 回归模型等多因素统计建模手段,将诸多的变量,如对照组患者干预前——基线调查时抑郁症状的严重程度、年龄、性别、干预试验的周期长度、药物剂量大小、研究发表年份等等纳入多元统计模型中,不同的研究结论均有差异,有人认为上述变量均是影响安慰剂反应率的可能因素,亦有人得出该反应率仅与发表年份相关。
不管如何,显然,可以预见的是居高不下的安慰剂反应率将会成为抗抑郁药物研发上市的「拦路虎」。
严谨完备的统计学分析,揭露假象始末
在系统回顾了历史研究后,Furukawa 博士团队发现既往的研究均存在一定的统计学设计与分析缺陷,基于此,该团队对发表及未发表的 RCT 试验进行 meta 分析,确认截止到 2015 年 12 月,在抗抑郁治疗的临床干预试验中,安慰剂组的反应率较 30 年前,究竟有无提高?如果没有,那究竟患者或者试验设计的哪些环节才是造成这一可能「假象」的始作俑者呢?
该团队将目前已经上市的全部二代抗抑郁药物、两种三环抗抑郁药(阿密曲替林、氯丙咪嗪)以及在药效学上「特立独行」的曲唑酮、萘法唑酮作为研究对象,详细检索上述药物上市前的 RCT 研究。
其中文献的纳入标准设定为:受试对象需为 18 岁以上的成年人,对象均以「单极重性抑郁症」进入试验阶段。检索数据库涵盖到 Cochrane CENTRAL, CINAHL,Embase, LiLACS, MEDLINE, MEDLINE In-Process, and PsycINFO。同时,该团队得到了大型临床药物试验中心的协助,得到了很多完备的数据资料。
在统计学处理方面,该团队将历史研究年份以五年为一个周期,对五年间的反应率作对数变换,继而进行合并。这里,有效被定义为采用汉密尔顿抑郁量表,为期 8 周的干预后,量表评分下降 50% 及以上。同时,针对先前研究完全忽略的问题,该团队对合并值反应率的参数分布进行正态性检验;针对反应率是否会在某个时点上突增或突减,研究者借鉴计量经济学模型,采用了「结构突变检验」,用以判断 5 年为一周期的,各研究时间段间是否存在差异。
最终该 meta 分析,总共纳入从 1978 年至 2015 年,共计 252 篇 RCT 研究,安慰剂组患者达到 26324 名。研究者发现,截止到 2000 年前,安慰剂反应率保持在 35—40% 之间,这与先前的研究结果一致。但亚组间的异质性差异,提示有潜在的混杂因素与这一结论相关。于是,研究者将研究周期、是否为多中心试验作为变量纳入 meta 回归模型中,在控制了这些变量后,惊讶地发现,安慰剂反应率与发病年份并无相关性,且其随着年份的增长一直保持稳定。
这一研究结果结论,是对目前「错误」观点的直接冲击,对临床药物试验的设计、药理学研究与新药开发将产生一定的指导意义。恰当的评价时间节点、是否为多中心的协同试验,对抗抑郁药物的临床试验评价具有重要的意义。值得庆幸的是,传统的 RCT 对照组金标准——「安慰剂」,可以暂时不用为药物试验的失败「背锅」了,它还将继续为人类评价药物的有效性服务下去。