虽然有很多证据证明,精神科重大疾病长期未接受治疗的话,会有相关后果,但是大部分临床医生没有使用任何形式的评估工具,去确定精神症状的减弱或者出现。
考虑到成本与训练和管理有关系,有些面谈式的评估,比如精神障碍风险综合征(SIPS)结构式访谈,在临床上应用不是很广泛。用低成本、简单的方法去确定高风险的个体,是我们做预防工作所需要的基本的能力。
美国巴尔摩的县马里兰大学,心理学院的Emily Kline和Jason Schiffman针对精神障碍风险的筛查的研究做了综述。
这篇文章的目的是,呈现一个全面的综述,介绍用自陈报告作为精神障碍的“筛查”形式。文献检索包括34个研究,其中在临床高风险评估草案中,作者用自陈问卷作为第一步的筛查。
每个筛查工具的信息都包括心理测量数据,在文章中会呈现出来。精神障碍风险筛查已经应用在不同的样本中,来确定评估的目标,临床上筛查样本、以及招募对研究感兴趣的参与者、评估症状的普遍性和严重性。
筛查工作的焦点是减少精神病性症状,用不同的患病率验证一个可靠的构想,帮助确定总体人口样本。
筛查的实施是帮助确定总体人群,这样随着时间的进行,可以确定充足的样本,可能符合CHR标准和精神障碍的筛查。
但是,我们仍然需要更多的研究,建立可靠的标准和筛查临界值,作为评估分数,来筛查出可能的高风险人群,因为通过总体人群和设置来筛查似乎是不可靠的。
1.引言
我们已经把很多的注意力,放在了长期未接受治疗的精神障碍患者身上。对有精神分裂症和其他精神障碍的患者来说,这作为一个潜在的可更改的预测因素,影响了各种各样有意义的结果。
在疾病的早期进行鉴别和干预,似乎有最大程度的治疗效果,也可以提高他们的生活质量(Marshall et al.,2005)。
减少精神障碍未接受治疗的持续时间是很有必要的,我们也发现精神障碍的“前驱症状”,在患者出现症状的前几个月或者几年可能就出现了,。
已经有很多工作,研究了精神障碍前期或者“临床高风险期” (CHR)识别和疾病治疗。
对于那些进行相关性研究,而不是单一过程研究的研究者来说。
面谈式的测量,例如精神障碍风险症状结构式访谈(SIPS;Miller et al.,2003),和高风险精神状态的综合评估(CAARMS;Yung et al.,2005),已经建立了一系列常用的风险标准。
但是因为某些原因,这些测量工具在一些环境中不适用,只能在特定设置中使用。访谈的目标是CHR的状态,这个过程很长,并且临床医生必须接受训练才能熟悉访谈的结构、评定量表和诊断标准(McGlashan et al.,2010)。
我们要发展简短的、操作简单的工具,这样的工具可以应用在临床,为那些易患精神障碍的人群,建立和宣传循征医疗工作的关键第一步。
简短的自陈量表有潜力筛查出总体人群中的患者,并且可能帮助我们筛查出更多的CHR患者,而不是通过临床医生或者自我转诊,来到专业的治疗过程中,这为我们提供了一个潜在的解决方案, 解决了CHR研究过程中确定样本的挑战。
尽管,面谈式的评估似乎能够确定,团体中不寻常的临床损害,以及大体上发展成精神疾病的风险增加性,大部分经过SIPS或者CAARMS为基础的CHR标准筛查的人,都不会发展成精神障碍(Fusar-Poli et al.,2012)。
通过明确它的特征性症状,以及关于未来精神病理学代表的,有预测性的广泛目标,改善CHR的结构,将会形成并且增加对这个人群治疗的选择性。
初步的证据表明了,筛查工作提供了一个有效的方法,去确定并且招募高风险样本;通过筛查招募样本,可能会更加“真实”的前驱症状(例如,转变的可能性更大)。
相对的样本是,通过更特殊的相关程序选出的样本(Rietdijk et al.,2012; van der Gaag et al.,2012)。过去的几十年中,研究者已经发展了几种简短的自陈报告工具,来评估发展成精神障碍的风险性(Klineet al.,2012)。
其中有一些测量方法,内容的焦点是减少症状的构想,比如,不寻常的认知和感觉,困境、情感困扰、迷信的信念或者变态的多疑想法(比如:Heinimaa et al.,2003;Ord et al.,2004;Loewy et al.,2005)。
这些量表与先前反复使用的自陈量表不同,设计的目的是评估患者精神障碍史的(例如,威斯康星州分裂型量表,分裂型人格问卷; Raine,1991; Kwapilet al.,2008)。
因为,现在更多量表的构想是,倾向于预测CHR状态,而不是测量“分裂”这个特点。
为了这个目的,已经有的测量工具有SIPS、CAARMS、分裂焦点的访谈、以及DSM障碍的结构性临床访谈(SCID)、儿童情感障碍和精神分裂症的访谈提纲(KSADS)。
这些强调建立临床实用性(也就是,预测精神障碍风险状态,或者转变成精神障碍),而不是形成特定疾病。(Liu et al.,2013;Cicero et al.)。
我们使用不同“金标准”测量方法,经过对精神障碍风险的构想有效性的研究,也反映了多元的设置、文化、目标人群、以及研究人员使用CHR筛查提纲的目的。
当前调查研究的目的是,形成到目前为止,精神障碍相关筛查工作的系统性综述,目的是,巩固这个领域筛查方法和策略的可用信息。
通过确定这个信息,我们希望确定成功的方法,来进行精神障碍的筛查,以及发现当前方法和领域的局限性,为将来的研究提供新的视角。
2. 方法
2.1.研究方法
本文的文献检索方法是系统性的文献查阅,使用的是PubMed和心理学文摘数据库,确保到目前为止已经发表的文章中,所有用自陈量表去评估精神障碍假定风险的研究,都被包括进来。
这些研究没有限制参与者的年龄、性别、民族或者临床症状。数据库搜索到最近的是2014年8月8号的文章。
我们选择了以下搜索条目,并且随后与布尔项(Boolean term)中的“和”相关联。
(1)“前驱症状”或者“有前驱症状的”或者“精神障碍风险”或者“临床高风险”或者“极端高风险”或者“减弱精神障碍”或者“早期基本的前驱症状状态”或者“次要精神障碍症状”。
(2)“筛查工具”或者“筛查”或者“屏蔽”或者“自我报告”;(3)“精神障碍”或者“精神分裂症”。
包括参考文献中列出文章,也包括经过评估确定的,在文献检索中可能没有检索到的其他相关研究。
2.2. 合格的标准和研究的选择
如果文献符合以下标准,就会包括在系统性综述中:英文能检索到、原创性研究、有研究者使用的筛查工具的名字、提供测量结束后关于筛查样本分数的比例数据,或者筛查样本符合CHR访谈标准的比例数据。
仅仅报道了自我报告测量筛查分数离散型的文献(比如,Müller et al.,2009,2010),没有包括在这篇综述中。
2.3. 数据提取
每个涉及到的文献中,研究中的特性说明如下:选择筛选工具、在哪个民族进行的研究、筛选参与者的数量、选择参与者的方法、筛查结果是否与更深度的评估作了比较(如果做了比较,所使用的评估类型)。
还有,“阳性”筛查结果的临界值、基于诊断的访谈筛查敏感性与特异性、筛查结果相关的结论。作者分别阅读了这些研究,并且提取出信息。其中矛盾很小,并且通过一致性的讨论解决了。
3. 结果
本研究从心理学文摘中检索到121个研究,从PubMed检索到131个研究。参考文献包括了其他相关的研究,这些研究也被检索到,可能有潜在的可用信息。
这篇综述中有35个研究符合2.2部分的标准。这些研究一般被分为三种类型。有效性的测量研究包括详细地对比筛查结果,作为一个金标准,评估精神障碍风险性状态(比如,Loewy et al.,2005)。
第二范畴包括“现实世界”,使用筛查工具发现有症状的个体,进行临床转诊,或者为那些对研究有兴趣的个体进行CHR研究(比如,Quijada et al.,2010)。
第三类研究中,使用问卷调查,不是进行筛查,而对一个特定的样本群体,用其他人口统计学或者临床协变量,进行检查精神障碍风险症状的离散型分析。
如果最后一类研究的作者也报道了“筛查结果”,我们也会进一步考虑(就是说,有多少参与者是“阳性”筛查结果,以及这些筛查结果是如何与临床联系起来的。例如:Kobayashiet al.,2011)。
所有这些研究包括了13中不同的测量方法,作为测量精神障碍风险的筛查工具。所有的工具都用了自陈量表(与临床上医生或者父母为主的列表完全不同),除非另有说明。
4. 讨论
4.1. 回顾筛查相关的研究
系统性综述确定了13种自我报告的方法,来自14个国家的研究,目的都是确定个体患精神障碍的临床高风险性。
研究根据更多的经验型访谈方法,对比了CHR/精神障碍诊断的筛查结果(比如,SIPS,CAARMS),报道了心理测量数据范围的广泛性。
根据设置、人口、测量方法、分数阈值、和金标准评估,敏感性范围是0.50 到1.00,特异性范围是0.10到1.00。
没有一个单一的测量方法,在两个以上的研究中,既显示了敏感性又显示了特异性,超过了0.07。
总体来说,考虑到我们预测临床诊断时,用筛查方法是不完美的,那些研究中,使用自我报告的分数,作为面对面精神障碍风险评估的替代者,应该解释为这个方法的局限性。
这些测量方法本身在一定程度上是不同的,他们集中于阳性症状的改变,以及评估症状相关的高风险状态的范围。
尽管精神障碍前驱症状的特点是认知的、行为的、和情感的改变(Yung和McGorry,1996)。我们广泛地使用SIPS和CAARMS,强调了他们在CHR综合症评估标准中出现的阳性症状。
考虑到这里强调用阳性症状来确定风险性,我们在筛查的时候很少关注阳性症状的改变,就不会惊奇了。
(例如:简明前驱症状问卷[PQ-B],修订版主要筛查工具[PS-R],简明青少年精神障碍风险问卷[YPARQ-B],爱苯德精神分裂症清单[ESI])。
似乎也与以SIPS和CAARMS为基础的,可靠的诊断一起使用。有一些测量方法,比如:PROD筛查工具(PROD)和一般健康问卷(GHQ)包含了很多条目,是评估非阳性症状(比如:情绪和说面困扰)的。
虽然这样也获得了一些其他的临床关注,可能不太明确,以至于不能在SIPS/CAARMS确认的CHR患者,和那些非精神病性的情感障碍之间做区分。
大部分在临床评估研究中使用的筛查工具,是在帮助我们寻找人群和精神病诊所时,已经做到了这些。
个体生活在出精神病性团体中,为他们选择了一个“丰富”的团体,在那里他们体验最低限度的压力,或者功能的损害。
在一般的精神科治疗和心理咨询中,我们已经偏爱使用筛查工具,来分诊或者转诊高风险患者,让他们得到专业的评估。
当用作转诊到专业诊所的基本工具时,筛选工具正向的预测价值是39-53%,意味着这些工具在临床上是有用的,可以用来筛查精神障碍高风险患者群体。
也可以筛查那些不相关的精神障碍或者行为问题(Bechdolf et al.2005,Lindgren et al.,2010;Niessen et al.,2010;Quijada et al.,2010;Ising et al.,2012;Rietdijk et al.,2012;vander Gaag et al.,2012)。
尤其是前驱症状问卷、PQB、和PQ-16已经获得了“实验室以外”的验证,他们的筛查相对较少使用实验测量。
相反的,一些研究中,研究者筛查普通人群,比如在学校、基层医疗和社区环境中,发现特异性很低(French et al.,2012;Owosoet al.,2014),并且普遍性不高(Razali et al.,2011;Kang et al.,2012)。
考虑到这个局限性,这些研究一般在筛查CHR方面很少有效。有可能需要很高的阈值或者更详细的条目,使得普通人群中的假阳性结果最小化。也就是说,在普通人群中,精神障碍的患病率可能太低,以至于不能筛查出来。
不同筛查工作的特定目标和环境,都会有合理的损失。一个招募信息的工作中,研究者希望确认每个可能性的案例都能够符合工具的高敏感性,甚至减少特异性或者在识别患者时整体降低。
也就是说,在漫长的临床评估中,极度需要设置,以及资源有局限性,我们需要一个高度特异性的工具,很快缩小可能的CHR个体之间的差距,甚至会脱落一些案例。
因为,研究结果考虑到由于样本不均匀,已经导致CHR的发病率以及适合的分数阈值前后矛盾,评估者在选择测量工具或者筛查阈值的时候,应该对环境敏感。
4.2. 评估CHR的患病率
有些研究使用了两步式的筛查,以及访谈程序,用一个可接受的金标准评估CHR的状态(也就是,CAARMS或者SIPS),在这些人群中评估CHR的患病率。
在未选择的青少年和青年人群中,很多研究评估出来的CHR患病率是4–5%,而且很一致(Lindgren et al.,2010;Ising et al.,2012;Jarrett et al.,2012; Rietdijk et al.,2012;vander Gaag et al.,2012;Zhang et al.,2014)。
研究者在青少年和青年人群样本中,进行筛查和访谈,评估出的患病率是1% (Kang et al.,2012;Chung et al.,2013),3% (Chen et al.,2014),和4%(Owoso et al.,2014)。
不考虑参与者在SIPS/CAARMS评估之前是否经过证实的筛查(Loewy et al.,2005;Niessen et al.,2010;Granö et al.,2011;Kline et al.,2012;Mossahebet al., 2012)。
毫无疑问,这些样本中的参与者,被转诊到了专业的精神障碍评估中,他们有更高的CHR比例(33–51%)。
尽管这些研究没有描述CHR的流行病学,并且因为假设阴性的筛查是查“真正的”阴性症状,潜在的低估了患病率,这些数据可以证明CHR评估和治疗服务的实用性。
4.3. 有效筛查的标准
通过疾病的实际患病数,临床医生必须考虑类似的疾病,我们用筛查和得出的标准,是为了确定筛查方案是否符合特定群体的发病率,并且有没有可能减少发病率。
为了这个目的,这篇综述中“有效筛查的十个标准”(表-1),为任何筛查机制的注意事项提供了有价值的综述(Obuchowski et al.,2001)。
表-1 十个有效筛查的标准(来自 Obuchowski et al.,2001)
1. 疾病有严重的后果
2. 可检测出临床前期高流行性
3. 筛查工具测量出一些前驱症状
4. 筛查准确度高
5. 在临床临界点之前筛查疾病
6. 筛查几乎不会引起发病率
7. 筛查是大众负担得起的,并且可以接触到的
8. 有治疗方法
9. 在筛查期间进行治疗,治疗更加有效
10. 治疗风险小
尽管这个标准清单不一定相近,但是这个标准提供了一个有用的启发式搜索,在筛查精神障碍风险症状时,检查潜在的利弊。
考虑到目前为止的文献中,精神分裂症和相关疾病治疗的花费和治疗时间长,很明显精神障碍与稳定的发病率和死亡率有关(Saha et al.,2007;表-1中的标准1)。
大部分发展成精神障碍的个体,经历了一个可识别的前驱症状阶段,这已经被描述并且编写出来,形成了当前高风险识别的标准(Fusar-Poli et al.,2013; 标准2)。
大量的研究综述强调了一些问题—以及潜在的解决办法—关于目前的筛查工具和程序(标准3和4)。
干预研究使用了认知行为治疗(Morrisonet al.,2007;Hutton and Taylor,2014; Okuzawa et al.)和药理学治疗(Stafford et al.,2012;van der Gaag et al.,2013)。已经表得到了一些证据,用来检查和处理临床高风险状态(标准5和8)。
然而,我们需要更多的研究,为CHR人群建立安全有效的干预方法,形成相对标准的治疗方法(标准9和10)。最后,尽管考虑到病耻感和临床负担,造成了标准6和7的挑战。
但是一些研究表明,一些筛查过程成功的解决了这些可能的障碍(例如,Quijada et al.,2010;Bechdolf et al.,2012;Jarrett et al.,2012;Rietdijk et al.,2012;van der Gaag et al.,2012)。
这些标准帮助我们强调了当前知识存在的问题,为了进行有效的筛查,这些问题必须处理。
4.4. 当前综述的局限
本文代表了快速扩展的研究领域,并且这个主题有很多局限性,它排除了精神障碍风险筛查工作最终成功或者失败时,任何宽范围的结论。
第一,很难比较在设置或者人群中单个筛查工具的使用。考虑到这些差异,以及这篇综述中所提到的筛查研究的不同目的,在每个研究环境中,我们应该考虑筛查工具的有效性。
第二,对工具本身来说—包括工具的内容、题目的数量和阈值分数—非常广泛。第三,很多研究中,研究者也评估了与“金标准”相反的不同心理测查工具。
最后,这篇综述中很少有研究包括长期随访研究数据。筛查后的长期随访研究会帮助确定筛查工具的范围,这个范围中筛查工具可以选择出那些人群,随着时间的进行,他们发展成精神障碍的可能性大。
4.5. 研究的未来方向
在人群和设置中,最理想筛查阈值的不稳定性,对筛查工作的成功造成了很大的障碍。这个差异性可能是因为广泛的设置中,当地文化的不同、发展的不同、以及临床严重程度的不同。
在大样本中,筛查工具的使用对形成文化—发育—感觉标准至关重要。不考虑标准的数据,以及对不同人群的敏感性的话,很难决定是什么形成了临床上有意义的评估。.
除了最初探测和诊断的目的,未来拓展循征医疗服务,我们也需要工具进行疾病的监控。进一步的对照试验要研究潜在的干预方法,去防止CHR患者中的精神障碍。
目前强调临床实践指南经常进行临床监控,发现精神障碍症状的恶化或者转变(Fusar-Poli et al.,2013)。
为了这个目的,尽管在临床实践中,我们每隔一段时间进行简短的自我报告评估,来监控临床状态的日常变化(Lambert et al.,2003),但是,没有任何确定的工具评估精神障碍症状的好转。
最后,这个综述没有列出精神障碍病耻感的问题,这可能深深地影响了筛查工作中的风险和获益的比例。筛查工作是不是为那些需要进一步评估的人造成了压力,或者让一个人对自己精神健康照顾提供者的信任感降低。
似乎在设置和文化中的范围很广。用更广泛的临床评估方法去评估精神症状的好转,可以帮助减少病耻感,这可能是精神障碍的筛查工作出现(Thompson et al.,2013)。
我们没有进行患者对精神障碍风险筛查的认知研究,但是,这应该在心理测查工作中考虑到,并且考虑成本问题。
4.6结论
有效的筛查使得临床上精神障碍高风险的个体认同性比较低,无论在普通人群中,还是那些初次与精神心理健康接触的人。这个系统的综述包括了34项研究,报道了精神障碍风险的筛查结果。
尽管筛查工具已经成功应用于确认高风险案例,没有一个筛查工具可以在所有的环境和人群中,可靠地预测面对面评估的结果,比如SIPS和CAARMS。
对规范和评估分数提高的进一步理解,也考虑到了,如何使筛选工作的成本和耻辱感最小化,这会帮助改善现有工具的有效性。
目前为止的研究指出,在特定人群(寻找帮助)中,对于那些可能从更多的专业化、临床-管理评估中获益的人,筛查似乎更有效。
丁香园精神频道已开通微信订阅号 关注即可获得 5 个叮当