我们演示如何部署基于 CogStack 的实时精神病风险计算和警报系统,这是一个用于电子健康记录的信息检索和提取平台。
最近的研究表明,一个自动化的、包括寿命的、包括寿命的、可转诊断的、基于临床的个性化风险计算器提供了一个强大的系统,通过利用电子健康记录(ER),支持大规模早期发现处于精神病风险的个人。此风险计算器已经过两次外部验证,并正在进行临床实施的可行性测试。未来可行性研究应促进此风险计算器在临床例程中的集成,这些研究需要解决实际挑战,例如缺少数据,以及这种风险计算器在真实和常规临床环境中的可用性。在这里,我们提出了一种在真实 EHR 系统中可能实现实时精神病风险检测和警报服务的方法。此方法利用了 CogStack 平台,该平台是一个开源、轻量级和分布式信息检索和文本提取系统。CogStack 平台包含一组服务,允许对临床数据进行全文搜索、包含寿命、实时计算精神病风险、向临床医生早期风险警报以及随着时间的推移对患者进行视觉监控。我们的方法包括:1) 将多个来源的数据引入和同步到 CogStack 平台,2) 实施风险计算器(其算法以前开发和验证),以便及时计算患者的精神病风险;3) 创建交互式可视化和仪表板,以监控患者的健康状况;4) 建立自动警报系统,以确保临床医生获得风险患者的通知,以便采取适当的行动。这是首次在临床常规中开发和实施类似的检测和警报系统,用于早期发现精神病的研究。
精神障碍是严重的心理健康疾病,导致难以区分心理的内在体验和环境的外部现实1,以及高于平均水平的自我伤害和自杀风险2。在标准护理下,这些疾病对公共卫生造成重大影响,给全世界的个人、家庭和社会带来重大的健康和经济负担。早期干预精神病可以改善这种精神障碍的结果4。特别是,对患有精神病的临床高危人群的检测、预后评估和预防治疗(CHR-P)5为改变疾病过程提供了独特的5潜力,从而提高了许多人及其家人的生活质量3、6。,6CHR-P个人是寻求帮助的年轻人,出现衰减症状和功能障碍7:他们患精神病的风险是20%,在2年8,但在一些特定的子组9,9,10。尽管取得了一些实质性的进步,但预防方法在常规临床实践中的影响受到检测大多数处于危险中的个体的能力的限制。目前的检测方法基于寻求帮助的行为和转介的嫌疑精神病风险;这些方法在处理大量样品时效率很低。因此,当前检测方法对绝大多数高危人群的可伸缩性相当有限。事实上,只有5%(独立的专业早期检测服务)到12%(青少年心理健康服务)的个人,在发展第一个精神病的风险,可以检测到在其风险阶段时,目前的检测策略6。
为了将预防方法的临床益处扩展到更多的高危人群,我们开发了一种自动化的、包括寿命(即跨所有年龄)、转诊断(即跨诊断)13、基于临床的个性化风险计算器,可大规模检测处于二级精神卫生保健中精神病风险的个人,超出符合CHR-P标准14的人。此风险计算器使用 Cox 比例危险模型,根据方法指南15:年龄、性别、种族、按性别年龄和主要指数诊断,从选择先验的五个常规收集的临床变量中预测六年内患精神病的风险。根据最先进的方法指南15的建议,这些临床变量是根据从元分析16,17,17获得先验知识选择的。预测变量的数量是有限的,以保持事件每个变量比,并尽量减少过度拟合偏差;包括太多变量没有先验滤波器会导致过度拟合问题和预测精度差18。用于开发该模型的方法提供了与自动机器学习方法18类似的预后精度。考克斯模型的参数是根据来自南伦敦和莫兹利国家卫生服务基金会信托基金(SLaM)的回顾性去识别的队列(SLaM)19年估算的。SLaM是一个国民健康服务(NHS)心理健康信托机构,为伦敦南部(兰贝斯、南华克、刘易斯汉姆和克罗伊登区)136万人口提供二级精神卫生保健,是世界上记录最高的精神病发病率之一。模型开发中使用的所有数据均从临床记录交互搜索 (CRIS) 平台提取,该平台是一个数字病例登记系统,它为研究人员提供匿名临床记录的追溯访问和分析19。CRIS 中的临床信息从 SLaM 的定制电子健康记录 (EHR) 系统中提取,称为电子患者旅程系统 (ePJS)。SLaM 是无纸化的,ePJS 代表了临床常规的标准数据收集平台。因此,转诊断风险计算器利用 ER,并有可能自动筛选获得继发性精神卫生保健的患者的大型 HR,以检测那些可能处于精神病风险的患者。该转诊断风险计算器的算法已经发布于之前,6,14,21。,21转诊断风险计算器已在两个NHS基金会信托14,21,21和优化22外部验证,显示其足够的预后性能和可概括性在不同的人群。
根据15、23,23号风险预测模型开发的方法指南,模型开发验证后的下一步是在常规临床实践中实施预测模型。实施研究之前通常先进行试点或可行性研究,以解决与在临床实践中使用风险算法相关的潜在实用限制。例如,运行计算器所需的数据(如年龄、性别和种族)可能在诊断日期不可用,或稍后更新。应考虑处理缺失数据和实时数据流中频繁更新的有效方法,以获得实现中最可靠的预测结果。此外,由于风险计算器的初始开发基于追溯性队列数据,因此不知道是否可以在实时数据流中使用,而实时数据流是真实临床环境的典型。另一个挑战是确保相关临床医生在适当的时间范围内,在共享和公认的通信途径内收到风险计算器生成的建议。
为了克服这些限制,我们完成了一项采用个性化转诊断风险计算器的可行性实施研究。该研究包括两个阶段:一个阶段是使用当地EHR的数据进行的体外阶段,无需联系临床医生或患者,另一个阶段是体内阶段,涉及与临床医生的直接接触。体外阶段有两个多目的:(一) 根据《综合实施研究框架》第27条解决执行障碍,(二) 将转诊断风险计算器纳入当地经济人权。实施障碍包括向临床医生传达风险结果。在SLaM中,所有患者都被邀请注册联系同意(C4C),这表明他们愿意联系进行研究,而不会影响护理质量。这减少了与联系患者相关的道德问题。此外,与临床医生一起组成的工作组还协助对这些信息的传达方式进行定制。在体内阶段(2018年5月14日至2019年4月29日),所有14岁以上(ii)超过14岁的个人(二)获得任何SLaM服务(兰贝斯、南华克、刘易斯汉姆、克罗伊登等区),(iii) 接受任何非有机、非精神障碍(急性和暂时性精神障碍除外)的第一个ICD-10指数初级诊断;ATPD),或CHR-P指定和(iv)与现有的联系方式被视为合格。在体内阶段,每周接触SLaM的新患者会自动接受精神病风险筛查,并检测出风险大于特定阈值的患者。研究小组随后联系了病人负责的临床医生,讨论进一步的建议,并最终建议进一步进行面对面的评估。如果评估者被认为符合人权专员人权专员的P标准,则转介至专业人权委员会服务处,例如南伦敦的外联和支助服务(OASIS)28。这将导致在精神病发作之前更好地发现个体,并为改变疾病过程提供重要机会。至关重要的是,这一可行性研究涉及将计算器完全集成到当地的EHR系统中,这是本文的主题。本可行性研究的完整方案,包括评估拟议研究计划概述、有关管理数据安全和道德问题的细节,已在我们以前的工作6中介绍。本文作为可行性研究的一部分,有选择地介绍基于当地EHR数据的实时精神病风险检测和警报系统的技术实施情况。更具体地说,本研究的目的是调查此风险计算器的技术可行性,以便一旦患者获得二级精神保健服务,就会及时检测他们。可行性研究的全部结果,在临床医生遵守风险计算器的建议方面,将单独提出。对拟议研究的有效性进行全面评估,这需要随机设计,超出了当前研究计划的范围。据我们所知,这是第一种描述基于实时EHR数据的风险计算器实现的方法,用于早期发现精神病。
我们的心理精神病风险检测和警报方法利用了 CogStack 平台。CogStack 平台是一个轻量级、分布式且容错的信息检索和文本提取平台24。该平台由三个关键组件组成:1) 使用 Java Spring Batch 框架实时从预定义的数据源(结构化和非结构化 EHR 数据(如 Word、PDF 文件和图像)引入和同步数据到预定义数据接收器的 CogStack 管道;2) 弹性搜索,一个搜索引擎,允许存储和查询EHR数据的完整文本,并提供各种应用程序编程接口(API),嵌入到引擎中的高级分析;和 3) Kibana,一个交互式的、基于 Web 的用户界面,允许用户在弹性搜索中查询数据,构建可视化仪表板,并设置对数据异常或其他感兴趣的模式的警报。此外,CogStack 还通过电子邮件和短信(文本)向临床医生发出警报,使临床医生能够及时收到风险计算器报告的高危患者通知。
我们利用 CogStack 平台,在 SLaM 基于 ePJS 提供基于 ePJS 的精神病风险检测和警报模型。与提供每周19日从 ePJS 上追溯访问非识别运行状况记录的机制的 CRIS 平台相比,SLaM 的 CogStack 平台能够实时访问可识别的 EHR,使警报更接近潜在设计的护理点和风险预测,尽管 CRIS 和 CogStack 平台都使用来自 SLaM 中的 ePJS 的数据。在以下部分中,我们提供了方法中关键步骤的详细信息,包括准备来自 EHR 的源数据、将源数据引入 CogStack 平台,以便通过弹性搜索实现全文搜索、使用 Python 守护进程线程运行精神病风险计算器,以及通过 Kibana 用户界面设置交互式可视化和实时风险警报。任何旨在构建基于 EHR 数据的实时风险检测和警报系统的研究人员都可以遵循该方法及其参考实现。如下所述,建议的方法利用了具有高灵活性和可移植性的开源、轻量级技术。这使得风险计算器能够在不同位置运行,并显示出对其他风险估计算法的高适用性。此外,该方法可作为增强嵌入在一般医疗保健系统中的 EHR 的风险检测和警报功能的简单方法。
我们展示了基于 CogStack(开源信息检索和提取平台)的实时精神病风险检测和警报系统的首次 EHR 实施。按照这种方法,可以将一组各种格式的临床数据(包括结构化和非结构化信息)转换为 CogStack 实例,从而实现全文搜索、交互式分析和数据可视化,以及实时提醒精神病患者。虽然最初的精神病风险计算器已经在几个NHS信托的试点研究中得到验证,尽管使用追溯性患者记录6,6,14,21,,21这个实验设计提供了第一个证据基础,这个风险计算器可以复制和部署实时使用。这种方法允许通过现有的临床通知渠道(如 Email)实时自动将预后结果传送给临床医生。这清楚地表明了进行大规模有效性试验的技术可行性,以评估该风险计算器在现实世界中的最终临床效用。
该协议在经验上是创新的,因为不存在类似的精神病风险检测和警报系统。此外,该协议在临床使用中具有很高的通用性,特别是因为我们的方法具有独特的优势。从理论角度看,我们使用的风险预测模型是基于 SLaM NHS 信托的大型回顾性去识别队列而开发的。SLaM 为伦敦南部 136 万人口提供二级精神卫生保健,是世界上精神病记录最高的国家之一。这个庞大的群体在社会人口和诊断特征上具有很高的多样性,使我们能够开发一种风险预测模型,这种模式不太可能偏向具有特定特征的人口。这有证据支持,证明这个风险计算器的预后准确性已经在两个不同的数据库14,21,21中复制了两次,包括一个SLaM以外的数据库。这种风险模型的另一个理论优势是,将基本的人口统计和临床诊断信息用作预测变量。这些信息在电子临床数据中无处不在,事实上,这些预测变量的缺失数据在我们以前的研究中,已证明比较少见。建筑预测器的信息可用性很高,因此可以在不同二级精神卫生保健部门的大量患者样本上运行风险计算器。此外,风险计算器是一种通用算法,适合所有处于二级精神卫生保健中出现精神病风险的个人,而不论个人的年龄如何。也就是说,这个计算器不仅适用于15-35岁范围的峰值精神病风险16,但也适合那些超出这个范围的人,表现出高度的通用性。
从实际角度来看,风险计算器和 CogStack 平台都是轻量级和开源服务,不涉及资源量大的技术或昂贵的基础架构。这种低成本且易于部署的平台可以减少在真实临床环境中采用该平台的障碍。此外,我们的解决方案克服了主要实施障碍:除非临床医生在日常实践中使用风险估计系统,否则它们几乎没有价值。具体来说,我们的方法从 EHR 访问数据,独立于电子医疗记录系统执行分析,并可通过现有通知渠道将分析结果发回临床医生。此方法不要求修改预先存在的系统中的业务逻辑,并且可以作为独立服务支持和扩展现有的临床决策支持系统。因此,该协议与已有的临床系统具有很高的兼容性,并可轻松集成到常规临床实践中。此外,该协议提供了用户友好的界面,用于搜索、分析和可视化临床数据,使临床医生能够轻松解释和探索风险结果。
此协议也有其局限性。首先,在常规临床实践中尚未评估该协议的有效性。本研究侧重于在本地 EHR 中实施实时精神病风险检测和警报系统的技术可行性测试。为了进一步评价该系统在常规临床实践中的有效性,未来需要大规模随机对照试验。第二个限制是,此协议中的风险分数预测基于第一个主诊断,即在单个快照中收集的静态数据。然而,CHR-P症状是随时间演变的内在变化。一个动态版本的精神病风险计算器,其中预测模型可以动态更新,以反映变化,最近已经开发26。今后的工作将侧重于将这个动态计算器集成到当前协议中。
此方法中最关键的步骤是确定用于风险计算器中提取预测变量的 EHR 数据。这还可能涉及创建数据元素映射,当 EHR 系统使用的数据模型不同于该协议中使用的数据模型时,例如针对患者种族的不同编码系统。我们有开源的所有代码和映射定义在线(https://github.com/cogstack-slam/psychosis)。根据这些材料,可以根据自己的情况复制部署或调整计算器。另一个关键步骤是在 CogStack 中创建用于数据引入的数据库视图。由于弹性搜索中的关系联接操作(即合并来自一个或多个数据库表的列)可能会导致高计算成本,因此我们通过创建数据库视图在 EHR 数据库中执行这些联接操作。此视图将提取风险计算器中预测变量所需的所有信息以及 CogStack 管道用于数据引入的数据分区的两个重要字段相结合。第一个字段是视图中的每个记录的唯一主键(”patient_id”使用此协议),第二个字段是最近修改记录时的时间戳。如果这两个字段设置不正确,CogStack 可能无法及时同步 EHR 数据库中的数据更新。有关 CogStack 数据引入故障的详细说明,可在https://cogstack.atlassian.net/wiki/spaces/COGDOC/overview和https://github.com/CogStack/CogStack-Pipeline上提供。
此协议可高度可传输,可轻松部署在具有 CRIS 或 CogStack 平台的 NHS 信托中。到目前为止,CRIS平台(包括同意程序)在其他地方已得到充分描述,并在英国12个NHS信托机构进行扩展,利用超过200万个已解鉴定的患者记录(https://crisnetwork.co/)。同样,CogStack 平台不仅部署在 SLaM 中,还部署了英国其他 NHS 信托机构,如伦敦大学学院医院 (UCLH)、国王学院医院 (KCH)、盖伊和圣托马斯 (GSTT) 以及默西护理 NHS 信托。那些没有平台的信托可以使用在线版本的风险计算器(http://psychosis-risk.net),或基于本手稿和我们的在线文档从头开始构建此协议。尽管此协议是为精神病风险检测而开发的,但此协议的体系结构设计并未与此特定用例相关联。该协议非常灵活,能够重新配置和重新利用实时监测和警报组件,用于其他风险测量领域,如药物不良反应,从而使临床医生能够及时采取行动,改善患者护理、安全和经验。
The authors have nothing to disclose.
这项研究由伦敦国王学院概念信心奖(MRC)(MC_PC_16048)直接输出到PFP。RD和AR得到以下组织的支持:(a) 莫兹利慈善机构;(a)(b) 伦敦南部国家卫生研究所生物医学研究中心和莫兹利NHS基金会信托基金和伦敦国王学院;(c) 英国卫生数据研究部,由英国医学研究理事会、工程和物理科学研究理事会、经济和社会研究理事会、卫生和社会护理部(英格兰)、苏格兰政府卫生和社会护理局首席科学家办公室、卫生和社会护理研究与发展司(威尔士政府)、公共卫生局(北爱尔兰)、英国心脏基金会和韦康信托基金资助;(d) BigData@Heart联合会,由创新药物倡议-2联合承诺根据第116074号赠款协定供资。这项联合承诺得到欧洲联盟地平线2020研究和创新方案和EFPIA的支持;由DE Grobbee和SD Anker担任主席,与20个学术和行业合作伙伴以及ESC合作;(e) 伦敦大学学院国家卫生研究所医院生物医学研究中心。这些供资机构在设计研究、收集和分析方面没有作用。所表达的意见是提交人的观点,不一定是国民保健制度、国家人权系统或卫生部的意见。
CogStack-Pipeline | King's College London | Open source software | |
Elasticsearch | Elastic NV | Open Source Search & Analytics | |
Kibana | Elastic NV | Open source data visualization plugin for Elasticsearch | |
Python packages ("elasticsearch", "elasticsearch_dsl", "pandas" and "numpy") | Open source community | Open source packages |