Vi viser hvordan du distribuerer en sanntids psykoserisikoberegning og varslingssystem basert på CogStack, en informasjonsuthentings- og ekstraksjonsplattform for elektroniske helseregistre.
Nyere studier har vist at en automatisert, levetid-inkluderende, transdiagnostisk og klinisk basert, individualisert risikokalkulator gir et kraftig system for å støtte tidlig påvisning av personer med risiko for psykose i stor skala, ved å utnytte elektroniske helseregistre (EPJ). Denne risikokalkulatoren er eksternt validert to ganger og gjennomgår mulighetstesting for klinisk implementering. Integrering av denne risikokalkulatoren i klinisk rutine bør lettes av potensielle mulighetsstudier, som er nødvendig for å løse pragmatiske utfordringer, for eksempel manglende data, og brukervennligheten til denne risikokalkulatoren i en reell og rutinemessig klinisk setting. Her presenterer vi en tilnærming for en potensiell implementering av en sanntidspsykoserisikodeteksjon og varslingstjeneste i et ekte EHR-system. Denne metoden bruker CogStack-plattformen, som er et åpen kildekode, lett og distribuert informasjonsuthentings- og tekstutvinningssystem. CogStack-plattformen inneholder et sett med tjenester som tillater fulltekstsøk av kliniske data, levetidsinkluderende, sanntidsberegning av psykoserisiko, tidlig risikovarsling til klinikere og visuell overvåking av pasienter over tid. Vår metode inkluderer: 1) inntak og synkronisering av data fra flere kilder til CogStack-plattformen, 2) implementering av en risikokalkulator, hvis algoritme tidligere ble utviklet og validert, for rettidig beregning av pasientens risiko for psykose, 3) opprettelse av interaktive visualiseringer og dashbord for å overvåke pasientenes helsestatus over tid, og 4) bygge automatiserte varslingssystemer for å sikre at klinikere blir varslet om pasienter i fare , slik at passende tiltak kan forfølges. Dette er den første studien som noensinne har utviklet og implementert et lignende deteksjons- og varslingssystem i klinisk rutine for tidlig påvisning av psykose.
Psykotiske lidelser er alvorlige psykiske lidelser som fører til vanskeligheter med å skille mellom den interne opplevelsen av sinnet og den ytre virkeligheten i miljøet1, samt en høyere enn gjennomsnittlig risiko for selvskading og selvmord2. Under standard omsorg, disse lidelsene resultere i store folkehelsekonsekvenser med en betydelig helse og økonomisk byrde på enkeltpersoner, familier og samfunn over hele verden3. Tidlige intervensjoner i psykose kan forbedre resultatene av denne psykiske lidelsen4. Spesielt, deteksjon, prognosevurdering og forebyggende behandling av personer som har klinisk høy risiko for å utvikle psykose (CHR-P)5 gir et unikt potensial til å endre løpet av lidelsen, og dermed forbedre livskvaliteten for mange mennesker og deres familier3,6. CHR-P individer er hjelpsøkende unge mennesker som presenterer med svekket symptomer og funksjonsnedsettelse7: deres risiko for å utvikle psykose er 20% ved 2-år8, men det er høyere i noen spesifikke undergrupper9,10. Til tross for noen betydelige fremskritt, er virkningen av forebyggende tilnærminger i rutinemessig klinisk praksis begrenset av evnen til å oppdage de fleste personer som er i faresonen11. Nåværende deteksjonsmetoder er basert på hjelpesøkende atferd og henvisninger på mistanke om psykoserisiko; disse metodene er svært ineffektive i håndteringen av et stort antall prøver11. Dermed er skalerbarheten av nåværende deteksjonsmetoder til det store flertallet av risikopopulasjonen ganske begrenset12. Faktisk kan bare 5% (frittstående spesialiserte tidlige deteksjonstjenester) til 12% (ungdomspsykiske helsetjenester) av personer med risiko for å utvikle en første psykotisk lidelse oppdages på tidspunktet for deres risikoutsatte stadium av dagens deteksjonsstrategier6.
For å utvide de kliniske fordelene ved forebyggende tilnærminger hos et større antall risikoutsatte individer, utviklet vi en automatisert, levetidsinkluderende (dvs. i alle aldre), transdiagnostikk (dvs. på tvers av ulike diagnoser)13, klinisk basert individualisert risikokalkulator, som kan oppdage personer med risiko for psykose i sekundær psykisk helsevern i stor skala, utover de som oppfyller CHR-P-kriteriene14. Denne risikokalkulatoren brukte en Cox proporsjonal faremodell for å forutsi risikoen for å utvikle en psykotisk lidelse over seks år fra fem rutinemessig innsamlede kliniske variabler valgt en priori, i tråd med metodiske retningslinjer15: alder, kjønn, etnisitet, alder for kjønn og primær indeksdiagnose. Disse kliniske variablene ble valgt ut basert på en priori kunnskap hentet fra metaanalyser16,17, som anbefalt av de toppmoderne metodiske retningslinjene15. Antall prediktorer er begrenset til å bevare forholdet hendelse per variabel og minimere overmontering av skjevheter; inkludert for mange variabler uten et priori filter fører til overmontering problemer og dårlig prognostisk nøyaktighet18. Metoden som brukes til å utvikle denne modellen gir lignende prognostisk nøyaktighet til automatiske maskinlæringsmetoder18. Parametere av Cox-modellen ble estimert basert på en retrospektiv de-identifisert kohort fra Sør-London og Maudsley National Health Service Foundation Trust (SLaM)19. SLaM er en National Health Service (NHS) psykisk helsetillit som gir sekundær psykisk helsevern til en befolkning på 1,36 millioner individer i Sør-London (Lambeth, Southwark, Lewisham og Croydon bydelene), og har en av de høyeste registrerte frekvensene av psykose i verden20. Alle data som brukes i modellutviklingen ble hentet fra Cris-plattformen (Clinical Record Interactive Search), et digitalt case registersystem, som gir forskere retrospektiv tilgang og analyse av anonymiserte kliniske poster19. Den kliniske informasjonen i CRIS hentes ut fra et skreddersydd elektronisk helsejournalsystem (EHR), ved SLaM, kalt electronic Patient Journey System (ePJS). SLaM er papirfri og ePJS representerer standard datainnsamlingsplattform for klinisk rutine. Dermed utnytter transdiagnostisk risikokalkulator EPJ og har potensial til å automatisk screene store EPJ-er av pasienter som får tilgang til sekundær psykisk helsevern, for å oppdage de som kan være utsatt for psykose. Algoritmen til denne transdiagnostiske risikokalkulatoren er publisert tidligere6,14,21. Transdiagnostisk risikokalkulator har blitt eksternt validert i to NHS Foundation Trusts14,21 og optimalisert22, som viser sin tilstrekkelige prognostiske ytelse og generalizability på tvers av ulike populasjoner.
Ifølge metodiske retningslinjer om utvikling av en risikoprediksjonmodell15,23, er neste trinn etter modellutvikling og validering å implementere prediksjonsmodellen i rutinemessig klinisk praksis. Implementeringsstudier innledes vanligvis med pilot- eller mulighetsstudier som tar for seg potensielle pragmatiske begrensninger forbundet med bruk av risikoalgoritmer i klinisk praksis. Nødvendige data for å kjøre en kalkulator, for eksempel alder, kjønn og etnisitet, er for eksempel ikke tilgjengelig på diagnosedatoen eller oppdateres senere. Effektive metoder for håndtering av manglende data og synkronisering av hyppige oppdateringer i sanntidsdatastrømmer bør vurderes for å oppnå de mest pålitelige prediksjonsresultatene i en implementering. Videre, siden den første utviklingen av risikokalkulatoren var basert på retrospektive kohortdata, er det ikke kjent om den kan brukes i en sanntidsdatastrøm som er typisk for en ekte klinisk innstilling. En annen utfordring er å sikre at relevante klinikere får anbefalingene som genereres av risikokalkulatoren innen en passende tidsramme og innenfor en delt og akseptert kommunikasjonsvei.
For å overvinne disse begrensningene har vi fullført en mulighetsimplementeringsstudie som bruker den individualiserte transdiagnostiske risikokalkulatoren. Studien inkluderte to faser: en in vitro fase som ble utført ved hjelp av data fra den lokale EHR, uten å kontakte klinikere eller pasienter, og en in vivo fase, som involverte direkte kontakt med klinikere. In vitro-fasen hadde to manifoldmål: (i) for å håndtere implementeringsbarrierer i henhold til Consolidated Framework for Implementation Research (CFIR)27 og (ii) for å integrere transdiagnostisk risikokalkulator i den lokale EHR. Implementeringsbarrierer omfattet kommunikasjon av risikoutfall til klinikere. I SLaM inviteres alle pasienter til å registrere seg for Consent for Contact (C4C), noe som indikerer deres vilje til å bli kontaktet for forskning, uten å påvirke kvaliteten på omsorgen. Dette reduserer de etiske problemstillingene knyttet til kontakt med pasienter. Videre hjalp arbeidsgrupper med klinikere skreddersøm av hvordan denne informasjonen ble kommunisert. I in vivo-fasen (14. mai 2018 til 29. april 2019) fikk alle individer (i) eldre enn 14 år (ii) som fikk tilgang til noen SLaM-tjeneste (bydelene Lambeth, Southwark, Lewisham, Croydon), (iii) som fikk en første ICD-10-indeks primærdiagnose av ikke-organiske, ikke-psykotiske psykiske lidelser (med unntak av akutt og transient psykotiske lidelser; ATPD), eller en CHR-P-betegnelse og (iv) med eksisterende kontaktdetaljer ble ansett som kvalifisert. I in vivo-fasen ble nye pasienter som fikk tilgang til SLaM hver uke automatisk screenet for deres psykoserisiko, og de med risiko større enn en viss terskel ble oppdaget. Forskerteamet kontaktet deretter pasientenes ansvarlige klinikere for å diskutere ytterligere anbefalinger og til slutt foreslå et ytterligere ansikt til ansikt vurdering6. Hvis de som ble vurdert ble vurdert å oppfylle CHR-P kriterier, ble de henvist til spesialist CHR-P tjenester, for eksempel Outreach og Støtte i Sør-London (OASIS)28. Dette vil resultere i bedre påvisning av individer før utbruddet av en psykotisk lidelse og gir en betydelig mulighet for å endre sykdomsforløpet. Avgjørende, denne mulighetsstudien involverte full integrering av kalkulatoren i det lokale EHR-systemet, som er tema i den nåværende artikkelen. Den fullstendige protokollen for denne mulighetsstudien, inkludert en oversikt over planen for evaluering av den foreslåtte forskningen, detaljer om håndtering av datasikkerhet og etiske problemstillinger, har blitt presentert i vårt tidligere arbeid6. Den nåværende artikkelen, som en del av mulighetsstudien6, fokuserer selektivt på å presentere den tekniske implementeringen av et sanntidspsykoserisikodeteksjons- og varslingssystem basert på de lokale EHR-dataene. Mer spesifikt er målet med denne studien å undersøke den tekniske gjennomførbarheten av denne risikokalkulatoren i rettidig påvisning av risikoutsatte pasienter så snart de får tilgang til en sekundær psykisk helsetjeneste. De fullstendige resultatene av mulighetsstudien, når det gjelder klinikeres overholdelse av anbefalingene fra risikokalkulatoren, vil bli presentert separat. En omfattende evaluering av effektiviteten av den foreslåtte forskningen, som krever randomisert design, er utenfor omfanget av dagens forskningsprogram. Så vidt vi vet, er dette den første metoden som beskriver implementeringen av en risikokalkulator basert på levende EHR-data for tidlig påvisning av psykose.
Vår tilnærming til psykose risikodeteksjon og varsling utnytter CogStack-plattformen. CogStack-plattformen er en lett, distribuert og feiltolerant informasjonsuthentings- og tekstuttrekkingsplattform24. Denne plattformen består av tre viktige komponenter: 1) CogStack Pipeline som bruker Java Spring Batch-rammeverket til å innta og synkronisere data fra en forhåndsdefinert datakilde (både strukturerte og ustrukturerte EHR-data i flere formater som Word, PDF-filer og bilder) til en forhåndsdefinert datavask i sanntid; 2) Elasticsearch, en søkemotor som tillater lagring og spørring av hele teksten i EHR-data, samt å gi ulike applikasjonsprogrammeringsgrensesnitt (APIer) for å bygge inn avansert analyse i motoren; og 3) Kibana, et interaktivt, nettbasert brukergrensesnitt som lar brukerne spørre etter data i Elasticsearch, bygge visualiseringsinstrumentbord og angi varsling om uregelmessigheter eller andre mønstre av interesse fra data. Videre inkorporerer CogStack muligheten til å varsle klinikere om potensielle problemer via e-post og SMS (tekst), slik at klinikere kan motta rettidige meldinger om risikoutsatte pasienter rapportert av risikokalkulatoren.
Vi presenterer en modell av psykose risikodeteksjon og varsling basert på ePJS ved SLaM, ved hjelp av CogStack-plattformen. Sammenlignet med CRIS-plattformen som gir en mekanisme for retrospektiv tilgang til avidentifiserte helseregistre fra ePJS på ukentlig basis19,gir CogStack-plattformen på SLaM tilgang til en identifiserbar EHR i sanntid, og bringer varslingen nærmere synspunktet og risikoprediksjonen i en potensiell design, selv om både CRIS- og CogStack-plattformene bruker data hentet fra ePJS i SLaM. I avsnittet som følger, gir vi detaljer om de viktigste trinnene i vår tilnærming, inkludert å forberede kildedata fra EHR, innta kildedataene i CogStack-plattformen for å aktivere fulltekstsøk via Elasticsearch, kjøre psykoserisikokalkulatoren ved hjelp av en Python-bakgrunnstråd, og sette interaktive visualiseringer og sanntidsrisikovarsling via Kibana-brukergrensesnittet. Enhver forsker som har som mål å bygge et sanntidsrisikodeteksjons- og varslingssystem basert på EHR-data, kan følge tilnærmingen og referanseimplementeringen. Som vi skal utdype nedenfor, utnytter den foreslåtte metoden åpen kildekode, lette teknikker med høy fleksibilitet og bærbarhet. Dette gjør at risikokalkulatoren kan kjøres på ulike steder og viser høy anvendelighet for andre risikoestimeringsalgoritmer. Videre fungerer metoden som en enkel tilnærming for å forbedre risikodeteksjonog varsle funksjonaliteten til en EHR innebygd i et generelt helsevesen.
Vi har demonstrert den første EHR-implementeringen av et sanntidspsykoserisikodeteksjons- og varslingssystem basert på CogStack, en åpen kildekode-informasjonshentings- og ekstraksjonsplattform. Etter denne tilnærmingen kan man transformere og innta et stort sett med kliniske data i ulike formater, inkludert strukturert og ustrukturert informasjon, til en CogStack-forekomst, for å muliggjøre fulltekstsøk, interaktive analyser og visualisering av data, samt sanntidsvarsling til klinikere av pasienter som er i fare for psykose. Selv om den opprinnelige psykoserisikokalkulatoren har blitt validert i pilotstudier på tvers av flere NHS Trusts, om enn ved hjelp av retrospektive pasientjournaler6,14,21, gir denne eksperimentelle designen det første bevisgrunnlaget for at denne risikokalkulatoren kan replikeres og distribueres for bruk i sanntid. Denne tilnærmingen tillater automatisk levering av prognostiske resultater til klinikere gjennom eksisterende kliniske varslingskanaler, for eksempel E-post, i sanntid. Dette viser tydelig den tekniske gjennomførbarheten for å gjennomføre en storskala effektivitetsstudie for å evaluere den ultimate kliniske nytten av denne risikokalkulatoren i den virkelige verden.
Denne protokollen er empirisk nyskapende, da det ikke eksisterer et lignende risikodeteksjons- og varslingssystem for psykose. Videre har denne protokollen høy generalizability i klinisk bruk, spesielt på grunn av de unike styrkene til vår tilnærming. Fra et teoretisk perspektiv brukte vi en risikoprediksjonsmodell som ble utviklet basert på en stor retrospektiv de-identifisert kohort fra SLaM NHS Trust. SLaM gir sekundær psykisk helsevern til en befolkning på 1,36 millioner individer i Sør-London og har en av de høyeste registrerte forekomstene av psykose i verden. Denne store kohorten, som har høyt mangfold i sosiodemografiske og diagnostiske egenskaper, gjør det mulig for oss å utvikle en risikoprediksjonsmodell som neppe vil være partisk mot en befolkning med spesifikke egenskaper. Dette støttes av bevis for at den prognostiske nøyaktigheten av denne risikokalkulatoren allerede har blitt replikert to ganger i to forskjellige databaser14,21, inkludert en utenfor SLaM. En annen teoretisk styrke i denne risikomodellen er at grunnleggende demografisk og klinisk diagnoseinformasjon ble brukt som prediktorer. Slik informasjon er allestedsnærværende i elektroniske kliniske data, og faktisk mangler data for disse prediktorene har vist seg å være relativt sjeldne i våre tidligere studier14,21. Den høye tilgjengeligheten av informasjon for bygningsprediktorer gjør det mulig å kjøre risikokalkulatoren over et stort antall pasientprøver på tvers av ulike sekundære psykiske helsesektorene. I tillegg er risikokalkulatoren en generell algoritme som passer for alle personer som er i fare for å utvikle psykose i sekundær psykisk helsevern, uavhengig av enkeltpersoners alder. Det vil si at denne kalkulatoren ikke bare er egnet for 15-35 aldersgruppe av topp psykose risiko16, men også for de utenfor dette området, viser en høy grad av generalizability.
Fra et praktisk perspektiv er både risikokalkulatoren og CogStack-plattformen lette og åpen kildekode-tjenester som ikke involverer ressurstunge teknikker eller kostbar infrastruktur. En slik rimelig og lett-å-distribuere plattform kan redusere barrierene for adopsjon i virkelige kliniske innstillinger. Også vår løsning overvinner hovedimplementeringsbarrieren: risikoestimeringssystemer gir liten verdi med mindre de brukes av klinikere i den daglige praksisen25. Spesielt får vår tilnærming tilgang til data fra EHR, utfører analyser uavhengig av et elektronisk medisinsk journalsystem og kan sende analyseresultater tilbake til klinikere gjennom eksisterende varslingskanaler. Denne metoden krever ikke at forretningslogikken i eksisterende systemer endres og kan fungere som en frittstående tjeneste for å støtte og utvide eksisterende kliniske beslutningsstøttesystemer. Dermed har protokollen høy kompatibilitet med eksisterende kliniske systemer og kan enkelt integreres i rutinemessig klinisk praksis. Videre gir protokollen brukervennlige grensesnitt for å søke, analysere og visualisere kliniske data, noe som gjør det enkelt for klinikere å tolke og utforske risikoresultatene.
Denne protokollen har også sine begrensninger. For det første har effektiviteten av denne protokollen ikke blitt evaluert i rutinemessig klinisk praksis. Denne studien fokuserte på tekniske mulighetstester for å implementere en sanntidspsykoserisikodeteksjon og varslingssystem i en lokal EHR. For ytterligere å evaluere effektiviteten av dette systemet i rutinemessig klinisk praksis, er fremtidige store randomiserte kontrollerte studier nødvendig6. En annen begrensning er at spådommene om risikoscore i denne protokollen ble gjort basert på de første primære diagnosene, som er statiske data samlet inn ved ett øyeblikksbilde. CHR-P-symptomene utvikler seg imidlertid over tid. En dynamisk versjon av psykose risikokalkulator, der prediksjonsmodeller kan oppdateres dynamisk for å gjenspeile endringene, er utviklet nylig26. Fremtidig arbeid vil fokusere på å integrere denne dynamiske kalkulatoren i den gjeldende protokollen.
Det mest kritiske trinnet i denne tilnærmingen var å identifisere EHR-data som ble brukt til ekstraktprediktorer i risikokalkulatoren. Dette kan også innebære å opprette dataelementtilordninger, når et EHR-system brukte en annen datamodell enn den som brukes i denne protokollen, for eksempel forskjellige kodesystemer for pasientenes etniske grupper. Vi har åpen kildekode alle kode- og kartdefinisjonene på nettet (https://github.com/cogstack-slam/psychosis). Basert på disse materialene, ville man være i stand til å gjenskape distribusjonen eller justere kalkulatoren avhengig av ens egen omstendighet. Et annet kritisk trinn var å opprette en databasevisning for datainntak i CogStack. Siden relasjonssammenføyningsoperasjoner (dvs. kombinere kolonner fra én eller flere databasetabeller) i Elasticsearch kan føre til høye beregningskostnader, gjennomførte vi disse sammenføyningsoperasjonene i EHR-databasen ved å opprette en databasevisning. Denne visningen kombinerte all informasjon som var nødvendig for å trekke ut prediktorer i risikokalkulatoren, og to viktige felt som ble brukt av CogStack-rørledninger for datapartisjonering i datainntak. Det første feltet er en unik primærnøkkel for hver post i visningen (“patient_id” brukt denne protokollen), og det andre er et tidsstempel når en oppføring ble endret sist. Hvis disse to feltene ikke ble angitt riktig, kan det hende at CogStack ikke synkroniserer dataoppdateringer i en EHR-database i tide. Detaljerte instruksjoner for feilsøking av problemer på CogStack-datainntak er tilgjengelig på https://cogstack.atlassian.net/wiki/spaces/COGDOC/overview og https://github.com/CogStack/CogStack-Pipeline.
Denne protokollen er svært transportabel og kan enkelt distribueres i NHS Trusts som har en CRIS eller CogStack plattform. Så langt har CRIS-plattformen inkludert samtykkeprosedyrene blitt fullstendig beskrevet andre steder og er under utvidelse over 12 NHS Trusts i Storbritannia, og utnytter over 2 millioner identifiserte pasientjournaler (https://crisnetwork.co/). På samme måte har CogStack-plattformen blitt utplassert ikke bare i SLaM, men også andre NHS Trusts over hele Storbritannia som University College London Hospitals (UCLH), King’s College Hospital (KCH), Guy’s og St Thomas ‘ (GSTT) og Mersey Care NHS Trusts. Disse trusts uten slike plattform kan bruke en online versjon av risiko kalkulator(http://psychosis-risk.net),eller bygge denne protokollen fra bunnen av basert på dette manuskriptet og våre elektroniske dokumenter. Selv om denne protokollen er utviklet for psykoserisikodeteksjon, er den arkitektoniske utformingen av denne protokollen ikke knyttet til dette spesifikke brukstilfellet. Protokollen er fleksibel nok til å tillate rekonfigurering og repurposing av sanntidsovervåking og varsling av komponenter for andre risikomålingsområder, for eksempel bivirkninger, og dermed tillate klinikere å iverksette tiltak i tide for å forbedre pasientbehandling, sikkerhet og erfaring.
The authors have nothing to disclose.
Denne studien er finansiert av og er en direkte produksjon av King’s College London Confidence in Concept award fra Medical Research Council (MRC) (MC_PC_16048) til PFP. RD og AR ble støttet av: (a) Maudsley Charity; (b) National Institute for Health Research (NIHR) Biomedical Research Centre ved Sør-London og Maudsley NHS Foundation Trust og King’s College London; (c) Health Data Research UK, som er finansiert av UK Medical Research Council, Engineering and Physical Sciences Research Council, Economic and Social Research Council, Department of Health and Social Care (England), Chief Scientist Office of the Scottish Government Health and Social Care Directorates, Health and Social Care Research and Development Division (Welsh Government), Public Health Agency (Nord-Irland), British Heart Foundation og Wellcome Trust; (d) The BigData@Heart Consortium, finansiert av Innovative Medicines Initiative-2 Joint Foretak under tilskuddsavtale nr. Dette felles foretaket mottar støtte fra EUs forsknings- og innovasjonsprogram horizon 2020 og EFPIA; det ledes av DE Grobbee og SD Anker, som samarbeider med 20 akademiske og industripartnere og ESC; og (e) National Institute for Health Research University College London Hospitals Biomedical Research Centre. Disse finansieringsorganene hadde ingen rolle i utformingen av studien, innsamlingen og analysene. Synspunktene som uttrykkes er de av forfatteren(e) og ikke nødvendigvis de av NHS, NIHR eller Helsedepartementet.
CogStack-Pipeline | King's College London | Open source software | |
Elasticsearch | Elastic NV | Open Source Search & Analytics | |
Kibana | Elastic NV | Open source data visualization plugin for Elasticsearch | |
Python packages ("elasticsearch", "elasticsearch_dsl", "pandas" and "numpy") | Open source community | Open source packages |