Biochemistry

gP2S, ett informationshanteringssystem för CryoEM-experiment

Published: June 10, 2021 doi: 10.3791/62377

Dorota Wypych¹, Daniel Kierecki¹, Filip M. Golebiowski¹, Alexis Rohou²

¹Roche Polska Sp. z o.o., ²Department of Structural Biology, Genentech

Summary

gP2S är en webbapplikation för spårning av cryoEM-experiment. Dess huvudfunktioner beskrivs, liksom de steg som krävs för att installera och konfigurera programmet. När programmet har konfigurerats kan man korrekt registrera metadata som är associerade med negativa färg- och cryoEM-experiment.

Abstract

Kryogen elektronmikroskopi (cryoEM) har blivit en integrerad del av många läkemedelsupptäcktsprojekt eftersom kristallografi av proteinmålet inte alltid är möjligt att uppnå och cryoEM ger ett alternativt sätt att stödja strukturbaserad ligand design. När man hanterar ett stort antal distinkta projekt, och inom varje projekt ett potentiellt stort antal ligand-protein-co-structures, blir korrekt journalföring snabbt utmanande. Många experimentella parametrar justeras för varje mål, inklusive vid provberedning, rutnätsberedning och mikroskopisteg. Därför kan korrekt journalföring vara av avgörande betydelse för att möjliggöra långsiktig reproducerbarhet och för att underlätta effektivt lagarbete, särskilt när steg i cryoEM-arbetsflödet utförs av olika operatörer. För att hantera denna utmaning utvecklade vi ett webbaserat informationshanteringssystem för cryoEM, kallat gP2S.

Programmet håller reda på varje experiment, från prov till slutlig atommodell, i samband med projekt, vars lista upprätthålls i programmet eller externt i ett separat system. Användardefinierade kontrollerade ordförråd av förbrukningsvaror, utrustning, protokoll och programvara hjälper till att beskriva varje steg i cryoEM-arbetsflödet på ett strukturerat sätt. gP2S är allmänt konfigurerbart och kan, beroende på teamets behov, finnas som en fristående produkt eller vara en del av ett bredare ekosystem av vetenskapliga tillämpningar, integrera via REST API: er med projekthanteringsverktyg, applikationer som spårar produktionen av proteiner eller små molekyler ligands, eller applikationer som automatiserar datainsamling och lagring. Användare kan registrera information om varje rutnäts- och mikroskopisession, inklusive viktiga experimentella metadata och parametervärden, och härstamningen för varje experimentell artefakt (exempel, rutnät, mikroskopisession, karta etc.) registreras. gP2S fungerar som en cryoEM experimentell arbetsflödesorganisatör som möjliggör korrekt journalföring för team och är tillgänglig under en licens med öppen källkod.

Introduction

Informationshantering vid cryoEM-anläggningar
Från och med 2014 har antalet kryogena elektronmikroskopi (cryoEM)^{1-anläggningar} vuxit explosionsartad, med minst 300 avancerade system installerade runt om i^{världen 2}, inklusive på ett antal läkemedelsföretag, vilket återspeglar en växande roll för cryoEM i läkemedelsupptäckt³. Dessa anläggningars uppdrag och deras krav på dataspårning och datahantering skiljer sig^{åt 4}. Vissa, till exempel nationella cryoEM-center, anklagas för att ta emot EM-rutnät, samla in datamängder och returnera data till användarna för strukturbestämning, kanske efter viss automatiserad bildbehandling. I sådana anläggningar är det viktigt att spåra nätets härkomst, dess koppling till ett användarförslag eller ett användarbidrag och härstamningen från rutnät till datauppsättning, men andra faktorer, såsom reningsmetoden för proteinprovet eller den slutliga strukturbestämningsprocessen, är mindre, eller inte alls, relevanta. I andra anläggningar, såsom lokala akademiska anläggningar, ansvarar varje slutanvändare för att förbereda sina egna prover och nät, genomföra mikroskopin, hantera rådata och dess bearbetning och publicering av resultaten. Det finns inget strikt behov av metadataspårning från en sådan anläggnings sida eftersom denna roll uppfylls av slutanvändaren eller deras huvudprövare.

I vår cryoEM-anläggning centraliseras hantering och optimering av prover, rutnät, datainsamlings- och bearbetningsprotokoll och resultat (kartor, modeller) över många projekt till en liten grupp utövare. Detta innebär utmaningar inom experimentell (meta)datahantering. Den experimentella härstamningen av strukturer, från atommodell hela vägen tillbaka till den exakta identiteten hos proteiner och ligander, via parametrar för nätberedning och protokoll för datainsamling, måste fångas in och bevaras noggrant. Dessa metadata måste göras tillgängliga för ett antal mänskliga aktörer. Till exempel kan en person som gör bildbehandling behöva veta vilken konstruktion av ett protein som användes och vad bildparametrarna var, även om de varken renade proteinet eller samlade cryoEM-data själva; Informatiksystem som automatiska datahanteringsdemoner måste identifiera det projekt för vilket ett mikroskop för närvarande samlar in data för att korrekt och systematiskt tilldela katalognamn.

Flera informationshanteringssystem finns tillgängliga för att stödja cryoEM-anläggningar. Kanske mest komplett bland dem är EMEN2⁵, som kombinerar funktioner i en elektronisk labbanteckningsbok, ett informationshanteringssystem och vissa delar av ett affärsprocesshanteringsverktyg. Används vid många synkrotroner, ISPyB⁶, ursprungligen byggd för att stödja röntgenstrålarna för kristallografi, stöder nu också cryoEM-datainsamling. Scipion⁷ är ett rikt och kraftfullt omslag runt bildbehandlingspaket, som gör det möjligt för användare att spela in arbetsflöden för bildbehandling och dela dem, till exempel via det offentliga arkivet EMPIAR⁸^,⁹, och är också integrerat med ISPyB för att möjliggöra kryoEM-databehandling i farten.

Här beskriver vi gP2S (för Genentech Protein to Structure), ett modernt och lätt kryoEM-informationshanteringssystem byggt för att stödja arbetsflödet från renat protein och små molekyler till den slutliga atommodellen.

Översikt över gP2S
gP2S är ett användarvänligt webbaserat cryoEM-informationshanteringssystem som underlättar korrekt journalföring för cryoEM-labb och multifunktionella, multiprojektanläggningar. Följande entiteter, deras relationer och associerade metadata spåras: projekt, utrustning, förbrukningsvaror, protokoll, exempel, rutnät, mikroskopisessioner, bildbehandlingssessioner, kartor och atommodeller. Användare kan också lägga till fritextkommentarer, eventuellt inklusive bifogade filer, vilket möjliggör omfattande anteckningar om alla entiteter som är registrerade i gP2S. Frontend har utformats för att underlätta användning med pekskärmsenheter och testats i stor utsträckning på 12,9"-iPad Pros, vilket gör det möjligt att använda gP2S på labbbänken medan du förbereder prover och galler (figur 1), samt vid datorn när du använder mikroskopet, bearbetar bilder eller deponeringsmodeller. Varje sida i frontend syftar till att minska manuell datainmatning genom att förinställningsparametrar förinställning till förnuftiga standardvärden när det är möjligt.

Backend för gP2S har ett antal REST API -slutpunkter (REpresentational State Transfer Application Programming Interface), vilket gör det möjligt att integrera gP2S i befintliga arbetsflöden och skript. Datamodellen utformades för att möjliggöra korrekt insamling av negativa stain- och cryoEM-arbetsflöden, inklusive förgrening, till exempel med ett exempel som används på flera rutnät, data från flera mikroskopisessioner som slås samman till en enda databehandlingssession eller en databehandlingssession som ger flera kartor.

Systemarkitektur
gP2S är ett klassiskt program på tre nivåer (figur 2). I denna modulära arkitektur är systemet uppdelat i tre separata lager, var och en ansvarig för att utföra distinkta uppgifter, och var och en utbytbar eller modifierbar oberoende av de andra. (1) Presentationslagret (eller frontend) ger användaren åtkomst via webbläsare (i stor utsträckning testad med Chrome och Safari), gör det möjligt att skapa och ändra arbetsflödeselement (inklusive dataverifiering) och visar experimentella data som enskilda entiteter, projektbaserade listor och fullständiga arbetsflödesrapporter. (2) Servicelagret (eller server delningen) fungerar som ett mellanliggande lager mellan användargränssnittet och lagringssystemet – det innehåller kärnaffärslogik, exponerar det tjänste-API som används av frontend, integreras med datalagring och LDAP-system (Lightweight Directory Access Protocol) för användarautentisering och utgör en grund för ytterligare integrering med externa system. (3) Beständighetsskiktet (dataåtkomst) ansvarar för lagring av experimentella data, användarkommentarer och bifogade filer.

Viktig teknik och nyckelramar
För att underlätta utveckling, byggande och underhåll av GP2S-applikationen användes flera tekniker och ramverk i projektet. De viktigaste är: Vue.js 2.4.2¹⁰ för frontend och SpringBoot 1.3¹¹ med inbäddad Tomcat 8-server för backend. Programmet använder MySQL 5.7- och MongoDB 4.0.6-databaser för lagring och LDAP^{12 för autentisering.} Som standard levereras och distribueras alla dessa komponentdelar som ett program.

Totalt använder programmet hundratals olika bibliotek antingen direkt eller indirekt. De mest framträdande listas i tabell 1.

Datamodell
Tre typer av entiteter kan särskiljas i gP2S-datamodellen(figur 3):arbetsflödesenheter som är relaterade till data som samlats in under experiment (t.ex. prover eller mikroskopisessioner). Utrustnings- och protokollenheter som beskriver data som är vanliga i alla projekt (t.ex. mikroskop eller vitrifikationsprotokoll). andra enheter som spelar stödjande eller tekniska roller i systemet (t.ex. kommentarer eller standardvärden).

Roten till arbetsflödesdataträdet är project-entiteten. Varje projekt består av ett antal proteiner och/eller ligands som är byggstenar för att skapa provenheter. Varje exempel kan användas för att skapa flera rutnät som i sin tur används i mikroskopisessioner (ett rutnät per mikroskopisession). De senare tilldelas bearbetningssessioner som kan ge en eller flera kartor. Den sista entiteten i trädet är atommodellen, skapad med en eller flera kartor. Följaktligen är varje arbetsflödesrelaterad entitet, från protein till modell, alltid bunden till ett visst projekt via sina förfäder. Sådan design skapar dataaggregat som är lätta att bearbeta antingen med frontend-modulen eller av externa system som använder API: et.

Förutom arbetsflödesdata finns det entiteter som beskriver utrustning som används i experiment eller protokoll som följdes när rutnät förbereddes. Att definiera dessa entiteter är en förutsättning för att skapa experimentella arbetsflödesentiteter som rutnät, mikroskopi och bearbetningssessioner.

Den sista typen av dataentitet, som kollektivt heter "Övrigt", används för tekniska ändamål (t.ex. bifogade filer eller standardvärden). Den här kategorin innehåller kommentarsenheter som kan länkas till alla arbetsflöden eller utrustnings-/protokollentiteter.

Tillgänglighet för programvara
Open source-versionen av gP2S är tillgänglig under en Apache License Version 2.0²⁶, från https://github.com/arohou/gP2S. En Docker-avbildning för att köra gP2S är tillgänglig https://hub.docker.com/r/arohou/gp2s. En filial till GP2S med sluten källkod är under fortsatt utveckling på Roche & Genentech.

Köra gP2S-programmet
Det finns två sätt att köra gP2S: som dockerbehållare eller som ett fristående Java-program. Det optimala valet beror på mål distributions miljön. Om du till exempel vill anpassa eller förbättra koden så att den passar användarnas specifika behov måste hela programmet byggas om först. I det här fallet kan gP2S som ett fristående program rekommenderas.

Docker-behållare
Det enklaste sättet att börja arbeta med gP2S-programmet är att köra det som en Docker-tjänst. För detta ändamål har en dedikerad Docker-avbildning förberetts och publicerats i Docker Hub-databasen ("https://hub.docker.com/r/arohou/gp2s"). Om du kör gP2S-avbildningen beror det på åtkomsten till MySQL- och MongoDB-databaser och till en LDAP-server. För icke-produktionsmiljö rekommenderas att du kör alla dessa beroenden som dockerprogram med flera behållare tillsammans med gP2S-programmet. För att göra detta sömlöst har en docker-compose-fil (https://github.com/arohou/gP2S/blob/master/docker-compose.yml) som innehåller alla nödvändiga konfigurationer av den slutliga miljön förberetts och tillhandahållits i GP2S GitHub-databasen (https://github.com/arohou/gP2S). Följande dockerbilder är beroenden: mysql²⁷, mongodb²⁸, apacheds²⁹.

I standardkonfigurationen tas alla lagrade data, både entiteter och bifogade filer bort när docker-behållarna tas bort. För att behålla data bör antingen docknings volymer användas eller gP2S-programmet bör anslutas till dedikerade databas instanser (MySQL och MongoDB). ApacheDS LDAP-serverbehållaren levereras med en förkonfigurerad administratörsanvändare (lösenord: hemlig). Dessa autentiseringsuppgifter bör användas för att logga in på gP2S-programmet när det körs som en Docker-tjänst. För produktionsmiljöer kan samma docker-compose-fil användas för att distribuera gP2S (och andra behållare om det behövs) som tjänster till en Docker Swarm container orchestration-plattform.

Den fullständiga processen att köra gP2S som dockerbehållare, inklusive all information om korrekt konfiguration, beskrivs i gP2S GitHub-databasen och omfattar följande avsnitt:

• Kör det dockade gP2S-programmet med alla beroenden.
• Tillgång till gP2S-programmet, databasen och LDAP.
• Uppdatering av gP2S-tjänsten med en ny version.
• Ta bort gP2S-applikationen.
• Konfigurera databeständighet.
• Ansluta det dockeriserade gP2S-programmet till dedikerade databaser eller en LDAP-server.
• Konfigurationsinformation

Fristående Java-applikation
Ett annat alternativ för att köra gP2S-programmet är att bygga ett fristående Java-paket. Den här metoden bör användas om det inte är möjligt att köra Docker-behållare. För att skapa gP2S-programmet måste du installera ett Java Development Kit version 8 eller senare. Hela byggprocessen hanteras av Maven-verktyget, som finns i kodbasen i GitHub-databasen. Byggkonfigurationen är beredd att bygga frontend-delen först, sedan kopiera den till serverdelskällor och sedan bygga den som ett slutligt program. På så sätt finns det inget behov av att installera några andra verktyg eller bibliotek för att förbereda ett fullt fungerande gP2S-paket. Som standard är resultatet av bygget ett JAR-paket (lagras lokalt) och Docker-avbildning (skjuts till databasen konfigurerad i Maven pom.xml-filen). Det är viktigt att komma ihåg att information som krävs för att ansluta till externa system (databaser och LDAP-server) måste tillhandahållas i en korrekt konfigurationsfil innan paketet byggs.

När gP2S JAR-paketet har skapats innehåller det alla beroenden och konfigurationsinformation som behövs för att köra programmet, inklusive Tomcat-programservern som är värd för systemet. Om paketet byggdes med flera konfigurationsfiler kan det köras i olika lägen utan ombyggnad.

GP2S GitHub-lagringsplatsen innehåller en fullständig beskrivning av processen att skapa och köra gP2S som ett fristående program och täcker följande ämnen:

• Bygga gP2S med Maven-verktyget
• Bygga och köra med inbäddade databaser
• Bygga och köra med beroenden utplacerade som dockercontainrar
• Bygga och köra med dedikerade databaser
• Konfigurera autentisering

Protocol

1. Ställa in gP2S för arbete

Logga in på gP2S. Vid lyckad inloggning visas huvudskärmen.
OBS: I det övre högra hörnet visas användarnamnet - klicka på detta för att logga ut. Navigeringsfältet till vänster består av en projektväljare (överst), en uppsättning navigeringsobjekt som visar de experimentella entitetstyper som definierar cryoEM-arbetsflödet (exempel, rutnät, mikroskopisessioner, bearbetningssessioner, kartor och modeller) och en länk till avsnittet Inställningar i programmet.
Innan några experiment kan loggas fyller du i avsnittet Inställningar med information om projekt, utrustning, förbrukningsvaror, programvara och protokoll som används på cryoEM-anläggningen. Inställningarna kan uppdateras när som helst genom att lägga till nya verktyg och projekt och genom att redigera de befintliga posterna. Men precis som alla entiteter i gP2S kan inte inställningartiteter tas bort när de har skapats.

2. Konfigurera minst ett projekt

Navigera till Inställningar > projekt.
Klicka på Skapa nytt projekt.
Skriv in en projektetikett.
Klicka på Spara.

3. Konfigurera minst en ytbehandlingsmaskin.

OBS: Ytbehandlingsmaskiner används för att ändra ytegenskaperna hos EM-galler - oftast är de glödurladdningar eller plasmarengöringsmedel.

Välj Ytbehandlingsmaskin i avsnittet Utrustning.
Klicka på Skapa ny dator.
Ange en etikett som kommer att fungera för att identifiera maskinen senare.
Ange tillverkare, modell och plats.
Klicka på Spara.

4. Registrera minst en rutnätstyp.

OBS: Rutnätstyper är avsedda att identifiera modeller av galler (t.ex. "2-μm hålig kolfilm på kopparnät med 300 maskor"), inte specifika partier eller massor av galler

Välj Rutnätstyp i avsnittet Förbrukningsvaror.
Klicka på Skapa ny rutnätstyp.
Ange en rutnätstypetikett, tillverkare och beskrivning.
Klicka på Spara.

5. Registrera minst en vitrifikationsmaskin

Välj Vitrification Machinei avsnittet Utrustning .
Klicka på Skapa ny dator.
Ange tillverkare, modell och plats.
Klicka på Spara.

6. Registrera minst ett Blotting Paper

Välj Blotting Paper i avsnittet Förbrukningsvaror.
Klicka på Skapa nytt Blotting Paper.
Skriv in en Blotting Paper-etikett, tillverkare och modell.
Klicka på Spara.

7. Registrera minst en Cryo Storage Device

Välj Cryo Storage Device i avsnittet Utrustning .
Klicka på Skapa ny lagringsenhet.
Ange enhetens tillverkare, modell och plats.
Ställ in växlingsknapparna för att ange om den tillagda lagringsenheten har cylindrar, rör och/eller lådor.
OBS: Om det gör det kommer gP2S att låta användare ange relevanta cylinder-, rör- och/eller boxidentifierare senare när användare loggar lagringsplatserna för enskilda rutnät. Med ovanstående delar av utrustning och förbrukningsvaror inställda är det möjligt att skapa tre typer av protokoll - ytbehandling, negativ fläck och vitrifiering.

8. Registrera minst ett ytbehandlingsprotokoll

Välj Ytbehandling i avsnittet Protokoll.
Klicka på Skapa nytt protokoll.
Ange en etikett för att identifiera protokollet.
Välj en av ytbehandlingsmaskinerna.
Ange inställningar som används under detta protokoll: utloppens varaktighet, ström och polaritet samt tryck samt eventuella tillsatser i atmosfären.
Klicka på Spara.

9. Skapa minst ett negativt fläckprotokoll

Välj Negativ fläck i avsnittet Protokoll.
Klicka på Skapa nytt protokoll.
Ange en protokolletikett.
Beskriv fläcken genom att ge värden för dess namn, pH och koncentration av tungmetallsalt.
Ange inkubationstiden för fläcken före blotting.
Ange fritextbeskrivning av protokollet.
Klicka på Spara.

10. Registrera minst ett protokoll för nätfrysning

Välj Vitrifiering i avsnittet Protokoll.
Klicka på Skapa nytt protokoll.
Ange en protokolletikett.
Välj relevant vitrifikationsmaskin i listrutan.
Välj det Blotting Paper som används i det här protokollet.
Ge sedan den återstående experimentella informationen: relativ fuktighet, temperatur, fläckkraft, antal fläckar, fläcktid, väntetid, tömningstid, antal provapplikationer.
Ange en fritextbeskrivning.
Klicka på Spara.
Obs: När du har konfigurerat protokollen är det möjligt att skapa både cryo- och negativt fläcknät. Om du vill använda gP2S för att spela in nästa steg i arbetsflödet, med början från mikroskopisessioner, är det nödvändigt att konfigurera ett mikroskop, en elektrondetektor och en provhållare.

11. Registrera minst ett mikroskop

Välj Mikroskop i avsnittet Utrustning.
Klicka på Skapa nytt mikroskop.
Skriv in en mikroskopetikett.
Ange tillverkare, modell och plats.
Välj vilka accelerationsspänningar som ska konfigureras och kan tas i drift på det här mikroskopet, från den förinställda listan på 80, 120, 200 och 300 kV.
Ange listan över kondensor ("C2") och objektiva bländare installerade. OBS: För varje typ kan upp till 4 bländarplatser konfigureras, varav en är avsedd som standardöppning för detta mikroskop. När det gäller de objektiva öppningarna, ange att en eller flera av slitsarna tas upp av en fasplatta, i vilket fall diameterparametern är inaktiverad.
Ange om mikroskopet är utrustat med en autoloader eller om det krävs en sidoingångshållare.
Ange om mikroskopet är utrustat med ett energifilter.
Ange standardvärden för utsugningsspänning, inställning av pistollins, dekorstorlek och energifilterslitsbredd (om relevant). De angivna värdena används när användare skapar mikroskopisessioner.

12. Registrera minst en elektrondetektor

Välj Elektrondetektor i avsnittet Utrustning.
Klicka på Skapa ny elektrondetektor.
Ange en etikett, tillverkare och modell.
Välj det mikroskop som detektorn är monterad på i en listruta.
Tillsätt minst en förstoring kalibrerad för denna kombination av mikroskopdetektor:
1. Under förstoringar väljer du Lägg till ny.
2. Ange både nominella och kalibrerade förstoringsvärden.
3. Upprepa dessa steg för alla förväntade förstoringsinställningar. Dessa förstoringsinställningar kommer senare att vara tillgängliga i en listrutan väljare för användare som loggar mikroskopi sessioner.
Använd kryssrutor för att ange om detektorn kan räkna elektroner, dosfraktion och superupplösning.
Slutligen, ge ytterligare specifikationer för detektorn: räknar per elektronfaktor (det genomsnittliga antalet räkningar registrerade av incidentelektron), den linjära dimensionen för varje pixel (i μm) och antalet rader och kolumner med pixlar.
Klicka på Spara

13. Om det finns ett eller flera mikroskop som kräver provhållare för sidoinmatning, registrera tillgängliga provhållare i gP2S.

Välj Provhållare i avsnittet Utrustning.
Klicka på Skapa ny hållare.
Ange en etikett, tillverkare, modell och plats.
Ange den maximala lutningen (i grader) för provhållaren.
Använd kryssrutorna för att ange om den kan hålla kryogena EM-galler och om den kan luta med dubbla axlar.
I en listruta väljer du alla mikroskop som hållaren kan användas med.
OBS: Detta säkerställer att endast relevanta innehavare listas när användare registrerar mikroskopisessioner med sidointrädesmikroskop.
Klicka på Spara.

14. Ange det mönster som gP2S ska följa när katalognamnet som är associerat med varje mikrokopisession ska anges.

Obs: Det kan vara mycket användbart att gP2S automatiskt genererar ett katalognamn för lagring av bilddata som registrerats under en mikroskopisession. Detta säkerställer systematisk, informationsrik namngivning av lagringskataloger. Ange det mönster som gP2S ska följa när katalognamnet som är associerat med varje mikroskopisession ska anges.

Välj Inställningar i avsnittet Admin.
Redigera katalognamnsmönstersträngen.
Obs: den här strängen kan innehålla följande variabler: projektetikett, rutnäts-ID, rutnätsetikett, etikett för mikroskopisession, mikroskopisessions-ID, startdatum för mikroskopisession, starttid för mikroskopisession och mikroskopetikett, avgränsad med ${}. Förutom dessa variabler kan katalognamnsmönster innehålla de flesta tecken. Standardkatalognamnmönstret är till exempel ${GridLabel}_${MicroscopyStartDate}_${ProjectLabel}_${MicroscopeLabel}_grid_${GridID}_session_${MicroscopySessionID}. Nu är tillräckliga inställningar konfigurerade för att möjliggöra registrering av experimentella entiteter fram till och med mikroskopisessioner.

15. Registrera programvara för bildbehandling som är tillgänglig för användarna.

Obs: Detta aktiverar registrering av bearbetningssessioner och senare entitetstyper (kartor och modeller).

Välj Bildbehandling.
Klicka på Skapa ny bildbehandlingsprogramvara.
Skriv in programvarans namn
Lista alla versioner som är tillgängliga för användare:
1. Välj Lägg till ny under programvaruversioner.
2. Ange programvaruversionen.
  Obs: Detta gör det möjligt för användare att ange exakt vilken version av programvaran de använde för att nå sina resultat när de registrerade bildbehandlingssessioner. Detta slutför den nödvändiga konfigurationen av gP2S. Användare bör nu kunna fånga nyckelmetadata som beskriver deras elektronmikroskopiexperiment, enligt beskrivningen i följande avsnitt.

Representative Results

Övergripande design- och navigeringsmönster
GP2S-programmet är projektorienterat, så att en entitet endast kan skapas i samband med ett projekt. Det relevanta projektet väljs först från listrutan som ligger nära det övre vänstra hörnet av programmet. För enkelhetens skull är listan över projekt filterbar och den sorteras med de nyligen använda projekten som visas högst upp. När du väljer ett projekt visas antalet entiteter av varje typ som är associerade med det här projektet i arbetsflödesavsnittet i navigeringsfältet till vänster. Användaren kan sedan klicka på någon av arbetsflödesenhetstyperna (t.ex. mikroskopisessioner) för att visa en lista över dessa entiteter inom det valda projektet (figur 4). Den här listan består för varje entitet av en etikett, datum och tidpunkt för skapandet, namnet på den användare som skapade den, en indikation på om några kommentarer har gjorts om den här entiteten och upp till sex viktiga metadatafält (till exempel för varje mikroskopisession: rutnät, antal bilder, start- och sluttider och vilka mikroskop och detektorer som användes). Om du väljer en av de listade entiteterna öppnas en informationssida med all information som är tillgänglig för det här objektet, inklusive en sammanfattningslista över alla överordnade entiteter (till exempel för en mikroskopisession visas dess överordnade rutnät och exempel). Detta möjliggör mycket snabb navigering genom en entitets "härstamning", till exempel möjliggör navigering med ett klick från en atommodell till detaljerna i exemplet (figur 5). Dessutom kan alla entiteter i gP2S kommenteras genom att välja "Kommentarer" längst upp till höger på dess informationssida, ange en fritextkommentar och eventuellt bifoga en eller flera filer.

Provberedning
I det första steget i arbetsflödet beskrivs exemplet. För att göra det, definiera först minst en komponent: Protein eller Ligand.

Att lägga till ett nytt protein kräver bara en proteinetikett, men för att hjälpa till att bättre beskriva proteinet tillsätt ett PUR-ID (för reningsidentifierare). Det här fältet accepterar all text och kan till exempel innehålla ett parti-/batchnummer eller fungera som en plats för en streckkodsetikett. Om gP2S har anpassats för att integreras med ett proteinregistreringssystem (se Diskussion) kan PUR-ID valideras automatiskt och användas för att hämta och visa detaljerad information om detta protein. För Ligands är en etikett och lagerkoncentration obligatorisk information. Alla andra fält är valfria och innehåller: koncept (streckkod, vanligt namn eller annan ligandidentifierare) och batch/partiidentifierare. Återigen, om gP2S har konfigurerats för att integreras med ett ligand-registreringssystem, kan konceptet och partiidentifierarna användas för att hämta och visa externt lagrade data som beskriver ligand (t.ex. dess kemiska struktur, analysresultat).

Ett prov definieras av alla kombinationer av proteiner och ligands och deras slutliga koncentrationer. Du kan också ange andra experimentella detaljer för provet, t.ex.

Förberedelse av rutnät
När exemplet är klart navigerar du till Rutnät. I listan hittar du under varje rutnäts etikett en eller två färgade taggar som anger rutnätstypen (cryo eller fläck) och om rutnätet är tillgängligt för användning. Om du vill skapa ett nytt rutnät väljer du Skapa nytt rutnät. Skriv in en etikett, välj rutnätstyp och ytbehandlingsprotokollet (t.ex. glödurladdning) som används. Ange sedan om du förbereder ett cryo- eller negativt fläckrutnät och väljer ett av de förkonfigurerade förberedelseprotokollen i listrutan, som fylls i med negativa fläckprotokoll eller vitrifieringsprotokoll, beroende på vilken rutnätsberedningstyp som valts tidigare. Välj sedan lämpligt exempel i listrutan och använd en växlingsknapp för att ange om exemplet förblir tillgängligt (beskrivs mer detaljerat nedan). Om du väljer att späda ut eller koncentrera det valda provet, ange detta med hjälp av växlingsknappen "utspädd/koncentrerad?" och ange relevant utspädnings- eller koncentrationsfaktor. Ange den volym som tillämpas på rutnätet (i μL) och kan eventuellt också registrera en inkubationstid. Slutligen definierar du rutnätets lagrings plats. För rutnät med negativa fläckar spelar du in lagringsboxens etikett/nummer och rutnätets position i rutan. För cryo-rutnät väljer du först en lagringsenhet i listan och tillhandahåller sedan information för tillgängliga och lämpliga fält (cylinder, rör och/eller låda, beroende på cryolagringsenhetens egenskaper som tidigare definierats i inställningarna).

De delar av arbetsflödet som beskrevs ovan, Exempel och rutnät, ingår i ett lagerhanteringssystem. Den här funktionen håller reda på om komponenterna fortfarande är tillgängliga för användning.

Ett protein eller ligand kan göras otillgängligt från provnivån. När du skapar ett exempel markerar du "sista droppen" för någon av exemplets komponenter som otillgängliga för framtida användning: de kommer inte längre att vara tillgängliga i listrutan när du skapar exempel, och de kommer inte att markeras med taggen "Tillgänglig" i listvyn.
Ett valt exempel kan markeras som otillgängligt med hjälp av en av de två växlingsväxlarna - "Tillgänglig för nättillverkning?" (under Prover) eller "Provet finns tillgängligt för vidare användning?" (under Rutnät).
Om du vill hantera rutnätets tillgänglighet använder du växlingsknappen "Rutnät återgått till lagring?" (under Mikroskopisessioner). Som standard är det här värdet inställt på "Ja" för alla negativa fläckrutnät och till "Nej" för cryoEM-rutnät.

datainsamling
När rutnäten har registrerats registrerar du datainsamlingsexperiment genom att skapa mikroskopisessioner i gP2S. Mikroskopisession är den mest komplexa experimentella entiteten som spåras av programmet och den är organiserad i fyra avsnitt: grundläggande information, mikroskopinställningar, exponeringsinställningar och mikroskopkontroll.

Det första avsnittet innehåller grundläggande information: en etikett för mikroskopisession, start- och slutdatum och -tider, vilket rutnät som avbildades, vilket mikroskop, detektor och provhållare (om tillämpligt) användes och hur många bilder som samlades in. När du skapar en ny mikroskopisession fylls startdatum och starttid automatiskt i systemet. Slutdatum och sluttid är valfritt. Detta beror på att en session kan registreras i systemet medan experimentet fortfarande pågår och därför skulle dess sluttid inte vara exakt känd. Om slutdatum och sluttid inte är kända skriver du in det manuellt eller använder knappen "nu" för att ange aktuellt datum och aktuell tid. Ett annat sätt är att dra nytta av det faktum att gP2S inte tillåter mer än en oavslutad mikroskopisessioner på ett givet mikroskop. Om du startar en ny mikroskopisession på samma mikroskop markeras automatiskt alla tidigare påbörjade sessioner som färdiga.

Välj Rutnätet i nästa steg. Listrutan kommer att ha alla tillgängliga rutnät i det aktuella projektet. När du har valt ett rutnät visas en del av dess grundläggande information: vem som skapade det och när och vilket exempel som tillämpades på det. Beroende på vilken typ av rutnät som är markerat markeras mikroskopisessionen som "fläck" eller "cryo" i listvyn.

Som standard är mikroskopet som senast användes i det aktuella projektet förvalt. Om ett visst mikroskop har en provinsättningsmekanism definierad som en autoloader är detta den information som visas som provhållare. Men om det valda mikroskopet kräver användning av sidoinmatningshållare, välj den hållare som används i listan över provhållare som är konfigurerade för att fungera med detta mikroskop (om det valda rutnätet är ett cryo-rutnät listas endast kryokompatibla hållare).

Den andra delen av ett formulär för mikroskopisession innehåller information om mikroskopinställningar som utsugnings- och accelerationsspänningar, pistollins, diameter på C2-bländare, objektiv bländare och energifilters slitsbredd. Under rutinanvändning ändras dessa inställningar sällan eftersom användare vanligtvis inte behöver avvika från standardvärden.

Det tredje avsnittet i mikroskopisessionen innehåller information om exponeringsinställningar. I det här avsnittet registreras följande metadata: förstoring (pixelstorlek), dekorstorlek, diameter på upplyst område, exponeringstid och om nanosond, räkneläge, dosfraktion och superupplösning användes (räkneläge, dosfraktion och superupplösningsinställningar aktiveras endast om den valda detektorn har dessa funktioner). Om dosfraktion användes registreras också antalet ramar och exponeringshastigheter.

För enkelhetens skull beräknas ett antal experimentellt viktiga parametrar i farten och visas i formuläret: den slutliga bildpixelstorleken (Å), exponeringshastigheten (elektroner/Å²/s), total exponering (elektroner/Å^2),bildlängd (er) och exponering per ram (elektron/Å²).

Den fjärde och sista delen av mikroskopisessionen kan användas för att registrera minimi- och maximimålet underfokus och antalet exponeringar per hål.

Medan mikroskopisessioner i gP2S kan användas för att registrera alla typer av mikroskopiarbete, vare sig det är för screening- eller datainsamlingsändamål, har vi funnit att det är tillräckligt och mer effektivt att be användare att fokusera på att registrera datainsamlingssessioner och att screeningsessioner, där ett rutnät endast inspekteras kort för kvalitetskontroll inte nödvändigtvis behöver registreras som mikroskopisessioner.

bildbehandling
Bild bearbetnings arbete registreras i gP2S som bearbetnings session entiteter. Varje bearbetningssession är relaterad till en eller flera mikroskopisessioner, som måste väljas från en listruta. Ange vilka programvarupaket (program och versioner) som användes, antalet mikrografer och antalet plockade partiklar. Du kan också registrera namnet på bearbetningens katalog.

Mappa deposition
När en eller flera tredimensionella rekonstruktioner har erhållits kan kartorna deponeras i gP2S. Varje karta är associerad med en bearbetningssession och består av den faktiska kartfilen (vanligtvis en MRC-formaterad fil, men gP2S tillåter alla filtyper) och viktiga metadata: pixelns storlek (Å), rekommenderad isocontour-nivå för ytrendering, vilken symmetri som tillämpas, antal bilder som används för att skapa kartan och den uppskattade upplösningen : i sina bästa och sämsta delar samt den genomsnittliga globala upplösningen. Kartor kan associeras med varandra med hjälp av följande typer av relationer: filtrerade, maskerade, återförsäljade eller förfinade versioner. När du registrerar en sådan association väljer du typen av relation (t.ex. "filtreras version av '' eller "har filtrerad version").

Modelldeposition
När en atommodell har erhållits kan den deponeras i GP2S modellavsnitt för det relevanta projektet. Modellfunktionen i den första versionen av gP2S är barebones: annat än den faktiska modellfilen (vanligtvis en PDB- eller mmCIF-fil), endast upplösningen (i Å) och kartan (eller listan över kartor) från vilken modellen härleddes, krävs. Dessutom är det möjligt att ange att en modell är en förfinad version av en tidigare deponerad modell. Ytterligare funktioner, inklusive modellvalidering, är under utveckling och kan läggas till i open source-versionen av gP2S i framtiden.

Rapporter
Det kan vara nödvändigt att generera sammanfattningsdokument som ska distribueras till samarbetspartners, som kanske inte har tillgång till gP2S eller arkiveras i ett filsystem. gP2S tillhandahåller en rapportfunktionalitet för detta ändamål, tillgänglig via en skrivarikon längst upp till höger på varje entitetsinformationsvysida. Detta genererar en utskrivbar PDF-fil som innehåller alla metadata som beskriver entiteten och var och en av dess överordnade entiteter, inklusive alla kommentarer. Denna funktion är särskilt värdefull efter modelldeposition, eftersom alla data och metadata som spårar härstamningen för den slutliga atommodellen hela vägen tillbaka till specifika protein- och småmolekylligandtomter via mikroskopisessioner och rutnät kommer att finnas tillgängliga i ett enda dokument.

Figur 1. gP2S körs på en iPad på en vitrification lab bänk. Användargränssnittet har utformats för drift med hjälp av pekskärmar, vilket underlättar användning i labbet och korrekt metadatainmatning. Klicka här om du vill visa en större version av den här figuren.

Bild 2: gP2S-systemarkitektur. gP2S följer en klassisk organisation på tre nivåer och förlitar sig på två databasservrar för datalagring och en LDAP-server för användarautentisering. Klicka här om du vill visa en större version av den här figuren.

Bild 3: GP2S-datamodellen. Entiteter visas som rektanglar (mörkorange för arbetsflödesentiteter, orange för utrustning och protokoll, gult för andra entitetstyper) och deras relationer betecknas (en-till-en, en-till-många, många-till-många) som betecknas med kontinuerliga linjer. Klicka här om du vill visa en större version av den här figuren.

Figur 4. Listvy för mikroskopisession. I den här vyn listas alla mikroskopisessioner som registrerats under det valda projektet ("CARD9" i den här skärmdumpen). En grön eller lila tagg skiljer mellan rumstemperatur (negativ fläck) och kryogena mikroskopisessioner, och några viktiga metadata som beskriver varje session listas (t.ex. användaren som registrerade den längst till höger). Om du klickar på namnet på en mikroskopisession öppnas en detaljerad vy över sessionen (en detaljerad vy av en modell visas i figur 5). Klicka här om du vill visa en större version av den här figuren.

Figur 5. Detaljvy för modell. Den övre delen av sidan visar tillgängliga metadata för den valda modellen. Kommentarsfönstret till höger kan döljas genom att klicka på korset (uppe till höger) eller "Kommentarer (1)" till vänster. Nedan gör en uppsättning ikoner det möjligt att skapa en PDF-rapport (skrivarikon, se huvudtext), redigera posten (pennikonen) eller duplicera den (dubbelrektangelikon). Den nedre delen av sidan innehåller en strukturlista över alla entiteter som modellen är fallande från, från Exempel till Kartor. Klicka här om du vill visa en större version av den här figuren.

Bibliotekets eller ramverkets namn	typ	version
Apacheds	LDAP-server	0.7.0
stuveriarbetare	utvecklingsverktyg	n/a
element	bibliotek	1.4.10
övervintra	bibliotek	5.0.12
Java	programmeringsspråk	1.8+
JavaScript	programmeringsspråk	EcmaScript 2017
JUnit (junit)	bibliotek	4.12
karma	bibliotek	1.4.1
Maven	utvecklingsverktyg	3+
MongoDB (mongodb)	DB-server	4.0.6
MySQL-databas	DB-server	5.7
Nod.js	ramverk	6.9.1
SASS (node-sass)	bibliotek	4.5.3
Vårboot	ramverk	1.3
Swagger-användargränssnitt	bibliotek	2.6.1
hankatt	programserver	8.5.15
Vue.js	ramverk	2.4.2
vue-cli (olika)	utvecklingsverktyg	2.6.12

Tabell 1. Bibliotek och ramverk som används av gP2S

Discussion

När gP2S används korrekt och konsekvent hjälper det till att uppnå korrekt registerhållning av metadata av hög kvalitet genom att genomdriva registrering av kritiska experimentella metadata med hjälp av strukturerade datamodeller och definierade ordförråd, men mervärdet av detta realiseras bara fullt ut när en hög efterlevnadsnivå uppnås i labbet. Ovanstående protokoll omfattar inte hur detta ska åstadkommas. Vi konstaterade att en effektiv tillsynsteknik var att mikroskopoperatörer vägrar att samla in data om nät som inte är registrerade i gP2S. Detta drev upp efterlevnaden mycket snabbt och lade grunden för framväxten, under de följande månaderna, av en stor mängd detaljerade och exakta experimentella detaljer och företagsminne. Efter några månaders användning blev värdet av korpus av metadata lagrade i gP2S så uppenbart för de flesta användare att efterlevnaden förblev hög utan uttryckligt ingripande.

För att fullt ut utnyttja detta kollektiva minne krävs att metadata som lagras i gP2S är tillgängliga för externa system och lätt förknippade med experimentella data (mikrografer) och resultat (kartor och modeller). Ovanstående protokoll beskriver inte hur man integrerar gP2S med andra informatik- och databehandlingssystem. Mest okomplicerade är potentiella integrationer via GP2S backend REST API, som inte kräver någon ändring av gP2S. Till exempel kör varje dator som styr våra datainsamlingsdetektorer ett skript som regelbundet frågar gP2S slutpunkt "getItemByMicroscope" under REST-styrenheten för mikroskopisessionshantering, för att kontrollera om en mikroskopisession pågår på mikroskopet. I så fall hämtar skriptet från gP2S lämpligt datalagringskatalognamn (som konfigurerats på sidan Inställningar, se ovan) och skapar en katalog på den lokala datalagringsenheten med det här namnet. Detta säkerställer systematisk namngivning av datalagringskataloger och minskar risken för fel på grund av skrivfel.

Även om de har kommenterats i källan till den offentliga versionen av GP2S är ytterligare integrationer som inbegriper gP2S-förbrukande externa systemdata också möjliga. I vårt labb integreras vår distribution av gP2S med (i) ett projekthanteringssystem, så att varje projekt som konfigurerats i gP2S kan länkas till ett företagsomfattande portföljprojekt och metadata från portföljen kan visas inom gP2S; ii) Ett system för proteinregistrering, så att varje protein som tillsätts gP2S via en identifierare som lagras lokalt, kopplas till en fullständig uppsättning register som beskriver proteinens härkomst, innehåller uppgifter om relevant molekylärbiologi, uttryckssystem och rening. iii) Ett litet system för hantering av molekylföreningar som gör det möjligt för gP2S att visa viktig information om varje ligand, såsom dess kemiska struktur. De kodändringar som krävs för att möjliggöra dessa integrationer beskrivs i avsnittet "Integration" i det README-BUILD.md dokument som är tillgängligt från GP2S-databasen (https://github.com/arohou/gP2S).

Den nuvarande versionen av gP2S har begränsningar, bland annat den alltför förenklade datamodellen och frontend för strukturdeposition (Modell). Detta lämnades avsiktligt i ett "barebones" tillstånd i den släppta versionen av gP2S eftersom en fullfjädrad strukturdeposition och valideringsfunktion för närvarande är under utveckling tillsammans med stöd för röntgenkristallografi. Ett annat designbeslut var att inte implementera något privilegium eller behörighetssystem: alla användare i gP2S har lika tillgång till dess funktioner och data. Detta kan göra det till ett dåligt val för anläggningar som betjänar användargrupper med konkurrerande intressen och sekretesskrav, men inte var ett problem för vår anläggning.

Utvecklingen av vår interna version av gP2S pågår och det är vår förhoppning att den open source-version som beskrivs här kommer att vara användbar för andra cryoEM-grupper, och att vissa kan bidra med förslag eller kodförbättringar i framtiden. Framtida värdefulla utvecklingar kan till exempel fokusera på integrationer med labbutrustning (vitrificationrobotar, elektronmikroskop), programvara (t.ex. för att skörda metadata för bildbehandling) och externa offentliga databaser (t.ex. för att underlätta strukturdepositioner).

Den systematiska insamlingen av högkvalitativa metadata som möjliggörs genom rutinmässig användning av gP2S i labbet och cryoEM-anläggningen kan ha en betydande, positiv inverkan på förmågan att åtala flera projekt parallellt under en period av år. I och med att fler och fler delade och centraliserade cryoEM-grupper och anläggningar etableras förväntar vi oss att behovet av informationshanteringssystem som gP2S kommer att fortsätta växa.

Disclosures

Alla upphovsmän är entreprenörer med eller anställda i Roche eller dess dotterbolag Genentech.

Acknowledgments

Författarna tackar alla andra medlemmar i GP2S utvecklingsteam som har arbetat med projektet sedan starten: Rafał Udziela, Cezary Krzyżanowski, Przemysław Stankowski, Jacek Ziemski, Piotr Suchcicki, Karolina Pająk, Ewout Vanden Eyden, Damian Mierzwiński, Michał Wojtkowski, Piotr Pikusa, Anna Surdacka, Kamil Łuczak och Artur Kusak. Vi tackar också Raymond Ha och Claudio Ciferri för att de hjälpte till att sätta ihop teamet och forma projektet.

Materials

Name	Company	Catalog Number	Comments
n/a	n/a	n/a	n/a

DOWNLOAD MATERIALS LIST

References

Cheng, Y., Grigorieff, N., Penczek, P. A., Walz, T. A Primer to Single-Particle Cryo-Electron Microscopy. Cell. 161 (3), 438-449 (2015).
High-End Cryo-EMs Worldwide. , Available from: https://www.google.com/maps/d/u/0/viewer?mid=1eQ1r8BiDYfaK7D1S9EeFJEgkLggMyoaT (2021).
Renaud, J. -P., et al. Cryo-EM in drug discovery: achievements, limitations and prospects. Nature Reviews Drug Discovery. 17 (7), 471-492 (2018).
Alewijnse, B., et al. Best practices for managing large CryoEM facilities. Journal of Structural Biology. 199 (3), 225-236 (2017).
Rees, I., Langley, E., Chiu, W., Ludtke, S. J. EMEN2: An Object Oriented Database and Electronic Lab Notebook. Microscopy and Microanalysis. 19 (1), 1-10 (2013).
Delagenière, S., et al. ISPyB: an information management system for synchrotron macromolecular crystallography. Bioinformatics. 27 (22), 3186-3192 (2011).
dela Rosa-Trevín, J. M., et al. Scipion: A software framework toward integration, reproducibility and validation in 3D electron microscopy. Journal of Structural Biology. 195 (1), 93-99 (2016).
EMPIAR deposition manual. , Available from: https://www.ebi.ac.u/pdbe/emdb/empiar/depostion/manual/#manScipion (2021).
Iudin, A., Korir, P. K., Salavert-Torres, J., Kleywegt, G. J., Patwardhan, A. EMPIAR: a public archive for raw electron microscopy image data. Nature Methods. 13 (5), 387-388 (2016).
Vue.js. , Available from: https://vuejs.org (2021).
Spring Boot. , Available from: https://spring.io/projects/spring-boot (2021).
Lightweight Directory Access Protocol. , Available from: https://ldap.com (2021).
Vue CLI. , Available from: https://cli.vuejs.org (2021).
Element, A Desktop UI Library. , Available from: https://element.eleme.io (2021).
Sass. , Available from: https://sass-lang.com/ (2021).
Karma. , Available from: http://karma-runner.github.io/ (2021).
Node.js. , Available from: https://nodejs.org/ (2021).
Java. , Available from: https://www.java.com/ (2021).
Apache Tomcat. , Available from: http://tomcat.apache.org/ (2021).
Hibernate. , Available from: https://hibernate.org (2021).
Swagger UI. , Available from: https://swagger.io/tools/swagger-ui/ (2021).
JUnit. , Available from: https://junit.org/junit4/ (2020).
Apache Maven Project. , Available from: https://maven.apache.org/ (2020).
MySQL. , Available from: https://www.mysql.com/ (2020).
mongoDB. , Available from: https://www.mongodb.com/ (2020).
Apache license, version 2.0. , Available from: https://www.apache.org/licenses/license-2.0 (2004).
mysql Docker Official Image. , Available from: https://hub.docker.com/_/mysql (2021).
mongo Docker Official Image. , Available from: https://hub.docker.com/_/mongo (2021).
openmicroscopy apacheds. , Available from: https://hub.docker.com/r/openmicroscopy/apacheds (2021).

Biochemistry

gP2S, ett informationshanteringssystem för CryoEM-experiment

Summary

Abstract

Introduction

Protocol

Representative Results

Discussion

Disclosures

Acknowledgments

Materials

References

Tags

Cite this Article

Summary

Abstract

Introduction

Protocol

Representative Results

Discussion

Disclosures

Acknowledgments

Materials

References

Tags

Cite this Article

Get cutting-edge science videos from JoVE sent straight to your inbox every month.