Denne artikkelen forklarer hvordan du bruker simuleringsovervåket maskinlæring for å analysere mitokondrienes morfologi i fluorescensmikroskopibilder av faste celler.
Den kvantitative analysen av subcellulære organeller som mitokondrier i cellefluorescensmikroskopibilder er en krevende oppgave på grunn av de iboende utfordringene i segmenteringen av disse små og morfologisk forskjellige strukturer. I denne artikkelen demonstrerer vi bruken av en maskinlæringsstøttet segmenterings- og analyserørledning for kvantifisering av mitokondriell morfologi i fluorescensmikroskopibilder av faste celler. Det dype læringsbaserte segmenteringsverktøyet er opplært på simulerte bilder og eliminerer kravet til grunnsannhetsmerknader for overvåket dyp læring. Vi demonstrerer nytten av dette verktøyet på fluorescensmikroskopibilder av faste kardiomyoblaster med et stabilt uttrykk av fluorescerende mitokondriermarkører og bruker spesifikke cellekulturforhold for å indusere endringer i mitokondriell morfologi.
I dette papiret demonstrerer vi nytten av et fysikkbasert maskinlæringsverktøy for subcellulær segmentering1 i fluorescensmikroskopibilder av faste kardiomyoblaster som uttrykker fluorescerende mitokondriermarkører.
Mitokondrier er de viktigste energiproduserende organeller i pattedyrceller. Spesielt er mitokondrier svært dynamiske organeller og finnes ofte i nettverk som stadig endrer seg i lengde og forgrening. Formen på mitokondrier påvirker deres funksjon, og celler kan raskt endre sin mitokondrielle morfologi for å tilpasse seg en endring i miljøet2. For å forstå dette fenomenet er den morfologiske klassifiseringen av mitokondrier som prikker, stenger eller nettverk svært informativ3.
Segmenteringen av mitokondrier er avgjørende for analysen av mitokondriell morfologi i celler. Nåværende metoder for å segmentere og analysere fluorescensmikroskopibilder av mitokondrier er avhengige av manuell segmentering eller konvensjonelle bildebehandlingsmetoder. Terskelbaserte tilnærminger som Otsu4 er mindre nøyaktige på grunn av de høye støynivåene i mikroskopibilder. Vanligvis har bilder for morfologisk analyse av mitokondrier et stort antall mitokondrier, noe som gjør manuell segmentering kjedelig. Matematiske tilnærminger som MorphoLibJ5 og semi-overvåkede maskinlæringsmetoder som Weka6 er svært krevende og krever ekspertkunnskap. En gjennomgang av bildeanalyseteknikkene for mitokondrier7 viste at dype læringsbaserte teknikker kan være nyttige for oppgaven. Faktisk har bildesegmentering i hverdagsbilder for applikasjoner som selvkjøring blitt revolusjonert med bruk av dype læringsbaserte modeller.
Dyp læring er en delmengde av maskinlæring som gir algoritmer som lærer av store mengder data. Overvåkede dype læringsalgoritmer lærer relasjoner fra store sett med bilder som er kommentert med deres ground truth (GT) etiketter. Utfordringene ved bruk av veiledet dyp læring for segmentering av mitokondrier i fluorescensmikroskopibilder er todelt. For det første krever overvåket dyp læring et stort datasett med treningsbilder, og når det gjelder fluorescensmikroskopi, vil det være en omfattende oppgave å gi dette store datasettet sammenlignet med når man bruker lettere tilgjengelige tradisjonelle kamerabaserte bilder. For det andre krever fluorescensmikroskopibilder GT-merknader av objektene av interesse i treningsbildene, noe som er en kjedelig oppgave som krever ekspertkunnskap. Denne oppgaven kan lett ta timer eller dager av ekspertens tid for et enkelt bilde av celler med fluorescerende merkede subcellulære strukturer. Videre utgjør variasjoner mellom annotatorer et problem. For å fjerne behovet for manuell merknad, og for å kunne utnytte den overlegne ytelsen til dype læringsteknikker, ble det her brukt en dyp læringsbasert segmenteringsmodell som ble trent på simulerte bilder. Fysikkbaserte simulatorer gir en måte å etterligne og kontrollere prosessen med bildedannelse i et mikroskop, slik at du kan lage bilder av kjente former. Ved hjelp av en fysikkbasert simulator ble et stort datasett av simulerte fluorescensmikroskopibilder av mitokondrier opprettet for dette formålet.
Simuleringen starter med geometrigenerering ved hjelp av parametriske kurver for formgenerering. Emittere er tilfeldig plassert på overflaten av formen på en jevnt fordelt måte slik at tettheten samsvarer med eksperimentelle verdier. En 3D-punktspredningsfunksjon (PSF) av mikroskopet beregnes ved hjelp av en beregningseffektiv tilnærming8 av Gibson-Lanni modell9. For å matche de simulerte bildene med eksperimentelle bilder, emuleres både den mørke strømmen og skuddstøyen for å oppnå fotorealisme. Den fysiske GT genereres i form av et binært kart. Koden for generering av datasettet og opplæring av simuleringsmodellen er tilgjengelig10, og trinnet for å lage dette simulerte datasettet er skissert i figur 1.
Vi viser nytten av dyp læringsbasert segmentering trent helt på et simulert datasett ved å analysere konfokale mikroskopibilder av faste kardiomyoblaster. Disse kardiomyoblastene uttrykte en fluorescerende markør i mitokondriell ytre membran, noe som muliggjorde visualisering av mitokondriene i fluorescensmikroskopibildene. Før forsøket ble gitt som et eksempel her, ble cellene fratatt glukose og tilpasset galaktose i 7 dager i kultur. Å erstatte glukose i vekstmediet med galaktose tvinger cellene i kulturen til å bli mer oksidative og dermed avhengige av mitokondriene for energiproduksjon11,12. Videre gjør dette cellene mer følsomme for mitokondriell skade. Mitokondrielle morfologiendringer kan eksperimentelt induseres ved å tilsette et mitokondrielt frakoblingsmiddel som karbonylcyanid m-klorfenylhydrason (CCCP) til cellekulturmediet13. CCCP fører til tap av mitokondriell membranpotensial (ΔΨm) og resulterer dermed i endringer i mitokondriene fra en mer rørformet (stavlignende) til en mer kuleformet (prikklignende) morfologi14. I tillegg har mitokondrier en tendens til å hovne opp under CCCP-behandling15. Vi viser den morfologiske fordelingen av mitokondrier når de galaktosetilpassede kardiomyoblastene ble behandlet med mitokondriell frakobling CCCP. De dype læringssegmentasjonene av mitokondriene gjorde det mulig for oss å klassifisere dem som prikker, stenger eller nettverk. Vi utledet deretter kvantitative beregninger for å vurdere grenlengdene og overfloden av de forskjellige mitokondrielle fenotypene. Trinnene i analysen er skissert i figur 2, og detaljene i cellekulturen, bildebehandling, datasettopprettelse for dyp læringsbasert segmentering, samt kvantitativ analyse av mitokondriene, er gitt nedenfor.
Vi diskuterer forholdsregler knyttet til de kritiske trinnene i protokollen i avsnittene om “geometrigenerering” og “simulatorparametere”. Avsnittet med tittelen “overføringslæring” diskuterer modifikasjoner for høyere gjennomstrømning når man tilpasser seg flere mikroskoper. Avsnittene om “partikkelanalyse” og “generering av andre subcellulære strukturer” refererer til fremtidige anvendelser av denne metoden. Avsnittet om “forskjellen fra biologisk sannhet” diskuterer de forskjellige årsakene til at simuleringene kan avvike fra reelle data og om disse grunnene påvirker vår anvendelse. Til slutt diskuterer vi et utfordrende scenario for vår metode i avsnittet “tettpakkede strukturer”.
Generering av geometri
For å generere 3D-geometrien til mitokondrier, fungerer en enkel 2D-struktur opprettet fra b-spline-kurver som skjeletter bra for opprettelsen av det syntetiske datasettet. Disse syntetiske formene etterligner nøye formene av mitokondrier observert i 2D-cellekulturer. Men når det gjelder 3D-vev som hjertevev, er formen og arrangementet av mitokondrier ganske forskjellige. I slike tilfeller kan ytelsen til segmenteringsmodellen forbedres ved å legge til direksjonalitet i de simulerte bildene.
Simulator parametere
Forsiktighet bør utvises når du stiller inn parametrene til simulatoren for å sikre at de samsvarer med dataene som skal kjøres slutningen på, da unnlatelse av å gjøre dette kan føre til lavere ytelse ved segmentering. En slik parameter er signal-til-støy-forholdet (SNR) -området. Området for SNR for dataene som skal testes, bør samsvare med verdiene i det simulerte datasettet. I tillegg skal PSF-en som brukes, samsvare med måltestdataene. Modelltrente bilder fra en konfokal PSF bør for eksempel ikke brukes til å teste bilder fra et epifluorescerende mikroskop. En annen parameter å være oppmerksom på er bruken av ekstra forstørrelse i testdataene. Hvis ytterligere forstørrelse har blitt brukt i testdataene, bør simulatoren også stilles inn på riktig måte.
Overfør læring
Overføringslæring er fenomenet å utnytte en lært modell trent på en oppgave for bruk i en annen oppgave. Dette fenomenet gjelder også for vårt problem i forhold til ulike typer mikroskopdata. Vektene til segmenteringsmodellen (utstyrt med kildekoden) som er opplært på en type mikroskopidata, kan brukes til å initialisere en segmenteringsmodell som skal brukes på en annen type optiske mikroskopdata. Dette gjør at vi kan trene på en betydelig mindre delmengde av treningsdatasettet (3000 bilder sammenlignet med 10.000), og dermed redusere beregningskostnadene ved simulering.
Partikkelanalyse
Partikkelanalyse kan også utføres på de segmenterte maskene. Dette kan gi informasjon om området og krumningen, etc., av de enkelte mitokondriene. Denne informasjonen kan også tjene som beregninger for kvantitativ sammenligning av mitokondrier (ikke brukt til dette eksperimentet). For eksempel definerer vi for tiden prikkmorfologien ved hjelp av en terskel basert på lengden på mitokondriene. Det kan være nyttig, i noen tilfeller, å innlemme elliptisitet for bedre å skille små stanglignende mitokondrier fra puncta eller prikklignende mitokondrier. Alternativt, hvis visse biologiske forhold fører til at mitokondriene krøller seg sammen, kan krumningskvantifisering være av interesse for å analysere mitokondriell populasjon.
Generering av andre subcellulære strukturer
Den fysikkbaserte segmenteringen av subcellulære strukturer er demonstrert for mitokondrier og vesikler1. Selv om vesikler utviser varierende former, er størrelsene mindre, og de ser ut som enkle kuler når de observeres gjennom et fluorescensmikroskop. Derfor simuleres geometrien av vesikler ved bruk av sfæriske strukturer med et passende diameterområde. Dette innebærer en endring i funksjonen genererer geometrien (sylindere i tilfelle mitokondrier og kuler i tilfelle vesikler) av strukturer og respektive parametere (trinn 5.4 i protokolldelen). Geometrisk har endoplasmatisk retikulum og mikrotubuli også blitt simulert som rørformede strukturer17. Modellering av endoplasmatisk retikulum med en diameter på 150 nm og mikrotubuli med en gjennomsnittlig ytre diameter på 25 nm og et indre hulrør på 15 nm i diameter gir tilnærminger av formene til disse strukturene. En annen parameter som vil variere for hver av disse subcellulære strukturer er fluorofortettheten. Dette beregnes ut fra fordelingen av biomolekylet som fluorforene binder seg til og sannsynligheten for binding.
Forskjell fra biologisk grunnsannhet
De simulerte dataene som brukes til simuleringsovervåket opplæring av dyplæringsmodellen, skiller seg fra reelle data på mange måter. (i) Fraværet av ikke-spesifikk merking i de simulerte dataene skiller seg fra reelle data, da det ofte er frittflytende fluoroforer i de virkelige dataene. Dette fører til en høyere gjennomsnittlig bakgrunnsverdi i det virkelige bildet. Denne forskjellen reduseres ved å matche SNR og sette bakgrunnsverdien slik at den samsvarer med de observerte reelle verdiene. (ii) Bevegelsen av subcellulære strukturer og fotokinetikk er to kilder til dynamikk i systemet. Bevegelige strukturer i levende celler (som beveger seg i området noen få millisekunder) forårsaker bevegelsesuskarphet. Eksponeringstiden reduseres under reell datainnsamling for å unngå uskarphetseffekten. På den annen side simulerer vi ikke timelapse og antar ubevegelige strukturer; Denne antagelsen er gyldig når eksponeringstiden i de reelle dataene er liten. Denne antagelsen kan imidlertid gi en feil i utgangen hvis eksponeringstiden til de virkelige dataene er stor nok til å introdusere bevegelsesuskarphet. Fotokinetikk, derimot, er i størrelsesorden nanosekunder til mikrosekunder og kan utelates i simuleringen, siden de vanlige eksponeringstidene for eksperimenter er lange nok (i størrelsesorden millisekunder) til å gjennomsnittlig effekten av fotokinetikk. (iii) Støy i mikroskopbilder har forskjellige kilder, og disse kildene har forskjellige sannsynlighetstetthetsfunksjoner. I stedet for å modellere disse individuelle støykildene, tilnærmer vi det som en gaussisk støy over en konstant bakgrunn. Denne forskjellen endrer ikke datafordelingen vesentlig for forholdene med lavt signal-til-bakgrunnsforhold (i området 2-4) og når det gjelder makrodensiteten til fluoroforer1. (iv) Artefakter i avbildning kan oppstå fra avvik, drift og systematiske uskarpheter. Vi antar at mikroskopet er godt justert og at regionene som er valgt for analyse i de virkelige dataene, er blottet for disse artefaktene. Det er også mulighet for modellering av noen av disse gjenstandene i PSF18,19,20.
Tettpakkede strukturer
Vanskelighetene med ikke å kunne skille overlappende stenger fra nettverk er et vedvarende problem i segmenteringen av 2D-mikroskopidata. Et ekstremt utfordrende scenario er presentert i figur 5, hvor mitokondriene er tett pakket, noe som fører til suboptimale resultater i segmenteringsmodellen og følgende analyse. Til tross for denne utfordringen kan bruk av morfologiske operatorer i slike situasjoner for å slanke skjelettiseringen bidra til å bryte disse altfor tilkoblede nettverkene, samtidig som betydelige endringer i alle mitokondrielle morfologikategorier fortsatt kan oppdages. I tillegg er bruken av et konfokal snarere enn et vidvinkelmikroskop for avbildning en metode for delvis å redusere dette problemet ved å eliminere ufokusert lys. Videre vil det i fremtiden være nyttig å utføre 3D-segmentering for å skille mitokondrier som krysser (dvs. fysisk danner et nettverk) fra stanglignende mitokondrier hvis fremspring i et enkelt plan overlapper hverandre.
Deep-learning segmentering er et lovende verktøy som tilbyr å utvide analysemulighetene til mikroskopibrukere, og dermed åpne muligheten for automatisert analyse av komplekse data og store kvantitative datasett, som tidligere ville vært uhåndterlig.
The authors have nothing to disclose.
Forfatterne anerkjenner diskusjonen med Arif Ahmed Sekh. Zambarlal Bhujabal er anerkjent for å hjelpe til med å konstruere de stabile H9c2-cellene. Vi anerkjenner følgende midler: ERC startbevilgning nr. 804233 (til K.A.), Forskerprosjekt for fornyelse nr. 325741 (til D.K.P.), Helse Nord RHF nr. HNF1449-19 (Å.B.B.), og UiTs tematiske finansieringsprosjekt VirtualStain med Cristin Prosjekt-ID 2061348 (D.K.P., Å.B.B., K.A., og A.H.).
12-well plate | FALCON | 353043 | |
Aqueous Glutaraldehyde EM Grade 25% | Electron Microscopy Sciences | 16200 | |
Axio Vert.A1 | Zeiss | Brightfield microscope | |
CCCP | Sigma-Aldrich | C2759 | |
Computer | n/a | n/a | Must be running Linux/Windows Operating System having an NVIDIA GPU with at least 4GB of memory |
Coverslips | VWR | 631-0150 | |
DAPI (stain) | Sigma-Aldrich | D9542 | |
DMEM | gibco | 11966-025 | |
Fetal Bovine Serum | Sigma-Aldrich | F7524 | |
Glass Slides (frosted edge) | epredia | AA00000112E01MNZ10 | |
H9c2 mCherry-EGFP-OMP25 | In-house stable cell line derived from purchased cell line | ||
Incubator | Thermo Fisher Scientific | 51033557 | |
LSM 800 | Zeiss | Confocal Microscope | |
Mounting Media (Glass) | Thermo Fisher Scientific | P36980 | |
Paraformaldehyde Solution, 4% in PBS | Thermo Fisher Scientific | J19943-K2 | |
Plan-Apochromat 63x oil (M27) objective with an NA of 1.4 | Zeiss | 420782-9900-000 | |
Sterile laminar flow hood | Labogene | SCANLAF MARS | |
Trypsin | Sigma-Aldrich | T4049 | |
Vacusafe aspiration system | VACUUBRAND | 20727400 | |
ZEN 2.6 | Zeiss |