Bioengineering

Fra voxel til Viden: En praktisk vejledning til opdelingen af Complex Electron Microscopy 3D-Data

Published: August 13, 2014 doi: 10.3791/51673

Wen-Ting Tsai¹, Ahmed Hassan¹, Purbasha Sarkar², Joaquin Correa^1,3, Zoltan Metlagel¹, Danielle M. Jorgens¹, Manfred Auer^1,2

¹Life Sciences Division, Lawrence Berkeley National Laboratory, ²Joint Bioenergy Institute, Physical Biosciences Division, Lawrence Berkeley National Laboratory, ³National Energy Research Scientific Computing Center, Lawrence Berkeley National Laboratory

Summary

Den flaskehals for cellulære 3D elektronmikroskopi er feature ekstraktion (segmentering) i meget komplekse 3D tæthed kort. Vi har udviklet et sæt kriterier, der giver vejledning om, hvilke segmentering tilgang (manuel, halvautomatisk eller automatisk) er bedst egnet til forskellige datatyper, hvilket giver et udgangspunkt for en effektiv segmentering.

Abstract

Moderne 3D-elektronmikroskopi tilgange har for nylig tilladt hidtil uset indblik i 3D ultrastrukturel organisering af celler og væv, der muliggør visualisering af store makromolekylære maskiner, såsom friktion komplekser, såvel som højere-ordens strukturer, såsom cytoskelettet og cellulære organeller i deres respektive celler og væv sammenhæng. I betragtning af den iboende kompleksitet af cellulære mængder, er det vigtigt først at udtrække de funktioner af interesse for at tillade visualisering, kvantificering og dermed forståelsen af deres 3D organisation. Hvert datasæt er defineret ved særlige karakteristika, fx, signal-støjforhold, sprødhed (skarphed) af de data, heterogenitet dens funktioner, crowdedness funktioner, tilstedeværelse eller fravær af karakteristiske figurer, der giver mulighed for nem identifikation og den procentvise af hele mængden, at en bestemt område af interesse indtager. Alle disse egenskaber skal overvejesved valget af den metode til at tage til segmentering.

De seks forskellige 3D ultrastrukturel datasæt fremlagt blev opnået ved tre forskellige billeddannelse tilgange: harpiks indlejret farves elektron tomografi, fokuseret ion Sprede- og seriel blok ansigt-scanning elektronmikroskopi (FIB-SEM, SBF-SEM) af mildt farvede og stærkt farvede prøver hhv. For disse datasæt, har fire forskellige segmentering tilgange er anvendt: (1) fuldt manuel modelbygning udelukkende efterfulgt af visualisering af modellen, (2) manuel sporing segmentering af de data, efterfulgt af overfladegengivelse, (3) halvautomatiske tilgange fulgt ved overfladegengivelse, eller (4) automatiserede specialdesignede segmentering algoritmer efterfulgt af overfladegengivelse og kvantitativ analyse. Afhængigt af kombinationen af data sæt karakteristika, blev det konstateret, at der typisk én af disse fire kategoriske metoder udkonkurrerer de andre, men afhængigt af den nøjagtige sekvens af kriterier, more end en fremgangsmåde kan være en succes. Baseret på disse data, foreslår vi en triage ordning, der kategoriserer både objektive data sæt karakteristika og subjektive personlige kriterier for analyse af de forskellige datasæt.

Introduction

Traditionelt elektronmikroskopi felt (EM) er opdelt i 1) den strukturelle biologi gren ved hjælp af høj og super høj opløsning TEM, typisk kombineret med implicitte eller eksplicitte data gennemsnit at undersøge den tredimensionale (3D) strukturen af makromolekylære komplekser med en defineret sammensætning og typisk en forholdsvis lille størrelse ^1-4, og 2) det cellulære billeddannelse gren, hvor hele cellulære scenerier visualiseres ^1,5,6. Mens den strukturelle biologi gren har gennemgået en spektakulær udvikling i løbet af de sidste fire årtier, blev cellebiologi gren meste begrænset til to dimensioner, ofte på mindre end optimalt præparerede prøver. Kun med fremkomsten af elektron tomografi i det sidste årti har celle biologisk ultrastrukturel billeddannelse udvidet til den tredje dimension ^5,7, hvor der typisk gennemsnit kan ikke udføres, da de cellulære scenerier og dermed de funktioner af interesse, er typisk unikke.

Selv visualiseret cellulære scener er ofte fantastisk for øjet, effektiv ekstraktion af de funktioner af interesse og efterfølgende kvantitativ analyse af sådanne yderst komplekse cellulære mængder halter bagefter, dels fordi den præcise proteinsammensætning er normalt ukendt, derfor gør det udfordrende at fortolke disse cellulære 3D-volumener. Til denne dato, er en omfattende biologisk ekspertise ofte behov for at fortolke komplekse tomogrammer, eller endog at identificere de vigtige områder og væsentlige komponenter i 3D volumen. Som en yderligere komplikation, visualisering af 3D volumener er bemærkelsesværdigt ikke-triviel. 3D-volumener kan opfattes og dermed visualiseret som stakke af 2D-billeder. Slice-by-skive inspektion af sekventielle 2D-billeder reducerer kompleksiteten, men det begrænser også feature extraction og dermed kvantitativ analyse af de to dimensioner. Men for de fleste 3D-objekter, skildringen af 3D-volumener som blot en stak hinanden følgende planer fører til en ufuldstændig end skæv perspektiv i et bestemt system 3D natur. Alternative former for visuel inspektion kræver enten volumen rendering eller overfladegengivelse, som-i betragtning af den ofte tætte karakter af et cellulært volumen-kan let føre til en modvirket visning af indlejrede objekter eller overvælde en bruger helt, hvilket gør interaktiv vejledning segmentering vanskelig.

For at afhjælpe disse barrierer, et stort udvalg af automatiserede feature extraction (segmentering) tilgange er blevet udviklet, som er typisk enten Density eller gradient-baserede ^8-10. Men disse metoder har tendens til at segmentere hele mængden, uanset hvilke områder eller funktioner er af interesse for den sagkyndige, selv om nogle af de seneste metoder kan målrette en bestemt funktion af interesse, såsom actinfilamenter ^11. Desuden kan de programmer, der udfører automatiserede segmentering undertiden resultere i produktionen af en lang række sub-volumen (fx ved anvendelsen vandskel immersion segmentering), der ofte brug for at blive fusioneret manuelt tilbage til omfattende det hele træk af interesse eller underkastes yderligere segmentering. Dette gælder især for komplekse og overfyldte datasæt, således mest destruktionsprocesser computer algoritmer er i stand til at udtrække kun de funktioner af interesse med troskab, og betydelige datasikring indsats af en ekspert er ofte nødvendig for at producere en ønsket segmenteret volumen.

Desuden er tilpassede løsninger på et meget specifikt problem ofte udgivet som et videnskabeligt møde papir, med lidt at ingen vægt på at gøre dem bredt og omfattende værktøjer tilgængelige for forskere, der ikke har indgående kendskab til områderne matematik, datalogi og / eller computergrafik. En justerbar programmeringssoftware miljø, som indeholder en række billedanalyse biblioteker, kan være et effektivt redskab sæt giver brugerne mulighed for effektivt at skrive deres egne moduler til præcis segmentering. Men denne tilgang kræver extensive uddannelse og en baggrund i datalogi med henblik på at drage fordel af sine mange funktioner eller kapaciteter til billedanalyse. Man kan arbejde inden for en sådan alsidig software miljø for visse datasæt, hvor funktionerne er mere sparsomme, fx ved at bruge kraftfulde form fremgangsmåder, der er afhængige af den unikke geometri "skabeloner" til at adskille objekter af interesse fra deres omgivelser ^12,13 .

En retfærdig række computergrafik visualiserings pakker findes for interaktiv vejledning segmentering og modelbyggeri. Nogle pakker er kommercielt tilgængelige, mens andre er af akademisk oprindelse og uddeles gratis, såsom: University of California San Francisco Chimera ^14, University of Colorado israelske forsvarsminister ^15, og University of Texas Austin VolumeRover ^16. Men den brede vifte og kompleksiteten af funktioner og muligheder disse programmer besidder stejlere indlæringskurve for each. Visse visualiseringsprogrammer give simple geometriske modeller, såsom bolde og pinde i forskellige størrelser, som kan placeres ind i tætheden kort med henblik på at skabe en forenklet model af den komplekse 3D-volumen. Disse modeller derefter give enkle geometriske og volumetriske målinger, og derfor gå videre end bare "smukt billede". En sådan manuel sporing af objekter fungerer godt for mængder, hvor kun et lille antal objekter skal spores og udvindes. Men den seneste udvikling af stort volumen 3D ultrastrukturelle billeddannelse ved hjælp af enten fokuseret ionstråle scanningselektronmikroskopi (FIB-SEM) ^17-20 eller seriebloknummer ansigt scanningselektronmikroskopi (SBF-SEM) ²¹ viser den yderligere komplikation, at størrelsen af 3D-data sæt kan variere fra gigabytes til snesevis og hundredvis af gigabyte, og selv terabytes. Derfor bør sådanne store 3D volumener er næsten utilgængelige for manuel funktion udvinding og dermed effektiv bruger-styret semi-automatiseret feature udvinding vil være en af de flaskehalse for en effektiv analyse af 3D volumener i en overskuelig fremtid.

Præsenteret her er fire forskellige segmentering tilgange, der rutinemæssigt anvendes på en lang række biologiske billedtyper. Disse metoder sammenlignes derefter for deres effektivitet for forskellige typer af datasæt, så en samling i en guide til at hjælpe biologer beslutte, hvad der kan være den bedste segmentering metode til effektiv feature extraction af deres egne data. Så detaljeret brugervejledninger er tilgængelige for de fleste af de programmer, der er beskrevet, er målet ikke at gøre potentielle brugere bekendt med nogen af disse særlige pakker. I stedet er målet at demonstrere de respektive styrker og begrænsninger af disse forskellige segmentering strategier ved at anvende dem til seks eksempel datasæt med forskellige karakteristika. Gennem denne sammenligning, har et sæt af kriterier, blevet udviklet, som er enten baseret på objektive billede karakteristika3D datasæt, såsom oplysninger kontrast, skarphed, crowdedness og kompleksitet, eller stammer fra subjektive overvejelser, såsom den ønskede målsætning for segmentering, at morfologier af de elementer være segmenteret, befolkningstæthed af funktionerne af interesse, hvilket betyder den del af volumen besat af funktionen af interesse, og hvordan man går optimalt med begrænsede ressourcer såsom tid og tilgængelighed af personale. Disse forskellige eksempler datasæt illustrere, hvordan disse objektive og subjektive kriterier kan anvendes sekventielt i en række forskellige kombinationer til opnåelse af en parring af visse feature extraction tilgange med visse typer datasæt. Anbefalingerne vil forhåbentlig hjælpe nybegyndere konfronteret med et stort udvalg af segmenteringsmuligheder vælge den mest effektive segmentering metode til deres egen 3D-volumen.

Mens fokus i dette papir er feature extraction, opmærksomhed på dataindsamling og præ-databehandling er afgørende for effektive filtreegmentation. Ofte farvning af prøver kan være ujævn, og derfor bør de potentielle farvning artefakter overvejes i segmentering procedure. Men plet normalt giver højere signal-støj, og derfor kræver mindre filtrering og andre matematiske behandling af cellulære mængder, der potentielt kan også resultere i artefakter. De respektive rå billeddata datasæt skal erhverves på de korrekte kontrast og kamera pixel indstillinger justeret, og rekonstrueret i en 3D-volumen. For tomogrammer, der flugter billeder rekonstrueret typisk ved hjælp af vægtet back-projektion, og derefter datasættet er normalt underkastet denoising algoritmer såsom ikke-lineær anisotropisk diffusion ²² bilaterale filtrering ²³ eller rekursive medianfiltrering ^24. FIB-SEM og SBF-SEM billeddata er afstemt med cross-korrelerende hinanden følgende skiver i XY udnytter programmer såsom ImageJ ^25. Kontrastforbedring og filtrering kan anvendes til at øge de funktionerinteresse og dermed de-støj billedstak. Filtrering kan udføres enten på hele volumen før subvolume valg eller om de valgte subvoluminer, som filtrering tilgange kan være beregningsmæssigt dyrt. Ned-sampling af dataene (udsmidningen), som undertiden anvendes til støjreduktion og / eller reduktion af filstørrelse, anbefales kun, hvis dataene er blevet væsentligt oversampled sammenlignet med den forventede opløsning.

Efter reduktion af støjen, kan de behandlede billeder derefter segmenteret ved forskellige metoder, og fokus i denne undersøgelse er på følgende fire: (1) manuel indvindes model generation ved at skabe en bold-og-stick model, (2) manuel sporing funktioner af interesse, (3) automatiseret tærskel-baserede tæthed, og (4) skræddersyet automatiseret segmentering via et script til projektet specifik segmentering. Boundary segmentering ⁸ og medrivende vandskel segmentering ¹⁰ er bedre alternativer til simpel tærskling, men they tilhører samme kategori, og er ikke medtaget eksplicit i denne diskussion.

Manuel sporing af tætheder kræver skitserer de funktioner af interesse, slice-by-skive, som tillader tilbageholdelse af den oprindelige tæthed af de respektive sub-cellulære områder. Denne fremgangsmåde giver mulighed for maksimal styring af segmentering proces, men er en kedelig og arbejdskrævende proces.

Automatiserede tærskel-baserede (og beslægtede) segmentering tæthed tilgange er semi-automatisk, hvor en algoritme vælger pixel baseret på et sæt af brugerdefinerede parametre. Flere akademiske (gratis) visualiserings pakker, såsom UCSF Chimera, israelske forsvarsminister, Fiji ^26, og VolumeRover er til rådighed, såvel som kommercielle (kræver betalte licenser) pakker, og begge typer typisk omfatte en eller flere af disse segmentering tilgange. Den software, der anvendes i dette arbejde for at illustrere disse forskellige metoder omfatter både kommercielle programmer og akademiske åbne sOurce programmer for manuelt at generere en abstrakt model, samt segmentering manuel og automatiseret tæthed. Dog kan open source-software til tider tilbyde mere avancerede muligheder gennem muligheden for tilpasning.

En sammenligning af disse teknikker, der anvender forskellige typer af datasæt førte til følgende præsentation af regler og vejledning om, hvordan man griber segmentering af forskellige biologiske data 3D volumener, som til vores viden er endnu ikke blevet offentliggjort. Dette er således det første systematisk sammenligning af de forskellige tilgange og deres anvendelighed på datasæt med varierende karakteristika for brugere med forskellige formål.

Protocol

1. Manuel Abstracted Model Generation

Bemærk: Detaljerne i den metode, der er beskrevet nedenfor, er specifikke for Chimera, men andre software pakker kan anvendes i stedet. Brug denne fremgangsmåde, når det eneste formål er at skabe en geometrisk model (fx en bold og stok-model) for at gøre geometriske målinger, snarere end at vise volumen form af objekterne.

Importer volumen data i et egnet program til manuel indvindes model generation.
1. Vælg Filer> Åbn kort for at trække op dialogen Åbn fil. Naviger til den fil placering af det ønskede kort.
2. Træk op Volume Viewer (Værktøjer> Lydstyrke data> Volume Viewer), og vælg Funktioner> Skærm stil at vise data med forskellige rendering stilarter.
3. Justér tærsklen for skærmen ved at trække den lodrette bjælke på histogrammet i Volume Viewervindue.
Naviger gennem 3D volumen (f.eks skive for skive) for at vælge et område af interesse for segmentering og beskære en mindre sub-volumen, hvis nødvendigt.
1. I Volume dialogboksen Viewer: Klik akse, og vælg derefter X, Y eller Z.
2. I Volume dialogboksen Viewer, skal du vælge Funktioner> Planes. Klik på en for at indstille dybde til at vise flyet svarer til nummeret i feltet til venstre, og klik på Alle for at vise alle planer.
3. I Volume dialogboksen Viewer, vælg Funktioner> Underområde valg.
  1. Klik og træk for at oprette en rektangulær kasse omkring området af interesse.
Placer markører langs funktionen af interesse og forbinde dem med indeksobligationer eventuelt (ofte gøres automatisk af programmet), indtil modellen er færdig.
1. Fra Volume Viewer menulinjen, vælge Værktøjer>Volumen dialogen Tracer at åbne dialogboksen Volume Tracer. I Volume dialogboksen Tracer, vælge Filer> Ny markørsæt.
2. I Volume dialogboksen Tracer, tjek Mus> Placer markører på høj kvalitet, Place markører på data fly, flytte og ændre størrelse markører, Link ny markør til valgte mærke, og Link fortløbende udvalgte markører.
3. Klik på Marker farveprøven og vælge en farve. Gentag dette trin til Link farve.
4. Indtast radier for markør og link model-byggeelementer.
5. I Volume Tracer vinduet vælg Placer markører ved hjælp af [højre] museknap, og indsæt radier til markører og links.
6. Højreklik på de data volumen til at begynde om markører. Markers vil automatisk blive tilsluttet.
7. I Volume dialogboksen Tracer, vælge Filer> Gem aktuel markør sæt, derefter Filer> Luk markør sæt.
Åbn en ny markør sæt (trin 1.3.1) for at begynde at bygge en model i en anden ønskede funktion af interesse. Udnyt kontrastfarver mellem markør sæt for at fremhæve forskelle i funktioner.

2. Manuel Sporing af funktioner seværdigheder

Bemærk: Detaljerne i den metode, der er beskrevet nedenfor, er specifikke for Amira, men andre software pakker kan anvendes i stedet. Brug denne fremgangsmåde, når befolkningstætheden er relativt lille, og når nøjagtighed feature extraction er altafgørende, da manuel sporing er en tidskrævende metode.

Importmængde data i et program med manuelle sporingsforanstaltninger muligheder. Software med denne evne generelt tilbyder mindst et grundlæggende malerpenslen.
1. For store mængder eller tomogrammer (f.eks, 16-bit 2.048 x 2.048 eller større .rec eller .mrc tomogrammer genereret i israelske forsvarsminister): Vælg Åbn data> Højreklik på filename.rec> format ...> Vælg Raw som LargeDiskData OK> Indlæs. Vælg passende Rådata Parametre fra header information> OK. Skift og Gem som en ny filename.am fil til brug i de følgende trin.
2. For mindre 3D billedstak filer (f.eks 3D .tif eller .mrc eller .rec): Åben data> Vælg filename.tif eller filename.mrc. Skift og højreklik> Gem som filename.am . Hvis der genereres en fejl, eller at programmet ikke svarer, kan filen være for stor og kan åbnes ved at følge trin 2.1.1.
Naviger gennem skiverne til at vælge en 3D-sub-volumen for segmentering, og derefter beskære til dette område af interesse.
1. I 3D Viewer-vinduet, skal du vælge Orthoslice at åbne billedfilen. Brug skyderen nederst til at navigere gennem skiver.
2. Hvis du vil beskære større data åbnet som LargeDiskData, skifte filnavn i Pool vindue> Højreklik> LatticeAccess. Enter den ønskede kasse størrelse> Anvend. Gem ny fil.
Opret segmentering fil.
1. Slå filen i Pool-vinduet> højreklik> Mærkning> LabelField. En ny fil vil blive oprettet og indlæses automatisk i fanen Segmentering Editor.
Trace grænsen af det første element i interesse, så fylde spor i hånden eller ved hjælp af en kommandolinje specifikt til den anvendte software. Følg den indslag af interesse gennem alle skiver og gentage den manuelle sporing segmentering. Brug følgende kommandoer, når du bruger Amira:
1. For at bruge malerpenselværktøjet, ændre pensel størrelse som ønsket, og derefter bruge musemarkøren til at spore grænsen til funktionen af interesse.
2. Fyld spores område med genvej "f". Tilføj markeringen ved at klikke på knappen med plustegnet, eller genvejen "a". Hvis det er nødvendigt, skal du trykke på "u" til at fortryde, og "s" for at trække eller slette.
3. Generer en overfladegengivelse til visualisering og grundlæggende kvalitativ eller kvantitativ analyse pr software brugervejledning instruktion.
  1. I pool fanen Objekt, skifte filnavnet-labels.am i Pool-vinduet> Højreklik> SurfaceGen.
  2. Vælg ønskede overflade egenskaber> Anvend. En ny fil filename.surf vil blive oprettet i puljen.
  3. At visualisere det segmenterede volumen, skifte filename.surf i Pool vindue> Højreklik> SurfaceView.
  4. Brug værktøjerne i 3DViewer vinduet for at flytte, rotere og zoome i 3D volumen.
4. Uddrag de nøjagtige tætheder og bestemme målinger såsom volumen eller areal. Eksport til andre programmer til mere avanceret visning, analyse og simulering.
  1. På 3DViewer vindue skal du klikke måleværktøjet> Vælg relevante valgmulighed (2D længde og 2D vinkel for målinger på en enkelt 2D plan, 3D-længde og 3D Vinkeltil målinger på en 3D-volumen).
  2. Klik på maskeoverfladen at måle den ønskede længde, afstand og vinkler. Værdierne vil blive opført i vinduet Egenskaber.
3. Automatiseret Densitetskorrigeret segmentering
Bemærk: Detaljerne i den metode, der er beskrevet nedenfor, er specifikke for Amira, men andre software pakker kan anvendes i stedet.
1. Brug denne fremgangsmåde på datasæt med enhver sort kontrast, skarphed, eller crowdedness at trække de tætheder af interesse.
2. Importmængde data i et program, er udstyret med tærskling, tryllestav eller andre tæthed-baserede værktøjer til automatisk segmentering. Følg trinene i 2.1-2.1.2 i vejledningen til manuel sporing.
3. Naviger gennem skiver og vælg område for segmentering. Hvis det er nødvendigt, beskære en mindre 3D sub-volumen for segmentering. Følg trinene i 2.2-2.2.2 i vejledningen til manuel sporing.
4. Vælg massefyldeen funktion af interesse, som regel ved at klikke på eller anbringe et mærke eller en ankerpunkt på funktionen. Hvis tilladt i softwaren, skal du indtaste et tal rækkevidde omfatter funktionens pixelintensitet og justere denne tolerance som ønsket. Densiteter tilhører funktionen vil blive afhentet i overensstemmelse med intensiteten af ankerets pixel eller tolerance værdi. Brug følgende kommandoer, når du bruger Amira.
  1. Brug Magic Wand Tool til funktioner med skelnelige marginer.
    1. Klik på det område af interesse, derefter justere skyderne i display og maskering til at fange korrekte interval af værdier, således at funktionen er fuldt fremhævet. Tilføj valget med genvej "a".
  2. Brug Threshold Værktøj til funktioner uden klart adskilte marginer.
  3. Vælg ikonet Threshold. Juster skyderen til at justere tætheden inden ønskelig rækkevidde, således at kun de funktioner af interesse maskeres. Klik på knappen Vælg, tilsæt derefter valget med genvej220, en ".
  4. At segmentere hele mængden, skal du vælge Alle skiver, før du tilføjer markering.
  5. For at fjerne støj, skal du vælge segmentering> Fjern Øer og / eller Segmentering> Glatte etiketter.
5. Generer en overflade til visualisering og kvalitativ analyse som beskrevet i manualen sporing sektion 2.6-2.6.2. Hvis det ønskes, eksport til andre programmer for passende 3D-visning, kvantitativ analyse og simuleringer.
4. skræddersyet Automated segmentering
Bemærk: Brug denne fremgangsmåde til at oprette tilpassede scripts til automatisk segmentering, som kræver baggrund erfaring i datalogi, men tillader evnen til at skabe en præcis tæthed model fra et stort volumen.
1. Værktøjer (specifikt eksempel på Shape-Overvåget Segmentering i Matlab ²⁷⁾
  1. Billede forbehandling: Udfør de-noising, baggrund fjernelse og billedforbedringved hjælp af følgende rørledning:
    1. Indlæs billedet ved hjælp af imread kommando.
      1. I kommandolinjen, skal du indtaste: >> im = imread ($ image_path), hvor $ image_path er placeringen af billedet, der skal analyseres.
    2. Fra Image Processing værktøjskassen, kalder Wiener Filter ved hjælp af en skønnet eller kendt Støj-power-til-signal forhold (NSR).
    3. På tidligere behandlet billede, kalde billedet åbnefunktion imopen at estimere baggrunden lag, derefter tildele resultatet som en anden maske.
      1. I kommandolinjen, skal du indtaste:. >> Baggrund = imopen (im, Strel ($ shape_string, $ str)), i denne metode, $ shape_string er lig med "disken 'variablen $ størrelse er givet ved analysatoren dvs >> baggrund = imopen (im, Strel ('disken', 15)).
    4. Fratræk den filtrerede billede med baggrunden.
      1. I kommandolinjen, skal du indtaste: >> IM2 = im -baggrund
    5. Afhængig af kvaliteten af resultaterne, udføre billede normalisering med eller uden kurvelys Otsu metode ^28, som kan kaldes med funktionen imadjust fra Image Processing Toolbox.
      1. I kommandolinjen, skal du indtaste: >> IM3 = imadjust (IM2)
    6. Forbered de funktioner af interesse for segmentering, hvilket begrænser regioner af interesse ved at beskære den normaliserede billede.
      1. Ved hjælp af imtool kommando, udforske området af interesse, der skal beskæres, og giver koordinaterne til kommandoen: >> im3_crop = imcrop (IM3, [x1 y1 x2 y2]), hvor vektoren [x1 y1 x2 y2] svarer til pladsen område, der skal beskæres.
  2. Shape anerkendelse / Overvåget form klassifikation: træne algoritmen ved at give konkrete eksempler for hver anden kategori af objekter (lineære spor i et 2D-billede på tværs af de funktioner af interesse).
    1. Kontroller at VLFEAT ²⁹ API er blevet installeret og besøge VLFEAT hjemmeside for mere dybdegående dokumentation.
    2. I kommandolinjen, skal du indtaste: >> [træ, ASGN] = VL_HIKMEANS (im3_crop, $ K, $ NLEAVES) hvor $ K er antallet af klyngen, der skal bruges, eller antallet af klasser observatøren ønsker at arrangere dataene i, og $ NLEAVES er det ønskede antal blade klynger dvs >> [træ, ASGN] = VL_HIKMEANS (im3_crop, 4.100)
    3. Brug manuelt segmenterede funktioner som input til VLFeat.
      BEMÆRK: Denne open source C-baserede bibliotek vil udføre pixel patching, plaster klyngedannelse, og klynge center positionering afhængigt af metode valgt at arbejde bedst for datasæt. De tilgængelige indstillinger spænder fra k-middel klyngedannelse at TEXTON tilgange ^30, og outputtet er et numerisk array, der beskriver funktionerne ønskede baseret på de givne forbilleder.
2. Segmentering: Brug denne fully automatiseret, men beregningsmæssigt dyre, tilgang til segment flere klasser af objekter samtidig, som vil blive skrevet ud som separate kort til yderligere visualisering og analyse.
  1. Læg den tidligere genererede tal array (modellen).
  2. Ring til støtte vektor maskine (SVM) funktion i VLFeat, ved hjælp af modellen, og det billede, der skal segmenteres som et input.
    1. I kommandolinjen, skal du indtaste: >> [w, b] = vl_svmtrain (x, y, 0,1), hvor x er den oprindelige beskåret billedet im2_crop og y er objektivt billede, det billede, der er blevet manuelt segmenteret. Brug >> ISEG = VL_IMSEG (I, etiketter) til at farve resultaterne i henhold til de etiketter, der genereres af klyngedannelse.
      BEMÆRK: Baseret på de særlige kendetegn ved modellen, vil VLFeat klassificere billedet på antallet af klasser (funktioner af interesse) tildelt fra begyndelsen. Afhængigt af den ønskede grad af nøjagtighed, er det muligt at kombinere denne metode med andre metoder eller skøn clustER parametre såsom skrog og klynge centre. Udgangssignalet fra SVM algoritme er en probabilistisk model og binære masker af de ønskede klasser i de nye datasæt.
  3. Gem resultaterne ved at indtaste kommandoen: >> imwrite (im, $ format, $ filename) hvor $ formatet er "tiff" og $ filnavn er stien til output filen.
  4. For at visualisere billeder, skal du indtaste kommandoen: >> imshow (im).

Representative Results

Figur 1 viser en typisk arbejdsgang for 3D elektronmikroskopi cellulære billeddannelse, herunder elektron tomografi, FIB-SEM, og SBF-SEM. Arbejdsprocessen indeholder rå dataindsamling, tilpasning og genopbygning i et 3D volumen, støjreduktion gennem filtrering, og når det er nødvendigt, beskæring til området af interesse med henblik på at maksimere effektiviteten af den valgte segmentering software. Sådanne preprocessed data er derefter klar til feature extraction / segmentering.

Figur 2 illustrerer arbejdsgangen fastlagt i figur 1 med fire forskellige datasæt (som vil blive indført yderligere nedenfor), hvoraf to er harpiks-embedded samples af elektron tomografi (figur 2A, 2B) med to andre, der hidrører fra FIB -SEM og SBF-SEM, henholdsvis (figur 2C, 2D). Billeder i figur 2 kolonne 1 er projektionvisninger (figur 2A1, 2B1) og blokoverfladen billeder (figur 2C1, 2D1), henholdsvis som ved tilpasning og genopbygning er samlet ind i en 3D-volumen. Kolonne 2 viser skiver gennem sådanne 3D-volumener, som ved filtrering (kolonne 3) viser en betydelig reduktion i støj og dermed ofte forekommer mere sprød. Efter valg og beskæring af det store 3D-volumen til regionen af interesse (kolonne 4), kan 3D-gengivelser af segmenterede funktioner af interesse (kolonne 5) opnås, og yderligere inspiceret, farvekodede og kvantitativt analyseret.

I alt seks 3D datasæt, der hver indeholder en stak billeder opnået enten gennem elektron tomografi (3 datasæt), FIB-SEM (2 datasæt), eller SBF-SEM (1 datasæt) bruges til at sammenligne, hvordan hver enkelt af de fire segmentering metoder udføre (Figur 3). De datasæt stammer fra en række forskellige forskningsprojekter i laboratoriet og således give areasonably varieret sæt af typiske eksperimentelle datasæt. Alle datasæt blev undersøgt af fire uafhængige forskere, der hver især er mest fortrolige med én bestemt metode, og de blev anklaget for at levere det bedst mulige resultat for hver af de seks datasæt.

De datasæt er fra prøver som følger: 1. Tal 3A1-3A5: højtryk-frosne, fryse-substituerede og harpiks-embedded chick indre øre hår celle stereocilia ^31, 2. Tal 3B1-3B5: højtryk-frosne, fryse substitueret og harpiks-embedded plante cellevæg (ikke offentliggjort), 3. Tal 3C1-3C5: højt tryk frosset, fryse-substitueret og harpiks-embedded indre øre hår celle kinocilium (ikke offentliggjort), 4. Tal 3D1-3D5: høj pres- frosne, fryse-substituerede og harpiks-embedded blokke af mitokondrier beliggende i humane brystkirtel epitelceller HMT-3522 S1 acini, som er blevet dyrket i laminin rige extracellular matrix ^32,33, 5. Tal 3E1-3E5: ufarvede bordplade-forarbejdet, harpiks-embedded blokke af sulfat reducering bakterielle biofilm (manuskript under udarbejdelse), og 6. Tal 3F1-3F5: membran grænse af naboceller af HMT -3522 S1 acini.

Som det kan ses af figur 3, kan forskellige segmentering tilgange føre til overvejende lignende resultater for nogle data sæt typer, men helt forskellige resultater for andre datatyper. For eksempel, håret celle stereocilia datasæt (figur 3A) giver rimelige segmentering volumener med alle fire indflyvninger med manuel indvindes model genereret af en ekspert bruger er den klareste at fortolke og foranstaltning. I dette tilfælde en sådan model giver mulighed for hurtige målinger af glødetråd-endeløse afstande tælle antallet af links, der findes mellem de aflange filamenter, samt bestemmelse af manglende dele af tætheden kortet svarertil steder, hvor prøven blev beskadiget under prøveforberedelse ^34. Sådanne oplysninger er langt mere vanskeligt at erhverve ved hjælp af de andre tre segmentering tilgange, selvom skræddersyet automatiseret segmentering giver bedre resultater end rent tæthed baseret tærskling.

For anlægget cellevæg (figur 3B), manuel model generation syntes at være den mest effektive i at formidle en følelse af orden i cellevæggen, som ingen af de andre tilgange opnå. Men det indvindes model ikke fange crowdedness af objekterne i datasættet. Manuel sporing funktioner af interesse synes at give et bedre resultat end tætheden-baserede eller form-overvågede tilgange. På den anden side, manuel sporing er meget arbejdskrævende og identifikation grænser de funktioner er noget subjektivt. Derfor kan automatiserede metoder foretrækkes til segmentering store mængder med en potentiel afvejning mellem præcision ogressourcer brugt på manuel segmentering.

For kinocilium datasæt (figur 3C), manuel indvindes modelgenerationen giver den reneste resultat og afslører en uventet arkitektur tre mikrotubuli i centrum af kinocilium, en detalje, der er tydeligt i de beskårne data, men tabt i alle andre fremgangsmåder , formodentlig på grund af plette heterogenitet. Imidlertid er andre potentielt vigtige funktioner i tætheden kort savnet i manuel generering af en abstrakt model. Dette skyldes det faktum, at den subjektive karakter af manuel model dannelse fører til en idealisering og indvinding af den faktiske massefylde observeret, og dermed til en subjektiv fortolkning i modellen formation. Derfor dette eksempel pænt viser, hvordan manuel indvindes model generation gør det muligt at koncentrere sig om et specifikt aspekt af 3D volumen. Men den selektive perception og forenkling ikke giver en fuldstændig redegørelse for alle proteinet complexes stede i datasættet. Derfor, hvis formål er at vise kompleksiteten af de data, så man bedre tjent med en af de tre andre metoder.

I tilfælde af 3D matrix-dyrket brystkirtel acini (figur 3D), er høj kontrast mitokondrier segmenteret efter alle fire tilgange med lethed, med manuel sporing af funktioner, der ikke alt for overraskende der giver de bedste resultater med det laveste beløb af forurening ( Figur 3D3). , Manuel sporing er dog meget arbejdskrævende og er derfor af begrænset brug for store mængder. Både tærskel-baserede tæthed og form-overvåget automatiseret segmentering udpakke mitokondrierne ganske godt, og vil resultere i en næsten perfekt segmentering, hvis yderligere tricks til oprydning er ansat (fx fjerne alle objekter under en bestemt tærskel på voxel tæthed) som tilgængelig i forskellige pakker. I dette tilfælde gjorde manuel indvindes modelbygning ikke givelovende resultater, delvis fordi mitokondrier ikke let kan tilnærmes med bold og stok-modeller.

Med hensyn til den bakterielle jord samfund / biofilm (figur 3E), tre af de fire tilgange giver rimelige resultater, med den manuelle model generation ikke klarer sig godt på grund af den udfordring, der repræsenterer biologiske objekter, såsom bakterier, ved geometriske former. Ekstracellulære vedhæng oprindelse fra bakterier kan påvises i de automatiserede segmentering metoder, men ikke så godt i den manuelle funktion sporing. Shape-overvåget skræddersyet automatiseret segmentering yderligere kan adskille de ekstracellulære funktioner fra bakterier på trods af deres lignende tætheder (data ikke vist), hvilket giver nem kvantificering af selv meget store datasæt. Da dette er oprindeligt et meget stort datasæt, den skræddersyet automatiseret segmentering klart udkonkurreret alle andre metoder, men måske har nydt godt af den lave kompleksitetog den relativt sparsomme fordeling af de genstande af interesse (lav crowdedness).

Ved behandlingen af grænsefladen mellem to eukaryote celler i et væv-lignende forbindelse (figur 3F), kun manuel sporing af funktioner af interesse givet gode resultater. Automatiserede density-baserede segmentering tilgange ikke opdager membranen grænsen mellem tilstødende celler helt, og selv de skræddersyede tilgange mislykkes, dels fordi formen af en celle ikke nemt tilnærmes eller sidestilles med former, på trods af sin klare succes for bakterierne i biofilmen (figur 3E5).

Observationen af figur 3, at segmenteringen tilgange gøre godt på nogle datasæt, men ikke på andre førte til spørgsmålet om, hvad der kendetegner hver af disse datasæt, og om det var muligt at kategorisere de typer af data egenskaber eller personlige mål, der syntes at passer godt med deres respektive tilgang. Systematisk undersøgelse af dette emne er ikke tidligere blevet gennemført, og dermed som et første skridt en virksomhed af en empirisk liste over billedfiler egenskaber og personlige mål kan guide en novice i deres forsøg på at finde den bedste fremgangsmåde for feature extraction af deres respektive datasæt.

Blev identificeret otte kriterier som væsentlige, er vist i figur 4, og de kan inddeles i to hovedkategorier: (1) de funktioner, der er iboende i datasættet, og forskerens personlige mål og andre overvejelser, der er (2) noget mere subjektive, men lige så vigtig. De viste overvejende stammer fra de seks datasæt i figur 3, med yderligere tre datasæt blive indført eksempler: en (figur 4A1) er en cryo-tomogram en cryo-del af Arabidopsis thaliana plantecellevægge, den anden (figur 4A2 , 4B1, 4D1 figur 3F1-3F5 kategori, men er endnu mere væsentligt kompleks, og den tredje (figur 4B2 , 4D2) er en harpiks-sektion tomogram af indre øre hår celle stereocilia i tværsnit, svarende til prøvens indhold vist i længdesnit i Figuress 2A1-2A5 og 3A1-3A5.

For den kategori af de objektive kriterier, som image egenskaber, fire træk iboende i datasættene foreslås at være af betydning:

Dataene kontrast kan være (1) lav (figur 4A1), som er typisk for cryo-EM tomogrammer, (2) mellemprodukt (figur 4A2), såsom i cellulære scenerier uden nogen klar organel eller andre fremtrædende træk stående, eller (3) høj (figur 4A3), som det er tilfældet for kinociliary tomogram eller stereocilia i tværsnit, på grund af tilpasningen af klart adskilte trådformede elementer i z-retningen.
Dataene kan være fuzzy (Figur 4B1), med ingen synligt klare grænser mellem to tæt placerede objekter, såsom celler i et væv eller sprød (Figur 4B2), med skarpt definerede grænser. Det er til dels en funktion af datasættet opløsning, der er i sagens natur højere med en faktor på omkring 2-4 til elektron tomogrammer sammenlignet med FIB-SEM. Naturligvis skarpere grænser er ønskelige for både manual samt automatiserede segmentering tilgange, men afgørende for sidstnævnte tilgang.
Tætheden kort kan enten være overfyldt (figur 4C1), som afspejles af de tætsiddende plante cellevægskomponenter eller tyndt befolkede (figur 4C2), som er bakterierne i en koloni, som illustrerer adskillelsen, der gør automatiseret billede segmentering væsentligt lettere.
Density kort kan være meget kompleks med meget forskellige funktioner, ofte med uregelmæssige former, såsom stria vascularis væv omkring et blodkar (figur 4D1) eller veldefinerede organel-lignende genstande med en lignende organisation, såsom stereocilia i tværsnit ( Figur 4D2).

Bemærk også de vidt forskellige skalaer i alle de forskellige eksempler, hvilket gør sammenligningen noget vanskeligt.

Bortset fra de mere objektive kriterier, såsom billedfiler egenskaber, fire meget subjektive kriterier, der vil guide valget af den passende sti foreslås også:

Ønsket Formål: Formålet kan være at visualisere hårbundt stereocilium i sin kompleksitet og til at bestemme og undersøge formen af objektet (figur 4E1), eller for at skabe en forenklet og indvindes bold og stok model, der er bygget ind i tætheden kort og tillader en hurtig tællesnd måling af de geometriske objekter (glødetråd længde, afstand og antallet af forbindelser) (figur 4E2).
Funktionen morfologi kan være meget uregelmæssig og komplekse lignende celler, såsom celle-celle-interaktion zoner (Figur 4F1), noget tilsvarende formet med nogen variation, såsom mitochondrier (figur 4F2), eller fortrinsvis identisk formede, såsom actinfilamenter og indlægget links i et hårbundt i langsgående orientering (figur 4F3).
Andelen af funktionen af interesse (befolkningstæthed) er vigtig, da man måske ønsker at segmentere alle funktioner i et 3D-datasæt, som det er tilfældet for planternes cellevægge (Figur 4G1), eller kun en lille brøkdel af den cellulære volumen som det er tilfældet for mitokondrier i en heterogen cellulær sekvens (figur 4G2). Afhængig af størrelsen af datasættet og volumenandelen der kræver segmentering, kan det være mest effektivt at brugemanuelle metoder. I andre tilfælde, som når man er interesseret i en række forskellige funktioner, er der simpelthen ikke noget alternativ til at bruge semi-automatiske segmentering tilgange.
Et andet centralt subjektive kriterium er den mængde ressourcer man er villig til at investere i segmentering processen, og hvilket niveau af troskab er nødvendig for at besvare et biologisk spørgsmål. Man kan ønsker og har brug for at kvantificere en funktionens volumetriske parametre (såsom størrelse, volumen, areal, længde, afstand fra andre funktioner, etc.), hvor der kan være behov for mere pleje at indhente nøjagtige kvantitative oplysninger (Figur 4H1) eller formålet kan være at blot tage et billede af sin 3D-form (figur 4H2). I en ideel verden, hvor ressourcerne er ubegrænsede, man tydeligt ikke ønsker at gå på kompromis, men snarere vælge den mest præcise sti brugerdreven assisteret manuel funktion ekstraktion. Mens dette kan arbejde for mange datasæt, i den nærmeste fremtid 3D volumener wil l være i størrelsesordenen 10k med 10k med 10k eller højere, og manuel segmentering vil ikke længere være i stand til at spille en fremtrædende rolle i segmentere sådan en enorm plads. Afhængigt af kompleksiteten af de data og andre data karakteristika, kan halvautomatisk segmentering blevet en nødvendighed.

I figur 5 er styrker og begrænsninger kort anført for de fire segmentering tilgange. De personlige mål og billedegenskaber identificeret i figur 4, der kan parre med hver strategi er skitseret som godt. I figur 6, de personlige mål og billedfiler karakteristika for de seks datasæt eksemplificere, hvordan at triage data og træffe beslutning om den bedste fremgangsmåde. Både 5 og 6 udvides på i diskussionen.

belastning / 51673 / 51673fig1highres.jpg "width =" 500px "/>
Figur 1. Arbejdsgang for biologisk billeddannelse genopbygning og analyse. Dette diagram giver et overblik over de forskellige tiltag til at indsamle og bearbejde billeder, indsamlet af tomografi, fokuseret ion stråle SEM og serienummer blok ansigt SEM. Rå resultater dataindsamling i 2D vippe serie eller serielle sektioner. Disse 2D-billede sæt skal flugte og rekonstrueret i 3D og derefter filtreret for at reducere støj og øge kontrasten i træk af interesse. Endelig kan dataene segmenteret og analyseres, i sidste ende resulterer i en 3D-model. Klik her for at se en større version af dette tal.

Figur 2
Figur 2.. Eksempler på workflow for forskellige datatyper fra tomografi og FIB-SEM Hvert trin i arbejdsgangen efter dataindsamlingen er vist gennem fire datasæt (rækker AD): harpiks indlejret farvede tomografi af længderetningen udskåret stereocilia, harpiks indlejret farvede tomografi af vegetabilsk cellevæg cellulose, FIB-SEM af bryst epitelcelle mitokondrier, og SBF-SEM af E. coli-bakterier. En 2D-skive gennem de rå data er vist i kolonne 1, og et billede fra dataene efter justering og 3D-rekonstruktion omfatter kolonne 2. filtrering teknikker, der anvendes i kolonne 3, er følgende: medianfilter (A3), ikke-anisotropisk diffusion filter (B3), Gaussisk sløring (C3), og Matlabs imadjust filter (D3). Et eksempel på den bedste segmentering for hvert datasæt fra det beskårne område af interesse (kolonne 4) vises som en 3D-gengivelse i kolonne 5. skalapanelerne: A1-A3 = 200 nm, A4 = 150 nm, A5 = 50 nm, B1-B3 = 200 nm, B4-B5 = 100 nm, C1-C3 = 1 mm, C4-C5 = 500 nm,D1-D3 = 2 mm, D4-D5 = 200 nm. Klik her for at se en større version af dette tal.

Figur 3
Figur 3. Anvendelse af fire segmentering tilgange til fx datasæt Seks eksempel datasæt blev segmenteret af alle fire metoder:. Manuel indvindes model generation, manuel opsporing, automatiseret tæthed baseret segmentering, og skræddersyet automatiseret segmentering. Manuel indvindes model generation var effektivt til harpiksen indlejret farvede tomografi af stereocilia (A), da formålet var at skabe en model for kvantitative formål snarere end at udvinde tætheder. Til harpiksen indlejret farvede tomografi af plantecelle væg (B), automatiseret densitet baseret Segmentaning var den mest effektive metode til hurtigt at udtrække cellulosen gennem mange skiver, hvor de manuelle metoder tog langt større indsats på kun et par skiver af data. Manuel indvindes model generation genereret mikrotubulus triplet i den farvede tomografi af kinocilium (C), mens andre segmentering metoder, der ikke gjorde, men de to automatiske tilgange udpakkede tætheder hurtigere og blev derfor foretrukket. På grund af formen af mitokondrier fra FIB-SEM af bryst epiteliale celler (D), manuel sporing billede reneste resultat, og lav befolkningstæthed kombineret med anvendelse af interpoleringsmetoder tilladt for hurtig segmentering. I betragtning af den store mængde, der er nødvendig for at være segmenteret, skræddersyet automatiseret segmentering viste sig at være mest effektive til at segmentere SBF-SEM bakterier data (E), men begge automatiske indflyvninger var sammenlignelige. Selvom tidskrævende, den eneste metode til at udvinde FIB-SEM af brystepithelceller cellemembranen (F) var manuel sporing skalapanelerne.:A1-A5 = 100 nm, B1-B5 = 100 nm, C1-C5 = 50 nm, D1-D5 = 500 nm, E1-E5 = 200 nm, F1-F5, barer = 500 nm. Klik her for at se en større version af dette tal.

Figur 4
Figur 4. objektivt billede egenskaber og subjektive personlige mål for triaging af datasæt. Brug af eksempler på datasæt karakteristika kriterier foreslås til at informere en beslutning om, hvilke segmentering tilgang til at bruge. Med hensyn til objektive karakteristika kan data i sagens natur have kontrast, der er lav, medium eller høj (A1-A3), være fuzzy eller sprøde (B1-B2), fordelt ud eller overfyldt (C1-C2), og har komplekse eller simpelthen organiserede funktioner (D1-D2). Subjektive personlige mål omfatter den ønskede o ÅL rettet mod en forenklet model eller udvinding af de eksakte tætheder (E1-E2), der identificerer en højtravende ark, højtravende lydstyrken eller lineær morfologi som funktionen af interesse (F1-F3), vælge en høj eller lav befolkningstæthed i funktionen af interesse (G1-G2), og fastslår, om afvejningen mellem high-fidelity og high-ressource-tildeling for en faldende afkast af investeringer såsom tid (H1-H2) skalapanelerne:. A1 = 50 nm, A2 = 1500 nm , A3 = 100 nm, B1 = 1500 nm, B2 = 200 nm, C1 = 100 nm, C2 = 200 nm, D1 = 10 mm, D2 = 200 nm, E1 = 100 nm, E2 = 50 nm, F1-F2 = 500 nm, F3 = 50 nm, G1 = 100 nm, G2 = 1 mm, H1-H2 = 100 nm. Klik her for at se en større version af dette tal.

px "/>
Figur 5. Sammenligning tabel med data egenskaber og subjektive sigter passende for forskellige segmentering tilgange. Tabellen er udarbejdet på styrker og begrænsninger af hver segmentering tilgang. Kriterierne fra figur 4 kan hjælpe med at identificere, hvilke datasæt er egnede for hvilke segmentering metode. Disse objektive billedfiler egenskaber og subjektive personlige mål blev valgt til optimal udnyttelse af hver metode, men forskellige kombinationer kan hindre eller hjælpe effektiviteten af segmentering. Klik her for at se en større version af dette tal.

Figur 6
Figur 6. afgørelse rutediagram til effektiv triage segmentering tilgange til datasæt med forskellige karakteristika. Baseret på de kendetegn fremhævet i Figur 4, dette diagram viser, hvor fire kriterier bidraget mest til den endelige beslutning om den bedste segmentering fremgangsmåde for hvert datasæt fra figur 3. Hvert datasæt er farvekodet til hurtigt at følge de dristige linjer, der repræsenterer den primære beslutningsproces, samt de stiplede linier, der afspejler en alternativ sti, som måske eller måske ikke føre til den samme fremgangsmåde. De kinocilium, bakterier og plantecelle væg datasæt blev bedst segmenteret med de to automatiserede metoder. I modsætning hertil cellemembranen og mitochondrier stier altid føre til manuel sporing på grund af deres vanskelige karakteristika. Klik her for at se en større version af dette tal.

Discussion

Effektive strategier for udvinding af relevante funktioner fra 3D EM volumener er et presserende behov for at holde op med de data tsunami, der for nylig har ramt biologisk billeddannelse. Mens data kan genereres i timer eller dage, det tager mange måneder at analysere 3D-volumener i dybden. Derfor er det klart, at det billede, analysen er blevet flaskehals for videnskabelige opdagelser; uden tilstrækkelige løsninger på disse problemer, billedbehandling forskere bliver ofre for deres egen succes. Dette er til dels på grund af den høje kompleksitet af data og også den makromolekylære fortrængning typisk findes i biologiske celler, hvor proteiner og proteinkomplekser kant en anden og i det væsentlige fremstår som en kontinuert gradient af gråtoner tætheder. Problemet kompliceres af forberedelse og billedbehandling prøve ufuldkommenheder, og i nogle tilfælde billedet genopbygning artefakter, hvilket fører til mindre end perfekt volumetriske data, der kan udgøre udfordringer for fuldautomatisk tilganges. Mest markant er dog det faktum, at eksperterne i prøveforberedelse, billedbehandling og den biologiske fortolkning sjældent er velbevandret i computervidenskab og kræver derfor også vejledning om, hvordan man effektivt nærme feature extraction og analyse. Derfor ved hjælp af forskellige eksempler, protokollen forklarer, hvordan du forbereder data for segmentering, samt trin for manuel indvindes model generation, automatiseret tæthed baseret segmentering, manuel sporing funktioner af interesse, og skræddersyet automatiseret segmentering. Kan findes De manuelle og automatiske indflyvninger skitseret i proceduren i en lang række af segmentering software hvoraf nogle er nævnt her, men andre lignende funktioner og er lige velegnede.

Resultaterne viser, at effektiviteten af hver af de 3D-segmentering tilgange varierer for hver forskellig type af datasæt. Selvom de forskellige tilgange produceret kvalitativt similar 3D-gengivelser som slutproduktet, mængden af tid og kræfter brugt på hver under segmenteringsprocessen varierede betydeligt. Anbefalingerne for relevante billedfiler egenskaber og personlige mål pr segmentering tilgang er opsummeret i figur 5, hvilket er yderligere forklaret i de følgende fire underafsnit. Disse kriterier blev anvendt på de seks datasæt, som vist i beslutning rutediagram i figur 6. Selvom figurerne 5 og 6 kun beregnet til at give en begrundelse for hvert datasæt og hvordan hver af de forskellige kriterier vægtes i beslutningsprocessen, de giver ikke en idiotsikker vejledning, men snarere et udgangspunkt. Der er simpelthen for mange kriterier, der har indflydelse på beslutningsprocessen: nogle er objektive kriterier, såsom data sæt egenskaber, mens andre er mere subjektive kriterier, såsom det ønskede mål. Det er sikkert at sige, at datasæt, der viser en høj level kontrast med skarpe skarpe grænser, har funktioner, der er godt adskilt og relativt homogent (ikke alt for forskellige), og behandles med det formål at vise en densitet model for et stort antal objekter, vil automatiserede metoder være bedre, hvis ikke for det faktum, at manuelle metoder ville simpelthen være ressource (tid) -prohibitive. På den anden side, hvis kontrast er lav, dataene er uklart, og derfor kræver en sagkyndig viden, objekterne er overfyldt, og de funktioner en høj diversitet og er således heterogen, kan man ikke have noget andet valg end manuel feature extraction / segmentering.

Manuel Abstracted Model Generation

Manuel indvindes model sporing er særlig effektiv i segmentere lineære elementer, der giver frø punkter (bolde), der automatisk kan tilsluttes (pinde). Sådanne bolde og pinde-modeller kan være meget stærk til at måle længden ennd orienteringen af en sådan model og give et tilstrækkeligt indvindes model for både kvalitativ inspektion og kvantitativ analyse. Manuel indvindes model generation er almindeligt anvendt, når minimere ressourceforbrug på analysen er vigtigere end absolut troskab til formerne af de oprindelige data. Det er mest succesfulde med lineære og homogene funktioner af interesse (f.eks filamenter rør). Data kontrast, skarphed, og crowdedness ikke spiller en stor rolle i fastsættelsen af denne metode succes, så længe det menneskelige øje kan genkende genstand for interesse. Sommetider sådanne modeller kan også anvendes som et skelet til segment 3D-kortet i en zone omkring skelettet. Selvom modellen er abstrakt snarere end en afspejling af nøjagtige densiteter repræsenterer en skeletonized version af 3D tæthed og muliggør således rod visualisering og kvalitativ analyse. Kvantitative målinger såsom længde kan også bestemmes ud fra det omtrentlige model. For eneksempel på software med manuel indvindes model generation, kan du besøge Chimera detaljerede brugervejledning online på http://www.cgl.ucsf.edu/chimera/current/docs/UsersGuide/index.html .

Manuel Sporing af funktioner seværdigheder

Manuel pensel sporing fungerer godt med næsten alle data egenskaber, men det er også den mest tidskrævende metode. Til tider er det eneste teknik til ekstraktion af en funktion af interesse fra et komplekst billede sæt indeholder en lang række funktioner, såsom den tynde og indviklede cellemembranen. Et nyttigt værktøj til rådighed i nogle programmer giver mulighed for interpolation mellem intermitterende segmenterede skiver, når funktionen af interesse ændrer sig jævnt. Manuel sporing kan anvendes mest effektivt, hvis dataene er sprøde og har medium til høj kontrast, men det kan også anvendestil mere udfordrende datasæt, så længe brugeren er bekendt med objekt af interesse. De data kompleksitet kan variere fra diskrete objekter til komplekse og overfyldte datasæt, hvor objekter er tætpakkede. I det sidstnævnte tilfælde kan manuel segmentering være det eneste valg, som automatiske indflyvninger ofte svært ved at segment det ønskede volumen og udtrække for meget eller for lidt. Vanskelige har morfologi, såsom indviklede plader eller mængder, også kan udvindes ved denne metode. Dog skal brugeren huske på, at et datasæt med flere vanskelige kendetegn kun kan segmenteres hvis befolkningstætheden i de funktioner af interesse er lav, da segmentering af høj befolkningstæthed af de elementer af interesse bliver tid uoverkommelige. For et eksempel på software med manuel sporing, kan du besøge Amira detaljerede brugervejledning online på http://www.vsg3d.com/sites/default/files/Amira_Users_GuidE.pdf.

Automatiseret Densitetskorrigeret segmentering

I modsætning til de manuelle teknikker, de automatiserede metoder er generelt mindre tidskrævende, hvilket er en vigtig faktor til at overveje, når segmentere en stor stak billeder. Dog kan simpelt tærskling ikke være så nøjagtige, og meget mere tid kan blive brugt på raffinement og datasikring af automatisk segmenterede volumen. Automatiseret tæthed-baserede segmentering virker bedst på datasæt, der viser et stort antal lignende funktioner af interesse, at alle kræver segmentering. Hvis dataene er mere kompleks, kan disse automatiserede teknikker stadig tjene som et første skridt, men vil sandsynligvis kræve nogle manuel indgriben ned linjen for at angive en subvolume indeholder funktionen af interesse. Denne strategi virker typisk godt på lineære morfologier eller indviklede mængder, men det er sjældent succes med tynde indviklede plader såsomcellemembraner. Minimalt behov for brugerindgreb med automatiserede metoder muliggør segmentering gennem store eller små mængder, mens expending få brugerkonti ressourcer såsom tid til gengæld for high fidelity. For et eksempel på software med automatiserede tæthed-baserede segmentering, besøg Amira detaljerede brugervejledning online på http://www.vsg3d.com/sites/default/files/Amira_Users_Guide.pdf .

Skræddersyet Automated segmentering

Skræddersyet automatiseret segmentering giver magt tilpasning af algoritmer til et bestemt datasæt, men det er ofte specifik for de fastsatte data eller datatype, der passer til et begrænset antal har egenskaber, og kan ikke generaliseres nemt. Proceduren fremvist her adskiller sig fra de generelle automatiske segmentering tilgange, såsom vandskel fordybelse og andet plan sæt metoder, der er afhængige af en programmeret bestemmelse af kritiske kimpunkter, efterfulgt af hurtig-marcherende terning udvidelse fra disse frø point. En variation af dette tema er grænse segmentering, hvor gradientvektor oplysninger informerer funktionen grænser. I modsætning hertil tilpassede script anvendt her er baseret på en uddannelse stadie, hvor brugeren manuelt spor nogle få eksempler. Gennem machine learning vil specifikke algoritmer registrerer og derefter lære selvstændigt genkende egenskaber og data egenskaber konsekvent fundet i sporene. En ekspert bruger kan omskole algoritmerne og forbedre nøjagtigheden af segmentering ved at medtage flere eksempel spor for at give et større sæt af spillefilm kriterier. Samlet set kan tærsklingsparametre og lignende fremgangsmåder, eller endda skræddersyede tilgange ikke være så nyttigt at udtrække et enkelt element af interesse fra et billede med komplekse mangfoldighed af organeller og figurer, som datasikring kan være lige så arbejdskrævende som manuel sporing.

Strategier for triaging Data og vælge en Segmentering Approach

I betragtning af de subjektive og objektive kriterier, der præsenteres i figur 4 og sammenfatning af egnede datasæt i figur 5, kan beslutningsprocessen ordning afbildet i figur 6 bistå en effektiv vurdering af feature extraction strategier for en lang række datasæt. Datasættene triaged i fire på hinanden følgende beslutninger, som hver især kan omfatte et hvilket som helst af de fire respektive formål samt de fire subjektive kriterier indført i figur 4. Som et eksempel, figur 6 er rationalet for triaging hver af de seks data sæt vist i figur 3. Utvivlsomt, for hvert datasæt er der ikke en enkelt unik vej, men snarere forskellige stier gennem denne matrix efter forskellige kriterier for beslutningstagning, der kan føre to ens eller forskellige anbefaling til segmentering af data. Mens hver datasæt vil have sit eget sæt af egenskaber, som ikke kan forudses, er seks eksempler, idet hver parret med en forklaring af rationalet bag den foretrukne feature extraction / segmentering tilgang. Mest også omfatte et forslag til en alternativ beslutning rute, som enten resulterer i brugen af den samme eller en anden segmentering metode (figur 6).

Den kinocilium er en sprød datasæt med klart definerede grænser, hvilket gør automatiserede tilgange mere tilbøjelige til at lykkes. Alle funktioner i interesse er godt adskilt, igen favorisere en automatiseret metode. Desuden funktionerne af interesse er lig hinanden, hvilket gør det et relativt homogent datasæt ideel til skræddersyet segmentering. Endelig var målet at udtrække hele funktionen, begunstige en semi-automatiseret metode. Som en følge heraf blev det konkluderet, at en automatiseret tærskel (solid grøn linje) samt en specialdesignet (fx form overvåget segmentering) metode (punkteret grøn linje) er begge tilbøjelige til at gøre godt på dette datasæt.

Lignende kriterier, skønt placeret i en anden rækkefølge i beslutningsprocessen netværk, finder anvendelse på tilfælde af bakterier. Der anbefales en skræddersyet tilgang, dels fordi dette datasæt var meget stor; dermed begrænsede ressourcer forbyde en arbejdskrævende manuelle indgriben / segmentering tilgang. Mens tærskling ville du have haft acceptable resultater, specialdesignede fremgangsmåde var i stand til at udføre undersøgelsens centrale mål at adskille de afrundede bakterielle figurer fra de ekstracellulære metal indlån, der er beliggende i-mellem bakterierne eller lige ved siden af bakterierne, og derfor skræddersyet tilgang blev foretrukket.

For stereocilia datasæt, den første overvejelse var det ønskede mål: målet kan enten være at vise hele tæthedeller for at skabe geometriske modeller. Mængden af interesse var et overfyldt område, og målet var at segment et stort antal objekter som adskilte objekter med henblik på efterfølgende at udføre kvantitativ volumetrisk analyse, herunder længder, tal, afstande, orientering etc. Det var nyttigt at de genstande af interesse var hovedsagelig lineær, og dette gjorde geometriske model spore den foretrukne metode. Men hvis der i stedet målet har været at vise hele tæthed, så den lineære funktion morfologi samt relativt høj kontrast med skarpt definerede grænser ville gøre en automatiseret tærskelværdiansættelse protokol muligt.

De cellemembraner og mitokondrier data sager er udfordrende for automatiserede metoder på grund af de forskellige kategorier af funktionen morfologi: indviklede plader og mængder hhv. Målet er at spore celle eller mitokondrier skitse præcist, men der er kun begrænsede ressourcer til at gøre det. Hertil kommer, funktionerne i interest er komplekse og kan ikke være nemt registreres automatisk eller forme-kodet, men for mitokondrierne datasæt den tilpassede scripting tilgang for bakterierne kan eventuelt anvendes med yderligere tilpasning. Heldigvis membranen og mitokondrier selv kun udgør en lille brøkdel af den samlede volumen og dermed manuel sporing er en enkel omend tidskrævende tilgang. Manuel sporing er også den foretrukne metode til sådanne datasæt, når kontrasten er temmelig lav, og grænserne er temmelig fuzzy. Som et resultat, selv om de udgør en væsentlig del af de datasæt, skal disse indviklede ark manuelt spores, simpelthen på grund af mangel på et bedre alternativ.

Anlægget datasæt stillet sine egne udfordringer, fordi målet var at segmentere alle objekter, der er tæt afstand og udgør en overfyldt natur. Visning af massefylde som-er vil gøre det muligt målinger om form og organisering af objekterne, men Because manuelt segmentere hver trådformede objekt er for dyrt, automatisk tærskling blev ansat i stedet.

De forskellige trin og tilsvarende resultater i at skabe en 3D-model er blevet vist her, men endnu vigtigere, at de data, karakteristika og personlige kriterier fundet være afgørende for fastlæggelsen af den bedste vej for segmentering er også blevet belyst. De vigtige karakteristika ved billeddata omfatte, hvad der er beskrevet her som modsætning crowdedness, sprødhed, og antallet af forskellige former eller funktioner (såsom organeller, filamenter, membraner). Subjektive kriterier til at overveje at omfatte det ønskede mål for segmentering (måling / optælling skeletonized repræsentation af data / visning mængder i 3D-gengivelser), morfologiske kendetegn funktionen af interesse (lineær, aflange, der er netbaseret, komplekse, indviklede), tætheden af funktioner af interesse i forhold til hele volumen (den del af de objekter, der ervigtigt og skal udvindes), og afvejning af de kompromiser for expending ressourcer til segmenteringen troskab af den oprindelige data og faldende afkast af investeringen resulterer i gradvise forbedringer for væsentligt højere fordeling af ressourcerne.

Feltet af billedet segmentering er væsentligt modnet i løbet af de seneste år, men der er ingen mirakelkur, ingen algoritme eller et program, der kan gøre det hele. Datasæt størrelser er vokset fra hundredvis af megabyte rutinemæssigt snesevis af gigabytes, og de er nu begyndt at overstige terabytes, hvilket gør manuel segmentering nær umuligt. Således skal investeres i de kloge og tid-effektiv feature extraction tilgange, der efterligner den menneskelige beslutningsproces flere ressourcer. En sådan indsats skal kombineres med (1) geografisk informationssystem (GIS) -baseret semantiske hierarkiske databaser (svarende til Google Earth), (2) oplysninger abstraktion teknikker (dvs. overgangfra en voxel til geometrisk / volumetrisk repræsentation) kompatibel med computer assisteret design (CAD) software med henblik på at reducere mængden af data og dermed muliggør visning af større mængder ^35, (3) simuleringsteknikker, da de ofte anvendes i ingeniørdiscipliner, samt (4) avanceret animation og film gør kapaciteter, herunder fly-gennem animationer (svarende til, hvad der er udviklet til gaming industrien).

Det er klart, effektiv feature extraction og segmentering ligger i hjertet af det kommende revolution i cellulær høj opløsning billeddannelse, og mens vil altid være behov for en bedre tilgang, de principper, der præsenteres her, såvel som eksempler på, hvad fremgangsmåde blev anvendt til forskellige datatyper vil give nogle værdifulde oplysninger for at gøre en beslutning om, hvilken tilgang til at tage.

Materials

Name	Company	Catalog Number	Comments
Amira	FEI Visualization Sciences Group		http://www.vsg3d.com/amira/overview
Chimera	UCSF		http://www.cgl.ucsf.edu/chimera/
Fiji/ImageJ	National Institute of Health		http://fiji.sc/Fiji, http://rsbweb.nih.gov/ij/
IMOD	Boulder Laboratory for 3D Electron Microscopy of Cells		http://bio3d.colorado.edu/imod/
Photoshop	Adobe		http://www.adobe.com/products/ photoshopfamily.html
MATLAB	MathWorks		http://www.mathworks.com/
VLFeat	VLFeat		http://www.vlfeat.org/

DOWNLOAD MATERIALS LIST

References

Auer, M. Three-dimensional electron cryo-microscopy as a powerful structural tool in molecular medicine. J Mol Med (Berl). 78 (4), 191-202 (2000).
Johnson, M. C., Rudolph, F., Dreaden, T. M., Zhao, G., Barry, B. A., Schmidt-Krey, I. Assessing two-dimensional crystallization trials of small membrane proteins for structural biology studies by electron crystallography. Journal of visualized experiments JoVE. (44), e1846 (2010).
Jun, S., Zhao, G., Ning, J., Gibson, G. A., Watkins, S. C., Zhang, P. Correlative microscopy for 3D structural analysis of dynamic interactions. Journal of visualized experiments JoVE. (76), e50386 (2013).
Meng, X., Zhao, G., Zhang, P. Structure of HIV-1 capsid assemblies by cryo-electron microscopy and iterative helical real-space reconstruction. Journal of visualized experiments JoVE. (54), e3041 (2011).
Chen, S., McDowall, A., et al. Electron Cryotomography of Bacterial Cells. Journal of visualized experiments JoVE. (39), e1943 (2010).
Meyerson, J. R., White, T. A., et al. Determination of molecular structures of HIV envelope glycoproteins using cryo-electron tomography and automated sub-tomogram averaging. Journal of visualized experiments JoVE. (58), e2770 (2011).
Lucic, V., Forster, F., Baumeister, W. Structural studies by electron tomography: from cells to molecules. Annu Rev Biochem. 74, 833-865 (2005).
Bajaj, C., Yu, Z., Auer, M. Volumetric feature extraction and visualization of tomographic molecular imaging. J Struct Biol. 144 (1-2), 132-143 (2003).
Lin, G., Adiga, U., Olson, K., Guzowski, J. F., Barnes, C. A., Roysam, B. A hybrid 3D watershed algorithm incorporating gradient cues and object models for automatic segmentation of nuclei in confocal image stacks. Cytometry A. 56 (1), 23-36 (2003).
Volkmann, N. A novel three-dimensional variant of the watershed transform for segmentation of electron density maps. Journal of Structural Biology. 138 (1), 123-129 (2002).
Rigort, A., Günther, D., et al. Automated segmentation of electron tomograms for a quantitative description of actin filament networks. Journal of structural biology. 177 (1), 135-144 (2012).
Cremers, D., Rousson, M., Deriche, R. A Review of Statistical Approaches to Level Set Segmentation. Integrating Color, Texture, Motion and Shape. International Journal of Computer Vision. 72 (2), 195-215 (2007).
Lin, Z., Davis, L. S. Shape-based human detection and segmentation via hierarchical part-template matching. IEEE Trans Pattern Anal Mach Intell. 32 (4), 604-618 (2010).
Pettersen, E. F., Goddard, T. D., et al. UCSF Chimera--a visualization system for exploratory research and analysis. J Comput Chem. 25 (13), 1605-1612 (2004).
Kremer, J. R., Mastronarde, D. N., McIntosh, J. R. Computer visualization of three-dimensional image data using IMOD. J Struct Biol. 116 (1), 71-76 (1996).
Zhang, Q., Bettadapura, R., Bajaj, C. Macromolecular structure modeling from 3D EM using VolRover 2.0. Biopolymers. 97 (9), 709-731 (2012).
Giannuzzi, L. A., Stevie, F. A. A review of focused ion beam milling techniques for TEM specimen preparation. Micron. 30 (3), 197-204 (1999).
Heymann, J. A. W., Hayles, M., Gestmann, I., Giannuzzi, L. A., Lich, B., Subramaniam, S. Site-specific 3D imaging of cells and tissues with a dual beam microscope. Journal of structural biology. 155 (1), 63-73 (2006).
Knott, G., Rosset, S., Cantoni, M. Focussed ion beam milling and scanning electron microscopy of brain tissue. Journal of visualized experiments JoVE. (53), e2588 (2011).
Wirth, R. Focused Ion Beam (FIB) combined with SEM and TEM: Advanced analytical tools for studies of chemical composition, microstructure and crystal structure in geomaterials on a nanometre scale. Chemical Geology. 261 (3-4), 217-229 (2009).
Denk, W., Horstmann, H. Serial block-face scanning electron microscopy to reconstruct three-dimensional tissue nanostructure. PLoS Biol. 2 (11), e329 (2004).
Frangakis, A. S., Hegerl, R. Noise reduction in electron tomographic reconstructions using nonlinear anisotropic diffusion. Journal of structural biology. 135 (3), 239-250 (2001).
Jiang, W., Baker, M. L., Wu, Q., Bajaj, C., Chiu, W. Applications of a bilateral denoising filter in biological electron microscopy. Journal of Structural Biology. 144 (1), 114-122 (2003).
Van der Heide, P., Xu, X. P., Marsh, B. J., Hanein, D., Volkmann, N. Efficient automatic noise reduction of electron tomographic reconstructions based on iterative median filtering. Journal of structural biology. 158 (2), 196-204 (2007).
Schneider, C. A., Rasband, W. S., Eliceiri, K. W. NIH Image to ImageJ: 25 years of image analysis. Nat Methods. 9 (7), 671-675 (2012).
Schindelin, J., Arganda-Carreras, I., et al. Fiji: an open-source platform for biological-image analysis. Nat Methods. 9 (7), 676-682 (2012).
MathWorks. MATLAB. , (2012).
Otsu, N. A Threshold Selection Method from Gray-Level Histograms. Systems, Man and Cybernetics, IEEE Transactions on. 9, 62-66 (1979).
Vedaldi, A., Fulkerson, B. VLFeat: An Open and Portable Library of Computer Vision Algorithms. , (2008).
Zhu, S. C., Guo, C., Wang, Y., Xu, Z. What are Textons? International Journal of Computer Vision. 62 (1-2), 121-143 (2005).
Gagnon, L. H., Longo-Guess, C. M., et al. The chloride intracellular channel protein CLIC5 is expressed at high levels in hair cell stereocilia and is essential for normal inner ear function. The Journal of neuroscience the official journal of the Society for Neuroscience. 26 (40), 10188-10198 (2006).
Briand, P., Petersen, O. W., Van Deurs, B. A new diploid nontumorigenic human breast epithelial cell line isolated and propagated in chemically defined medium. In vitro cellular & developmental biology journal of the Tissue Culture Association. 23 (3), 181-188 (1987).
Petersen, O. W., Rønnov-Jessen, L., Howlett, A. R., Bissell, M. J. Interaction with basement membrane serves to rapidly distinguish growth and differentiation pattern of normal and malignant human breast epithelial cells. Proceedings of the National Academy of Sciences of the United States of America. 89 (19), 9064-9068 (1992).
Shin, J. B., Krey, J. F., et al. Molecular architecture of the chick vestibular hair bundle. Nature neuroscience. 16 (3), 365-374 (2013).
Yang, W., Zeng, Z., Max, N., Auer, M., Crivelli, S. Simplified Surface Models of Tubular Bacteria and Cytoskeleta. Journal of Information & Computational Science. 9 (6), 1589-1598 (2012).

Bioengineering

Fra voxel til Viden: En praktisk vejledning til opdelingen af Complex Electron Microscopy 3D-Data

Summary

Abstract

Introduction

Protocol

Representative Results

Discussion

Materials

References

Tags

Cite this Article

Summary

Abstract

Introduction

Protocol

Representative Results

Discussion

Materials

References

Tags

Cite this Article

Get cutting-edge science videos from JoVE sent straight to your inbox every month.