Waiting
Login processing...

Trial ends in Request Full Access Tell Your Colleague About Jove
Click here for the English version

Environment

Automatisk bildebehandling for å bestemme samfunnsstørrelsesstrukturen til elvevirvelløse dyr

Published: January 13, 2023 doi: 10.3791/64320

Summary

Artikkelen er basert på opprettelsen av en tilpasset protokoll for å skanne, oppdage, sortere og identifisere digitaliserte objekter som tilsvarer bentiske elvemakroinvertebrater ved hjelp av en halvautomatisk bildebehandlingsprosedyre. Denne prosedyren tillater oppkjøp av de individuelle størrelsesfordelingene og størrelsesberegningene til et makroinvertebratsamfunn på omtrent 1 time.

Abstract

Kroppsstørrelse er et viktig funksjonelt trekk som kan brukes som en bioindikator for å vurdere virkningen av forstyrrelser i naturlige samfunn. Samfunnsstørrelsesstruktur reagerer på biotiske og abiotiske gradienter, inkludert menneskeskapte forstyrrelser på tvers av taxa og økosystemer. Imidlertid er den manuelle målingen av små organismer som bentiske makroinvertebrater (f.eks. >500 μm til noen få centimeter lang) tidkrevende. For å fremskynde estimeringen av samfunnets størrelsesstruktur, utviklet vi her en protokoll for halvautomatisk å måle den individuelle kroppsstørrelsen til bevarte elvmakroinvertebrater, som er en av de mest brukte bioindikatorene for å vurdere den økologiske tilstanden til ferskvannsøkosystemer. Denne protokollen er tilpasset fra en eksisterende metodikk utviklet for å skanne marine mesozooplankton med et skannesystem designet for vannprøver. Protokollen består av tre hovedtrinn: (1) skanning av delprøver (fine og grove prøvestørrelsesfraksjoner) av elvmakroinvertebrater og behandling av de digitaliserte bildene for å individualisere hvert oppdaget objekt i hvert bilde; (2) opprette, evaluere og validere et læringssett gjennom kunstig intelligens for å halvautomatisk skille de enkelte bildene av makroinvertebrater fra detritus og gjenstander i de skannede prøvene; og (3) skildre størrelsesstrukturen til makroinvertebratsamfunnene. I tillegg til protokollen inkluderer dette arbeidet kalibreringsresultatene og oppregner flere utfordringer og anbefalinger for å tilpasse prosedyren til makroinvertebratprøver og å vurdere ytterligere forbedringer. Samlet sett støtter resultatene bruken av det presenterte skannesystemet for automatisk kroppsstørrelsesmåling av elvmakroinvertebrater og antyder at skildringen av deres størrelsesspekter er et verdifullt verktøy for rask biovurdering av ferskvannsøkosystemer.

Introduction

Bentiske makroinvertebrater brukes bredt som bioindikatorer for å bestemme den økologiske tilstanden til vannlegemer1. De fleste indekser for å beskrive makroinvertebrate samfunn fokuserer på taksonomiske beregninger. Imidlertid oppfordres nye biovurderingsverktøy som integrerer kroppsstørrelse til å gi et alternativt eller komplementært perspektiv til taksonomiske tilnærminger 2,3.

Kroppsstørrelse regnes som et metatrekk som er relatert til andre viktige egenskaper som metabolisme, vekst, respirasjonog bevegelse. Videre kan kroppsstørrelse bestemme trofisk posisjon og interaksjoner5. Forholdet mellom individuell kroppsstørrelse og normalisert biomasse (eller overflod) etter størrelsesklasse i et samfunn er definert som størrelsesspekteret6 og følger det generelle mønsteret av en lineær reduksjon i normalisert biomasse når individuell størrelse øker på en logaritmisk skala7. Hellingen av dette lineære forholdet har blitt grundig studert teoretisk, og empiriske studier på tvers av økosystemer har brukt det som en økologisk indikator på samfunnsstørrelsesstrukturen4. En annen syntetisk indikator på samfunnsstørrelsesstruktur som har blitt brukt med hell i studier av biologisk mangfold-økosystemfunksjon, er samfunnsstørrelsesdiversitet, som er representert som Shannon-indeksen for størrelsesklassene i størrelsesspekteret eller dets analoge, som beregnes ut fra de individuelle størrelsesfordelingene8.

I ferskvannsøkosystemer brukes størrelsesstrukturen til forskjellige faunagrupper som en ataksisk indikator for å vurdere responsen fra biotiske samfunn til miljøgradienter 9,10,11 og til menneskeskapte forstyrrelser 12,13,14,15,16. Makroinvertebrater er ikke et unntak, og deres størrelsesstruktur reagerer også på miljøendringer17,18 og menneskeskapte forstyrrelser, som gruvedrift 19, arealbruk 20, eller nitrogen (N) og fosfor (P) anrikning20,21,22. Å måle hundrevis av individer for å beskrive samfunnsstørrelsesstrukturen er imidlertid en kjedelig og tidkrevende oppgave som ofte unngås som en rutinemessig måling i laboratorier på grunn av mangel på tid. Dermed er det utviklet flere halvautomatiske eller automatiske bildebehandlingsmetoder for å klassifisere og måle prøver23,24,25,26. Imidlertid er de fleste av disse metodene fokusert på taksonomisk klassifisering mer enn på organismens individuelle størrelse og er ikke klare til bruk for alle slags makroinvertebrater. I marin planktonøkologi har et skanningsbildeanalysesystem blitt mye brukt til å bestemme størrelsen og taksonomisk sammensetning av dyreplanktonsamfunn 27,28,29,30,31. Dette instrumentet finnes i flere marine institutter over hele verden, og det brukes til å skanne bevarte dyreplanktonprøver for å oppnå høyoppløselige digitale bilder av hele prøven. Den nåværende protokollen tilpasser bruken av dette instrumentet for å estimere det makroinvertebrate samfunnsstørrelsesspekteret i elver på en rask automatisk måte uten å investere i å skape en ny enhet.

Protokollen består av å skanne en prøve og behandle hele bildet for automatisk å få enkeltbilder (dvs. vignetter) av objektene i prøven. Flere mål på form, størrelse og grånivåfunksjoner karakteriserer hvert objekt og tillater automatisk klassifisering av objektene i kategorier, som deretter valideres av en ekspert. Den individuelle størrelsen på hver organisme beregnes ved hjelp av ellipsoidal biovolume (mm3), som er avledet fra området av organismen målt i piksler. Dette gjør det mulig å oppnå størrelsesspekteret til prøven på en rask måte. Så vidt vi vet, har dette skanningsbildesystemet bare blitt brukt til å behandle mesozooplanktonprøver, men enheten kan potensielt tillate arbeid med ferskvannsbentiske makroinvertebrater.

Det overordnede målet med denne studien er derfor å introdusere en metode for raskt å oppnå den individuelle størrelsen på bevarte elvmakroinvertebrater ved å tilpasse en eksisterende protokoll som tidligere ble brukt med marine mesozooplankton 27,32,33. Prosedyren består av å bruke en halvautomatisk tilnærming som opererer med en skanneenhet for å skanne vannprøver og tre åpne programvare for å behandle de skannede bildene. En tilpasset protokoll for å skanne, oppdage og identifisere digitaliserte elvemakroinvertebrater for automatisk å skaffe seg samfunnets størrelsesstruktur og relaterte størrelsesberegninger presenteres her. Vurderingen av prosedyren og retningslinjene for å øke effektiviteten presenteres også basert på 42 skannede bilder av elvemakroinvertebratprøver samlet inn fra tre bassenger på den nordøstlige (NE) iberiske halvøy (Ter, Segre-Ebre og Besòs).

Prøvene ble samlet inn på 100 m elvestrekninger etter protokollen for feltprøvetaking og laboratorieanalyse av bunndyrmakroinvertebrater i fordable elver fra den spanske regjeringen34. Prøvene ble samlet inn med en surber sampler (ramme: 0,3 m x 0,3 m, mesh: 250 μm) etter en multi-habitat undersøkelse. I laboratoriet ble prøvene rengjort og siktet gjennom et 5 mm og et 500 μm nett for å oppnå to underprøver: en grov subsample (5 mm mesh) og en fin subsample (500 μm mesh), som ble lagret i separate hetteglass og konservert i 70% etanol. Separering av prøven i to størrelsesfraksjoner muliggjør en bedre estimering av samfunnsstørrelsesstrukturen, siden store organismer er sjeldnere og færre enn de små organismene. Ellers har den skannede prøven en partisk representasjon av den store størrelsesfraksjonen.

Subscription Required. Please recommend JoVE to your librarian.

Protocol

MERK: Protokollen beskrevet her er basert på systemet utviklet av Gorsky et al.27 for marine mesozooplankton. En spesifikk beskrivelse av skanneren (ZooSCAN), skanneprogramvare (VueScan 9x64 [9.5.09]), bildebehandlingsprogramvare (Zooprocess, ImageJ) og automatisk identifikasjonsprogramvare (Plankton Identifier) trinn finnes i tidligere referanser32,33. For best å justere størrelsene på de bentiske makroinvertebratene med hensyn til mesozooplanktonet, når prosjektet er opprettet etter den opprinnelige protokollen32,33, endrer du parameteren for minimumsstørrelse (minsizeesd_mm) til 0,3 mm og parameteren for maksimal størrelse (maxsizeesd_mm) til 100 mm i konfigurasjonsfilen. For å bidra til å følge protokollen oppsummeres dette i et arbeidsdiagram (figur 1). Det opprettede prosjektet lagres i datamaskinens C-mappe og er organisert i følgende mapper: PID_process, Zooscan_back, Zooscan_check, Zooscan_config, Zooscan_meta, Zooscan_results og Zooscan_scan. Hver mappe består av flere undermapper som de forskjellige programmene bruker i de følgende trinnene i protokollen.

1. Innsamling av digitale bilder for prøver fra virvelløse dyr

  1. Skanne og behandle det tomme
    MERK: Lag to tomme bilder daglig før skanning for å trekke ut bakgrunnsskanningene mens du behandler de skannede bildene samme dag.
    1. Slå på skanneren og slå på lyset i dobbel posisjon for å projisere hvitt lys fra toppen og fra bunnen.
      MERK: Ved skanning av mesozooplanktonprøver brukes den oppadgående lysretningen, men fordi makroinvertebrater er mer ugjennomsiktige, anbefales det å bytte lyset til en dobbel posisjon.
    2. Rengjør og skyll skannebrettet med vann fra springen.
    3. Hell 110 ml vann fra springen som oppbevares ved romtemperatur (RT) i skannebrettet til glasset er dekket. Plasser den store rammen (24,5 cm x 15,8 cm) på skannebrettet i riktig posisjon (med hjørnet øverst til venstre i skannebrettet), og fyll den med vann fra springen til trinnet i rammen er dekket for å unngå en meniskeffekt, noe som vil endre det skannede bildet. Lukk skannerlokket.
      MERK: Bruk vann på RT for å unngå kondens og bobledannelse. Rengjør rammen uten merker eller dråper for å unngå lysrefleksjon.
    4. Gå til bildebehandlingsprogramvaren, velg arbeidsprosjektet og klikk på Skann (Konverter) bakgrunnsbilde.
    5. Gå til skanneprogramvaren og klikk på Forhåndsvisning. Sørg for å forhåndsvise det skannede bildet, kontroller at det ikke er noen linjer eller flekker, og vent i minst 30 s før du starter en ny skanning. Klikk på Skann og trykk OK i instruksjonsvinduet før den andre skanningen for å sende dataene fra skanneprogramvaren til bildebehandlingsprogramvaren.
      MERK: Skann to ganger for å få de to bakgrunnsskanningene som vil omfatte det tomme. Dette trinnet gjøres en gang hver dag før prøvebehandlingen påbegynnes, og bildene lagres i Zooscan_back-mappen.
    6. Lukk skanneprogramvaren etter at skanningen er fullført.
  2. Prøvepreparering og skanning
    FORSIKTIG: Etanol er en brannfarlig væske og kan forårsake alvorlig øyeskade / irritasjon.
    1. Fyll ut eksempelmetadataene. Gå til bildebehandlingsprogramvaren, og velg Fyll ut eksempelmetadata. Skriv inn eksempelidentiteten, klikk på OK og fyll ut metadataene.
      MERK: Metafilen er spesielt laget for mesozooplanktonprøver, så den passer ikke til den bentiske makroinvertebratprøvetakingsmetoden, men alle felt i filen må fylles ut før skanningen, ellers vil et feilflagg dukke opp.
    2. Hell 110 ml 70% etanol i skannebrettet til glasset er dekket og plasser den store rammen (24,5 cm x 15,8 cm) med hjørnet øverst til venstre på skannebrettet.
      MERK: Arbeid med etanol i stedet for vann, da makroinvertebrater er bevart i etanol. I vann flyter de og driver i skannebrettet, noe som forhindrer et skarpt bilde og dermed pålitelige størrelsesmålinger. Etanol bør konserveres ved RT for å unngå kondens og bobledannelse.
    3. Hell makroinvertebratprøven i skannebrettet kantet av rammen, og dekk rammetrinnet med mer etanol om nødvendig.
      MERK: Avstå fra å legge til for mye etanol for å unngå at organismene flyter og driver.
    4. Homogeniser prøven gjennom hele rammeområdet, plasser de største individene i midten av brettet for riktig bildebehandling, og senk de flytende organismer ved hjelp av en trenål.
      MERK: Hvis en delprøve numerisk inneholder mer enn 1000 personer, deler du delprøven i to eller flere brøker for å minimere berøring av organismer i det skannede bildet, og skanner brøkene separat.
    5. Skill de rørende organismer og organismer som berører rammekantene ved hjelp av trenålen.
      MERK: Dette trinnet krever 5-20 min. Berøring av organismer betraktes som et enkelt objekt av programvaren; I disse tilfellene samsvarer de beregnede individuelle størrelsene derfor ikke med faktiske enkeltorganismer og kan forvrenge estimatet av samfunnsstørrelsesstrukturen. Det er mulighet for å redigere bildet med bildebehandlingsprogramvaren for å skille dem, men dette tilleggstrinnet innebærer minst 1,5 timers reprosessering; Dermed anbefales manuell separasjon på det sterkeste.
    6. For å skanne prøven, lukk skannerlokket, gå til bildebehandlingsprogramvaren, velg arbeidsprosjektet og klikk på SCAN Sample with Zooscan (For Archive, No Process).
    7. Velg eksemplet, og følg instruksjonene.
    8. Gå til skanneprogramvaren og klikk på Forhåndsvisning. Sørg for å forhåndsvise det skannede bildet, kontroller at det ikke er noen linjer eller flekker, og vent minst 30 s før du starter en ny skanning.
    9. Etter minst 30 s, klikk på Scan-knappen i skanneprogramvaren.
      MERK : Trykk OK i bildebehandlingsprogramvaren etter å ha trykket på Skann i skanneprogramvaren. Ikke trykk på noen tast på tastaturet, og unngå vibrasjoner i skanningen under skanningen. Tre filer genereres i Zooscan_scan > _raw-mappen : (i) et kodet bildefilformat (.tif) (16 bit); (ii) et standard tekstdokument kalt LOG (.txt) som registrerer informasjon om skanneparametrene; og (iii) et standard tekstdokument kalt META (.txt) med informasjon om prøvetakingsmetodene.
    10. Kontroller at råskanningen er riktig.
      MERK: Hvis skanningen har lyse striper eller andre synlige problemer, bør du vurdere å gjenta skanningen for å unngå problemer i følgende trinn.
  3. Eksempel på gjenoppretting
    1. Fjern rammen og skyll den over skannebrettet ved hjelp av en klemflaske fylt med 70% etanol for å gjenopprette eventuelle vedlagte makroinvertebrater.
    2. Løft den øvre delen av skanneren for å hente alle organismer og etanol fra brettet gjennom skanningstrakten og inn i et beger. Med den øvre delen av skanneren fortsatt løftet, skyll brettet med klemmeflasken for å feie langs eventuelle gjenværende organismer.
    3. Pass prøvene og etanolen fra begeret gjennom et 500 μm nett for å beholde hvirvelløse dyr i nettet, og oppbevar dem tilbake i et hetteglass med 70% etanol.
    4. Når alle prøvene er gjenfunnet i hetteglasset, rengjør du brettet med vann fra springen.
      MERK: Vask brettet med vann fra springen mellom prøvene for å minimere etanolutfelling, noe som endrer bildebehandlingen. Skyll rammen med vann fra springen for å unngå potensielle skader knyttet til etanolbruk. På slutten av dagen, rengjør brettet med vann fra springen og tørk det forsiktig med papir for å unngå riper.
  4. Bildebehandling
    1. Gå til bildebehandlingsprogramvaren og velg CONVERT & PROCESS Images and Organisms in Batch Mode og deretter Convert AND Process Image AND Particles (Image in RAW Folder). Behold standardinnstillingene og klikk på OK. NORMAL END vises på slutten av prosessen.
      MERK: En PID-fil og vignettene som tilsvarer alle de oppdagede objektene i det skannede bildet (i en felles fotografisk gruppefil [.jpg]) vil bli opprettet i Zooscan_scan > _work-mappen. En PID-fil er en enkelt fil som lagrer alle metadataene (metafil), de tekniske dataene som er knyttet til loggfilen, og en tabell med 36 målte variabler av alle objektene som er oppdaget i bildet. De målte variablene tilsvarer ulike estimater av grånivå, fraktal dimensjon, form og størrelse. Variablene som kan brukes til størrelsesestimering er arealet og hovedaksen og de mindre aksene til en ellipse med et likt areal til objektet (se avsnitt 3 i protokollen). Behandlingstiden avhenger av bildetettheten og datamaskinens egenskaper, og kan startes mellom prøver mens du gjenoppretter og forbereder neste prøve. Ellers anbefales det å starte behandlingen av prøvene som skannes hver dag i batchmodus om natten og se etter riktig bildebehandling neste morgen.
    2. Kontroller om bakgrunnen i det behandlede bildet er riktig trukket fra eksempelbildet ved hjelp av bildebehandlingsprogramvaren eller ved å sjekke maskebildene (avsluttet i msk1.gif) som ligger i Zooscan_scan > _work. Hvis bakgrunnen inneholder mettede områder eller mange prikker, bør du vurdere å gjenta skanningen for å sikre bilder av høy kvalitet.
      NOTAT: For å unngå mettede områder i bakgrunnen, bør skannebrettet skylles med vann fra springen etter hver skanning med etanol. Det er også viktig å (1) redusere antall skannede individer (ved å fraksjonere prøven og skanne i forskjellige folder); (2) sørg for at store organismer plasseres i midten av skannebrettet; (3) bruk ren, filtrert etanol; (4) redusere smuss på prøvene; (5) sikre at volumet av etanol for skanningen er tilstrekkelig; og (6) sørge for at forsinkelsen mellom forhåndsvisningen av prøven og skanningen er minst 30 s.
  5. Separasjon av berørende organismer
    MERK: Når det er flere vignetter med berørende organismer, er det nødvendig å skille bildene av de rørende organismene fra andre organismer og / eller fra fibre / rusk for å sikre et riktig estimat av samfunnets størrelsesstruktur.
    1. Gå til bildebehandlingsprogramvaren for å oppdage vignettene med flere objekter. Velg SEPARASJON ved hjelp av vignetter, og trykk på OK. I vinduet for konfigurasjonsvalg beholder du standardinnstillingene og klikker på OK.
    2. Behold standardinnstillingene i vinduet SEPARASJON fra VIGNETTER , velg i tillegg LEGG TIL konturer på vignetter, og velg deretter eksemplet du vil redigere.
    3. Skill de rørende organismene i hver vignett som dukker opp ved å tegne en linje med musen (trykk på rulleknappen for å tegne). Når separasjonen i en vignett er fullført, klikker du på X-knappen øverst til høyre i vinduet og trykker JA for å behandle den neste. Trykk NEI for å avslutte og lagre endringene. På slutten av prosessen vises NORMAL END hvis alt er riktig.
    4. Etter separasjon behandler du bildet på nytt for å hente de oppdaterte objektdataene. Gå til bildebehandlingsprogramvaren, klikk på PROCESS (Converted) Image (Process One), og velg Process Again Particles from Processed Images in WORK Sub-Folders. Velg eksemplet, og i vinduet Single Image Process beholder du standardinnstillingene, merker av for Arbeid med separasjonsmaske (CREATE-MODIFY-INCLUDE)og klikker deretter på OK. På slutten av prosessen vises NORMAL END hvis alt er riktig.
    5. I vinduet Separasjonskontroll trykker du på OK for å lagre bildet med konturene før behandlingen. Hvis det finnes et tidligere bilde, blir det erstattet.
    6. I vinduet Separation Control Mask velger du om nødvendig REDIGER for å legge til separasjonslinjer i masken ved hjelp av musen for å skille berørende organismer som ikke har dukket opp før i separasjonstrinnet ved hjelp av vignetter. Når du er ferdig, avslutter du prosessen, og i vinduet Separasjonsmaskekontroll velger du JA for å godta masken. På slutten av prosessen vises NORMAL END hvis alt er riktig.
      MERK: Reprosessering av en prøve med en separasjonsmaske er tidkrevende (dette kan ta mer enn 1,5 timer per prøve). Det er å foretrekke å dedikere den nødvendige tiden i trinn 1.2.5 for å unngå dette ekstra trinnet.

2. Automatisk gjenkjenning av objektene

MERK: Lag et læringssett for automatisk å forutsi identiteten til de oppdagede objektene, og dermed skille organismene fra ruskene i prøven.

  1. Oppretting av læringssett
    1. Kopier bildene og .pid-filene som er knyttet til bildene som skal brukes til å opprette kategoriene i læringssettet fra Zooscan_scan > _work til PID_process > Unsorted_vignettes_pid.
      MERK: Velg et delsett av prøver med høyt taksadiversitet og forskjellige prøvetakingssteder og / eller prøvetakingssesonger for å sikre maksimal representativitet av organismer i prøvene.
    2. I PID_process > Læresett-mappen oppretter du en undermappe med navnet på det nye læringssettet (dvs. yyyymmdd_raw_LS), og i den oppretter du undermappene som tilsvarer hver kategori i læringssettet (dvs. virvelløse dyr, rusk, andre virvelløse dyr).
      MERK: For å effektivt oppnå samfunnsstørrelsesstrukturen til elvemakroinvertebratprøver, anbefales det å bruke et læringssett basert på bare tre kategorier: makroinvertebrater, andre hvirvelløse dyr og rusk. Dette læringssettet skiller i utgangspunktet vignettene til objekter som tilsvarer organismer fra de som tilsvarer rusk (f.eks. Fibre, partikler eller filamentøse alger).
    3. Gå til bildebehandlingsprogramvaren (kun avansert modus) og velg EXTRACT Vignetter for PLANKTON IDENTIFIER (usorterte vignetter for opplæring). Behold standardalternativene og merk av for Legg til disposisjoner .
    4. Gå til programvaren for automatisk identifikasjon, klikk på Læring, velg fra PID_process > Learning_set den opprettede undermappen for det nye læringssettet (trinn 2.1.2), og trykk OK.
    5. I den venstre delen (Unsorted Thumbs) i det åpne vinduet velger du mappen Usortert vignettes_pid. Velg vignettene og dra dem med musen fra de usorterte tomlene til mappen til den tilsvarende kategorien i høyre seksjon, Sorterte tommeltotter, for å klassifisere hvert objekt i de definerte kategoriene. De flyttede vignettene vil bli merket med en rød X.
      MERK: Definer kategoriene manuelt ved å opprette undermapper i den sorterte tommelmappen, eller opprett dem ved å klikke på mappeikonet i programvaren. Ikke flytt mer enn 50 vignetter samtidig.
    6. Når alle kategoriene er fullført med de valgte objektene (ca. 300 objekter per kategori), klikker du på Opprett læringsfil og lagrer den med ønsket navn.
      MERK: Læringssettet lagres som en .pid-fil i PID_process > Learning set-mappen i prosjektet. Det anbefales å opprette og teste flere læringssett med forskjellige nivåer av kategorier (fra grove til fine former) og med en annen balanse mellom antall objekter innenfor hver kategori. Start med et grovt læringssett med et lavt antall kategorier og minst 50 objekter per kategori, og øk deretter antall objekter i hver kategori og/eller lag finere læringssett. En kategori bør være representativ for dens variabilitet i settet av prøver.
  2. Evaluering av læringssettet
    MERK: Utfør kryssvalidering med to bretter og fem forsøk ved hjelp av Random Forest-metoden med den automatiske identifikasjonsprogramvaren for å oppnå en forvirringsmatrise av den resulterende klassifiseringen av objektene.
    1. Gå til den automatiske klassifiseringsprogramvaren og klikk på Dataanalyse.
    2. I Velg læringsfil velger du den opprettede læringssettfilen fra PID_process > læringssett.
    3. I Velg en metode velger du Cross-Validation Random Forest-metoden . I Opprinnelige variabler fjerner du merket for posisjonsvariablene (X, Y, XM, YM, BX, BY og Høyde). I tilpassede variabler merker du bare av for ESD.
      MERK: Denne metoden bruker en tilfeldig del av læringssettet til å gjenkjenne den andre delen (to ganger), og dette gjentas fem ganger for å sikre at den er statistisk robust.
    4. Klikk på Start analyse, og lagre resultatene som Analysis_name.txt i PID_process > Prediction-mappen. Når analysen er fullført, avslutter du dataanalysen.
    5. Gå til PID_process > Prediction-mappen og klikk på kryssvalideringsfilen. Et vindu vil dukke opp med forvirringsmatrisen til den sanne klassifiseringen (rader) versus den automatiske klassifiseringen (kolonner).
      MERK: Tilbakekallingen er prosentandelen av organismer som tilhører en gruppe som automatisk ble godt gjenkjent, mens 1-presisjon er prosentandelen av organismer klassifisert av algoritmen som en gruppe som ikke er anerkjent (forurensning i en gruppe). Tilbakekallingen skal være over 70%, og forurensningen (1-presisjon) bør være lavere enn 20%.
    6. Gjenta trinn 2.1-2.5 hvis flere læringssett ble opprettet og tilbakekallingen og 1-presisjonen til hver enkelt må innhentes.
      MERK: Hvis flere læringssett er opprettet, velg det som har størst tilbakekalling (god anerkjennelse) og presisjon (lav forurensning) av interessegruppen (dvs. makroinvertebrater) for å teste den automatiske prediksjonen av et sett med prøver i neste trinn.
  3. Prediksjon av identifisering av makroinvertebrater
    MERK: Bruk det valgte læringssettet til å forutsi identiteten til alle objektene i et delsett av prøver ved hjelp av den automatiske identifikasjonsprogramvaren med en tilfeldig skogalgoritme.
    1. Gå til den automatiske identifikasjonsprogramvaren og klikk på Dataanalyse.
    2. I Velg læringsfil velger du læringssettfilen fra PID_process > læringssett som må brukes for prediksjonen.
    3. I Velg eksempelfil(er) velger du eksemplene (PID-filer) som skal forutsies fra den PID_results mappen.
      Behandle maksimalt 20 PID-filer samtidig for å unngå feil relatert til minneproblemer. Hvis for mange .pid-filer behandles samtidig, vil prosessen vise en riktig slutt, men kan ikke behandles godt, og det kan oppstå en feil i de neste trinnene når du behandler med bildebehandlingsprogramvaren.
    4. I Velg en metode velger du Tilfeldig skog-metoden . Merk av for Lagre detaljerte resultater for hver prøve. I Opprinnelige variabler fjerner du merket for posisjonsvariablene (X, Y, XM, YM, BX, BY og Høyde). I tilpassede variabler merker du bare av for ESD.
    5. Klikk på Start analyse, og lagre resultatene som Analysis_name.txt i PID_process > Prediction-mappen.
  4. Manuell validering
    MERK: En ekspert validerer manuelt prediksjonen fra forrige trinn for å omklassifisere feilklassifiserte objekter i riktig kategori.
    1. Kopier de Analysis_sample_dat1.txt filene som skal valideres, fra PID_process > Prediction-mappen til PID_process > Pid_results-mappen.
    2. Gå til bildebehandlingsprogramvaren og velg EXTRACT Vignettes in Folders According to PREDICTION eller VALIDATION. Velg deretter Bruk forutsagte filer fra "pid_results" -mappen. Behold standardinnstillingene, og trykk på OK.
    3. Programvaren oppretter en mappe kalt sample_yyyymmdd_hhmm_to_validate med de forutsagte objektene i mappen PID_process > Sorterte vignetter.
    4. Gå til mappen PID_process > Sorterte vignetter, og kopier mappen sample_yyyymmdd_ hhmm_to_validate. Erstatt mappenavnet _to validere med _validated.
    5. Hvis du vil validere den automatiske klassifiseringen manuelt, åpner du mappen sample_yyyymmdd_ hhmm_validated og ser gjennom alle vignettene fra hver undermappe (kategori) for å finne ut om det finnes feilklassifiserte objekter. Når ett objekt er feilklassifisert, drar du vignetten med musen til riktig mappe (kategori).
    6. Gå til bildebehandlingsprogramvaren og velg LOAD Identifikasjoner fra Sorterte vignetter. Behold standardinnstillingene, og velg yyyymmdd_hhmm_name_validated som skal behandles.
    7. Gå til PID_process > Pid_results > Dat1_validated, der det er opprettet en fil med navnet Id_from_sorted_vignettes_yyyymmdd_hhmm.txt og én .txt fil for hver av de validerte eksemplene (sample_tot_1_dat1.txt).
      Disse .txt filene inneholder en ny kolonne som presenterer prediksjonen, kalt pred_valid_Id_yyyymmdd_hhmm, som spesifiserer ekspertklassifiseringen av hvert objekt (dvs. den validerte klassifiseringen). Nye kategorier (f.eks. finere taksonomiske kategorier) kan opprettes på dette tidspunktet, under validering. Behold imidlertid navnet på den opprinnelige kategorien i det nye navnet (f.eks. macroinvertebrate_chironomidae). Dette gjør det mulig å spore den opprinnelige kategorien når du beregner tilbakekallingen og presisjonen, og for enkelt å gruppere alle makroinvertebrater for å beregne parametrene for samfunnsstørrelsesstruktur (dvs. størrelsesspekteret og størrelsesdiversitetet). Tekstfilen gir dataene knyttet til hvert objekt, inkludert de mindre og store aksene som brukes til å oppnå ellipsoidvolumet til hver organisme som et mål på individuell kroppsstørrelse. Videre inneholder de to siste kolonnene i tabellen de forutsagte og validerte kategoriene for hvert objekt (rad), som gjør det mulig å beregne, etter kategori, tilbakekallingen og presisjonen av læringssettet på delmengden av prøver.Figure 1

Figur 1: Arbeidskart som representerer seksjon 1 og seksjon 2 i protokollen. Tidene er illustrerende og kan endres avhengig av datamaskinen, overflod av vignetter å behandle, og antall kategorier av læringssettet. Denne saken tilsvarer valideringen av et læringssett med tre kategorier på et sett med 42 delprøver (totalt 47 473 vignetter). Vennligst klikk her for å se en større versjon av denne figuren.

3. Beregning av individuell størrelsesfordeling, størrelsesspektra og størrelsesberegninger

MERK: Beregningene nevnt i dette avsnittet ble utført ved hjelp av Matlab (se skript som Tilleggsfil 1).

  1. Individuell størrelsesfordeling
    1. Den siste kolonnen i Id_from_sorted_vignettes_YYYYMMDD_HHHH.txt-filen inneholder den validerte klassifiseringen av objektene. Velg bare objektene som er klassifisert som makroinvertebrater for å skildre deres individuelle størrelsesfordeling i prøven.
      MERK: Individuell kroppsstørrelse tilsvarer det ellipsoidale volumet av makroinvertebrate organismer. Systemet gir målinger i piksler.
    2. Sett sammen vektorene med størrelsesmålene fra begge skanningene, fordi hver fraksjon har en annen subsampling eksponent. Før sammenkobling, korriger for fraksjoneringen ved å replikere størrelsesvektorene så mange ganger som den tilsvarende underprøven er fraksjonert.
      MERK: Dette trinnet er nødvendig hvis en skanning tilsvarer en brøkdel av en prøve (dvs. grov eller fin).
    3. Beregn det ellipsoide volumet fra de store (M) og mindre (m) aksene til prolate ellipsoider med samme pikselområder som organismene. Før du beregner det ellipsoide volumet, konverterer du hovedaksen (M) og underordnet (m) fra piksler til millimeter (mm) med følgende konverteringsfaktor (jf):
      1 piksel = 2 400 dpi
      1 tommer = 25,4 mm
      jf = 25.4/2400
      Det ellipsoidale volumet (ellipVol med enheter i mm3) tilsvarer:
      Equation 1
    4. Skildre funksjonen for sannsynlig tetthet for den individuelle størrelsesfordelingen på logg2-skalaen .
  2. Størrelse mangfold
    1. Beregn størrelsesmangfoldet (Sd) etter Quintana et al (2008)8, som i García-Comas et al (2016)35:
      Equation 2
      der p x(x) er sannsynlighetstetthetsfunksjonen for størrelse x, og x representerer log2 (ellipVol). Dette tiltaket er derfor Shannons mangfoldsindeks tilpasset et kontinuerlig mål, for eksempel den individuelle størrelsesfordelingen i et samfunn.
  3. Normalisert biovolumstørrelsesspektrum (NBSS)
    1. Definer størrelsesklassene til NBSS, etablere den nedre grensen av spekteret som 0,01 kvantil av makroinvertebratstørrelsesfordelingen i prøvene og skape størrelsesklasser med en geometrisk skala fra base 2 til den største organismen i prøvene er omfattet.
      MERK: Størrelsesklassebredden øker med størrelsen for å ta hensyn til større variasjon forbundet med større størrelser. NBSS for makroinvertebratsamfunnene som ble analysert her, hadde 14 størrelsesklasser (tabell 1).
    2. Oppnå normalisert biovolum ved å dele det totale biovolumet i hver størrelsesklasse med størrelsesklassebredden.
  4. Størrelse spektrum skråning
    1. Beregn den lineære skråningen til NBSS.
      MERK: Hellingen (μ) beregnes ut fra forholdet mellom logg 2 (størrelsesklasse midtpunkt) og logg2 (normalisert biomasse) i størrelsesklassene større enn modusen, og ignorerer eventuelle tomme (i denne studien, størrelsesklassene fra 3 til 14).
Størrelsesklassegrenser (mm3) Midtpunkt i størrelsesklasse (mm3)
0,1236 0,1855
0,2473 0,3709
0,4946 0,7418
0,9891 1,4837
1,9783 1,4837
3,9560 5,9348
7,9131 11,8696
15,8261 23,7392
31,6522 47,4783
63,3044 94,9567
126,6089 189,9133
253,2178 379,8267
506,4300 7597,7000
1012,9000 15193,0000
2025,7000

Tabell 1: Størrelsesklasser av normalisert biomassestørrelsesspektrum (NBSS). Tabellen viser også 15 størrelsesklassegrenser og størrelsesklassens midtpunkter for organismene.

Subscription Required. Please recommend JoVE to your librarian.

Representative Results

Innsamling av digitale bilder av prøver fra virvelløse dyr
Skanne nyanser: Etanolavsetning i skannebrettet
Under testing av systemet for virvelløse dyr var flere skanninger av dårlig kvalitet. Et mørkt mettet område i bakgrunnen hindret normal bearbeiding av bildet og måling av de enkelte størrelsene på virvelløse dyr (figur 2). Flere grunner er gitt for utseendet på mettede områder i bakgrunnen eller svært pixelerte bilder: (1) tilstedeværelsen av for mange organismer på skannebrettet; (2) tilstedeværelsen av smuss i prøvene; (3) en utilstrekkelig forsinkelse mellom forhåndsvisningen av prøven og skanningen; eller (4) bruke i bildebehandlingen et bakgrunnsbilde av dårlig kvalitet på grunn av kondens, smuss eller dårlig vannkvalitet33. I makroinvertebrate samfunnsprøver forårsaker bruk av etanol i stedet for vann nedbør på brettet, noe som danner en mørk skygge hvis den ikke skylles ordentlig med vann mellom skanningene. Dette er viktig for å få skarpe bilder og for å minimere eventuell relatert korrosjon av skannebrettglasset.

Skanning nyanser: Rusk konsentrasjon
Fra analysen av en delmengde på 47 473 vignetter tilsvarte en høy prosentandel (86,1%) rusk, inkludert detritus, fibre eller kroppsdeler (som ben eller gjeller) eller skanningsartefakter (figur 3A-E). Virvelløse organismer tilsvarte de resterende 13,9% av de oppdagede gjenstandene (figur 3F-L). Til tross for den tidligere grundige separasjonen av organismer fra organisk materiale i laboratoriet, var det fortsatt mange små rusk igjen i hetteglasset.

Skanne nyanser: Berøre objekter
Den betydelige tilstedeværelsen av rusk forbedrer berøringen mellom organismer, og derfor opprettelsen av vignetter med aggregater som inkluderer flere berørende organismer og organismer festet til partikler eller fibre (figur 4A-C). Disse vignettene er en kilde til skjevhet i å bestemme formen på den individuelle størrelsesstrukturen. I et sett med fem prøver (11 subsamples), ut av alle vignetter med noen makroinvertebrater, korresponderte 10% med grupper med berøring av organismer eller organismer som berører partikler eller fibre. Disse vignettene ble redigert med bildebehandlingsprogrammet for å skille de rørende organismer og organismer med partikler festet. Reprosessering av prøvene med separasjonsmasken involverte opprettelsen av nye vignetter med de nylig separerte objektene, som ble validert for å sikre riktig klassifisering.

Automatisk gjenkjenning av objektene
Resultater av læringssett
Et læringssett er et sett med vignetter av objekter klassifisert i forskjellige kategorier av en ekspert og brukt i en veiledet læringsmodell, og dette kan også kalles et treningssett27. Det er mulig å arbeide med et eksisterende læringssett, oppdatere det eksisterende læringssettet med nye vignetter og/eller kategorier, eller opprette et nytt læringssett for et bestemt prosjekt.

For å bestemme det beste læringssettet for raskt å oppnå makroinvertebratstørrelsesstrukturen, ble flere læringssett opprettet og testet gjennom kryssvalidering med Random Forest-algoritmen. Den resulterende forvirringsmatrisen viser den sanne klassifiseringen (rader) versus den automatiske klassifiseringen (kolonner). Tilbakekallingen er prosentandelen av organismer som tilhører en kategori som automatisk ble godt klassifisert, mens 1-presisjonen er prosentandelen av organismer feilklassifisert av algoritmen som tilhørende en kategori (forurensning i en kategori)33. Som en tommelfingerregel bør tilbakekallingen være over 70%, og forurensningen (1-presisjonen) bør være lavere enn 20% for å holde en kategori i læringssettet. Læringssettet med størst tilbakekalling og presisjon for makroinvertebrater blir deretter ytterligere validert med en delmengde av prøver for å bestemme den virkelige nøyaktigheten i makroinvertebratidentifikasjon.

Tre typer ataksiske læringssett (rå, mellomliggende og fine) med kategorier basert på objektenes morfologiske egenskaper ble testet. Det rå læringssettet inkluderte tre kategorier: makroinvertebrater, andre virvelløse dyr (mikrokrepsdyr) og rusk (fibre, partikler og gjenstander som glassflekker). Det mellomliggende læringssettet inkluderte 16 kategorier: 5 for makroinvertebrater, 3 for andre virvelløse dyr og 8 for rusk. Det fine læringssettet inkluderte ytterligere 4 kategorier av virvelløse dyr, med totalt 20 kategorier (tabell 2).

I tillegg til å definere kategoriene ble også effekten av antall vignetter per kategori testet. Hvert læringssett ble testet separat ved hjelp av 50 vignetter, 100 vignetter og 300 vignetter i hver kategori (og 500 vignetter for rålæringssettet med tre kategorier). Alle kategoriene var balansert i antall bortsett fra "Ostracoda", "long-round macroinvertebrates" og "round shell macroinvertebrates", som inkluderte færre individer i 100-vignetten og 300 vignettlæringssett fordi det ikke ble oppdaget nok organismer av disse kategoriene i de skannede bildene.

Tilbakekallingen og presisjonen for virvelløse dyr (alle makroinverebratekategoriene sammen) og organismer (kategoriene makroinvertebrater og andre virvelløse dyr sammen) ble vurdert for å velge det beste læringssettet ved kryssvalidering (se tabellene i tilleggsfil 2). Det beste læringssettet var det rå læringssettet med tre kategorier (makroinvertebrater, andre virvelløse dyr og rusk), med 300 objekter i hver kategori (tabell 2). Rålæringssettet ble deretter brukt til å validere den automatiske klassifiseringen av objektene i delmengden av skannede prøver.

Læringssett Antall kategorier Bilder per kategori Tilbakekall organismer Husk makro-virvelløse dyr 1-presisjons organismer 1-presisjons virvelløse dyr
3 50 0.97 0.84 0.12 0.24
100 0.96 0.87 0.06 0.17
300 0.95 0.91 0.09 0.15
500 0.93 0.88 0.13 0.2
Middels 16 50 0.83 0.77 0.17 0.24
100 0.84 0.79 0.15 0.21
300 0.87 0.84 0.14 0.18
Bot 20 50 0.89 0.86 0.14 0.18
100 0.9 0.87 0.11 0.14
300 0.9 0.86 0.13 0.14

Tabell 2: Opprettet og testet læringssett (rå, middels og fin) med kategoriene innenfor hver enkelt og antall objekter per kategori. Tilbakekalling og 1-presisjon av de opprettede læringssettene. Kategorier av rålæringssettet: Makroinvertebrater (1), Andre virvelløse dyr (2), Rusk (3). Kategorier av middels læringssett: Lange makroinvertebrater (1), Lange glatte makroinvertebrater (2), Lange piggete makroinvertebrater (3), Runde makroinvertebrater (4), Runde skallmakroinvertebrater (5), Cladocera (6), Copepoda (7), Ostracoda (8), Aggregater (9), Fibre (10), Hoder (11), Ben (12), Flekker (13), Mørke flekker (14), Lysegrå flekker (15), Runde flekker (16). kategorier av finlæringssettet: Lange virvelløse dyr (1), Lange glatte makroinvertebrater (2), Lange glatte mørke makroinvertebrater (3), Lange runde virvelløse dyr (4), Lange piggete makroinvertebrater (5), Runde makroinvertebrater (6), Runde skallmakroinvertebrater (7), Runde mørke makroinvertebrater (8), Runde skallmakroinvertebrater (9), Cladocera (10), Copepoda (11), Ostracoda (12), Aggregater (13), Fibre (14), Hoder (15), Ben (16), Flekker (17), Mørke flekker (18), lysegrå flekker (19), runde flekker (20).

Validering av automatisk gjenkjenning med det beste læringssettet
Objektene i en delmengde av 42 fine og grove underprøver ble automatisk klassifisert av det valgte læringssettet med Random Forest-algoritmen. Etter manuell validering var tilbakekallingen for alle kategoriene høy (i gjennomsnitt 0,94 for virvelløse dyr, 0,95 for andre virvelløse dyr og 0,92 for rusk), mens forurensningen (1-presisjon) var ganske lav, bortsett fra andre virvelløse dyr (0,25 for makroinvertebrater, 0,84 for andre virvelløse dyr og 0,01 for rusk) (figur 5 ). Andre virvelløse dyr (mikrokrepsdyr) var sjeldne i prøvene (tilstede i 17 av 42 underprøver); Dermed var sammenligningen ikke robust. Videre ble denne kategorien sterkt påvirket av forurensningen på grunn av likheten i form og grånivå til andre gjenstander.

Sammenligningen av automatisk versus validert forekomst av virvelløse dyr viste at disse var sterkt korrelert (Pearsons r = 0,92, p-verdi < 0,0001, n = 24 for grove subsamples; Pearsons r = 0,98, p-verdi < 0,0001, n = 18 for fine delprøver), med en liten overestimering av den automatiske ytelsen på grunn av forurensning fra rusk (skråninger < 1) (figur 6). Når det gjelder sammenligning av gjennomsnittlig ellipsoidalt volum, var korrelasjonen også høy (Pearsons r = 0,96, p-verdi < 0,0001, n = 24 for grove prøver; Pearsons r = 0,99, p-verdi < 0,0001, n = 18 for fine prøver), og størrelsesspektrumhellingen var nær −1 (figur 6). Forskjellen i skråningene mellom de fine og grove fraksjonene gjenspeiler den større effekten av feilklassifisering i de store størrelsesfraksjonene, noe som er relatert til deres lave organismetall.

Sannsynlighetstetthetsfunksjonene til de individuelle størrelsesfordelingene til den automatiske prediksjonen stemte godt overens med de validerte prediksjonene for de fine delprøvene, så vel som for de grove underutvalgene. Det var imidlertid noen unntak for de grove subsamplene knyttet til antall organismer og dermed større effekt av feilklassifisering i disse tilfellene, som fremhevet tidligere (figur 7).

Effekt av berøring av organismer på individuelle størrelsesfordelinger, størrelsesspektra og størrelsesmålinger
En sammenligning av størrelsesfordelingene oppnådd før og etter separasjonen av de rørende organismer og før valideringen i en delmengde av fem utvalgte prøver ble utført for å vurdere effekten av berøring av gjenstander. For å sammenligne størrelsesfordelingene ble de grove og fine delprøvene kombinert, i henhold til deres fraksjonering, for å rekonstruere en prøve som representerer makroinvertebratsamfunnet. I tre utvalg økte mengden etter validering (>500 individer) (figur 8A). Til tross for denne økningen passet det gjennomsnittlige ellipsoidale volumet svært godt til det som ble beregnet i de validerte utvalgene (figur 8B).

Størrelsesfordelingen av de korrigerte prøvene (etter separasjon av berørende organismer) var litt forskjellig fra de validerte. Dermed hadde tilstedeværelsen av flere objekter en liten innflytelse på størrelsesfordelingene i disse prøvene (figur 9A-E). Følgelig korrelerte størrelsesmangfoldet beregnet ut fra de korrigerte utvalgene sterkt med størrelsesmangfoldet til de validerte (Pearsons r = 0,94, p-verdi = 0,017, n = 5) (figur 9F).

Teoretisk sett har det normaliserte biovolumstørrelsesspekteret (NBSS) til et samfunn med flere trofiske nivåer en størrelsesspektrumhelling i log2-skalaen som nærmer seg -1 under steady state-forhold4. NBSS i naturlige samfunn har ofte en støt i stedet for en lineær fordeling, og dette tilskrives for det meste utvalgsskjevheten i de minste størrelsesklassene36. I denne studien var den tredje størrelsesklassen den vanligste i NBSS.

NBSS-ene var ganske like mellom trinnene i protokollen (figur 10A-C), bortsett fra noen få størrelsesklasser i et par spektra (figur 10D-E). Følgelig korrelerte størrelsesspektrumhellingen beregnet ut fra de korrigerte prøvene sterkt med skråningen basert på de validerte (Pearsons r = 0,99, p-verdi ≤ 0,0001, n = 5) (figur 10F).

Figure 2
Figur 2: Eksempler på skannede bilder med ulike kvaliteter før og etter bearbeiding. (A,B) Råbilde (venstre) og behandlet bilde (høyre) av en fin delsample med god skannekvalitet; (C,D) Råbilde (venstre) og behandlet bilde (høyre) av en fin subsample med dårlig skannekvalitet (mørk bakgrunn og kuttet bilde på venstre kant); (E, F) råbilde (venstre) og behandlet bilde (høyre) av en fin subsample med dårlig skannekvalitet (veldig pikselert mørk bakgrunn). Vennligst klikk her for å se en større versjon av denne figuren.

Figure 3
Figur 3: Konturvignetter som representerer forskjellige objekter som er tilstede i prøvene. (A-E) Rusk (fiber, rund flekk, makroinvertebrat ben, flekker og organisk rusk); (F-I) virvelløse dyr (Coleoptera, Diptera, Plecoptera og Trichoptera) og (J-L) andre virvelløse dyr (Cladocera, Copepoda og Ostracoda). Skalastenger indikerer 1 mm gma = 1,1. Vennligst klikk her for å se en større versjon av denne figuren.

Figure 4
Figur 4: Eksempler på vignetter som inneholder flere objekter. (A) Et makroinvertebrat (Hydracarina) festet til en fiber; (B) flere organismer (Caenidae) aggregert av en fiber; og (C) to rørende makroinvertebrater (Chironomidae og Caenidae). Skalastenger indikerer 1 mm gma = 1,1. Vennligst klikk her for å se en større versjon av denne figuren.

Figure 5
Figur 5: Boxplots av tilbakekalling og forurensning (1-presisjon). Boxplots for de tre kategoriene makroinvertebrater, andre virvelløse dyr og rusk (300 vignetter per kategori) av det valgte læringssettet validert på en delmengde av prøver (n = 42). Vennligst klikk her for å se en større versjon av denne figuren.

Figure 6
Figur 6: Sammenligning mellom forekomst og gjennomsnittlig ellipsoidalt volum estimater i automatisk versus validert klassifisering. (A) Mengdeestimater i underutvalgene (n = 42) og (B) gjennomsnittlige ellipsoidale volumestimater i delutvalgene (n = 42). De mørke prikkene tilsvarer de grove delprøvene (>0,5 cm mesh); de grå prikkene tilsvarer de fine underprøvene (>500 μm nett). Den stiplede linjen representerer 1:1-relasjonen. Vennligst klikk her for å se en større versjon av denne figuren.

Figure 7
Figur 7: Sannsynlighetstetthetsfunksjoner som representerer det relative bidraget (y-aksen) til den enkelte størrelse i loggskalaen (x-aksen) for sammenligning mellom automatiske estimater og mellom validerte estimater. (A,B) Automatiske og validerte estimater for grove delutvalg (n = 18), (C,D) Automatiske og validerte estimater for fine delutvalg (n = 24). (A,C) Sammenligning mellom automatiske estimater og (B,D) sammenligning mellom validerte estimater. Farger representerer hver delprøve for å skille spektrene. Vennligst klikk her for å se en større versjon av denne figuren.

Figure 8
Figur 8: Sammenligning mellom overflod og gjennomsnittlig ellipsoidalt volum estimater i validerte subsamples versus subsamples validert etter separasjon av rørende objekter fra utvalgte naturlige prøver (fine og grove subsamples sammen ). (A) Mengdeestimater etter prøvetakingsramme (n = 5) og (B) gjennomsnittlige ellipsoidale volumestimater (n = 5). Den stiplede linjen representerer 1:1-relasjonen. Vennligst klikk her for å se en større versjon av denne figuren.

Figure 9
Figur 9: Funksjoner for sannsynlighetstetthet som representerer det relative bidraget (y-aksen) til den individuelle størrelsen i log2-skalaen (x-aksen) for den automatiske prediksjonen, validert prediksjon og validert prediksjon med deres respektive størrelsesdiversitetsverdier (Sd). (A-E) Sannsynlighetstetthetsfunksjoner for utvalgte naturlige prøver (fine og grove delprøver sammen) (n = 5); Den røde linjen tilsvarer den automatiske prediksjonen, den blå linjen tilsvarer den validerte prediksjonen, og den grønne linjen tilsvarer de korrigerte prøvene (validert etter separasjonen av berøringsobjekter). (F) Sammenligning av validerte versus korrigerte størrelsesdiversitetsestimater; Den stiplede linjen tilsvarer 1:1-relasjonen. Vennligst klikk her for å se en større versjon av denne figuren.

Figure 10
Figur 10: Normaliserte biovolumstørrelsesspektra (NBSS) og sammenligning av NBSS-skråninger (μ) mellom behandlinger. (A-E) NBSS som representerer forholdet mellom midtpunktverdien for hver størrelsesklasse i log-skalaen (x-aksen) versus det normaliserte biovolumet per skanningsramme (y-aksen) av de fem valgte prøvene for de automatiske (røde kryssene), validerte (blå trekanter) og korrigerte (grønne sirkler) spådommer med deres respektive størrelsesspekter Skråninger (μ) beregnet i størrelsesklassene fra modalstørrelsesklassen og oppover (den tredje størrelsesklassen er angitt med den vertikale stiplede linjen). (F) Sammenligning av skråningene beregnet på de validerte prøvene mot de korrigerte (etter separasjon av berøringsobjekter). Den stiplede linjen tilsvarer 1:1-relasjonen, r2. Vennligst klikk her for å se en større versjon av denne figuren.

Tilleggsfil 1: Matlab-skript for å utføre beregningene. Klikk her for å laste ned denne filen.

Tilleggsfil 2: Kryssvalidering, tilbakekalling og 1-presisjon for de opprettede læringssettene. (A) Rå læringssett med 3 kategorier og 50 vignetter per kategori; (B) rå læringssett med 3 kategorier og 100 vignetter per kategori; (C) rå læringssett med 3 kategorier og 300 vignetter per kategori; (D) rå læringssett med 3 kategorier og 500 vignetter per kategori; (E) rå læringssett med 5 kategorier og 50 vignetter per kategori; (F) rå læringssett med 5 kategorier og 100 vignetter per kategori; (G) rå læringssett med 5 kategorier og 300 vignetter per kategori; (H) mellomlæringssett med 16 kategorier og 50 vignetter per kategori; (I) mellomlæringssett med 16 kategorier og 100 vignetter per kategori; (J) mellomlæringssett med 16 kategorier og 300 vignetter per kategori; (K) fint læringssett med 20 kategorier og 50 vignetter per kategori; (L) fint læringssett med 20 kategorier og 100 vignetter per kategori; og (M) fint læringssett med 20 kategorier og 300 vignetter per kategori. Klikk her for å laste ned denne filen.

Subscription Required. Please recommend JoVE to your librarian.

Discussion

Tilpasningen av metodikken beskrevet av Gorsky et al. 2010 for elvemakroinvertebrater muliggjør høy klassifiseringsnøyaktighet ved estimering av samfunnsstørrelsesstrukturen hos ferskvannsmakroinvertebrater. Resultatene antyder at protokollen kan redusere tiden for estimering av den individuelle størrelsesstrukturen i et utvalg til ca. 1 time. Den foreslåtte protokollen er således ment å fremme rutinemessig bruk av makroinvertebrate størrelsesspektra som en rask og integrerende bioindikator for å vurdere virkningen av forstyrrelser i ferskvannsøkosystemer. Det makroinvertebrate størrelsesspekteret har allerede blitt brukt som en vellykket indeks for å evaluere den økologiske tilstanden til kystlaguner22. Med utviklingen av protokollen kan intensive undersøkelser på virvelløse dyr utføres for å muliggjøre feltovervåkingskampanjer som dekker store romlige og tidsmessige skalaer.

Siden målet med denne protokollen er å oppnå den individuelle størrelsesfordelingen av det samplede samfunnet på en rask måte, uten hensyn til taksonomi, anbefales det å lage et enkelt læringssett som det som er foreslått her. Tester av finere læringssett, med et høyere antall kategorier, gir lavere tilbakekalling og presisjon for virvelløse dyr som helhet (tabell 2), og valideringstrinnet er mer tidkrevende.

Den automatiske prediksjonen stemte godt overens med den validerte prediksjonen av 42 naturlige delprøver fra forskjellige prøvetakingssteder, noe som tyder på at metoden i automatisk modus er egnet for telling og måling av makroinvertebrater i naturlige prøver (figur 6). Videre antyder likheten i NBSS-ene mellom de automatiske og validerte prediksjonene og den høye tilpasningen til den lineære teoretiske modellen at den automatiske modusen er en lovende metode for å forfølge teoretiske økologiske studier (figur 10).

Under tilpasningen av denne protokollen ble det oppdaget flere problemer, og de ble løst eller minimert på forskjellige måter. Et problem å ta hensyn til når du skanner makroinvertebratprøver, er utseendet på mørke mettede områder. Dermed er det viktig å sjekke de behandlede, skannede bildene så snart som mulig for å oppdage dette problemet og gjenta skanningen om nødvendig. Dette problemet har også blitt funnet ved skanning av plankton33, men det økes ved bruk av etanol i stedet for vann fra springen. Det anbefales ikke å bruke vann fra springen, da organismer bevart i 70% etanol vil drive på overflaten. Selv om enheten er designet for å motstå fortynnet etanol (5%), er de hvirvelløse prøvene bevart med 70% etanol. Drift med lavere konsentrasjoner av etanol anbefales heller ikke, da organismene kan bli skadet gjennom rehydrerings- og dehydreringsprosesser37. Den foreslåtte løsningen, som anbefales på det sterkeste, er å skylle skannebrettet med ferskvann flere ganger etter hver skanning utført med etanol. Dette unngår akkumulering av bunnfall som kan endre bildebakgrunnen og beskytter glasset på skannebrettet mot korrosjon.

Et annet oppdaget problem er tilstedeværelsen av vignetter med flere organismer, noe som kan endre størrelsesspekteret på grunn av underestimering av individer av visse størrelser. Når antallet vignetter med flere objekter er lavt (<10 %), som i denne studien, har tilstedeværelsen av flere objekter liten innflytelse på størrelsesfordelingene og NBSS-ene i disse utvalgene (figur 9 og figur 10). Dette indikerer at for å oppnå en representativ størrelsesstruktur for makroinvertebratsamfunnet, er det ikke nødvendig å investere tid i trinn 1.5 i protokollen (separasjonen av berørende organismer), for hvilken bildebehandlingen varer ca. 1,5 timer. I stedet anbefales det sterkt å ta tid i trinn 2.5 av protokollen (separere berøring av organismer eller aggregater ved hjelp av en trenål), som er mye mindre tidkrevende (maksimalt 30 min) og sikrer et riktig estimat av størrelsesfordelingene i automatisk modus30. Et alternativ for å redusere antall berørende organismer er å arbeide med færre organismer per skanning, men tidsforpliktelsen investert i skanning av en prøve i et høyt antall fraksjoner og muligheten for aggregering av organismer bør tas i betraktning. En annen løsning ville være å bevare bare en subsample som ville tillate beregning av et representativt størrelsesspekter ved sortering av organismer i laboratoriet i stedet for å bevare alle samplede organismer, som gjort i dette arbeidet. Reduksjonen i antall organismer per prøve vil redusere sannsynligheten for å berøre organismer. Videre, når færre individer lagres, inneholder prøven mindre rusk, noe som letter separasjonen, spesielt hvis fibre kan unngås.

Den observerte begrensningen av den automatiske klassifiseringsmetoden er relatert til den lave tilstedeværelsen av mikrokrepsdyr (kategori: andre makroinvertebrater) i de brukte prøvene. Mangelen på representasjon av mikrocrustaceans kan påvirke deres korrekte klassifisering og begrense presisjonen til den automatiske prediksjonen for denne kategorien. Likevel presenterer de andre kategoriene, rusk og makroinvertebrater, som er hovedmålet med dette arbeidet, høy tilbakekalling og presisjon. Alternativer til å bruke denne skannerenheten ville være å tilpasse en vanlig skanner for å holde vannrammer, fremme åpen kildekode for prøvebehandling og maskinlæring som den som er gitt her, og skrive koder for måling av organismer under mikroskopet med et kamera eller gjennom fluks med et sett med kameraer. Dette har blitt gjort ved flere anledninger 23,24,25,26,38,39,40, men metoden som vi foreslår regulerer skanningsparameteriseringen for å oppnå sammenlignbare størrelsesestimater, noe som er vanskelig å kontrollere for med de andre systemene. Videre er den foreslåtte protokollen og skanneenheten klar til bruk, åpen kildekode og allerede etablert i det marine mesozooplanktonsamfunnet. Samlet sett demonstrerer tilpasningen av denne protokollen en lovende vei for bruk av denne automatiske bildebehandlingsmetoden for å oppnå størrelsesstrukturen til ferskvannsmakroinvertebrater effektivt og for å teste potensialet for størrelsesmålinger for ferskvannsbiovurdering.

Subscription Required. Please recommend JoVE to your librarian.

Disclosures

Forfatterne erklærer ingen potensielle konkurrerende interesser.

Acknowledgments

Dette arbeidet ble støttet av det spanske departementet for vitenskap, innovasjon og universiteter (tilskuddsnummer RTI2018-095363-B-I00). Vi takker CERM-UVic-UCC-medlemmene Èlia Bretxa, Anna Costarrosa, Laia Jiménez, María Isabel González, Marta Jutglar, Francesc Llach og Núria Sellarès for deres arbeid innen prøvetaking og laboratoriesortering av virvelløse dyr og David Albesa for samarbeidet i prøveskanningen. Til slutt takker vi Josep Maria Gili og Institut de Ciències del Mar (ICM-CSIC) for bruken av laboratoriefasilitetene og skannerenheten.

Materials

Name Company Catalog Number Comments
Beaker Labbox Other containers could be used
Dionized water Icopresa  8420239600123 To dilute the ethanol
Funnel Vitlab 41094
Glass vials 8 ml Labbox SVSN-C10-195 1 vial/subsample
ImageJ Software  Free access Version 4.41o/ Image processing software
Large frame Hydroptic  Provided by ZooScan 24.5 cm x 15.8 cm
Monalcol 96 (Ethanol 96) Montplet 1050JE001
Plankton Identifier Software Free access Version 1.2.6/ Automatic identification software
Sieve Cisa 26852.2 Nominal aperture 500µ and nominal aperture 0,5 cm
Tweezers Bondline B5SA Stainless, anti-magnetic, anti-acid
VueScan 9 x 64 (9.5.09) Software Hydroptic Version 9.0.51/ Sacn software
Wooden needle Any plastic or wood needle can be used
Zooprocess Software  Free access Version 7.14/Image processing software
ZooScan  Hydroptic 54 Version III/ Scanner

DOWNLOAD MATERIALS LIST

References

  1. Birk, S., et al. Three hundred ways to assess Europe's surface waters: An almost complete overview of biological methods to implement the Water Framework Directive. Ecological Indicators. 18, 31-41 (2012).
  2. Basset, A., Sangiorgio, F., Pinna, M. Monitoring with benthic macroinvertebrates: advantages and disadvantages of body size descriptors. Aquatic Conservation: Marine and Freshwater Ecosystems. 14, S43-S58 (2004).
  3. Reyjol, Y., et al. Assessing the ecological status in the context of the European Water Framework Directive: Where do we go now. Science of the Total Environment. 497-498, 332-344 (2014).
  4. Brown, J. H., Gillooly, J. F., Allen, A. P., Savage, V. M., West, G. B. Toward a metabolic theory of ecology. Ecology. 85 (7), 1771-1789 (2004).
  5. Woodward, G., et al. Body size in ecological networks. Trends in Ecology & Evolution. 20 (7), 402-409 (2005).
  6. Sprules, W. G., Barth, L. E. Surfing the biomass size spectrum: Some remarks on history, theory, and application. Canadian Journal of Fisheries and Aquatic Sciences. 73 (4), 477-495 (2016).
  7. White, E. P., Ernest, S. K. M., Kerkhoff, A. J., Enquist, B. J. Relationships between body size and abundance in ecology. Trends in Ecology & Evolution. 22 (6), 323-330 (2007).
  8. Quintana, X. D., et al. A nonparametric method for the measurement of size diversity with emphasis on data standardization. Limnology and Oceanography - Methods. 6 (1), 75-86 (2008).
  9. Blanchard, J. L., Heneghan, R. F., Everett, J. D., Trebilco, R., Richardson, A. J. From bacteria to whales: Using functional size spectra to model marine ecosystems. Trends in Ecology & Evolution. 32 (3), 174-186 (2017).
  10. Petchey, O. L., Belgrano, A. Body-size distributions and size-spectra: Universal indicators of ecological status. Biology Letters. 6 (4), 434-437 (2010).
  11. Emmrich, M., et al. Geographical patterns in the body-size structure of European lake fish assemblages along abiotic and biotic gradients. Journal of Biogeography. 41 (12), 2221-2233 (2014).
  12. Arranz, I., Brucet, S., Bartrons, M., García-Comas, C., Benejam, L. Fish size spectra are affected by nutrient concentration and relative abundance of non-native species across streams on the NE Iberian Peninsula. Science of the Total Environment. 795, 148792 (2021).
  13. Vila-Martínez, N., Caiola, N., Ibáñez, C., Benejam, L. l, Brucet, S. Normalized abundance spectra of the fish community reflect hydropeaking on a Mediterranean large river. Ecological Indicators. 97, 280-289 (2019).
  14. Benejam, L. l, Tobes, I., Brucet, S., Miranda, R. Size spectra and other size-related variables of river fish communities: systematic changes along the altitudinal gradient on pristine Andean streams. Ecological Indicators. 90, 366-378 (2018).
  15. Sutton, I. A., Jones, N. E. Measures of fish community size structure as indicators for stream monitoring programs. Canadian Journal of Fisheries and Aquatic Sciences. 77 (5), 824-835 (2019).
  16. Murry, B. A., Farrell, J. M. Resistance of the size structure of the fish community to ecological perturbations in a large river ecosystem. Freshwater Biology. 59, 155-167 (2014).
  17. Townsend, C. R., Thompson, R. M. Body size in streams: Macroinvertebrate community size composition along natural and human-induced environmental gradients. In Body Size: The Structure and Function of Aquatic Ecosystems. Hildrew, A. G., Raffaelli, D. G., Edmonds-Brown, R. , Cambridge University Press. Cambridge, UK. (2007).
  18. Gjoni, V., et al. Patterns of functional diversity of macroinvertebrates across three aquatic ecosystem types, NE Mediterranean. Mediterranean Marine Science. 20 (4), 703-717 (2019).
  19. Pomeranz, J. P. F., Warburton, H. J., Harding, J. S. Anthropogenic mining alters macroinvertebrate size spectra in streams. Freshwater Biology. 64 (1), 81-92 (2019).
  20. García-Girón, J., et al. Anthropogenic land-use impacts on the size structure of macroinvertebrate assemblages are jointly modulated by local conditions and spatial processes. Environmental Research. 204, 112055 (2022).
  21. Demi, L. M., Benstead, J. P., Rosemond, A. D., Maerz, J. C. Experimental N and P additions alter stream macroinvertebrate community composition via taxon-level responses to shifts in detrital resource stoichiometry. Functional Ecology. 33 (5), 855-867 (2019).
  22. Basset, A., et al. A benthic macroinvertebrate size spectra index for implementing the Water Framework Directive in coastal lagoons in Mediterranean and Black Sea ecoregions. Ecological Indicators. 12 (1), 72-83 (2012).
  23. Ärje, J., et al. Automatic image-based identification and biomass estimation of invertebrates. Methods in Ecology and Evolution. 11 (8), 922-931 (2020).
  24. Raitoharju, J., et al. Benchmark database for fine-grained image classification of benthic macroinvertebrates. Image and Vision Computing. 78, 73-83 (2018).
  25. Lytle, D. A., et al. Automated processing and identification of benthic invertebrate samples. Journal of the North American Benthological Society. 29 (3), 867-874 (2010).
  26. Serna, J. P., Fernández, D. S., Vélez, F. J., Aguirre, N. J. An image processing method for recognition of four aquatic macroinvertebrates genera in freshwater environments in the Andean region of Colombia. Environmental Monitoring and Assessment. 192, 617 (2020).
  27. Gorsky, G., et al. Digital zooplankton image analysis using the ZooScan integrated system. Journal of Plankton Research. 32 (3), 285-303 (2010).
  28. Marcolin, C. R., Schultes, S., Jackson, G. A., Lopes, R. M. Plankton and seston size spectra estimated by the LOPC and ZooScan in the Abrolhos Bank ecosystem (SE Atlantic). Continental Shelf Research. 70, 74-87 (2013).
  29. Silva, N., Marcolin, C. R., Schwamborn, R. Using image analysis to assess the contributions of plankton and particles to tropical coastal ecosystems. Estuarine, Coast and Shelf Science. 219, 252-261 (2019).
  30. Vandromme, P., et al. Assessing biases in computing size spectra of automatically classified zooplankton from imaging systems: A case study with the ZooScan integrated system. Methods in Oceanography. 1-2, 3-21 (2012).
  31. Naito, A., et al. Surface zooplankton size and taxonomic composition in Bowdoin Fjord, north-western Greenland: A comparison of ZooScan, OPC and microscopic analyses. Polar Science. 19, 120-129 (2019).
  32. García-Comas, C., Picheral, E. Zooprocess/Plankton Identifier protocol for computer assisted zooplankton sorting. , Available from: https://manualzz.com/doc/43116355/zooprocess—plankton-identifier-protocol-for (2013).
  33. Picheral, E. ZooSCAN: Manual to scan and process samples. Quantitative Imaging Platform of Villefranche sur Mer (PlQv). , Available from: http://www.hydroptic.com/assets/uploads/files/documentations/ae4e0-zooscan_user_manual.pdf (2020).
  34. Protocolo de muestreo y laboratorio de fauna bentónica de invertebrados en ríos vadeables. CÓDIGO: ML-Rv-I-2013. Ministerio de Agricultura, Alimentación y Medio Ambiente. , Available from: https://www.miteco.gob.es/es/agua/temas/estado-y-calidad-de-las-aguas/ML-Rv-I-2013_Muestreo%20y%20laboratorio_Fauna%20bent%C3%B3nica%20de%20de%20invertebrado_%20R%C3%Ados%20vadeables_24_05_2013_tcm30-175284.pdf (2013).
  35. García-Comas, C., et al. Prey size diversity hinders biomass trophic transfer and predator size diversity promotes it in planktonic communities. Proceedings of the Royal Society Biological Sciences. 283 (1824), 20152129 (2016).
  36. García-Comas, C., et al. Mesozooplankton size structure in response to environmental conditions in the East China Sea: How much does size spectra theory fit empirical data of a dynamic coastal area. Progress in Oceanography. 121, 141-157 (2014).
  37. Marquina, D., Buczek, M., Ronquist, F., Lukasik, P. The effect of ethanol concentration on the morphological and molecular preservation of insects for biodiversity studies. PeerJ. 9, 10799 (2021).
  38. Bell, J. L., Hopcroft, R. R. Assessment of ZooImage as a tool for the classification of zooplankton. Journal of Plankton Research. 30 (12), 1351-1367 (2008).
  39. Colas, F., et al. The ZooCAM, a new in-flow imaging system for fast onboard counting, sizing and classification of fish eggs and metazooplankton. Progress in Oceanography. 166, 54-65 (2018).
  40. Bachiller, E., Fernandes, J. A., Irigoien, X. Improving semiautomated zooplankton classification using an internal control and different imaging devices. Limnology and Oceanography Methods. 10 (1), 1-9 (2012).

Tags

Miljøvitenskap utgave 191
Automatisk bildebehandling for å bestemme samfunnsstørrelsesstrukturen til elvevirvelløse dyr
Play Video
PDF DOI DOWNLOAD MATERIALS LIST

Cite this Article

Gurí, R., Arranz, I., Ordeix,More

Gurí, R., Arranz, I., Ordeix, M., García-Comas, C. Automatic Image Processing to Determine the Community Size Structure of Riverine Macroinvertebrates. J. Vis. Exp. (191), e64320, doi:10.3791/64320 (2023).

Less
Copy Citation Download Citation Reprints and Permissions
View Video

Get cutting-edge science videos from JoVE sent straight to your inbox every month.

Waiting X
Simple Hit Counter