Waiting
Login processing...

Trial ends in Request Full Access Tell Your Colleague About Jove
Click here for the English version

Environment

Automatisk billedbehandling til bestemmelse af strukturen i Fællesskabets størrelse af makroinvertebrater i floder

Published: January 13, 2023 doi: 10.3791/64320

Summary

Artiklen er baseret på oprettelsen af en tilpasset protokol til at scanne, opdage, sortere og identificere digitaliserede objekter svarende til bentiske flodmakroinvertebrater ved hjælp af en halvautomatisk billeddannelsesprocedure. Denne procedure tillader erhvervelse af de individuelle størrelsesfordelinger og størrelsesmålinger for et makroinvertebratsamfund på ca. 1 time.

Abstract

Kropsstørrelse er et vigtigt funktionelt træk, der kan bruges som bioindikator til at vurdere virkningerne af forstyrrelser i naturlige samfund. Fællesskabets størrelsesstruktur reagerer på biotiske og abiotiske gradienter, herunder menneskeskabte forstyrrelser på tværs af taxa og økosystemer. Imidlertid er manuel måling af små kropsorganismer såsom bentiske makroinvertebrater (f.eks. >500 μm til et par centimeter lang) tidskrævende. For at fremskynde estimeringen af samfundets størrelsesstruktur udviklede vi her en protokol til halvautomatisk måling af den individuelle kropsstørrelse af bevarede flodmakroinvertebrater, som er en af de mest almindeligt anvendte bioindikatorer til vurdering af ferskvandsøkosystemers økologiske tilstand. Denne protokol er tilpasset fra en eksisterende metode udviklet til at scanne marine mesozooplankton med et scanningssystem designet til vandprøver. Protokollen består af tre hovedtrin: (1) scanning af delprøver (fine og grove prøvestørrelsesfraktioner) af flodmakroinvertebrater og behandling af de digitaliserede billeder for at individualisere hvert detekteret objekt i hvert billede; 2) oprettelse, evaluering og validering af et læringssæt ved hjælp af kunstig intelligens for halvautomatisk at adskille de individuelle billeder af makroinvertebrater fra detritus og artefakter i de scannede prøver og (3) skildrer størrelsesstrukturen af makroinvertebratsamfundene. Ud over protokollen omfatter dette arbejde kalibreringsresultaterne og opregner flere udfordringer og anbefalinger til at tilpasse proceduren til prøver fra makroinvertebrater og overveje yderligere forbedringer. Samlet set understøtter resultaterne brugen af det præsenterede scanningssystem til automatisk måling af kropsstørrelse af flodmakroinvertebrater og tyder på, at afbildningen af deres størrelsesspektrum er et værdifuldt værktøj til hurtig biovurdering af ferskvandsøkosystemer.

Introduction

Bentiske makroinvertebrater anvendes bredt som bioindikatorer til bestemmelse af vandlegemers økologiske tilstand1. De fleste indekser til beskrivelse af makroinvertebratsamfund fokuserer på taksonomiske målinger. Nye biovurderingsværktøjer, der integrerer kropsstørrelse, opfordres imidlertid til at give et alternativt eller komplementært perspektiv til taksonomiske tilgange 2,3.

Kropsstørrelse betragtes som et metatræk, der er relateret til andre vitale træk såsom stofskifte, vækst, åndedræt og bevægelse4. Desuden kan kropsstørrelse bestemme trofisk position og interaktioner5. Forholdet mellem individuel kropsstørrelse og den normaliserede biomasse (eller overflod) efter størrelsesklasse i et samfund defineres som størrelsesspektret6 og følger det generelle mønster for et lineært fald i normaliseret biomasse, når individuel størrelse stiger på en logaritmisk skala7. Hældningen af dette lineære forhold er blevet grundigt undersøgt teoretisk, og empiriske undersøgelser på tværs af økosystemer har brugt det som en økologisk indikator for samfundets størrelsesstruktur4. En anden syntetisk indikator for samfundets størrelsesstruktur, der med succes er blevet anvendt i biodiversitetsøkosystemets funktionsundersøgelser, er samfundsstørrelsesdiversitet, som er repræsenteret som Shannon-indekset for størrelsesklasserne i størrelsesspektret eller dets analoge, som beregnes ud fra de individuelle størrelsesfordelinger8.

I ferskvandsøkosystemer anvendes størrelsesstrukturen af forskellige faunagrupper som en ataxisk indikator til at vurdere biotiske samfunds respons miljøgradienter 9,10,11 og på menneskeskabte forstyrrelser 12,13,14,15,16. Makroinvertebrater er ikke en undtagelse, og deres størrelsesstruktur reagerer også på miljøændringer17,18 og menneskeskabte forstyrrelser, såsom minedrift 19, arealanvendelse 20 eller kvælstof (N) og fosfor (P) berigelse20,21,22. Imidlertid er måling af hundredvis af individer for at beskrive samfundets størrelsesstruktur en kedelig og tidskrævende opgave, der ofte undgås som en rutinemæssig måling i laboratorier på grund af mangel på tid. Således er der udviklet flere halvautomatiske eller automatiske billeddannelsesmetoder til klassificering og måling af prøver23,24,25,26. Imidlertid er de fleste af disse metoder fokuseret på taksonomisk klassificering mere end på organismernes individuelle størrelse og er ikke klar til brug for alle slags makroinvertebrater. I marin planktonøkologi er et scanningsbilledanalysesystem blevet brugt i vid udstrækning til at bestemme størrelsen og den taksonomiske sammensætning af zooplanktonsamfund 27,28,29,30,31. Dette instrument findes i flere marine institutter verden over, og det bruges til at scanne bevarede dyreplanktonprøver for at opnå digitale billeder i høj opløsning af hele prøven. Denne protokol tilpasser brugen af dette instrument til at estimere makroinvertebraternes samfundsstørrelsesspektrum i floder på en hurtig automatisk måde uden at investere i at skabe en ny enhed.

Protokollen består i at scanne en prøve og behandle hele billedet for automatisk at få enkelte billeder (dvs. vignetter) af objekterne i prøven. Flere målinger af form, størrelse og gråniveaufunktioner karakteriserer hvert objekt og giver mulighed for automatisk klassificering af objekterne i kategorier, som derefter valideres af en ekspert. Den individuelle størrelse af hver organisme beregnes ved hjælp af det ellipsoide biovolumen (mm3), som er afledt af organismens areal målt i pixels. Dette gør det muligt hurtigt at opnå prøvens størrelsesspektrum. Så vidt vi ved, er dette scanningsbilleddannelsessystem kun blevet brugt til at behandle mesozooplanktonprøver, men enheden kan potentielt give mulighed for at arbejde med ferskvands bentiske makroinvertebrater.

Det overordnede mål med denne undersøgelse er derfor at introducere en metode til hurtigt at opnå den individuelle størrelse af bevarede flodmakroinvertebrater ved at tilpasse en eksisterende protokol, der tidligere blev brugt med marine mesozooplankton 27,32,33. Proceduren består i at bruge en halvautomatisk tilgang, der fungerer med en scanningsenhed til at scanne vandprøver og tre åbne software til at behandle de scannede billeder. En tilpasset protokol til scanning, registrering og identifikation af digitaliserede flodmakroinvertebrater for automatisk at erhverve samfundets størrelsesstruktur og relaterede størrelsesmålinger præsenteres heri. Vurderingen af proceduren og retningslinjerne for at øge effektiviteten præsenteres også baseret på 42 scannede billeder af makroinvertebratprøver fra floder indsamlet fra tre bassiner på den nordøstlige (NE) iberiske halvø (Ter, Segre-Ebre og Besòs).

Prøverne blev indsamlet på 100 m flodstrækninger i henhold til protokollen for feltprøvetagning og laboratorieanalyse af bentiske flodmakroinvertebrater i fordable floder fra den spanske regering34. Prøverne blev indsamlet med en surber-sampler (ramme: 0,3 m x 0,3 m, maske: 250 μm) efter en multihabitatundersøgelse. I laboratoriet blev prøverne renset og sigtet gennem en maske på 5 mm og en 500 μm maske for at opnå to delprøver: en grov delprøve (5 mm maske) og en fin delprøve (500 μm maske), som blev opbevaret i separate hætteglas og konserveret i 70% ethanol. Opdeling af prøven i to størrelsesfraktioner giver mulighed for en bedre estimering af samfundets størrelsesstruktur, da store organismer er sjældnere og færre end de små organismer. Ellers har den scannede prøve en forudindtaget repræsentation af den store størrelsesfraktion.

Subscription Required. Please recommend JoVE to your librarian.

Protocol

BEMÆRK: Protokollen beskrevet her er baseret på systemet udviklet af Gorsky et al.27 til marine mesozooplankton. En specifik beskrivelse af scanneren (ZooSCAN), scanningssoftware (VueScan 9x64 [9.5.09]), billedbehandlingssoftware (Zooprocess, ImageJ) og automatisk identifikationssoftware (Plankton Identifier) trin findes i tidligere referencer32,33. For bedst muligt at justere størrelsen af de bentiske makroinvertebrater i forhold til mesozooplanktonet, når projektet er oprettet efter den oprindelige protokol32,33, skal parameteren for minimumsstørrelse (minsizeesd_mm) til 0,3 mm og parameteren for maksimal størrelse (maxsizeesd_mm) til 100 mm i konfigurationsfilen. For at hjælpe med at følge protokollen er dette opsummeret i et arbejdsdiagram (figur 1). Det oprettede projekt gemmes i computerens C-mappe og er organiseret i følgende mapper: PID_process, Zooscan_back, Zooscan_check, Zooscan_config, Zooscan_meta, Zooscan_results og Zooscan_scan. Hver mappe består af flere undermapper, som de forskellige softwareprogrammer bruger i de følgende trin i protokollen.

1. Erhvervelse af digitale billeder til prøver af makroinvertebrater

  1. Scanning og behandling af tomme felter
    BEMÆRK: Opret to tomme billeder dagligt før scanning for at udtrække baggrundsscanningerne, mens du behandler de scannede billeder samme dag.
    1. Tænd scanneren, og tænd lyset i dobbelt position for at projicere hvidt lys fra toppen og bunden.
      BEMÆRK: Ved scanning af mesozooplanktonprøver anvendes den opadgående lysretning, men fordi makroinvertebrater er mere uigennemsigtige, anbefales det at skifte lyset til en dobbelt position.
    2. Rengør og skyl scanningsbakken med postevand.
    3. Hæld 110 ml postevand opbevaret ved stuetemperatur (RT) i scanningsbakken, indtil glasset er dækket. Placer den store ramme (24,5 cm x 15,8 cm) på scanningsbakken i den rigtige position (med hjørnet øverst til venstre på scanningsbakken), og fyld den med postevand, indtil rammens trin er dækket for at undgå en meniskeffekt, som ville ændre det scannede billede. Luk scannerlåget.
      BEMÆRK: Brug vand ved RT for at undgå kondens og bobledannelse. Rengør rammen uden mærker eller dråber for at undgå lysrefleksion.
    4. Gå til billedbehandlingssoftwaren, vælg arbejdsprojektet, og klik på Scan (konverter) baggrundsbillede.
    5. Gå til scanningssoftwaren, og klik på Preview. Sørg for at forhåndsvise det scannede billede, kontroller, at der ikke er linjer eller pletter, og vent i mindst 30 sekunder, før du starter en ny scanning. Klik på Scan, og tryk på OK i instruktionsvinduet før den anden scanning for at sende dataene fra scanningssoftwaren til billedbehandlingssoftwaren.
      BEMÆRK: Scan to gange for at få de to baggrundsscanninger, der udgør det tomme felt. Dette trin udføres en gang hver dag, før prøvebehandlingen startes, og billederne gemmes i Zooscan_back mappen.
    6. Luk scanningssoftwaren, når scanningen er afsluttet.
  2. Prøveforberedelse og scanning
    FORSIGTIG: Ethanol er en brandfarlig væske og kan forårsage alvorlig øjenskade / irritation.
    1. Udfyld eksempelmetadataene. Gå til billedbehandlingssoftwaren, og vælg Udfyld eksempelmetadata. Indtast eksempelidentiteten, klik på OK, og udfyld metadataene.
      BEMÆRK: Metafilen er specielt oprettet til mesozooplanktonprøver, så den passer ikke til den bentiske makroinvertebratprøveudtagningsmetode, men alle felter i filen skal udfyldes før scanningen, ellers vises et fejlflag.
    2. Hæld 110 ml 70% ethanol i scanningsbakken, indtil glasset er dækket, og placer den store ramme (24,5 cm x 15,8 cm) med hjørnet øverst til venstre på scanningsbakken.
      BEMÆRK: Arbejd med ethanol i stedet for vand, da makroinvertebraterne bevares i ethanol. I vand flyder og driver de i scanningsbakken, hvilket forhindrer et skarpt billede og dermed pålidelige størrelsesmålinger. Ethanol bør konserveres ved RT for at undgå kondens og bobledannelse.
    3. Hæld prøven af makroinvertebrater i scanningsbakken, der er kantet af rammen, og dæk rammetrinnet med mere ethanol, hvis det er nødvendigt.
      BEMÆRK: Afstå fra at tilføje for meget ethanol for at undgå, at organismerne flyder og driver.
    4. Homogeniser prøven i hele rammeområdet, placer de største individer i midten af bakken for korrekt billedbehandling, og synk de flydende organismer ved hjælp af en trænål.
      BEMÆRK: Hvis en delprøve numerisk indeholder mere end 1.000 individer, skal delprøven opdeles i to eller flere fraktioner for at minimere berøring af organismer i det scannede billede, og fraktionerne scannes separat.
    5. Adskil de rørende organismer og de organismer, der berører rammekanterne ved hjælp af trænålen.
      BEMÆRK: Dette trin kræver 5-20 min. Rørende organismer betragtes som et enkelt objekt af softwaren; I disse tilfælde svarer de beregnede individuelle størrelser således ikke til faktiske enkeltorganismer og kan skævvride skønnet over samfundets størrelsesstruktur. Der er mulighed for at redigere billedet med billedbehandlingssoftwaren for at adskille dem, men dette ekstra trin involverer mindst 1,5 timers oparbejdning; Derfor anbefales manuel adskillelse stærkt.
    6. For at scanne prøven skal du lukke scannerlåget, gå til billedbehandlingssoftwaren, vælge arbejdsprojektet og klikke på SCAN Sample with Zooscan (For Archive, No Process).
    7. Vælg eksemplet, og følg vejledningen.
    8. Gå til scanningssoftwaren, og klik på Preview. Sørg for at forhåndsvise det scannede billede, kontroller, at der ikke er nogen linjer eller pletter, og vent mindst 30 sekunder, før du starter en ny scanning.
    9. Efter mindst 30 sekunder skal du klikke på knappen Scan i scanningssoftwaren.
      BEMÆRK: Tryk på OK i billedbehandlingssoftwaren, når du har trykket på Scan i scanningssoftwaren. Tryk ikke på en tast på computerens tastatur, og undgå vibrationer i scanningen under scanningen. Tre filer genereres i den Zooscan_scan > _raw mappe: (i) et mærket billedfilformat (.tif) (16 bit); ii) et standardtekstdokument med navnet LOG (.txt), der registrerer oplysninger om scanningsparametrene og iii) et standardtekstdokument med navnet META (.txt) med oplysninger om prøveudtagningsmetoderne.
    10. Kontroller, at den rå scanning er korrekt.
      BEMÆRK: Hvis scanningen har lyse striber eller andre synlige problemer, kan du overveje at gentage scanningen for at undgå problemer i følgende trin.
  3. Prøve opsving
    1. Fjern rammen og skyl den over scanningsbakken ved hjælp af en klemmeflaske fyldt med 70% ethanol for at genvinde eventuelle vedhæftede makroinvertebrater.
    2. Løft den øverste del af scanneren for at hente alle organismer og ethanol fra bakken gennem scanningstragten til et bægerglas. Mens den øverste del af scanneren stadig er løftet, skylles bakken med klemmeflasken for at feje langs eventuelle resterende organismer.
    3. Prøverne og ethanolen fra bægerglasset ledes gennem et maskum på 500 μm for at fastholde de hvirvelløse dyr i masken, og opbevar dem tilbage i et hætteglas med 70 % ethanol.
    4. Når alle prøverne er genfundet i hætteglasset, rengøres bakken med postevand.
      BEMÆRK: Vask bakken med postevand mellem prøverne for at minimere ethanoludfældning, hvilket ændrer billedbehandlingen. Skyl rammen med postevand for at undgå potentielle skader i forbindelse med ethanolbrug. I slutningen af dagen skal du rengøre bakken med postevand og tørre den forsigtigt med papir for at undgå ridser.
  4. Billedbehandling
    1. Gå til billedbehandlingssoftwaren, og vælg KONVERTER & BEHANDL billeder og organismer i batchtilstand, og konverter derefter OG behandl billede OG partikler (billede i RAW-mappe). Behold standardindstillingerne, og klik på OK. NORMAL END vises i slutningen af processen.
      BEMÆRK: En PID-fil og vignetterne svarende til alle de registrerede objekter i det scannede billede (i en fælles fotografisk gruppefil [.jpg]) oprettes i mappen Zooscan_scan > _work. En PID-fil er en enkelt fil, der gemmer alle metadata (metafil), de tekniske data, der er knyttet til logfilen, og en tabel med 36 målte variabler af alle de objekter, der er registreret i billedet. De målte variabler svarer til forskellige estimater af gråt niveau, fraktal dimension, form og størrelse. De variabler, der kan bruges til størrelsesestimering, er arealet og de større og mindre akser for en ellipse med et areal, der svarer til objektet (se afsnit 3 i protokollen). Behandlingstiden afhænger af billedtætheden og computerens egenskaber og kan startes mellem prøver, mens den næste prøve gendannes og forberedes. Ellers anbefales det at starte behandlingen af de prøver, der scannes hver dag i batch-tilstand om natten, og kontrollere for korrekt billedbehandling næste morgen.
    2. Kontroller, om baggrunden i det behandlede billede er trukket korrekt fra eksempelbilledet ved hjælp af billedbehandlingssoftwaren eller ved at kontrollere maskebillederne (afsluttet i msk1.gif) placeret i Zooscan_scan > _work. Hvis baggrunden indeholder mættede områder eller mange prikker, kan du overveje at gentage scanningen for at sikre billeder i høj kvalitet.
      BEMÆRK: For at undgå mættede områder i baggrunden skal scanningsbakken skylles med postevand efter hver scanning med ethanol. Det er også vigtigt at (1) reducere antallet af scannede individer (ved at fraktionere prøven og scanne i forskellige folder); (2) Sørg for, at store organismer placeres i midten af scanningsbakken; 3) anvende ren, filtreret ethanol 4) reducere snavs på prøverne 5) sikre, at mængden af ethanol til scanning er tilstrækkelig og (6) Sørg for, at forsinkelsen mellem forhåndsvisning af prøven og scanningen er mindst 30 sekunder.
  5. Adskillelse af rørende organismer
    BEMÆRK: Når der er flere vignetter med rørende organismer, er det nødvendigt at adskille billederne af de rørende organismer fra andre organismer og / eller fra fibre / snavs for at sikre et korrekt skøn over samfundets størrelsesstruktur.
    1. Gå til billedbehandlingssoftwaren for at registrere vignetterne med flere objekter. Vælg SEPARATION Using Vignettes, og tryk på OK. I vinduet til konfigurationsvalg skal du beholde standardindstillingerne og klikke på OK.
    2. I vinduet ADSKILLELSE fra VIGNETTER skal du beholde standardindstillingerne, desuden vælge TILFØJ konturer på vignetter og derefter vælge det eksempel, der skal redigeres.
    3. Adskil de rørende organismer i hver vignet, der dukker op, ved at tegne en linje med musen (tryk på rulleknappen for at tegne). Når adskillelsen i en vignet er fuldført, skal du klikke på X-knappen i øverste højre hjørne af vinduet og trykke på JA for at behandle den næste. Tryk på NEJ for at afslutte og gemme ændringerne. I slutningen af processen vises NORMAL END , hvis alt er korrekt.
    4. Efter adskillelse skal du behandle billedet igen for at hente de opdaterede objektdata. Gå til billedbehandlingssoftwaren, klik på PROCESS (Converted) Image (Process One), og vælg Process Again Particles from Processed Images i WORK-undermapper. Vælg prøven, og behold standardindstillingerne i vinduet Single Image Process , marker Arbejd med separationsmaske (CREATE-MODIFY-INCLUDE), og klik derefter på OK. I slutningen af processen vises NORMAL END , hvis alt er korrekt.
    5. I vinduet Separationskontrol skal du trykke på OK for at gemme billedet med konturerne før behandlingen; Hvis der findes et tidligere billede, erstattes det.
    6. I vinduet Separationskontrolmaske skal du om nødvendigt vælge REDIGER for at føje separationslinjer til masken ved hjælp af musen for at adskille rørende organismer, der ikke har vist sig før i separationstrinnet ved hjælp af vignetter. Når du er færdig, skal du afslutte processen og i vinduet Separationsmaskekontrol vælge JA for at acceptere masken. I slutningen af processen vises NORMAL END , hvis alt er korrekt.
      BEMÆRK: Oparbejdning af en prøve med en separationsmaske er tidskrævende (dette kan tage mere end 1,5 time pr. prøve). Det foretrækkes at afsætte den nødvendige tid i trin 1.2.5 for at undgå dette ekstra trin.

2. Automatisk genkendelse af objekterne

BEMÆRK: Opret et læringssæt til automatisk at forudsige identiteten af de detekterede objekter og dermed adskille organismerne fra affaldet i prøven.

  1. Oprettelse af læringssæt
    1. Kopier billederne og .pid-filerne, der er knyttet til de billeder, der skal bruges til at oprette kategorierne i læringssættet fra Zooscan_scan > _work til PID_process > Unsorted_vignettes_pid.
      BEMÆRK: Vælg en delmængde af prøver med høj taxadiversitet og forskellige prøveudtagningssteder og/eller prøvetagningssæsoner for at sikre maksimal repræsentativitet af organismer i prøverne.
    2. I mappen PID_process > Learning set skal du oprette en undermappe med navnet på det nye læringssæt (dvs. yyyymmdd_raw_LS), og inde i den skal du oprette de undermapper, der svarer til hver kategori af læringssættet (dvs. makroinvertebrater, snavs, andre hvirvelløse dyr).
      BEMÆRK: For effektivt at opnå samfundsstørrelsesstrukturen for prøver af flodmakroinvertebrater anbefales det at bruge et læringssæt baseret på kun tre kategorier: makroinvertebrater, andre hvirvelløse dyr og affald. Dette læringssæt adskiller grundlæggende vignetterne af objekter, der svarer til organismer, fra dem, der svarer til affald (f.eks. Fibre, partikler eller filamentøse alger).
    3. Gå til billedbehandlingssoftwaren (kun avanceret tilstand), og vælg UDDRAG vignetter til PLANKTON IDENTIFIER (usorterede vignetter til træning). Behold standardindstillingerne, og marker afkrydsningsfeltet Tilføj konturer .
    4. Gå til den automatiske identifikationssoftware, klik på Læring, vælg PID_process > Learning_set den oprettede undermappe til det nye læringssæt (trin 2.1.2), og tryk på OK.
    5. I venstre sektion (Usorterede tommelfingre) i det åbne vindue skal du vælge mappen Usorteret vignettes_pid. Vælg vignetterne, og træk dem med musen fra de usorterede tommelfingre til mappen for deres tilsvarende kategori i højre sektion, Sorterede tommelfingre, for at klassificere hvert objekt i de definerede kategorier. De flyttede vignetter markeres med et rødt X.
      BEMÆRK: Definer kategorierne manuelt ved at oprette undermapper i den sorterede tommelfingermappe eller oprette dem ved at klikke på mappeikonet i softwaren. Flyt ikke mere end 50 vignetter på samme tid.
    6. Når alle kategorierne er afsluttet med de valgte objekter (ca. 300 objekter pr. Kategori), skal du klikke på Opret læringsfil og gemme den med det ønskede navn.
      BEMÆRK: Læringssættet gemmes som en .pid-fil i projektets PID_process > Learning set-mappe . Det anbefales at oprette og teste flere læringssæt med forskellige niveauer af kategorier (fra grove til fine former) og med en anden balance mellem antallet af objekter inden for hver kategori. Start med et groft læringssæt med et lavt antal kategorier og mindst 50 objekter pr. kategori, og øg derefter antallet af objekter i hver kategori og/eller opret finere læringssæt. En kategori bør være repræsentativ for dens variabilitet i sættet af prøver.
  2. Evaluering af læringssættet
    BEMÆRK: Udfør krydsvalidering med to folder og fem forsøg ved hjælp af metoden Random Forest med den automatiske identifikationssoftware for at opnå en forvirringsmatrix af den resulterende klassificering af objekterne.
    1. Gå til den automatiske klassificeringssoftware, og klik på Dataanalyse.
    2. I Vælg læringsfil skal du vælge den oprettede læringssætfil fra PID_process > læringssæt.
    3. I Vælg en metode skal du vælge metoden Tilfældigt skovområde med krydsvalidering . I Oprindelige variabler skal du fjerne markeringen af positionsvariablerne (X, Y, XM, YM, BX, BY og Højde). I Tilpassede variabler skal du kun markere ESD.
      BEMÆRK: Denne metode bruger en tilfældig del af læringssættet til at genkende den anden del (to gange), og dette gentages fem gange for at sikre, at den er statistisk robust.
    4. Klik på Start analyse, og gem resultaterne som Analysis_name.txt i mappen PID_process > forudsigelse. Når analysen er fuldført, skal du afslutte dataanalysen.
    5. Gå til mappen PID_process > forudsigelse, og klik på krydsvalideringsfilen. Et vindue vises med forvirringsmatrixen for den sande klassificering (rækker) versus den automatiske klassificering (kolonner).
      BEMÆRK: Tilbagekaldelsen er procentdelen af organismer, der tilhører en gruppe, der automatisk blev godt anerkendt, mens 1-præcision er procentdelen af organismer, der er klassificeret af algoritmen som en gruppe, der ikke genkendes (forurening i en gruppe). Tilbagekaldelsen skal være over 70%, og forureningen (1-præcision) skal være lavere end 20%.
    6. Gentag trin 2.1-2.5, hvis der blev oprettet flere læringssæt, og tilbagekaldelsen og 1-præcisionen af hvert enkelt skal opnås.
      BEMÆRK: Hvis der er oprettet flere læringssæt, skal du vælge det med den største tilbagekaldelse (god genkendelse) og præcision (lav forurening) af gruppen af interesse (dvs. makroinvertebrater) for at teste den automatiske forudsigelse af et sæt prøver i næste trin.
  3. Forudsigelse af identifikation af makroinvertebrater
    BEMÆRK: Brug det valgte læringssæt til at forudsige identiteten af alle objekterne i en delmængde af prøver ved hjælp af den automatiske identifikationssoftware med en tilfældig skovalgoritme.
    1. Gå til den automatiske identifikationssoftware, og klik på Dataanalyse.
    2. I Vælg læringsfil skal du vælge den læringssætfil fra PID_process > læringssæt , der skal bruges til forudsigelsen.
    3. I Vælg eksempelfil(er) skal du fra mappen PID_results vælge de eksempler (PID-filer), der skal forudsiges.
      BEMÆRK: Behandl maksimalt 20 .pid-filer på samme tid for at undgå fejl relateret til hukommelsesproblemer. Hvis der behandles for mange .pid-filer på samme tid, viser processen en korrekt afslutning, men behandles muligvis ikke godt, og der kan opstå en fejl i de næste trin, når du behandler med billedbehandlingssoftwaren.
    4. I Vælg en metode skal du vælge metoden Tilfældig skov . Sæt kryds ved Gem detaljerede resultater for hver prøve. I Oprindelige variabler skal du fjerne markeringen af positionsvariablerne (X, Y, XM, YM, BX, BY og Height). I Tilpassede variabler skal du kun markere ESD.
    5. Klik på Start analyse, og gem resultaterne som Analysis_name.txt i mappen PID_process > forudsigelse.
  4. Manuel validering
    BEMÆRK: En ekspert validerer manuelt forudsigelsen fra det forrige trin for at omklassificere fejlklassificerede objekter til den korrekte kategori.
    1. Kopiér de Analysis_sample_dat1.txt filer, der skal valideres, fra mappen PID_process > Forudsigelse til mappen PID_process > Pid_results.
    2. Gå til billedbehandlingssoftwaren, og vælg UDPAK vignetter i mapper i henhold til PREDICTION eller VALIDATION. Vælg derefter Brug forudsagte filer fra mappen "pid_results". Behold standardindstillingerne, og tryk på OK.
    3. Softwaren opretter en mappe kaldet sample_yyyymmdd_hhmm_to_validate med de forudsagte objekter i mappen PID_process > Sorterede vignetter.
    4. Gå til mappen PID_process > Sorterede vignetter, og kopier mappen sample_yyyymmdd_ hhmm_to_validate. Erstat mappenavnet, _to valider med _validated.
    5. Hvis du vil validere den automatiske klassificering manuelt, skal du åbne mappen sample_yyyymmdd_ hhmm_validated og gennemse alle vignetterne fra hver undermappe (kategori) for at identificere, om der er fejlklassificerede objekter. Når et objekt er fejlklassificeret, skal du trække vignetten med musen til den korrekte mappe (kategori).
    6. Gå til billedbehandlingssoftwaren, og vælg LOAD-identifikationer fra Sorterede vignetter. Behold standardindstillingerne, og vælg yyyymmdd_hhmm_name_validated, der skal behandles.
    7. Gå til PID_process > Pid_results > Dat1_validated, hvor der er oprettet en fil med navnet Id_from_sorted_vignettes_yyyymmdd_hhmm.txt og en .txt fil for hver af de validerede eksempler (sample_tot_1_dat1.txt).
      BEMÆRK: Disse .txt filer indeholder en ny kolonne, der præsenterer forudsigelsen, kaldet pred_valid_Id_yyyymmdd_hhmm, som angiver ekspertklassificeringen for hvert objekt (dvs. den validerede klassifikation). Nye kategorier (f.eks. finere taksonomiske kategorier) kan oprettes på dette tidspunkt under valideringen. Behold dog navnet på den oprindelige kategori i det nye navn (f.eks. macroinvertebrate_chironomidae). Dette gør det muligt at spore den oprindelige kategori ved beregning af tilbagekaldelse og præcision og let gruppere alle makroinvertebrater for at beregne samfundets størrelsesstrukturparametre (dvs. størrelsesspektret og størrelsesdiversiteten). Tekstfilen indeholder de data, der er knyttet til hvert objekt, herunder de mindre og større akser, der bruges til at opnå det ellipsoide volumen af hver organisme som et mål for individuel kropsstørrelse. Desuden indeholder de sidste to kolonner i tabellen de forudsagte og validerede kategorier for hvert objekt (række), som gør det muligt at beregne efter kategori tilbagekaldelsen og præcisionen af læringssættet på delmængden af prøver.Figure 1

Figur 1: Arbejdsdiagram, der repræsenterer afsnit 1 og afsnit 2 i protokollen. Tiderne er illustrative og kan ændre sig afhængigt af computeren, overflod af vignetter, der skal behandles, og antallet af kategorier i læringssættet. Dette tilfælde svarer til valideringen af et læringssæt bestående af tre kategorier på et sæt på 42 delprøver (i alt 47.473 vignetter). Klik her for at se en større version af denne figur.

3. Beregning af den individuelle størrelsesfordeling, størrelsesspektre og størrelsesmålinger

BEMÆRK: Beregningerne nævnt i dette afsnit blev udført ved hjælp af Matlab (se script som supplerende fil 1).

  1. Individuel størrelsesfordeling
    1. Den sidste kolonne i Id_from_sorted_vignettes_YYYYMMDD_HHHH.txt filen indeholder den validerede klassificering af objekterne. Vælg kun de objekter, der er klassificeret som makroinvertebrater, for at vise deres individuelle størrelsesfordeling i prøven.
      BEMÆRK: Individuel kropsstørrelse svarer til det ellipsoide volumen af makroinvertebratorganismerne. Systemet giver målinger i pixels.
    2. Sammenkæd vektorerne med størrelsesmålingerne fra begge scanninger, fordi hver fraktion har en anden delsamplingseksponent. Før sammenkædning korrigeres for fraktioneringen ved at replikere størrelsesvektorerne så mange gange, som den tilsvarende delprøve er blevet fraktioneret.
      BEMÆRK: Dette trin er nødvendigt, hvis en scanning svarer til en brøkdel af en prøve (dvs. grov eller fin).
    3. Beregn ellipsoidvolumen fra de store (M) og mindre (m) akser af prolatellipsoider med de samme pixelområder som organismerne. Før du beregner det ellipsoide volumen, skal du konvertere hovedaksen (M) og molaksen (m) fra pixel til millimeter (mm) med følgende omregningsfaktor (cf):
      1 pixel = 2.400 dpi
      1 tommer = 25,4 mm
      cf = 25,4/2400
      Det ellipsoide volumen (ellipVol med enheder i mm3) svarer til:
      Equation 1
    4. Afbild sandsynlighedstæthedsfunktionen for den individuelle størrelsesfordeling på log 2-skalaen.
  2. Størrelse mangfoldighed
    1. Beregn størrelsesdiversiteten (Sd) efter Quintana et al. (2008)8, som i García-Comas et al. (2016)35:
      Equation 2
      hvor p x(x) er sandsynlighedstæthedsfunktionen for størrelse x, og x repræsenterer log2 (ellipVol). Dette mål er derfor Shannon-mangfoldighedsindekset tilpasset et kontinuerligt mål, såsom den individuelle størrelsesfordeling i et samfund.
  3. Normaliseret biovolumenstørrelsesspektrum (NBSS)
    1. NBSS' størrelsesklasser defineres, idet spektrets nedre grænse fastlægges som 0,01-kvantilen af størrelsesfordelingen for makroinvertebrater i prøverne, og der oprettes størrelsesklasser ved hjælp af en geometrisk skala af base 2, indtil den største organisme i prøverne er omfattet.
      BEMÆRK: Størrelsesklassens bredde øges med størrelsen for at tage højde for den større variation, der er forbundet med større størrelser. NBSS for de makroinvertebratsamfund, der blev analyseret her, havde 14 størrelsesklasser (tabel 1).
    2. Få det normaliserede biovolumen ved at dividere det samlede biovolumen i hver størrelsesklasse med størrelsesklassens bredde.
  4. Størrelse, spektrum hældning
    1. Beregn NBSS's lineære hældning.
      BEMÆRK: Hældningen (μ) beregnes ud fra forholdet mellem log 2 (størrelsesklasse midtpunkt) og log2 (normaliseret biomasse) i størrelsesklasserne større end tilstanden, idet eventuelle tomme ignoreres (i denne undersøgelse størrelsesklasserne fra 3 til 14).
Grænser for størrelsesklasse (mm3) Størrelsesklasse midtpunkt (mm3)
0,1236 0,1855
0,2473 0,3709
0,4946 0,7418
0,9891 1,4837
1,9783 1,4837
3,9560 5,9348
7,9131 11,8696
15,8261 23,7392
31,6522 47,4783
63,3044 94,9567
126,6089 189,9133
253,2178 379,8267
506,4300 7597,7000
1012,9000 15193,0000
2025,7000

Tabel 1: Størrelsesklasser for det normaliserede biomassestørrelsesspektrum (NBSS). Tabellen viser også de 15 størrelsesklassegrænser og størrelsesklassens midtpunkter for organismerne.

Subscription Required. Please recommend JoVE to your librarian.

Representative Results

Erhvervelse af digitale billeder af prøver af makroinvertebrater
Scanningsnuancer: Ethanolaflejring i scanningsbakken
Under test af systemet for makroinvertebrater var flere scanninger af dårlig kvalitet. Et mørkt mættet område i baggrunden forhindrede normal behandling af billedet og måling af de enkelte størrelser af makroinvertebraterne (figur 2). Der er givet flere grunde til udseendet af mættede områder i baggrunden eller stærkt pixelerede billeder: (1) tilstedeværelsen af for mange organismer på scanningsbakken; 2) tilstedevaerelsen af snavs i prøverne 3) en utilstrækkelig forsinkelse mellem forhåndsvisningen af prøven og scanningen heraf eller (4) brug i billedbehandlingen af et baggrundsbillede af dårlig kvalitet på grund af kondens, snavs eller dårlig vandkvalitet33. I makroinvertebratsamfundsprøver forårsager brugen af ethanol i stedet for vand nedbør på bakken, hvilket danner en mørk skygge, hvis den ikke skylles ordentligt med vand mellem scanninger. Dette er vigtigt for at opnå skarpe billeder og for at minimere enhver relateret korrosion af scanningsbakkeglasset.

Scanning nuancer: Koncentration af snavs
Fra analysen af en delmængde på 47.473 vignetter svarede en høj procentdel (86,1%) til affald, herunder detritus, fibre eller kropsdele (såsom ben eller gæller) eller scanningsartefakter (figur 3A-E). Hvirvelløse organismer svarede til de resterende 13,9% af de detekterede objekter (figur 3F-L). På trods af den tidligere omhyggelige adskillelse af organismer fra organisk materiale i laboratoriet var der stadig masser af små snavs tilbage i hætteglasset.

Scanning nuancer: Berøring af objekter
Den betydelige tilstedeværelse af affald forbedrer berøringen mellem organismer og derfor skabelsen af vignetter med aggregater, der inkluderer flere rørende organismer og organismer bundet til partikler eller fibre (figur 4A-C). Disse vignetter er en kilde til bias ved bestemmelse af formen på den individuelle størrelsesstruktur. I et sæt på fem prøver (11 delprøver) svarede 10% ud af alle vignetter med makroinvertebrater til grupper med rørende organismer eller organismer, der rørte partikler eller fibre. Disse vignetter blev redigeret med billedbehandlingsprogrammet for at adskille de rørende organismer og organismerne med partikler fastgjort. Oparbejdning af prøverne med separationsmasken involverede oprettelsen af nye vignetter med de nyligt adskilte objekter, som blev valideret for at sikre deres korrekte klassificering.

Automatisk genkendelse af objekterne
Læringssæt resultater
Et læringssæt er et sæt vignetter af objekter, der er klassificeret i forskellige kategorier af en ekspert og bruges i en overvåget læringsmodel, og dette kan også kaldes et træningssæt27. Det er muligt at arbejde med et eksisterende læringssæt, opdatere det eksisterende læringssæt med nye vignetter og/eller kategorier eller oprette et nyt læringssæt til et specifikt projekt.

For at bestemme det bedste læringssæt til hurtigt at opnå makroinvertebratstørrelsesstrukturen blev flere læringssæt oprettet og testet gennem krydsvalidering med Random Forest-algoritmen. Den resulterende forvirringsmatrix viser den sande klassificering (rækker) versus den automatiske klassificering (kolonner). Tilbagekaldelsen er procentdelen af organismer, der tilhører en kategori, der automatisk blev godt klassificeret, mens 1-præcisionen er procentdelen af organismer, der fejlagtigt klassificeres af algoritmen som tilhørende en kategori (forurening i en kategori)33. Som tommelfingerregel skal tilbagekaldelsen være over 70%, og forureningen (1-præcision) skal være lavere end 20% for at holde en kategori i læringssættet. Læringssættet med den største tilbagekaldelse og præcision for makroinvertebrater valideres derefter yderligere med en delmængde af prøver for at bestemme dets reelle nøjagtighed i identifikation af makroinvertebrater.

Tre typer ataxiske læringssæt (rå, mellemliggende og fine) med kategorier baseret på objekternes morfologiske egenskaber blev testet. Det rå læringssæt omfattede tre kategorier: makroinvertebrater, andre hvirvelløse dyr (mikrokrebsdyr) og snavs (fibre, partikler og artefakter som glaspletter). Det mellemliggende læringssæt omfattede 16 kategorier: 5 for makroinvertebrater, 3 for andre hvirvelløse dyr og 8 for affald. Det fine læringssæt omfattede yderligere 4 kategorier af makroinvertebrater med i alt 20 kategorier (tabel 2).

Ud over at definere kategorierne blev effekten af antallet af vignetter pr. kategori også testet. Hvert læringssæt blev testet separat ved hjælp af 50 vignetter, 100 vignetter og 300 vignetter i hver kategori (og 500 vignetter til det rå læringssæt med tre kategorier). Alle kategorierne var afbalanceret i antal undtagen "Ostracoda", "langrundede makroinvertebrater" og "makroinvertebrater med rundskal", som omfattede færre individer i læringssættene med 100 vignet og 300 vignetter, fordi der ikke blev påvist nok organismer af disse kategorier i de scannede billeder.

Tilbagekaldelsen og præcisionen for makroinvertebrater (alle makroinverebratkategorierne tilsammen) og organismer (kategorierne makroinvertebrater og andre hvirvelløse dyr tilsammen) blev overvejet for at vælge det bedste læringssæt ved krydsvalidering (se tabellerne i supplerende fil 2). Det bedste læringssæt var det rå læringssæt med tre kategorier (makroinvertebrater, andre hvirvelløse dyr og affald) med 300 objekter i hver kategori (tabel 2). Det rå læringssæt blev efterfølgende brugt til at validere den automatiske klassificering af objekterne i delmængden af scannede prøver.

Læringssæt Antal kategorier Billeder pr. kategori Husk organismer Husk makro-hvirvelløse dyr 1-præcision organismer 1-præcisions makroinvertebrater
3 50 0.97 0.84 0.12 0.24
100 0.96 0.87 0.06 0.17
300 0.95 0.91 0.09 0.15
500 0.93 0.88 0.13 0.2
Medium 16 50 0.83 0.77 0.17 0.24
100 0.84 0.79 0.15 0.21
300 0.87 0.84 0.14 0.18
Bøde 20 50 0.89 0.86 0.14 0.18
100 0.9 0.87 0.11 0.14
300 0.9 0.86 0.13 0.14

Tabel 2: Oprettede og testede læringssæt (rå, mellemliggende og fine) med kategorierne inden for hver enkelt og antallet af objekter pr. kategori. Tilbagekaldelse og 1-præcision af de oprettede læringssæt. Kategorier af Raw-læringssættet: Makroinvertebrater (1), Andre hvirvelløse dyr (2), Affald (3). Kategorier af mellemlæringssættet: Lange makroinvertebrater (1), Lange glatte makroinvertebrater (2), Lange spidse makroinvertebrater (3), Runde makroinvertebrater (4), Makroinvertebrater med rundskal (5), Cladocera (6), Copepoda (7), Ostracoda (8), Aggregater (9), Fibre (10), Hoveder (11), Ben (12), Pletter (13), Mørke pletter (14), Lysegrå pletter (15), Runde pletter (16). kategorier af det fine læringssæt: Lange makroinvertebrater (1), Lange glatte makroinvertebrater (2), Lange glatte mørke makroinvertebrater (3), Langrunde makroinvertebrater (4), Lange spidse makroinvertebrater (5), Runde makroinvertebrater (6), Makroinvertebrater med rundskal (7), Runde mørke makroinvertebrater (8), Makroinvertebrater med rundskal (9), Cladocera (10), Copepoda (11), Ostracoda (12), Aggregater (13), Fibre (14), Hoveder (15), Ben (16), Pletter (17), Mørke pletter (18), lysegrå pletter (19), runde pletter (20).

Validering af automatisk genkendelse med det bedste læringssæt
Objekterne i en delmængde af 42 fine og grove delprøver blev automatisk klassificeret af det valgte læringssæt med algoritmen Random Forest. Efter manuel validering var tilbagekaldelsen for alle kategorierne høj (i gennemsnit 0,94 for makroinvertebrater, 0,95 for andre hvirvelløse dyr og 0,92 for affald), mens forureningen (1-præcision) var ret lav, undtagen for andre hvirvelløse dyr (0,25 for makroinvertebrater, 0,84 for andre makroinvertebrater og 0,01 for affald) (figur 5 ). Andre hvirvelløse dyr (mikrokrebsdyr) var sjældne i prøverne (til stede i 17 ud af 42 delprøver); Sammenligningen var således ikke robust. Desuden var denne kategori stærkt påvirket af forureningen på grund af ligheden i form og grå niveauer med andre genstande.

Sammenligningen af automatisk versus valideret forekomst af makroinvertebrater viste, at disse var stærkt korrelerede (Pearsons r = 0,92, p-værdi < 0,0001, n = 24 for grove delprøver; Pearsons r = 0,98, p-værdi < 0,0001, n = 18 for fine delprøver) med en let overvurdering af den automatiske ydeevne på grund af forurening fra affald (skråninger < 1) (figur 6). Med hensyn til sammenligningen af det gennemsnitlige ellipsoide volumen var korrelationen også høj (Pearsons r = 0,96, p-værdi < 0,0001, n = 24 for grove prøver; Pearsons r = 0,99, p-værdi < 0,0001, n = 18 for fine prøver), og størrelsesspektrumhældningen var tæt på -1 (figur 6). Forskellen i hældningerne mellem de fine og grove fraktioner afspejler den større effekt af fejlklassificering i de store størrelsesfraktioner, hvilket er relateret til deres lave organismetal.

Sandsynlighedstæthedsfunktionerne for de individuelle størrelsesfordelinger af den automatiske forudsigelse stemte stærkt overens med de validerede forudsigelser for de fine delprøver såvel som for de grove delprøver. Der var dog nogle undtagelser for de grove delprøver relateret til antallet af organismer og dermed større effekt af fejlklassificering i disse tilfælde, som fremhævet tidligere (figur 7).

Effekt af rørende organismer på de individuelle størrelsesfordelinger, størrelsesspektre og størrelsesmålinger
En sammenligning af størrelsesfordelingerne opnået før og efter adskillelsen af de rørende organismer og før valideringen i en delmængde af fem udvalgte prøver blev udført for at vurdere effekten af berøring af objekter. For at sammenligne størrelsesfordelingen blev de grove og fine delprøver kombineret i henhold til deres fraktionering for at rekonstruere en prøve, der repræsenterer makroinvertebratsamfundet. I tre stikprøver steg mængden efter validering (>500 individer) (figur 8A). På trods af denne stigning lå det gennemsnitlige ellipsoide volumen meget tæt op ad det, der blev beregnet i de validerede prøver (figur 8B).

Størrelsesfordelingen af de korrigerede prøver (efter adskillelsen af rørende organismer) adskiller sig lidt fra de validerede. Således havde tilstedeværelsen af flere objekter en lille indflydelse på størrelsesfordelingen i disse prøver (figur 9A-E). Følgelig korrelerede størrelsesdiversiteten beregnet ud fra de korrigerede prøver stærkt med størrelsesdiversiteten af de validerede (Pearsons r = 0,94, p-værdi = 0,017, n = 5) (figur 9F).

Teoretisk set har det normaliserede biovolumenstørrelsesspektrum (NBSS) for et samfund med flere trofiske niveauer en størrelsesspektrumhældning i log2-skalaen , der nærmer sig -1 under steady state-forhold4. NBSS i naturlige samfund har ofte en bump snarere end en lineær fordeling, og dette tilskrives for det meste prøveudtagningsbias i de mindste størrelsesklasser36. I denne undersøgelse var den tredje størrelsesklasse den mest almindelige i NBSS.

NBSS'erne var ret ens mellem protokollens trin (figur 10A-C), bortset fra nogle få størrelsesklasser i et par spektre (figur 10D-E). Følgelig korrelerede størrelsesspektrumhældningen beregnet ud fra de korrigerede prøver stærkt med hældningen baseret på de validerede (Pearsons r = 0,99, p-værdi ≤ 0,0001, n = 5) (figur 10F).

Figure 2
Figur 2: Eksempler på scannede billeder med forskellige kvaliteter før og efter behandling. (A,B) Råbillede (venstre) og behandlet billede (højre) af en fin delprøve med god scanningskvalitet; (C,D) Raw-billede (venstre) og behandlet billede (højre) af en fin delprøve med dårlig scanningskvalitet (mørk baggrund og klippet billede på venstre kant); (E,F) råbillede (venstre) og behandlet billede (højre) af en fin delprøve med dårlig scanningskvalitet (meget pixeleret mørk baggrund). Klik her for at se en større version af denne figur.

Figure 3
Figur 3: Konturvignetter, der repræsenterer forskellige objekter, der findes i prøverne. (A-E) Affald (fiber, rund plet, makroinvertebratben, pletter og organisk affald); (F-I) makroinvertebrater (Coleoptera, Diptera, Plecoptera og Trichoptera) og (J-L) andre hvirvelløse dyr (Cladocera, Copepoda og Ostracoda). Skalabjælker angiver 1 mm gma = 1,1. Klik her for at se en større version af denne figur.

Figure 4
Figur 4: Eksempler på vignetter, der indeholder flere objekter. A) Et makroinvertebrat (Hydracarina) fastgjort til en fiber B) flere organismer (Caenidae) aggregeret af en fiber og C) to rørende makroinvertebrater (Chironomidae og Caenidae). Skalabjælker angiver 1 mm gma = 1,1. Klik her for at se en større version af denne figur.

Figure 5
Figur 5: Boxplots af tilbagekaldelse og kontaminering (1-præcision). Boksplottene for de tre kategorier af makroinvertebrater, andre hvirvelløse dyr og affald (300 vignetter pr. kategori) i det valgte læringssæt valideret på en delmængde af prøver (n = 42). Klik her for at se en større version af denne figur.

Figure 6
Figur 6: Sammenligning mellem estimaterne for bestandsstørrelsen og den gennemsnitlige ellipsoide mængde i automatisk versus valideret klassificering. (A) Estimater for bestandsstørrelsen i delstikprøverne (n = 42) og (B) gennemsnitlige estimater af ellipsoidt volumen i delstikprøverne (n = 42). De mørke prikker svarer til de grove delprøver (>0,5 cm mesh); De grå prikker svarer til de fine delprøver (>500 μm maske). Den stiplede linje repræsenterer 1:1-relationen. Klik her for at se en større version af denne figur.

Figure 7
Figur 7: Sandsynlighedstæthedsfunktioner, der repræsenterer det relative bidrag (y-aksen) af den individuelle størrelse i log-skalaen (x-aksen) til sammenligning mellem automatiske estimater og mellem validerede estimater. (A,B) Automatiske og validerede skøn for grove delstikprøver (n = 18), (C,D) Automatiske og validerede estimater for fine delstikprøver (n = 24). (A,C) Sammenligning mellem automatiske estimater og (B,D) sammenligning mellem validerede estimater. Farver repræsenterer hver delprøve for at hjælpe med at skelne spektrene. Klik her for at se en større version af denne figur.

Figure 8
Figur 8: Sammenligning mellem estimater for bestandsstørrelse og gennemsnitlig ellipsoid volumen i validerede delprøver versus delprøver, der er valideret efter adskillelse af rørende genstande fra udvalgte naturlige prøver (fine og grove delprøver sammen ). (A) Skøn over bestandsstørrelse efter stikprøvegrundlag (n = 5) og (B) gennemsnitlige estimater af ellipsoid volumen (n = 5). Den stiplede linje repræsenterer 1:1-relationen. Klik her for at se en større version af denne figur.

Figure 9
Figur 9: Sandsynlighedstæthedsfunktioner, der repræsenterer det relative bidrag (y-aksen) af den individuelle størrelse i log2-skalaen (x-aksen) til automatisk forudsigelse, valideret forudsigelse og valideret forudsigelse med deres respektive størrelsesdiversitetsværdier (Sd). A-E) sandsynlighedstæthedsfunktioner for udvalgte naturlige prøver (fine og grove delprøver sammen) (n = 5) Den røde linje svarer til den automatiske forudsigelse, den blå linje svarer til den validerede forudsigelse, og den grønne linje svarer til de korrigerede prøver (valideret efter adskillelse af rørende objekter). F) sammenligning af validerede versus korrigerede skøn over størrelsesdiversitet Den stiplede linje svarer til forholdet 1:1. Klik her for at se en større version af denne figur.

Figure 10
Figur 10: Normaliserede biovolumenstørrelsesspektre (NBSS) og sammenligning af NBSS-hældninger (μ) mellem behandlingerne. (A-E) NBSS, der repræsenterer forholdet mellem midtpunktsværdien for hver størrelsesklasse i logskalaen (x-aksen) versus den normaliserede biovolumen pr. scanningsramme (y-akse) for de fem udvalgte prøver til forudsigelser af automatiske (røde kryds), validerede (blå trekanter) og korrigerede (grønne cirkler) med deres respektive størrelsesspektrum hældninger (μ) beregnet i størrelsesklasserne fra fra modalstørrelsesklassen og opad (den tredje størrelsesklasse er angivet med den lodrette stiplede linje). (F) Sammenligning af hældningerne beregnet på de validerede prøver versus de korrigerede (efter adskillelse af rørende genstande). Den stiplede linje svarer til forholdet 1:1, r2. Klik her for at se en større version af denne figur.

Supplerende fil 1: Matlab-script til udførelse af beregningerne. Klik her for at downloade denne fil.

Supplerende fil 2: Krydsvalidering, tilbagekaldelse og 1-præcision af de oprettede læringssæt. (A) Rå læringssæt med 3 kategorier og 50 vignetter pr. kategori; B) råundervisningssæt med 3 kategorier og 100 vignetter pr. kategori C) råt læringssæt med 3 kategorier og 300 vignetter pr. kategori D) råundervisningssæt med 3 kategorier og 500 vignetter pr. kategori E) råundervisningssæt med 5 kategorier og 50 vignetter pr. kategori F) råundervisningssæt med 5 kategorier og 100 vignetter pr. kategori G) råundervisningssæt med 5 kategorier og 300 vignetter pr. kategori H) mellemliggende læringssæt med 16 kategorier og 50 vignetter pr. kategori I) mellemliggende læringssæt med 16 kategorier og 100 vignetter pr. kategori J) mellemliggende læringssæt med 16 kategorier og 300 vignetter pr. kategori K) fint læringssæt med 20 kategorier og 50 vignetter pr. kategori L) fint læringssæt med 20 kategorier og 100 vignetter pr. kategori og (M) fint læringssæt med 20 kategorier og 300 vignetter pr. kategori. Klik her for at downloade denne fil.

Subscription Required. Please recommend JoVE to your librarian.

Discussion

Tilpasningen af metoden beskrevet af Gorsky et al. 2010 for flodmakroinvertebrater giver mulighed for høj klassificeringsnøjagtighed ved estimering af samfundsstørrelsesstrukturen hos ferskvandsmakroinvertebrater. Resultaterne tyder på, at protokollen kan reducere tiden til estimering af den individuelle størrelsesstruktur i en prøve til ca. 1 time. Den foreslåede protokol har således til formål at fremme rutinemæssig anvendelse af spektre af makroinvertebraters størrelse som en hurtig og integrerende bioindikator til vurdering af virkningen af forstyrrelser i ferskvandsøkosystemer. Størrelsesspektret for makroinvertebrater er allerede blevet anvendt som et vellykket indeks til evaluering af kystlagunernes økologiske tilstand22. Med udviklingen af protokollen kan der udføres intensive undersøgelser af hvirvelløse dyr for at muliggøre feltovervågningskampagner, der dækker store rumlige og tidsmæssige skalaer.

Da formålet med denne protokol er at opnå den individuelle størrelsesfordeling af det stikprøveudtagne samfund på en hurtig måde, uden hensyntagen til taksonomi, anbefales det at oprette enkle læringssæt som det, der foreslås her. Test af finere læringssæt med et højere antal kategorier giver lavere tilbagekaldelse og præcision for makroinvertebrater som helhed (tabel 2), og valideringstrinnet er mere tidskrævende.

Den automatiske forudsigelse stemte i høj grad overens med den validerede forudsigelse af 42 naturlige delprøver fra forskellige prøvetagningssteder, hvilket tyder på, at metoden i automatisk tilstand er egnet til at tælle og måle makroinvertebrater i naturlige prøver (figur 6). Desuden antyder ligheden i NBSS'erne mellem de automatiske og validerede forudsigelser og den høje tilpasning til den lineære teoretiske model, at den automatiske tilstand er en lovende metode til at forfølge teoretiske økologiske undersøgelser (figur 10).

Under tilpasningen af denne protokol opstod der flere problemer, og de blev løst eller minimeret på forskellige måder. Et problem, der skal tages i betragtning ved scanning af makroinvertebratprøver, er udseendet af mørke mættede områder. Det er derfor vigtigt at kontrollere de behandlede, scannede billeder så hurtigt som muligt for at opdage dette problem og gentage scanningen om nødvendigt. Dette problem er også fundet ved scanning af plankton33, men det øges ved brug af ethanol i stedet for postevand. Det anbefales ikke at bruge ledningsvand, da organismerne konserveret i 70% ethanol vil drive på overfladen. Selvom enheden er designet til at modstå fortyndet ethanol (5%), bevares de hvirvelløse prøver med 70% ethanol. Det anbefales heller ikke at arbejde med lavere koncentrationer af ethanol, da organismerne kan blive beskadiget gennem rehydrerings- og dehydreringsprocesser37. Den foreslåede løsning, som stærkt anbefales, er at skylle scanningsbakken med ferskvand flere gange efter hver scanning udført med ethanol. På den måde undgår man ophobning af bundfald, der kan ændre billedets baggrund, og beskytter scanningsbakkens glas mod korrosion.

Et andet opdaget problem er tilstedeværelsen af vignetter med flere organismer, som kan ændre størrelsesspektret på grund af undervurdering af individer af visse størrelser. Når antallet af vignetter med flere objekter er lavt (<10%), som i denne undersøgelse, har tilstedeværelsen af flere objekter en lille indflydelse på størrelsesfordelingen og NBSS'erne i disse prøver (figur 9 og figur 10). Dette indikerer, at for at opnå en repræsentativ størrelsesstruktur for makroinvertebratsamfundet er det ikke nødvendigt at investere tid i trin 1.5 i protokollen (adskillelsen af rørende organismer), for hvilken billedoparbejdningen varer ca. 1,5 timer. I stedet anbefales det stærkt at tage tid i trin 2.5 i protokollen (adskillelse af rørende organismer eller aggregater ved hjælp af en trænål), hvilket er meget mindre tidskrævende (maksimalt 30 min) og sikrer et korrekt skøn over størrelsesfordelingen i automatisk tilstand30. En mulighed for at reducere antallet af rørende organismer er at arbejde med færre organismer pr. scanning, men den tid, der investeres i at scanne en prøve i et stort antal fraktioner, og muligheden for aggregering af organismer bør tages i betragtning. En anden løsning ville være kun at bevare en delprøve, der ville gøre det muligt at beregne et repræsentativt størrelsesspektrum ved sortering af organismerne i laboratoriet i stedet for at bevare alle de organismer, der er udtaget prøver af, som det er gjort i dette arbejde. Reduktionen i antallet af organismer pr. prøve ville reducere sandsynligheden for at røre organismer. Når færre individer opbevares, indeholder prøven desuden mindre affald, hvilket letter adskillelsen, især hvis fibre kan undgås.

Den observerede begrænsning af den automatiske klassificeringsmetode er relateret til den lave forekomst af mikrokrebsdyr (kategori: andre makroinvertebrater) i de anvendte prøver. Manglen på repræsentation af mikrokrebsdyr kan påvirke deres korrekte klassificering og begrænse præcisionen af den automatiske forudsigelse for denne kategori. Ikke desto mindre præsenterer de andre kategorier, affald og makroinvertebrater, som er hovedformålet med dette arbejde, høj tilbagekaldelse og præcision. Alternativer til at bruge denne scannerenhed ville være at tilpasse en fælles scanner til at holde vandrammer, fremme open source-koder til prøvebehandling og maskinindlæring som den, der er angivet her, og skrive koder til måling af organismer under mikroskopet med et kamera eller gennem flux med et sæt kameraer. Dette er gjort ved flere lejligheder 23,24,25,26,38,39,40, men den metode, vi foreslår, regulerer scanningsparameteriseringen for at opnå sammenlignelige størrelsesestimater, hvilket er vanskeligt at kontrollere for med de andre systemer. Desuden er den foreslåede protokol og scanningsenhed klar til brug, open source og allerede etableret i det marine mesozooplanktonsamfund. Samlet set viser tilpasningen af denne protokol en lovende mulighed for at anvende denne automatiske billeddannelsesmetode til effektivt at opnå størrelsesstrukturen hos hvirvelløse ferskvandsdyr og til at teste potentialet for størrelsesmålinger til ferskvandsbiovurdering.

Subscription Required. Please recommend JoVE to your librarian.

Disclosures

Forfatterne erklærer ingen potentielle konkurrerende interesser.

Acknowledgments

Dette arbejde blev støttet af det spanske ministerium for videnskab, innovation og universiteter (bevillingsnummer RTI2018-095363-B-I00). Vi takker CERM-UVic-UCC-medlemmerne Èlia Bretxa, Anna Costarrosa, Laia Jiménez, María Isabel González, Marta Jutglar, Francesc Llach og Núria Sellarès for deres arbejde med makroinvertebratfeltprøveudtagning og laboratoriesortering og David Albesa for at samarbejde om prøvescanning. Endelig takker vi Josep Maria Gili og Institut de Ciències del Mar (ICM-CSIC) for brugen af laboratoriefaciliteterne og scannerenheden.

Materials

Name Company Catalog Number Comments
Beaker Labbox Other containers could be used
Dionized water Icopresa  8420239600123 To dilute the ethanol
Funnel Vitlab 41094
Glass vials 8 ml Labbox SVSN-C10-195 1 vial/subsample
ImageJ Software  Free access Version 4.41o/ Image processing software
Large frame Hydroptic  Provided by ZooScan 24.5 cm x 15.8 cm
Monalcol 96 (Ethanol 96) Montplet 1050JE001
Plankton Identifier Software Free access Version 1.2.6/ Automatic identification software
Sieve Cisa 26852.2 Nominal aperture 500µ and nominal aperture 0,5 cm
Tweezers Bondline B5SA Stainless, anti-magnetic, anti-acid
VueScan 9 x 64 (9.5.09) Software Hydroptic Version 9.0.51/ Sacn software
Wooden needle Any plastic or wood needle can be used
Zooprocess Software  Free access Version 7.14/Image processing software
ZooScan  Hydroptic 54 Version III/ Scanner

DOWNLOAD MATERIALS LIST

References

  1. Birk, S., et al. Three hundred ways to assess Europe's surface waters: An almost complete overview of biological methods to implement the Water Framework Directive. Ecological Indicators. 18, 31-41 (2012).
  2. Basset, A., Sangiorgio, F., Pinna, M. Monitoring with benthic macroinvertebrates: advantages and disadvantages of body size descriptors. Aquatic Conservation: Marine and Freshwater Ecosystems. 14, S43-S58 (2004).
  3. Reyjol, Y., et al. Assessing the ecological status in the context of the European Water Framework Directive: Where do we go now. Science of the Total Environment. 497-498, 332-344 (2014).
  4. Brown, J. H., Gillooly, J. F., Allen, A. P., Savage, V. M., West, G. B. Toward a metabolic theory of ecology. Ecology. 85 (7), 1771-1789 (2004).
  5. Woodward, G., et al. Body size in ecological networks. Trends in Ecology & Evolution. 20 (7), 402-409 (2005).
  6. Sprules, W. G., Barth, L. E. Surfing the biomass size spectrum: Some remarks on history, theory, and application. Canadian Journal of Fisheries and Aquatic Sciences. 73 (4), 477-495 (2016).
  7. White, E. P., Ernest, S. K. M., Kerkhoff, A. J., Enquist, B. J. Relationships between body size and abundance in ecology. Trends in Ecology & Evolution. 22 (6), 323-330 (2007).
  8. Quintana, X. D., et al. A nonparametric method for the measurement of size diversity with emphasis on data standardization. Limnology and Oceanography - Methods. 6 (1), 75-86 (2008).
  9. Blanchard, J. L., Heneghan, R. F., Everett, J. D., Trebilco, R., Richardson, A. J. From bacteria to whales: Using functional size spectra to model marine ecosystems. Trends in Ecology & Evolution. 32 (3), 174-186 (2017).
  10. Petchey, O. L., Belgrano, A. Body-size distributions and size-spectra: Universal indicators of ecological status. Biology Letters. 6 (4), 434-437 (2010).
  11. Emmrich, M., et al. Geographical patterns in the body-size structure of European lake fish assemblages along abiotic and biotic gradients. Journal of Biogeography. 41 (12), 2221-2233 (2014).
  12. Arranz, I., Brucet, S., Bartrons, M., García-Comas, C., Benejam, L. Fish size spectra are affected by nutrient concentration and relative abundance of non-native species across streams on the NE Iberian Peninsula. Science of the Total Environment. 795, 148792 (2021).
  13. Vila-Martínez, N., Caiola, N., Ibáñez, C., Benejam, L. l, Brucet, S. Normalized abundance spectra of the fish community reflect hydropeaking on a Mediterranean large river. Ecological Indicators. 97, 280-289 (2019).
  14. Benejam, L. l, Tobes, I., Brucet, S., Miranda, R. Size spectra and other size-related variables of river fish communities: systematic changes along the altitudinal gradient on pristine Andean streams. Ecological Indicators. 90, 366-378 (2018).
  15. Sutton, I. A., Jones, N. E. Measures of fish community size structure as indicators for stream monitoring programs. Canadian Journal of Fisheries and Aquatic Sciences. 77 (5), 824-835 (2019).
  16. Murry, B. A., Farrell, J. M. Resistance of the size structure of the fish community to ecological perturbations in a large river ecosystem. Freshwater Biology. 59, 155-167 (2014).
  17. Townsend, C. R., Thompson, R. M. Body size in streams: Macroinvertebrate community size composition along natural and human-induced environmental gradients. In Body Size: The Structure and Function of Aquatic Ecosystems. Hildrew, A. G., Raffaelli, D. G., Edmonds-Brown, R. , Cambridge University Press. Cambridge, UK. (2007).
  18. Gjoni, V., et al. Patterns of functional diversity of macroinvertebrates across three aquatic ecosystem types, NE Mediterranean. Mediterranean Marine Science. 20 (4), 703-717 (2019).
  19. Pomeranz, J. P. F., Warburton, H. J., Harding, J. S. Anthropogenic mining alters macroinvertebrate size spectra in streams. Freshwater Biology. 64 (1), 81-92 (2019).
  20. García-Girón, J., et al. Anthropogenic land-use impacts on the size structure of macroinvertebrate assemblages are jointly modulated by local conditions and spatial processes. Environmental Research. 204, 112055 (2022).
  21. Demi, L. M., Benstead, J. P., Rosemond, A. D., Maerz, J. C. Experimental N and P additions alter stream macroinvertebrate community composition via taxon-level responses to shifts in detrital resource stoichiometry. Functional Ecology. 33 (5), 855-867 (2019).
  22. Basset, A., et al. A benthic macroinvertebrate size spectra index for implementing the Water Framework Directive in coastal lagoons in Mediterranean and Black Sea ecoregions. Ecological Indicators. 12 (1), 72-83 (2012).
  23. Ärje, J., et al. Automatic image-based identification and biomass estimation of invertebrates. Methods in Ecology and Evolution. 11 (8), 922-931 (2020).
  24. Raitoharju, J., et al. Benchmark database for fine-grained image classification of benthic macroinvertebrates. Image and Vision Computing. 78, 73-83 (2018).
  25. Lytle, D. A., et al. Automated processing and identification of benthic invertebrate samples. Journal of the North American Benthological Society. 29 (3), 867-874 (2010).
  26. Serna, J. P., Fernández, D. S., Vélez, F. J., Aguirre, N. J. An image processing method for recognition of four aquatic macroinvertebrates genera in freshwater environments in the Andean region of Colombia. Environmental Monitoring and Assessment. 192, 617 (2020).
  27. Gorsky, G., et al. Digital zooplankton image analysis using the ZooScan integrated system. Journal of Plankton Research. 32 (3), 285-303 (2010).
  28. Marcolin, C. R., Schultes, S., Jackson, G. A., Lopes, R. M. Plankton and seston size spectra estimated by the LOPC and ZooScan in the Abrolhos Bank ecosystem (SE Atlantic). Continental Shelf Research. 70, 74-87 (2013).
  29. Silva, N., Marcolin, C. R., Schwamborn, R. Using image analysis to assess the contributions of plankton and particles to tropical coastal ecosystems. Estuarine, Coast and Shelf Science. 219, 252-261 (2019).
  30. Vandromme, P., et al. Assessing biases in computing size spectra of automatically classified zooplankton from imaging systems: A case study with the ZooScan integrated system. Methods in Oceanography. 1-2, 3-21 (2012).
  31. Naito, A., et al. Surface zooplankton size and taxonomic composition in Bowdoin Fjord, north-western Greenland: A comparison of ZooScan, OPC and microscopic analyses. Polar Science. 19, 120-129 (2019).
  32. García-Comas, C., Picheral, E. Zooprocess/Plankton Identifier protocol for computer assisted zooplankton sorting. , Available from: https://manualzz.com/doc/43116355/zooprocess—plankton-identifier-protocol-for (2013).
  33. Picheral, E. ZooSCAN: Manual to scan and process samples. Quantitative Imaging Platform of Villefranche sur Mer (PlQv). , Available from: http://www.hydroptic.com/assets/uploads/files/documentations/ae4e0-zooscan_user_manual.pdf (2020).
  34. Protocolo de muestreo y laboratorio de fauna bentónica de invertebrados en ríos vadeables. CÓDIGO: ML-Rv-I-2013. Ministerio de Agricultura, Alimentación y Medio Ambiente. , Available from: https://www.miteco.gob.es/es/agua/temas/estado-y-calidad-de-las-aguas/ML-Rv-I-2013_Muestreo%20y%20laboratorio_Fauna%20bent%C3%B3nica%20de%20de%20invertebrado_%20R%C3%Ados%20vadeables_24_05_2013_tcm30-175284.pdf (2013).
  35. García-Comas, C., et al. Prey size diversity hinders biomass trophic transfer and predator size diversity promotes it in planktonic communities. Proceedings of the Royal Society Biological Sciences. 283 (1824), 20152129 (2016).
  36. García-Comas, C., et al. Mesozooplankton size structure in response to environmental conditions in the East China Sea: How much does size spectra theory fit empirical data of a dynamic coastal area. Progress in Oceanography. 121, 141-157 (2014).
  37. Marquina, D., Buczek, M., Ronquist, F., Lukasik, P. The effect of ethanol concentration on the morphological and molecular preservation of insects for biodiversity studies. PeerJ. 9, 10799 (2021).
  38. Bell, J. L., Hopcroft, R. R. Assessment of ZooImage as a tool for the classification of zooplankton. Journal of Plankton Research. 30 (12), 1351-1367 (2008).
  39. Colas, F., et al. The ZooCAM, a new in-flow imaging system for fast onboard counting, sizing and classification of fish eggs and metazooplankton. Progress in Oceanography. 166, 54-65 (2018).
  40. Bachiller, E., Fernandes, J. A., Irigoien, X. Improving semiautomated zooplankton classification using an internal control and different imaging devices. Limnology and Oceanography Methods. 10 (1), 1-9 (2012).

Tags

Miljøvidenskab nr. 191
Automatisk billedbehandling til bestemmelse af strukturen i Fællesskabets størrelse af makroinvertebrater i floder
Play Video
PDF DOI DOWNLOAD MATERIALS LIST

Cite this Article

Gurí, R., Arranz, I., Ordeix,More

Gurí, R., Arranz, I., Ordeix, M., García-Comas, C. Automatic Image Processing to Determine the Community Size Structure of Riverine Macroinvertebrates. J. Vis. Exp. (191), e64320, doi:10.3791/64320 (2023).

Less
Copy Citation Download Citation Reprints and Permissions
View Video

Get cutting-edge science videos from JoVE sent straight to your inbox every month.

Waiting X
Simple Hit Counter