Environment

Elaborazione automatica delle immagini per determinare la struttura delle dimensioni della comunità dei macroinvertebrati fluviali

Published: January 13, 2023 doi: 10.3791/64320

Rosa Gurí^1,4, Ignasi Arranz^2,4, Marc Ordeix^1,4, Carmen García-Comas^3,4

¹Center for the Study of Mediterranean Rivers (CERM), Universitat de Vic - Universitat Central de Catalunya, ²Laboratoire Evolution et Diversité Biologique (EDB), UMR5174, Université Toulouse 3 Paul Sabatier, Centre national de la recherche scientifique (CNRS), Institut de Recherche pour le Développement (IRD), ³Department of Marine Biology and Oceanography, Institut de Ciències del Mar, Consejo Superior de Investigaciones Científicas (CSIC), ⁴Aquatic Ecology Group, Universitat de Vic - Universitat Central de Catalunya

Summary

L'articolo si basa sulla creazione di un protocollo adattato per scansionare, rilevare, ordinare e identificare oggetti digitalizzati corrispondenti a macroinvertebrati fluviali bentonici utilizzando una procedura di imaging semiautomatica. Questa procedura consente l'acquisizione delle distribuzioni dimensionali individuali e delle metriche dimensionali di una comunità di macroinvertebrati in circa 1 ora.

Abstract

La dimensione corporea è un importante tratto funzionale che può essere utilizzato come bioindicatore per valutare gli impatti delle perturbazioni nelle comunità naturali. La struttura delle dimensioni della comunità risponde ai gradienti biotici e abiotici, comprese le perturbazioni antropogeniche tra taxa ed ecosistemi. Tuttavia, la misurazione manuale di organismi di piccole dimensioni come i macroinvertebrati bentonici (ad esempio, >da 500 μm a pochi centimetri di lunghezza) richiede molto tempo. Per accelerare la stima della struttura delle dimensioni della comunità, qui, abbiamo sviluppato un protocollo per misurare semi-automaticamente le dimensioni corporee individuali dei macroinvertebrati fluviali conservati, che sono uno dei bioindicatori più comunemente usati per valutare lo stato ecologico degli ecosistemi di acqua dolce. Questo protocollo è adattato da una metodologia esistente sviluppata per scansionare il mesozooplancton marino con un sistema di scansione progettato per campioni d'acqua. Il protocollo consiste in tre fasi principali: (1) scansione di sottocampioni (frazioni di dimensioni del campione fini e grossolane) di macroinvertebrati fluviali ed elaborazione delle immagini digitalizzate per individualizzare ogni oggetto rilevato in ciascuna immagine; (2) creare, valutare e convalidare un set di apprendimento attraverso l'intelligenza artificiale per separare semi-automaticamente le singole immagini di macroinvertebrati da detriti e artefatti nei campioni scansionati; e (3) raffigurando la struttura dimensionale delle comunità di macroinvertebrati. Oltre al protocollo, questo lavoro include i risultati della calibrazione ed elenca diverse sfide e raccomandazioni per adattare la procedura ai campioni di macroinvertebrati e da considerare per ulteriori miglioramenti. Nel complesso, i risultati supportano l'uso del sistema di scansione presentato per la misurazione automatica delle dimensioni corporee dei macroinvertebrati fluviali e suggeriscono che la rappresentazione del loro spettro dimensionale è uno strumento prezioso per la rapida biovalutazione degli ecosistemi di acqua dolce.

Introduction

I macroinvertebrati bentonici sono ampiamente utilizzati come bioindicatori per determinare lo stato ecologico dei corpi idrici¹. La maggior parte degli indici per descrivere le comunità di macroinvertebrati si concentra su metriche tassonomiche. Tuttavia, i nuovi strumenti di biovalutazione che integrano le dimensioni corporee sono incoraggiati a fornire una prospettiva alternativa o complementare agli approcci tassonomici ^2,3.

La dimensione del corpo è considerata un metatratto correlato ad altri tratti vitali come il metabolismo, la crescita, la respirazione e il movimento⁴. Inoltre, le dimensioni del corpo possono determinare la posizione trofica e le interazioni⁵. La relazione tra le dimensioni corporee individuali e la biomassa normalizzata (o abbondanza) per classe dimensionale in una comunità è definita come lo spettro dimensionale⁶ e segue il modello generale di una diminuzione lineare della biomassa normalizzata all'aumentare delle dimensioni individuali su una scala logaritmica⁷. La pendenza di questa relazione lineare è stata ampiamente studiata teoricamente e studi empirici attraverso gli ecosistemi l'hanno utilizzata come indicatore ecologico della struttura dimensionale della comunità⁴. Un altro indicatore sintetico della struttura dimensionale della comunità che è stato utilizzato con successo negli studi sul funzionamento della biodiversità-ecosistema è la diversità delle dimensioni della comunità, che è rappresentata come l'indice di Shannon delle classi dimensionali dello spettro dimensionale o il suo analogo, che viene calcolato in base alle distribuzioni dimensionali individuali⁸.

Negli ecosistemi di acqua dolce, la struttura dimensionale di diversi gruppi faunistici viene utilizzata come indicatore atassico per valutare la risposta delle comunità biotiche ai gradienti ambientali 9,10,11 e alle perturbazioni antropogeniche 12,13,14,15,16. I macroinvertebrati non fanno eccezione, e la loro struttura dimensionale risponde anche ai cambiamenti ambientali^17,18 e alle perturbazioni antropogeniche, come l'estrazione mineraria ¹⁹, l'uso del suolo 20, o l'arricchimento di azoto (N) e fosforo (P)^20,21,22. Tuttavia, misurare centinaia di individui per descrivere la struttura delle dimensioni della comunità è un compito noioso e dispendioso in termini di tempo che viene spesso evitato come misurazione di routine nei laboratori a causa della mancanza di tempo. Pertanto, sono stati sviluppati diversi metodi di imaging semiautomatici o automatici per classificare e misurare i campioni^23,24,25,26. Tuttavia, la maggior parte di questi metodi sono focalizzati sulla classificazione tassonomica più che sulla dimensione individuale degli organismi e non sono pronti per l'uso per tutti i tipi di macroinvertebrati. Nell'ecologia del plancton marino, un sistema di analisi delle immagini a scansione è stato ampiamente utilizzato per determinare le dimensioni e la composizione tassonomica delle comunità di zooplancton 27,28,29,30,31. Questo strumento può essere trovato in diversi istituti marini in tutto il mondo e viene utilizzato per scansionare campioni di zooplancton conservati per ottenere immagini digitali ad alta risoluzione dell'intero campione. Il presente protocollo adatta l'uso di questo strumento per stimare lo spettro dimensionale della comunità di macroinvertebrati nei fiumi in modo rapido e automatico senza investire nella creazione di un nuovo dispositivo.

Il protocollo consiste nella scansione di un campione e nell'elaborazione dell'intera immagine per ottenere automaticamente singole immagini (cioè vignette) degli oggetti nel campione. Diverse misure di forma, dimensioni e caratteristiche di livello di grigio caratterizzano ogni oggetto e consentono la classificazione automatica degli oggetti in categorie, che vengono poi convalidate da un esperto. La dimensione individuale di ciascun organismo viene calcolata utilizzando il biovolume ellissoidale (mm³), che deriva dall'area dell'organismo misurata in pixel. Ciò consente di ottenere rapidamente lo spettro dimensionale del campione. Per quanto ne sappiamo, questo sistema di imaging a scansione è stato utilizzato solo per elaborare campioni di mesozooplancton, ma il dispositivo potrebbe potenzialmente consentire di lavorare con macroinvertebrati bentonici d'acqua dolce.

L'obiettivo generale di questo studio è, quindi, quello di introdurre un metodo per ottenere rapidamente la dimensione individuale dei macroinvertebrati fluviali conservati adattando un protocollo esistente precedentemente utilizzato con mesozooplancton marino 27,32,33. La procedura consiste nell'utilizzare un approccio semi-automatico che opera con un dispositivo di scansione per scansionare campioni d'acqua e tre software aperti per elaborare le immagini scansionate. Viene qui presentato un protocollo adattato per scansionare, rilevare e identificare i macroinvertebrati fluviali digitalizzati per acquisire automaticamente la struttura delle dimensioni della comunità e le relative metriche dimensionali. La valutazione della procedura e le linee guida per migliorare l'efficienza sono presentate anche sulla base di 42 immagini scansionate di campioni di macroinvertebrati fluviali raccolti da tre bacini nella penisola iberica nord-orientale (NE) (Ter, Segre-Ebre e Besòs).

I campioni sono stati raccolti in tratti fluviali di 100 m seguendo il protocollo per il campionamento sul campo e l'analisi di laboratorio di macroinvertebrati fluviali bentonici in fiumi guadabili dal governo spagnolo³⁴. I campioni sono stati raccolti con un campionatore surber (telaio: 0,3 m x 0,3 m, maglia: 250 μm) a seguito di un'indagine multi-habitat. In laboratorio, i campioni sono stati puliti e setacciati attraverso una maglia di 5 mm e una maglia di 500 μm per ottenere due sottocampioni: un sottocampione grossolano (maglia da 5 mm) e un sottocampione fine (maglia da 500 μm), che sono stati conservati in fiale separate e conservati in etanolo al 70%. La separazione del campione in due frazioni dimensionali consente una migliore stima della struttura dimensionale della comunità, poiché gli organismi di grandi dimensioni sono più rari e meno degli organismi piccoli. In caso contrario, il campione scansionato ha una rappresentazione distorta della frazione di grandi dimensioni.

Subscription Required. Please recommend JoVE to your librarian.

Protocol

NOTA: Il protocollo qui descritto si basa sul sistema sviluppato da Gorsky et ^al.27 per il mesozooplancton marino. Una descrizione specifica dello scanner (ZooSCAN), del software di scansione (VueScan 9x64 [9.5.09]), del software di elaborazione delle immagini (Zooprocess, ImageJ) e del software di identificazione automatica (Plankton Identifier) si trova nei riferimenti precedenti^32,33. Per regolare al meglio le dimensioni dei macroinvertebrati bentonici rispetto al mesozooplancton, una volta creato il progetto seguendo il protocollo originale^32,33, modificare il parametro di dimensione minima (minsizeesd_mm) a ^0,3 mm e il parametro di dimensione massima (maxsizeesd_mm) a 100 mm nel file di configurazione. Per facilitare il rispetto del protocollo, questo è riassunto in un diagramma di lavoro (Figura 1). Il progetto creato viene memorizzato nella cartella C del computer ed è organizzato nelle seguenti cartelle: PID_process, Zooscan_back, Zooscan_check, Zooscan_config, Zooscan_meta, Zooscan_results e Zooscan_scan. Ogni cartella è composta da diverse sottocartelle che le diverse applicazioni software utilizzano nei passaggi successivi del protocollo.

1. Acquisizione di immagini digitali per campioni di macroinvertebrati

Scansione ed elaborazione del pezzo vuoto
NOTA: creare due immagini vuote al giorno prima della scansione per estrarre le scansioni in background durante l'elaborazione delle immagini acquisite nello stesso giorno.
1. Accendere lo scanner e accendere la luce in doppia posizione per proiettare luce bianca dall'alto e dal basso.
  NOTA: Quando si esegue la scansione di campioni di mesozooplancton, viene utilizzata la direzione della luce verso l'alto, ma poiché i macroinvertebrati sono più opachi, si consiglia di passare la luce in una posizione doppia.
2. Pulire e sciacquare il vassoio di scansione con acqua di rubinetto.
3. Versare 110 ml di acqua di rubinetto conservata a temperatura ambiente (RT) nel vassoio di scansione fino a coprire il bicchiere. Posizionare la cornice grande (24,5 cm x 15,8 cm) sul vassoio di scansione nella posizione corretta (con l'angolo nella parte superiore sinistra del vassoio di scansione) e riempirla con acqua di rubinetto fino a coprire il gradino della cornice per evitare un effetto menisco, che altererebbe l'immagine acquisita. Chiudere il coperchio dello scanner.
  NOTA: Utilizzare acqua in RT per evitare la formazione di condensa e bolle. Pulire il telaio senza segni o goccioline per evitare riflessi di luce.
4. Vai al software di elaborazione delle immagini, seleziona il progetto di lavoro e fai clic su Scansione (Converti) immagine di sfondo.
5. Vai al software di scansione e fai clic su Anteprima. Assicurati di visualizzare l'anteprima dell'immagine acquisita, controlla che non ci siano linee o macchie e attendi almeno 30 secondi prima di iniziare un'altra scansione. Fare clic su Scansione e premere OK nella finestra delle istruzioni prima della seconda scansione per inviare i dati dal software di scansione al software di elaborazione delle immagini.
  NOTA: eseguire la scansione due volte per ottenere le due scansioni in background che comporranno lo spazio vuoto. Questo passaggio viene eseguito una volta al giorno prima di iniziare l'elaborazione del campione e le immagini vengono archiviate nella cartella Zooscan_back.
6. Chiudere il software di scansione al termine della scansione.
Preparazione e scansione dei campioni
ATTENZIONE: L'etanolo è un liquido infiammabile e potrebbe causare gravi danni agli occhi / irritazione.
1. Compilare i metadati di esempio. Vai al software di elaborazione delle immagini e seleziona Compila metadati di esempio. Immettere l'identità di esempio, fare clic su OK e compilare i metadati.
  NOTA: il metafile è stato creato appositamente per i campioni di mesozooplancton, quindi non si adatta alla metodologia di campionamento dei macroinvertebrati bentonici, ma tutti i campi del file devono essere compilati prima della scansione, altrimenti verrà visualizzato un flag di errore.
2. Versare 110 ml di etanolo al 70% nel vassoio di scansione fino a coprire il vetro e posizionare il telaio grande (24,5 cm x 15,8 cm) con l'angolo nella parte superiore sinistra del vassoio di scansione.
  NOTA: Lavorare con etanolo invece di acqua, poiché i macroinvertebrati sono conservati in etanolo. In acqua, galleggiano e vanno alla deriva nel vassoio di scansione, impedendo un'immagine nitida e, quindi, misurazioni affidabili delle dimensioni. L'etanolo deve essere conservato a RT per evitare la formazione di condensa e bolle.
3. Versare il campione di macroinvertebrati nel vassoio di scansione bordato dal telaio e coprire il passo del telaio con più etanolo, se necessario.
  NOTA: Astenersi dall'aggiungere troppo etanolo per evitare che gli organismi fluttuino e vadano alla deriva.
4. Omogeneizzare il campione in tutta l'area del telaio, posizionando gli individui più grandi al centro del vassoio per una corretta elaborazione delle immagini e affondare gli organismi galleggianti usando un ago di legno.
  NOTA: Se un sottocampione contiene numericamente più di 1.000 individui, dividere il sottocampione in due o più frazioni per ridurre al minimo il contatto con gli organismi nell'immagine scansionata e scansionare le frazioni separatamente.
5. Separare gli organismi che toccano e gli organismi che toccano i bordi del telaio usando l'ago di legno.
  NOTA: questo passaggio richiede 5-20 minuti. Gli organismi che toccano sono considerati un singolo oggetto dal software; Pertanto, in questi casi, le dimensioni individuali calcolate non corrispondono a singoli organismi effettivi e possono influenzare la stima della struttura dimensionale della Comunità. C'è la possibilità di modificare l'immagine con il software di elaborazione delle immagini per separarli, ma questo passaggio aggiuntivo comporta almeno 1,5 ore di rielaborazione; Pertanto, la separazione manuale è altamente raccomandata.
6. Per eseguire la scansione del campione, chiudere il coperchio dello scanner, accedere al software di elaborazione delle immagini, selezionare il progetto funzionante e fare clic su SCAN Sample with Zooscan (For Archive, No Process).
7. Selezionare l'esempio e seguire le istruzioni.
8. Vai al software di scansione e fai clic su Anteprima. Assicurati di visualizzare l'anteprima dell'immagine acquisita, controlla che non ci siano linee o punti e attendi almeno 30 secondi prima di iniziare un'altra scansione.
9. Dopo almeno 30 secondi, fare clic sul pulsante Scansione nel software di scansione.
  NOTA: premere OK nel software di elaborazione delle immagini dopo aver premuto Scan nel software di scansione. Non premere alcun tasto sulla tastiera del computer ed evitare le vibrazioni della scansione durante la scansione. Nella cartella Zooscan_scan > _raw vengono generati tre file: (i) un formato di file immagine con tag (.tif) (16 bit); ii) un documento di testo standard denominato LOG (.txt) che registra le informazioni sui parametri di scansione; e iii) un documento di testo standard denominato META (.txt) con informazioni sui metodi di campionamento.
10. Verificare che la scansione raw sia corretta.
  NOTA: se la scansione presenta strisce chiare o altri problemi visibili, è consigliabile ripetere la scansione per evitare problemi nei passaggi seguenti.
Recupero del campione
1. Rimuovere il telaio e sciacquarlo sopra il vassoio di scansione utilizzando una bottiglia di spremitura riempita con etanolo al 70% per recuperare eventuali macroinvertebrati attaccati.
2. Sollevare la parte superiore dello scanner per recuperare tutti gli organismi e l'etanolo dal vassoio attraverso l'imbuto di recupero della scansione in un becher. Con la parte superiore dello scanner ancora sollevata, sciacquare il vassoio con il flacone di spremitura per spazzare via eventuali organismi rimanenti.
3. Far passare i campioni e l'etanolo dal becher attraverso una maglia da 500 μm per trattenere gli invertebrati nella rete e conservarli in una fiala con etanolo al 70%.
4. Una volta recuperati tutti i campioni nel flaconcino, pulire il vassoio con acqua di rubinetto.
  NOTA: lavare il vassoio con acqua di rubinetto tra i campioni per ridurre al minimo la precipitazione di etanolo, che altera l'elaborazione delle immagini. Risciacquare il telaio con acqua di rubinetto per evitare potenziali danni legati all'uso di etanolo. Alla fine della giornata, pulire il vassoio con acqua di rubinetto e asciugarlo delicatamente con carta per evitare graffi.
Elaborazione di immagini
1. Vai al software di elaborazione delle immagini e seleziona Converti ed elabora immagini e organismi in modalità batch, quindi Converti ed elabora immagine E particelle (immagine nella cartella RAW). Mantenere le impostazioni predefinite e fare clic su OK. NORMAL END apparirà alla fine del processo.
  NOTA: Nella cartella Zooscan_scan > _work verranno creati un file PID e le vignette corrispondenti a tutti gli oggetti rilevati nell'immagine acquisita (in un file Joint Photographic Group [.jpg]). Un file PID è un singolo file che memorizza tutti i metadati (metafile), i dati tecnici associati al file di registro e una tabella con 36 variabili misurate di tutti gli oggetti rilevati nell'immagine. Le variabili misurate corrispondono a diverse stime del livello di grigio, della dimensione frattale, della forma e delle dimensioni. Le variabili che possono essere utilizzate per la stima delle dimensioni sono l'area e gli assi maggiore e minore di un'ellisse con un'area uguale all'oggetto (vedere la sezione 3 del protocollo). Il tempo di elaborazione dipende dalla densità dell'immagine e dalle caratteristiche del computer e può essere avviato tra i campioni durante il recupero e la preparazione del campione successivo. In caso contrario, si consiglia di avviare l'elaborazione dei campioni scansionati ogni giorno in modalità batch durante la notte e verificare la corretta elaborazione delle immagini la mattina successiva.
2. Verificare se lo sfondo dell'immagine elaborata viene sottratto in modo appropriato dall'immagine campione utilizzando il software di elaborazione delle immagini o controllando le immagini maschera (terminate in msk1.gif) situate in Zooscan_scan > _work. Se lo sfondo contiene aree sature o molti punti, è consigliabile ripetere la scansione per garantire immagini di alta qualità.
  NOTA: per evitare aree sature sullo sfondo, il vassoio di scansione deve essere risciacquato con acqua di rubinetto dopo ogni scansione con etanolo. È anche importante (1) ridurre il numero di individui scansionati (frazionando il campione e scansionando in pieghe diverse); (2) assicurarsi che i grandi organismi siano posizionati al centro del vassoio di scansione; 3) utilizzare etanolo pulito e filtrato; (4) ridurre la sporcizia sui campioni; 5) garantire che il volume di etanolo per la scansione sia adeguato; e (6) assicurarsi che il ritardo tra l'anteprima del campione e la scansione sia di almeno 30 s.
Separazione degli organismi che toccano
NOTA: Quando ci sono diverse vignette con organismi che toccano, è necessario separare le immagini degli organismi che toccano da altri organismi e / o da fibre / detriti per garantire una corretta stima della struttura delle dimensioni della comunità.
1. Vai al software di elaborazione delle immagini per rilevare le vignette con più oggetti. Selezionare SEPARAZIONE mediante vignette e premere OK. Nella finestra di selezione della configurazione, mantenere le impostazioni predefinite e fare clic su OK.
2. Nella finestra SEPARAZIONE da VIGNETTE, mantenere le impostazioni predefinite, selezionare inoltre AGGIUNGI contorni su vignette, quindi selezionare il campione da modificare.
3. Separare gli organismi in contatto in ogni vignetta che si apre disegnando una linea con il mouse (premere il pulsante di rotazione per disegnare). Una volta completata la separazione in una vignetta, fare clic sul pulsante X nell'angolo superiore destro della finestra e premere SÌ per elaborare quella successiva. Premere NO per terminare e salvare le modifiche. Alla fine del processo, apparirà NORMAL END se tutto è corretto.
4. Dopo la separazione, rielaborare l'immagine per ottenere i dati dell'oggetto aggiornati. Vai al software di elaborazione delle immagini, fai clic su PROCESS (Converted) Image (Process One) e seleziona Process Again Particles from Processed Images in WORK Sub-Folders. Selezionare l'esempio e, nella finestra Processo immagine singola , mantenere le impostazioni predefinite, selezionare Lavora con maschera di separazione (CREATE-MODIFY-INCLUDE), quindi fare clic su OK. Alla fine del processo, apparirà NORMAL END se tutto è corretto.
5. Nella finestra Controllo separazione , premere OK per salvare l'immagine con i contorni prima dell'elaborazione; Se esiste un'immagine precedente, verrà sostituita.
6. Nella finestra Maschera di controllo di separazione , se necessario, selezionare MODIFICA per aggiungere linee di separazione alla maschera utilizzando il mouse per separare gli organismi in contatto che non sono apparsi prima nel passaggio di separazione utilizzando vignette. Al termine, terminare il processo e, nella finestra Controllo maschera di separazione , selezionare SÌ per accettare la maschera. Alla fine del processo, apparirà NORMAL END se tutto è corretto.
  NOTA: la rielaborazione di un campione con una maschera di separazione richiede molto tempo (potrebbe richiedere più di 1,5 ore per campione). È preferibile dedicare il tempo richiesto al punto 1.2.5 per evitare questo passaggio aggiuntivo.

2. Riconoscimento automatico degli oggetti

NOTA: Creare un set di apprendimento per prevedere automaticamente l'identità degli oggetti rilevati, separando così gli organismi dai detriti nel campione.

Creazione di set di apprendimento
1. Copiare le immagini e i file .pid associati alle immagini che verranno utilizzati per creare le categorie del set di apprendimento da Zooscan_scan > _work a PID_process > Unsorted_vignettes_pid.
  NOTA: Selezionare un sottoinsieme di campioni con un'elevata diversità di taxa e diversi siti di campionamento e/o stagioni di campionamento per garantire la massima rappresentatività degli organismi nei campioni.
2. Nella cartella PID_process > Learning set, crea una sottocartella con il nome del nuovo set di apprendimento (ad esempio, yyyymmdd_raw_LS) e, al suo interno, crea le sottocartelle che corrisponderanno a ciascuna categoria del set di apprendimento (ad esempio, macroinvertebrati, detriti, altri invertebrati).
  NOTA: Per ottenere in modo efficiente la struttura delle dimensioni della comunità dei campioni di macroinvertebrati fluviali, si consiglia di utilizzare un set di apprendimento basato su sole tre categorie: macroinvertebrati, altri invertebrati e detriti. Questo set di apprendimento separa fondamentalmente le vignette di oggetti corrispondenti agli organismi da quelli corrispondenti ai detriti (ad esempio, fibre, particelle o alghe filamentose).
3. Accedere al software di elaborazione delle immagini (solo modalità avanzata) e scegliere EXTRACT Vignettes for PLANKTON IDENTIFIER (unsorted vignettes for training). Mantenete le opzioni predefinite e selezionate la casella Aggiungi contorni .
4. Andare al software di identificazione automatica, fare clic su Apprendimento, selezionare da PID_process > Learning_set la sottocartella creata per il nuovo set di apprendimento (passaggio 2.1.2) e premere OK.
5. Nella sezione sinistra (Pollici non ordinati) della finestra aperta, selezionare la cartella Unsorted vignettes_pid. Selezionare le vignette e trascinarle con il mouse dai pollici non ordinati alla cartella della categoria corrispondente nella sezione destra, Pollici ordinati, per classificare ciascun oggetto nelle categorie definite. Le vignette spostate saranno contrassegnate con una X rossa.
  NOTA: definire manualmente le categorie creando sottocartelle nella cartella dei pollici ordinati o crearle facendo clic sull'icona delle cartelle nel software. Non spostare più di 50 vignette contemporaneamente.
6. Una volta completate tutte le categorie con gli oggetti selezionati (circa 300 oggetti per categoria), clicca su Crea file di apprendimento e salvalo con il nome desiderato.
  NOTA: il set di apprendimento verrà salvato come file .pid nella cartella PID_process > Learning set del progetto. Si consiglia di creare e testare diversi set di apprendimento con diversi livelli di categorie (dalle forme grossolane a quelle fini) e con un diverso equilibrio del numero di oggetti all'interno di ciascuna categoria. Inizia con un set di apprendimento grossolano con un numero basso di categorie e almeno 50 oggetti per categoria, quindi aumenta il numero di oggetti in ogni categoria e / o crea set di apprendimento più fini. Una categoria dovrebbe essere rappresentativa della sua variabilità nell'insieme dei campioni.
Valutazione del set di apprendimento
NOTA: Eseguire la convalida incrociata con due pieghe e cinque prove utilizzando il metodo Random Forest con il software di identificazione automatica per ottenere una matrice di confusione della classificazione risultante degli oggetti.
1. Vai al software di classificazione automatica e fai clic su Analisi dei dati.
2. In Seleziona file di apprendimento, selezionare il file del set di apprendimento creato da PID_process > Set di apprendimento.
3. In Selezionare un metodo scegliere il metodo Foresta casuale a convalida incrociata . In Variabili originali, deselezionate le variabili di posizione (X, Y, XM, YM, BX, BY e Height). In Variabili personalizzate, selezionare solo ESD.
  NOTA: questo metodo utilizza una parte casuale del set di apprendimento per riconoscere l'altra parte (due pieghe) e questo viene ripetuto cinque volte per garantire che sia statisticamente robusto.
4. Fare clic su Avvia analisi e salvare i risultati come Analysis_name.txt nella cartella PID_process > Previsione. Quando l'analisi è stata completata correttamente, uscire dall'analisi dei dati.
5. Vai alla cartella PID_process > Prediction e fai clic sul file di convalida incrociata. Apparirà una finestra con la matrice di confusione della classificazione vera (righe) rispetto alla classificazione automatica (colonne).
  NOTA: Il richiamo è la percentuale di organismi appartenenti a un gruppo che è stato automaticamente ben riconosciuto, mentre 1-precisione è la percentuale di organismi classificati dall'algoritmo come gruppo che non è riconosciuto (contaminazione in un gruppo). Il richiamo dovrebbe essere superiore al 70% e la contaminazione (precisione 1) dovrebbe essere inferiore al 20%.
6. Ripetere i passaggi 2.1-2.5 se sono stati creati diversi set di apprendimento e si devono ottenere il richiamo e la precisione 1 di ciascuno.
  NOTA: Se sono stati creati diversi set di apprendimento, scegliere quello con il maggior richiamo (buon riconoscimento) e precisione (bassa contaminazione) del gruppo di interesse (cioè macroinvertebrati) per testare la previsione automatica di un set di campioni nella fase successiva.
Predizione dell'identificazione di macroinvertebrati
NOTA: utilizzare il set di apprendimento selezionato per stimare l'identità di tutti gli oggetti in un sottoinsieme di campioni utilizzando il software di identificazione automatica con un algoritmo di foresta casuale.
1. Vai al software di identificazione automatica e fai clic su Analisi dei dati.
2. In Seleziona file di apprendimento selezionare il file del set di apprendimento da PID_process > set di apprendimento che deve essere utilizzato per la stima.
3. In Seleziona file di esempio, selezionare dalla cartella PID_results i campioni (file PID) che verranno previsti.
  NOTA: elaborare un massimo di 20 file pid contemporaneamente per evitare errori relativi a problemi di memoria. Se vengono elaborati troppi file .pid contemporaneamente, il processo mostrerà una fine corretta ma potrebbe non essere elaborato correttamente e potrebbe verificarsi un errore nei passaggi successivi durante l'elaborazione con il software di elaborazione delle immagini.
4. In Selezionare un metodo scegliere il metodo Foresta casuale . Selezionare Salva risultati dettagliati per ogni campione. In Variabili originali, deselezionare le variabili di posizione (X, Y, XM, YM, BX, BY e Altezza). In Variabili personalizzate, selezionare solo ESD.
5. Fare clic su Avvia analisi e salvare i risultati come Analysis_name.txt nella cartella PID_process > Previsione.
Convalida manuale
NOTA: un esperto convalida manualmente la previsione del passaggio precedente per riclassificare gli oggetti classificati erroneamente nella categoria corretta.
1. Copiare i file di Analysis_sample_dat1.txt da convalidare dalla cartella PID_process > Prediction alla cartella PID_process > Pid_results.
2. Vai al software di elaborazione delle immagini e seleziona ESTRAI vignette in cartelle in base a PREDICTION o VALIDATION. Quindi, selezionare Usa file PREDICTED dalla cartella "pid_results". Mantenere le impostazioni predefinite e premere OK.
3. Il software crea una cartella chiamata sample_yyyymmdd_hhmm_to_validate con gli oggetti previsti nella cartella PID_process > vignette ordinate.
4. Passare alla cartella PID_process > Vignette ordinate e copiare la cartella sample_yyyymmdd_ hhmm_to_validate. Sostituire il nome della cartella _to convalidare con _validated.
5. Per convalidare manualmente la classificazione automatica, aprire il sample_yyyymmdd_ hhmm_validated della cartella ed esaminare tutte le vignette di ogni sottocartella (categoria) per identificare se sono presenti oggetti classificati in modo errato. Quando un oggetto è classificato in modo errato, trascinare la vignetta utilizzando il mouse sulla cartella (categoria) corretta.
6. Vai al software di elaborazione delle immagini e seleziona CARICA identificazioni da vignette ordinate. Mantieni le impostazioni predefinite e seleziona yyyymmdd_hhmm_name_validated da elaborare.
7. Passare a PID_process > Pid_results > Dat1_validated, dove sono stati creati un file denominato Id_from_sorted_vignettes_yyyymmdd_hhmm.txt e un file di .txt per ciascuno degli esempi convalidati (sample_tot_1_dat1.txt).
  NOTA: questi file .txt contengono una nuova colonna che presenta la previsione, denominata pred_valid_Id_yyyymmdd_hhmm, che specifica la classificazione di esperti di ciascun oggetto (ad esempio, la classificazione convalidata). Nuove categorie (ad esempio, categorie tassonomiche più fini) potrebbero essere create a questo punto, durante la convalida. Tuttavia, mantenere il nome della categoria originale nel nuovo nome (ad esempio, macroinvertebrate_chironomidae). Ciò consente di ripercorrere la categoria originale quando si calcola il richiamo e la precisione e di raggruppare facilmente tutti i macroinvertebrati per calcolare i parametri della struttura dimensionale della comunità (cioè lo spettro dimensionale e la diversità dimensionale). Il file di testo fornisce i dati associati a ciascun oggetto, inclusi gli assi minore e maggiore utilizzati per ottenere il volume ellissoidale di ciascun organismo come misura delle dimensioni corporee individuali. Inoltre, le ultime due colonne della tabella contengono le categorie previste e validate di ciascun oggetto (riga), che consentono di calcolare, per categoria, il richiamo e la precisione del set di apprendimento sul sottoinsieme di campioni.

Figura 1: Diagramma di lavoro che rappresenta la sezione 1 e la sezione 2 del protocollo. I tempi sono illustrativi e potrebbero cambiare a seconda del computer, dell'abbondanza di vignette da elaborare e del numero di categorie del set di apprendimento. Questo caso corrisponde alla convalida di un set di apprendimento di tre categorie su un set di 42 sottocampioni (in totale, 47.473 vignette). Fare clic qui per visualizzare una versione ingrandita di questa figura.

3. Calcolo della distribuzione delle dimensioni individuali, degli spettri delle dimensioni e delle metriche delle dimensioni

NOTA: i calcoli menzionati in questa sezione sono stati eseguiti utilizzando Matlab (vedere lo script come file supplementare 1).

Distribuzione dimensionale individuale
1. L'ultima colonna del file Id_from_sorted_vignettes_YYYYMMDD_HHHH.txt contiene la classificazione convalidata degli oggetti. Selezionare solo gli oggetti classificati come macroinvertebrati per rappresentare la loro distribuzione dimensionale individuale nel campione.
  NOTA: La dimensione corporea individuale corrisponde al volume ellissoidale degli organismi macroinvertebrati. Il sistema fornisce misurazioni in pixel.
2. Concatenare i vettori con le misure dimensionali di entrambe le scansioni, perché ogni frazione ha un diverso esponente di sottocampionamento. Prima della concatenazione, correggere il frazionamento replicando i vettori di dimensione tutte le volte che il sottocampione corrispondente è stato frazionato.
  NOTA: questo passaggio è necessario se una scansione corrisponde a una frazione di un campione (cioè grossolana o fine).
3. Calcola il volume ellissoidale dagli assi maggiore (M) e minore (m) degli ellissoidi prolati con le stesse aree di pixel degli organismi. Prima di calcolare il volume ellissoidale, convertire gli assi maggiore (M) e minore (m) da pixel a millimetri (mm) con il seguente fattore di conversione (cf):
  1 pixel = 2.400 dpi
  1 pollice = 25,4 mm
  cf = 25.4/2400
  Il volume ellissoidale (ellipVol con unità in mm³) corrisponde a:
4. Rappresentare la funzione di densità di probabilità della distribuzione dimensionale individuale sulla scala log₂ .
Diversità delle taglie
1. Calcola la diversità dimensionale (Sd) seguendo Quintana et al. (2008)⁸, come in García-Comas et al. (2016)³⁵:
  
  dove p x(x) è la funzione di densità di probabilità di dimensione x, e _x rappresenta log₂(ellipVol). Questa misura è, quindi, l'indice di diversità di Shannon adattato a una misura continua, come la distribuzione delle dimensioni individuali in una comunità.
Spettro dimensionale del biovolume normalizzato (NBSS)
1. Definire le classi dimensionali dell'NBSS, stabilendo il limite inferiore dello spettro come il quantile 0,01 della distribuzione dimensionale dei macroinvertebrati nei campioni e creando classi di dimensioni mediante una scala geometrica di base 2 fino a comprendere l'organismo più grande nei campioni.
  NOTA: la larghezza della classe di dimensione aumenta con le dimensioni per tenere conto della maggiore variabilità associata a dimensioni maggiori. L'NBSS delle comunità di macroinvertebrati analizzate qui aveva 14 classi di dimensioni (Tabella 1).
2. Ottenere il biovolume normalizzato dividendo il biovolume totale in ciascuna classe di dimensione per la larghezza della classe di dimensione.
Pendenza dello spettro dimensionale
1. Calcolare la pendenza lineare dell'NBSS.
  NOTA: La pendenza (μ) viene calcolata in base alla relazione tra il log 2 (classe dimensionale mid-point) eil log₂ (biomassa normalizzata) nelle classi dimensionali maggiori della modalità, ignorando quelle vuote (in questo studio, le classi di dimensione da 3 a 14).

Limiti della classe di dimensione (mm³)	Classe di dimensione punto medio (mm³)
0,1236	0,1855
0,2473	0,3709
0,4946	0,7418
0,9891	1,4837
1,9783	1,4837
3,9560	5,9348
7,9131	11,8696
15,8261	23,7392
31,6522	47,4783
63,3044	94,9567
126,6089	189,9133
253,2178	379,8267
506,4300	7597,7000
1012,9000	15193,0000
2025,7000

Tabella 1: Classi dimensionali dello spettro dimensionale normalizzato della biomassa (NBSS). La tabella mostra anche i limiti delle 15 classi dimensionali e i punti medi della classe dimensionale degli organismi.

Subscription Required. Please recommend JoVE to your librarian.

Representative Results

Acquisizione di immagini digitali di campioni di macroinvertebrati
Sfumature di scansione: deposizione di etanolo nel vassoio di scansione
Durante il test del sistema per i macroinvertebrati, diverse scansioni erano di scarsa qualità. Un'area scura satura sullo sfondo ha impedito la normale elaborazione dell'immagine e la misurazione delle dimensioni individuali dei macroinvertebrati (Figura 2). Diverse ragioni sono state fornite per la comparsa di aree sature sullo sfondo o immagini altamente pixelate: (1) la presenza di troppi organismi sul vassoio di scansione; 2) la presenza di sporcizia nei campioni; (3) un ritardo insufficiente tra l'anteprima del campione e la sua scansione; o (4) utilizzare nell'elaborazione delle immagini un'immagine di sfondo di scarsa qualità a causa di condensa, sporcizia o scarsa qualità dell'acqua³³. Nei campioni di comunità di macroinvertebrati, l'uso di etanolo al posto dell'acqua provoca precipitazioni sul vassoio, che forma un'ombra scura se non viene adeguatamente risciacquato con acqua tra le scansioni. Questo è fondamentale per ottenere immagini nitide e per ridurre al minimo qualsiasi corrosione correlata del vetro del vassoio di scansione.

Sfumature di scansione: concentrazione di detriti
Dall'analisi di un sottoinsieme di 47.473 vignette, un'alta percentuale (86,1%) corrispondeva a detriti, inclusi detriti, fibre o parti del corpo (come gambe o branchie) o artefatti di scansione (Figura 3A-E). Gli organismi invertebrati corrispondevano al restante 13,9% degli oggetti rilevati (Figura 3F-L). Così, nonostante la precedente meticolosa separazione degli organismi dalla materia organica in laboratorio, molti piccoli detriti rimanevano ancora nella fiala.

Sfumature di scansione: toccare oggetti
La presenza significativa di detriti migliora il contatto tra gli organismi e, quindi, la creazione di vignette con aggregati che includono più organismi tattili e organismi attaccati a particelle o fibre (Figura 4A-C). Queste vignette sono una fonte di distorsione nel determinare la forma della struttura dimensionale individuale. In un set di cinque campioni (11 sottocampioni), su tutte le vignette con macroinvertebrati, il 10% corrispondeva a gruppi con organismi che toccavano o organismi che toccavano particelle o fibre. Tali vignette sono state modificate con il programma di elaborazione delle immagini al fine di separare gli organismi che toccano e gli organismi con particelle attaccate. La rielaborazione dei campioni con la maschera di separazione ha comportato la creazione di nuove vignette con gli oggetti appena separati, che sono stati convalidati per garantire la loro corretta classificazione.

Riconoscimento automatico degli oggetti
Risultati del set di apprendimento
Un set di apprendimento è un insieme di vignette di oggetti classificati in diverse categorie da un esperto e utilizzati in un modello di apprendimento supervisionato, e questo può anche essere chiamato un set di addestramento²⁷. È possibile lavorare con un set di apprendimento esistente, aggiornare il set di apprendimento esistente con nuove vignette e / o categorie o creare un nuovo set di apprendimento per un progetto specifico.

Per determinare il miglior set di apprendimento per ottenere rapidamente la struttura dimensionale dei macroinvertebrati, sono stati creati e testati diversi set di apprendimento attraverso la convalida incrociata con l'algoritmo Random Forest. La matrice di confusione risultante mostra la classificazione reale (righe) rispetto alla classificazione automatica (colonne). Il richiamo è la percentuale di organismi appartenenti a una categoria che è stata automaticamente ben classificata, mentre la precisione 1 è la percentuale di organismi erroneamente classificati dall'algoritmo come appartenenti a una categoria (contaminazione in una categoria)³³. Come regola generale, il richiamo dovrebbe essere superiore al 70% e la contaminazione (precisione 1) dovrebbe essere inferiore al 20% per mantenere una categoria nel set di apprendimento. Il set di apprendimento con il massimo richiamo e precisione per i macroinvertebrati viene quindi ulteriormente convalidato con un sottoinsieme di campioni per determinare la sua reale accuratezza nell'identificazione dei macroinvertebrati.

Sono stati testati tre tipi di set di apprendimento atassico (grezzo, intermedio e fine) con categorie basate sulle caratteristiche morfologiche degli oggetti. Il set di apprendimento grezzo includeva tre categorie: macroinvertebrati, altri invertebrati (microcrostacei) e detriti (fibre, particelle e artefatti come macchie di vetro). Il set di apprendimento intermedio comprendeva 16 categorie: 5 per i macroinvertebrati, 3 per altri invertebrati e 8 per i detriti. Il set di apprendimento fine comprendeva altre 4 categorie di macroinvertebrati, con un totale di 20 categorie (Tabella 2).

Oltre a definire le categorie, è stato testato anche l'effetto del numero di vignette per categoria. Ogni set di apprendimento è stato testato separatamente utilizzando 50 vignette, 100 vignette e 300 vignette in ogni categoria (e 500 vignette per il set di apprendimento grezzo con tre categorie). Tutte le categorie erano bilanciate in numero ad eccezione di "Ostracoda", "macroinvertebrati a lungo giro" e "macroinvertebrati a guscio rotondo", che includevano meno individui nelle 100 vignette e 300 set di apprendimento della vignetta perché non sono stati rilevati abbastanza organismi di queste categorie nelle immagini scansionate.

Il richiamo e la precisione per i macroinvertebrati (tutte le categorie di macroinverbrati insieme) e gli organismi (le categorie di macroinvertebrati e altre categorie di invertebrati insieme) sono stati considerati per selezionare il miglior set di apprendimento mediante convalida incrociata (vedere le tabelle nel file supplementare 2). Il miglior set di apprendimento è stato il set di apprendimento grezzo con tre categorie (macroinvertebrati, altri invertebrati e detriti), con 300 oggetti in ogni categoria (Tabella 2). Il set di apprendimento grezzo è stato successivamente utilizzato per convalidare la classificazione automatica degli oggetti nel sottoinsieme di campioni scansionati.

Set di apprendimento	Numero di categorie	Immagini per categoria	Richiamare gli organismi	Richiamo macro-invertebrati	1-organismi di precisione	1-macroinvertebrati di precisione
Crudo	3	50	0.97	0.84	0.12	0.24
		100	0.96	0.87	0.06	0.17
		300	0.95	0.91	0.09	0.15
		500	0.93	0.88	0.13	0.2
Medio	16	50	0.83	0.77	0.17	0.24
		100	0.84	0.79	0.15	0.21
		300	0.87	0.84	0.14	0.18
Bene	20	50	0.89	0.86	0.14	0.18
		100	0.9	0.87	0.11	0.14
		300	0.9	0.86	0.13	0.14

Tabella 2: Set di apprendimento creati e testati (grezzi, intermedi e fini) con le categorie all'interno di ciascuno e il numero di oggetti per categoria. Richiamo e 1-precisione dei set di apprendimento creati. Categorie del set di apprendimento grezzo: Macroinvertebrati (1), Altri invertebrati (2), Detriti (3). Categorie del set di apprendimento medio: macroinvertebrati lunghi (1), macroinvertebrati lunghi lisci (2), macroinvertebrati lunghi appuntiti (3), macroinvertebrati rotondi (4), macroinvertebrati a guscio rotondo (5), Cladocera (6), Copepoda (7), Ostracoda (8), Aggregati (9), Fibre (10), Teste (11), Gambe (12), Coloranti (13), Macchie scure (14), Colorazioni grigio chiaro (15), Colorazioni rotonde (16). categorie del Fine learning set: Macroinvertebrati lunghi (1), Macroinvertebrati lisci lunghi (2), Macroinvertebrati lunghi lisci scuri (3), Macroinvertebrati rotondi lunghi (4), Macroinvertebrati appuntiti lunghi (5), Macroinvertebrati rotondi (6), Macroinvertebrati a guscio rotondo (7), Macroinvertebrati scuri rotondi (8), Macroinvertebrati a guscio rotondo (9), Cladocera (10), Copepoda (11), Ostracoda (12), Aggregati (13), Fibre (14), Teste (15), Gambe (16), Macchie (17), Macchie scure (18), macchie grigio chiaro (19), macchie rotonde (20).

Convalida del riconoscimento automatico con il miglior set di apprendimento
Gli oggetti in un sottoinsieme di 42 sottocampioni fini e grossolani sono stati automaticamente classificati dal set di apprendimento selezionato con l'algoritmo Random Forest. Dopo la convalida manuale, il richiamo per tutte le categorie è stato elevato (in media, 0,94 per i macroinvertebrati, 0,95 per gli altri invertebrati e 0,92 per i detriti), mentre la contaminazione (1-precisione) è stata piuttosto bassa, ad eccezione di altri invertebrati (0,25 per i macroinvertebrati, 0,84 per gli altri macroinvertebrati e 0,01 per i detriti) (Figura 5 ). Altri invertebrati (microcrostacei) erano rari nei campioni (presenti in 17 sottocampioni su 42); Pertanto, il confronto non era solido. Inoltre, questa categoria è stata fortemente influenzata dalla contaminazione a causa della somiglianza nella forma e dei livelli di grigio con altri oggetti.

Il confronto tra l'abbondanza di macroinvertebrati automatica e convalidata ha mostrato che questi erano altamente correlati (r di Pearson = 0,92, valore p < 0,0001, n = 24 per sottocampioni grossolani; r = 0,98 di Pearson, valore p < 0,0001, n = 18 per i sottocampioni fini), con una leggera sovrastima delle prestazioni automatiche dovute alla contaminazione da detriti (pendenze < 1) (Figura 6). Per quanto riguarda il confronto del volume ellissoidale medio, anche la correlazione era elevata (r di Pearson = 0,96, valore p < 0,0001, n = 24 per campioni grossolani; r di Pearson = 0,99, valore p < 0,0001, n = 18 per i campioni fini) e la pendenza dello spettro dimensionale era vicina a -1 (Figura 6). La differenza nelle pendenze tra le frazioni fini e grossolane riflette il maggiore effetto dell'errata classificazione nelle frazioni di grandi dimensioni, che è correlato al loro basso numero di organismi.

Le funzioni di densità di probabilità delle singole distribuzioni dimensionali della previsione automatica concordavano fortemente con le previsioni convalidate per i sottocampioni fini, così come per i sottocampioni grossolani. Tuttavia, vi erano alcune eccezioni per i sottocampioni grossolani relativi al numero di organismi e, quindi, un maggiore effetto di classificazione errata in quei casi, come evidenziato in precedenza (Figura 7).

Effetto del contatto con gli organismi sulle distribuzioni dimensionali individuali, sugli spettri dimensionali e sulle metriche dimensionali
È stato eseguito un confronto delle distribuzioni dimensionali ottenute prima e dopo la separazione degli organismi toccanti e prima della convalida in un sottoinsieme di cinque campioni selezionati per valutare l'effetto del contatto con gli oggetti. Per confrontare le distribuzioni dimensionali, i sottocampioni grossolani e fini sono stati combinati, secondo il loro frazionamento, per ricostruire un campione che rappresenta la comunità dei macroinvertebrati. In tre campioni, l'abbondanza dopo la convalida è aumentata (>500 individui) (Figura 8A). Nonostante questo aumento, il volume ellissoidale medio si avvicina molto a quello calcolato nei campioni convalidati (Figura 8B).

Le distribuzioni dimensionali dei campioni corretti (dopo la separazione degli organismi che toccano) differivano leggermente da quelle convalidate. Pertanto, la presenza di più oggetti ha avuto una piccola influenza sulle distribuzioni dimensionali in quei campioni (Figura 9A-E). Di conseguenza, la diversità dimensionale calcolata sulla base dei campioni corretti era fortemente correlata con la diversità dimensionale di quelli convalidati (r di Pearson = 0,94, valore p = 0,017, n = 5) (Figura 9F).

Teoricamente, lo spettro dimensionale normalizzato del biovolume (NBSS) di una comunità con diversi livelli trofici ha una pendenza dello spettro dimensionale nella scala log₂ che si avvicina a -1 in condizioni di stato stazionario⁴. L'NBSS nelle comunità naturali ha spesso un bump piuttosto che una distribuzione lineare, e questo è principalmente attribuito alla distorsione del campionamento delle classi di dimensioni più piccole³⁶. Nel presente studio, la terza classe di dimensioni era la più comune nella NBSS.

Gli NBSS erano abbastanza simili tra le fasi del protocollo (Figura 10A-C), ad eccezione di alcune classi di dimensioni in un paio di spettri (Figura 10D-E). Di conseguenza, la pendenza dello spettro dimensionale calcolata in base ai campioni corretti era fortemente correlata con la pendenza basata su quelli convalidati (r di Pearson = 0,99, valore p ≤ 0,0001, n = 5) (Figura 10F).

Figura 2: Esempi di immagini scansionate con qualità diverse prima e dopo l'elaborazione. (A,B) Immagine grezza (a sinistra) e immagine elaborata (a destra) di un sottocampione fine con una buona qualità di scansione; (C,D) Immagine grezza (a sinistra) e immagine elaborata (a destra) di un sottocampione fine con scarsa qualità di scansione (sfondo scuro e immagine tagliata sul bordo sinistro); (E,F) immagine raw (a sinistra) e immagine elaborata (a destra) di un sottocampione fine con scarsa qualità di scansione (sfondo scuro molto pixelato). Fare clic qui per visualizzare una versione ingrandita di questa figura.

Figura 3: Vignette di contorno che rappresentano diversi oggetti presenti nei campioni. (A-E) Detriti (fibre, macchie rotonde, zampe di macroinvertebrati, macchie e detriti organici); (F-I) macroinvertebrati (Coleotteri, Ditteri, Plecoptera, e Trichoptera) e (J-L) altri invertebrati (Cladocera, Copepoda e Ostracoda). Le barre della scala indicano 1 mm gma = 1,1. Fare clic qui per visualizzare una versione ingrandita di questa figura.

Figura 4: Esempi di vignette contenenti più oggetti. (A) un macroinvertebrato (Hydracarina) attaccato ad una fibra; B) organismi multipli (Caenidae) aggregati da una fibra; e (C) due macroinvertebrati toccanti (Chironomidae e Caenidae). Le barre della scala indicano 1 mm gma = 1,1. Fare clic qui per visualizzare una versione ingrandita di questa figura.

Figura 5: Boxplot di richiamo e contaminazione (precisione 1). I boxplot per le tre categorie di macroinvertebrati, altri invertebrati e detriti (300 vignette per categoria) del set di apprendimento selezionato convalidati su un sottoinsieme di campioni (n = 42). Fare clic qui per visualizzare una versione ingrandita di questa figura.

Figura 6: Confronto tra le stime dell'abbondanza e del volume ellissoidale medio nella classificazione automatica rispetto a quella convalidata. (A) Stime dell'abbondanza nei sottocampioni (n = 42) e (B) stime del volume ellissoidale medio nei sottocampioni (n = 42). I punti scuri corrispondono ai sottocampioni grossolani (maglia >0,5 cm); I punti grigi corrispondono ai sottocampioni fini (maglia >500 μm). La linea tratteggiata rappresenta la relazione 1:1. Fare clic qui per visualizzare una versione ingrandita di questa figura.

Figura 7: Funzioni di densità di probabilità che rappresentano il contributo relativo (asse y) della dimensione individuale nella scala logaritmica (asse x) per il confronto tra stime automatiche e tra stime convalidate. (A,B) Stime automatiche e convalidate per sottocampioni grossolani (n = 18), (C,D) Stime automatiche e convalidate per sottocampioni fini (n = 24). (A,C) Confronto tra stime automatiche e (B,D) confronto tra stime convalidate. I colori rappresentano ogni sottocampione per aiutare a discernere gli spettri. Fare clic qui per visualizzare una versione ingrandita di questa figura.

Figura 8: Confronto tra le stime dell'abbondanza e del volume ellissoidale medio in sottocampioni convalidati rispetto a sottocampioni convalidati dopo la separazione di oggetti in contatto da campioni naturali selezionati (sottocampioni fini e grossolani insieme). (A) Stime dell'abbondanza mediante sistema di campionamento (n = 5) e (B) stime del volume ellissoidale medio (n = 5). La linea tratteggiata rappresenta la relazione 1:1. Fare clic qui per visualizzare una versione ingrandita di questa figura.

Figura 9: Funzioni di densità di probabilità che rappresentano il contributo relativo (asse y) della dimensione individuale nella scala log₂ (asse x) per la previsione automatica, la previsione convalidata e la previsione convalidata con i rispettivi valori di diversità dimensionale (Sd). (A-E) Funzioni di densità di probabilità per campioni naturali selezionati (sottocampioni fini e grossolani insieme) (n = 5); La linea rossa corrisponde alla previsione automatica, la linea blu corrisponde alla previsione convalidata e la linea verde corrisponde ai campioni corretti (convalidati dopo la separazione degli oggetti in contatto). (F) confronto tra stime convalidate e corrette della diversità dimensionale; La linea tratteggiata corrisponde alla relazione 1:1. Fare clic qui per visualizzare una versione ingrandita di questa figura.

Figura 10: Spettri dimensionali normalizzati del biovolume (NBSS) e confronto delle pendenze NBSS (μ) tra i trattamenti. (A-E) NBSS che rappresenta la relazione tra il valore del punto medio di ciascuna classe dimensionale nella scala logaritmica (asse x) rispetto al biovolume normalizzato per fotogramma di scansione (asse y) dei cinque campioni selezionati per le previsioni automatiche (croci rosse), convalidate (triangoli blu) e corrette (cerchi verdi) con il rispettivo spettro di dimensioni pendenze (μ) calcolate nelle classi di dimensione dalla classe di dimensione modale e verso l'alto (la terza classe di dimensione è indicata dalla linea tratteggiata verticale). (F) Confronto delle pendenze calcolate sui campioni validati rispetto a quelle corrette (dopo la separazione degli oggetti che toccano). La linea tratteggiata corrisponde alla relazione 1:1, r². Fare clic qui per visualizzare una versione ingrandita di questa figura.

File supplementare 1: script Matlab per eseguire i calcoli. Clicca qui per scaricare questo file.

File supplementare 2: Convalida incrociata, richiamo e precisione 1 dei set di apprendimento creati. (A) Set di apprendimento grezzo con 3 categorie e 50 vignette per categoria; (B) set di apprendimento grezzo con 3 categorie e 100 vignette per categoria; (C) set di apprendimento grezzo con 3 categorie e 300 vignette per categoria; (D) set di apprendimento grezzo con 3 categorie e 500 vignette per categoria; (E) set di apprendimento grezzo con 5 categorie e 50 vignette per categoria; (F) set di apprendimento grezzo con 5 categorie e 100 vignette per categoria; (G) set di apprendimento grezzo con 5 categorie e 300 vignette per categoria; (H) set di apprendimento intermedio con 16 categorie e 50 vignette per categoria; (I) set di apprendimento intermedio con 16 categorie e 100 vignette per categoria; (J) set di apprendimento intermedio con 16 categorie e 300 vignette per categoria; (K) set di apprendimento fine con 20 categorie e 50 vignette per categoria; (L) set di apprendimento fine con 20 categorie e 100 vignette per categoria; e (M) set di apprendimento fine con 20 categorie e 300 vignette per categoria. Clicca qui per scaricare questo file.

Subscription Required. Please recommend JoVE to your librarian.

Discussion

L'adattamento della metodologia descritta da Gorsky et al. 2010 per i macroinvertebrati fluviali consente un'elevata accuratezza di classificazione nella stima della struttura dimensionale della comunità nei macroinvertebrati d'acqua dolce. I risultati suggeriscono che il protocollo può ridurre il tempo per stimare la struttura dimensionale individuale in un campione a circa 1 ora. Pertanto, il protocollo proposto ha lo scopo di promuovere l'uso di routine degli spettri dimensionali dei macroinvertebrati come bioindicatore rapido e integrativo per valutare l'impatto delle perturbazioni negli ecosistemi di acqua dolce. Lo spettro dimensionale dei macroinvertebrati è già stato utilizzato come indice di successo per valutare lo stato ecologico delle lagune costiere²². Con lo sviluppo del protocollo, è possibile effettuare indagini intensive sugli invertebrati per consentire campagne di monitoraggio sul campo che coprono grandi scale spaziali e temporali.

Poiché lo scopo di questo protocollo è quello di ottenere la distribuzione dimensionale individuale della comunità campionata in modo rapido, ignorando la tassonomia, si consiglia di creare un set di apprendimento semplice come quello qui proposto. I test di set di apprendimento più fini, con un numero maggiore di categorie, danno un richiamo e una precisione inferiori per i macroinvertebrati nel loro complesso (Tabella 2) e la fase di convalida richiede più tempo.

La previsione automatica concordava fortemente con la previsione convalidata di 42 sottocampioni naturali provenienti da diversi siti di campionamento, suggerendo che il metodo in modalità automatica è adatto per contare e misurare i macroinvertebrati in campioni naturali (Figura 6). Inoltre, la somiglianza nelle NBSS tra le previsioni automatiche e convalidate e l'elevata aderenza al modello teorico lineare suggerisce che la modalità automatica è un metodo promettente per perseguire studi ecologici teorici (Figura 10).

Durante l'adattamento di questo protocollo, sono stati riscontrati diversi problemi e sono stati risolti o ridotti al minimo in modi diversi. Un problema da tenere in considerazione durante la scansione di campioni di macroinvertebrati è la comparsa di aree scure sature. Pertanto, è importante controllare le immagini elaborate e scansionate il prima possibile per rilevare questo problema e ripetere la scansione, se necessario. Questo problema è stato riscontrato anche durante la scansione del plancton³³, ma è aumentato dall'uso di etanolo invece dell'acqua del rubinetto. Non è raccomandato l'uso di acqua di rubinetto, poiché gli organismi conservati in etanolo al 70% andranno alla deriva sulla superficie. Anche se il dispositivo è progettato per resistere all'etanolo diluito (5%), i campioni di invertebrati sono conservati con etanolo al 70%. Non è raccomandato nemmeno operare con concentrazioni inferiori di etanolo, poiché gli organismi potrebbero essere danneggiati attraverso processi di reidratazione e disidratazione³⁷. La soluzione proposta, che è altamente raccomandata, è quella di sciacquare il vassoio di scansione con acqua dolce più volte dopo ogni scansione eseguita con etanolo. Ciò evita l'accumulo di precipitati che possono alterare lo sfondo dell'immagine e protegge il vetro del vassoio di scansione dalla corrosione.

Un altro problema rilevato è la presenza di vignette con più organismi, che possono alterare lo spettro delle dimensioni a causa della sottostima di individui di determinate dimensioni. Quando il numero di vignette con più oggetti è basso (<10%), come in questo studio, la presenza di più oggetti ha una piccola influenza sulle distribuzioni dimensionali e NBSS in quei campioni (Figura 9 e Figura 10). Ciò indica che, per ottenere una struttura dimensionale rappresentativa della comunità dei macroinvertebrati, non è necessario investire tempo nella fase 1.5 del protocollo (la separazione degli organismi che toccano), per la quale il ritrattamento delle immagini dura circa 1,5 ore. Invece, si consiglia vivamente di prendere tempo nel passaggio 2.5 del protocollo (separare gli organismi o gli aggregati che toccano usando un ago di legno), che è molto meno dispendioso in termini di tempo (massimo 30 minuti) e garantisce una corretta stima delle distribuzioni dimensionali in modalità automatica³⁰. Un'opzione per ridurre il numero di organismi che toccano è quella di lavorare con meno organismi per scansione, ma l'impegno di tempo investito nella scansione di un campione in un numero elevato di frazioni e la possibilità di aggregazione degli organismi dovrebbero essere presi in considerazione. Un'altra soluzione sarebbe quella di conservare solo un sottocampione che consentirebbe di calcolare uno spettro dimensionale rappresentativo quando si selezionano gli organismi in laboratorio invece di preservare tutti gli organismi campionati, come fatto in questo lavoro. La riduzione del numero di organismi per campione ridurrebbe la probabilità di toccare gli organismi. Inoltre, quando vengono immagazzinati meno individui, il campione contiene meno detriti, il che facilita la separazione, soprattutto se le fibre possono essere evitate.

La limitazione osservata del metodo di classificazione automatica è correlata alla bassa presenza di microcrostacei (categoria: altri macroinvertebrati) nei campioni utilizzati. La mancanza di rappresentazione dei microcrostacei può influire sulla loro corretta classificazione e limitare la precisione della previsione automatica per questa categoria. Tuttavia, le altre categorie, detriti e macroinvertebrati, che sono l'obiettivo principale di questo lavoro, presentano un elevato richiamo e precisione. Le alternative all'utilizzo di questo dispositivo scanner sarebbero quelle di adattare uno scanner comune per contenere fotogrammi d'acqua, promuovere codici open source per l'elaborazione dei campioni e l'apprendimento automatico come quello fornito qui e scrivere codici per misurare gli organismi al microscopio con una fotocamera o attraverso il flusso con un set di telecamere. Questo è stato fatto in diverse occasioni 23,24,25,26,38,39,40, ma il metodo che proponiamo regola la parametrizzazione della scansione al fine di ottenere stime dimensionali comparabili^, che è difficile da controllare con gli altri sistemi. Inoltre, il protocollo e il dispositivo di scansione proposti sono pronti all'uso, open-source e già affermati nella comunità del mesozooplancton marino. Nel complesso, l'adattamento di questo protocollo dimostra una strada promettente per l'utilizzo di questo metodo di imaging automatico per ottenere la struttura dimensionale dei macroinvertebrati d'acqua dolce in modo efficiente e per testare il potenziale delle metriche dimensionali per la biovalutazione dell'acqua dolce.

Subscription Required. Please recommend JoVE to your librarian.

Disclosures

Gli autori non dichiarano potenziali interessi concorrenti.

Acknowledgments

Questo lavoro è stato sostenuto dal Ministero spagnolo della Scienza, dell'Innovazione e dell'Università (numero di sovvenzione RTI2018-095363-B-I00). Ringraziamo i membri del CERM-UVic-UCC Èlia Bretxa, Anna Costarrosa, Laia Jiménez, María Isabel González, Marta Jutglar, Francesc Llach e Núria Sellarès per il loro lavoro nel campionamento dei campi di macroinvertebrati e nella selezione di laboratorio e David Albesa per aver collaborato alla scansione dei campioni. Ringraziamo infine Josep Maria Gili e l'Institut de Ciències del Mar (ICM-CSIC) per l'uso delle strutture di laboratorio e del dispositivo di scansione.

Materials

Name	Company	Catalog Number	Comments
Beaker	Labbox		Other containers could be used
Dionized water	Icopresa	8420239600123	To dilute the ethanol
Funnel	Vitlab	41094
Glass vials 8 ml	Labbox	SVSN-C10-195	1 vial/subsample
ImageJ Software	Free access		Version 4.41o/ Image processing software
Large frame	Hydroptic	Provided by ZooScan	24.5 cm x 15.8 cm
Monalcol 96 (Ethanol 96)	Montplet	1050JE001
Plankton Identifier Software	Free access		Version 1.2.6/ Automatic identification software
Sieve	Cisa	26852.2	Nominal aperture 500µ and nominal aperture 0,5 cm
Tweezers	Bondline	B5SA	Stainless, anti-magnetic, anti-acid
VueScan 9 x 64 (9.5.09) Software	Hydroptic		Version 9.0.51/ Sacn software
Wooden needle			Any plastic or wood needle can be used
Zooprocess Software	Free access		Version 7.14/Image processing software
ZooScan	Hydroptic	54	Version III/ Scanner